前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇如何學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
關(guān)鍵詞:強(qiáng)化學(xué)習(xí);神經(jīng)網(wǎng)絡(luò);馬爾科夫決策過程;算法;應(yīng)用
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2012)28-6782-05
在機(jī)器學(xué)習(xí)領(lǐng)域,大致可以將學(xué)習(xí)分為監(jiān)督學(xué)習(xí)、非監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)三大類。強(qiáng)化學(xué)習(xí)以其在線學(xué)習(xí)能力和具有無導(dǎo)師制的自適應(yīng)能力,因此被認(rèn)為設(shè)計智能Agent的核心技術(shù)之一。從20世紀(jì)80年代末開始,隨著數(shù)學(xué)基礎(chǔ)日益發(fā)展的支持,應(yīng)用范圍不斷擴(kuò)大,強(qiáng)化學(xué)習(xí)也就成為目前機(jī)器學(xué)習(xí)的研究熱點(diǎn)之一。在研究過程中,隨著各種方法、技術(shù)和算法大量應(yīng)用于強(qiáng)化學(xué)習(xí)中,其缺陷和問題也就日漸顯現(xiàn)出來,尋找一種更好的方式和算法來促進(jìn)強(qiáng)化學(xué)習(xí)的發(fā)展和廣泛應(yīng)用,是研究人員探討和研究的重點(diǎn)。因此,神經(jīng)網(wǎng)絡(luò)及其算法以其獨(dú)特的泛化能力和存儲能力成為眾多研究人員重視的研究對象。
在此之前,已有大量研究者通過神經(jīng)網(wǎng)絡(luò)的特性來加強(qiáng)強(qiáng)化學(xué)習(xí)的效果及應(yīng)用。張濤[2]等人利用將Q學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)中的BP網(wǎng)絡(luò)、S激活函數(shù)相結(jié)合,加上神經(jīng)網(wǎng)絡(luò)的泛化能力,不僅解決了倒立擺系統(tǒng)的一系列問題,而且還進(jìn)一步提高了強(qiáng)化學(xué)習(xí)理論在實際控制系統(tǒng)的應(yīng)用。林聯(lián)明在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)研究Sarsa強(qiáng)化算法,提出用BP網(wǎng)絡(luò)隊列保存SAPs,解決由于過大而帶來的Q值表示問題[3]。強(qiáng)化學(xué)習(xí)理論在機(jī)器控制研究中也應(yīng)用廣泛。段勇在基于行為的移動機(jī)器人控制方法基礎(chǔ)上,將模糊神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)理論相結(jié)合,構(gòu)成模糊強(qiáng)化系統(tǒng),解決了連續(xù)狀態(tài)空間和動作空間的強(qiáng)化學(xué)習(xí)問題和復(fù)雜環(huán)境中的機(jī)器人導(dǎo)航問題[4]。由此可見,將神經(jīng)網(wǎng)絡(luò)與強(qiáng)化學(xué)習(xí)相結(jié)合,已經(jīng)是現(xiàn)今強(qiáng)化學(xué)習(xí)研究的重點(diǎn)方向,也已經(jīng)取得了頗豐的成果。但是,如何將神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)理論更好的融合,選擇何種算法及模型,如何減少計算量和加快學(xué)習(xí)算法收斂速度,以此來推動強(qiáng)化學(xué)習(xí)理論研究更向前發(fā)展,解決更多的實際應(yīng)用問題,這些依然還是待解決的研究課題之一。下面,根據(jù)本人對強(qiáng)化學(xué)習(xí)的研究,朋友給予的指導(dǎo)以及參照前人的研究成果,對基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)作個基本概述。
1 強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)(reinforcement),又稱再勵學(xué)習(xí)或評價學(xué)習(xí),它是重要的機(jī)器學(xué)習(xí)方法之一,在機(jī)器人控制、制造過程控制、任務(wù)調(diào)配及游戲中有著廣泛的應(yīng)用。
1.1 定義
所謂強(qiáng)化學(xué)習(xí)就是智能Agent從環(huán)境狀態(tài)到行為映射的學(xué)習(xí),并通過不斷試錯的方法選擇最優(yōu)行為策略,以使動作從環(huán)境中獲得的累積獎賞值最大。
強(qiáng)化學(xué)習(xí)狀態(tài)值函數(shù)有三個基本表達(dá)式,如下:
這三個狀態(tài)的值函數(shù)或狀態(tài)—動作對函數(shù)的值函數(shù)是用來表達(dá)目標(biāo)函數(shù),該目標(biāo)函數(shù)是從長期的觀點(diǎn)確定什么是最優(yōu)的動作。其中[γ]為折扣因子,[rt]是agent從環(huán)境狀態(tài)[st]到[st+1]轉(zhuǎn)移后所接受到的獎賞值,其值可以為正,負(fù)或零。其中式(1)為無限折扣模型,即agent需要考慮未來h([h∞])步的獎賞,且在值函數(shù)以某種形式進(jìn)行累積;式(2)為有限模型,也就是說agent只考慮未來h步的獎賞和。式(3)為平均獎賞模型,agent考慮其長期平均的獎賞值。最優(yōu)策略可以由(4)式確定
1.2 基本原理與一般結(jié)構(gòu)
強(qiáng)化學(xué)習(xí)就是能夠和環(huán)境進(jìn)行交互的智能Agent,通過怎樣的學(xué)習(xí)選擇能夠達(dá)到其目標(biāo)的最優(yōu)動作。通俗的說,在Agent與環(huán)境進(jìn)行交互的過程中,每個行為動作都會獲得特定的獎賞值。如果Agent的某個行為策略導(dǎo)致環(huán)境正的獎賞值(強(qiáng)化信號),那么Agent以后產(chǎn)生這個行為策略的趨勢就會加強(qiáng)。Agent的目標(biāo)就是對每個離散的狀態(tài)發(fā)現(xiàn)最優(yōu)策略以期望的折扣獎賞和最大。
在上述定義中描述了強(qiáng)化學(xué)習(xí)的三個狀態(tài)值或函數(shù)動作對函數(shù)來表達(dá)目標(biāo)函數(shù),可以求得最優(yōu)策略(根據(jù)(4)式)。但是由于環(huán)境具有不確定性[5],因此在策略[π]的作用下,狀態(tài)[st]的值也可以寫為
強(qiáng)化學(xué)習(xí)把學(xué)習(xí)看作試探評價過程,可用圖1描述。強(qiáng)化學(xué)習(xí)選擇一個動作作用于環(huán)境,環(huán)境受到作用后其狀態(tài)會發(fā)生變化,從一個狀態(tài)轉(zhuǎn)換到另一個狀態(tài),同時產(chǎn)生一個強(qiáng)化信號反饋給Agent,即獎懲值。Agent接受到獎懲值和環(huán)境狀態(tài)變化,進(jìn)行學(xué)習(xí)更新,并根據(jù)獎懲值和環(huán)境當(dāng)前狀態(tài)選擇下一個動作,選擇的原則是使受到正強(qiáng)化(獎)的概率增大。選擇的動作不僅影響立即強(qiáng)化值,而且影響環(huán)境下一時刻的狀態(tài)及最終的強(qiáng)化值。
2 神經(jīng)網(wǎng)絡(luò)
2.1 神經(jīng)網(wǎng)絡(luò)概述
神經(jīng)網(wǎng)絡(luò)是指模擬人類大腦的神經(jīng)系統(tǒng)的結(jié)構(gòu)與功能,運(yùn)用大量的處理部件,采用人工方式構(gòu)造的一種網(wǎng)絡(luò)系統(tǒng)。神經(jīng)網(wǎng)絡(luò)是一種非線性動力學(xué)系統(tǒng),并且具有以分布式存儲和并行協(xié)同處理的特點(diǎn),其理論突破了傳統(tǒng)的、串行處理的數(shù)字計算機(jī)的局限。盡管單個神經(jīng)元的結(jié)構(gòu)和功能比較簡單,但是千千萬萬個神經(jīng)元構(gòu)成的神經(jīng)網(wǎng)絡(luò)系統(tǒng)所能表現(xiàn)的行為卻是豐富多彩的。
單個神經(jīng)元的模型如圖2所示。
人工神經(jīng)元模型由一組連接,一個加法器,一個激活函數(shù)組成。連接強(qiáng)度可由各連接上的值表示,權(quán)值為正表示激活,權(quán)值為負(fù)表示抑制;加法器用于求輸入信號對神經(jīng)元的相應(yīng)突觸加權(quán)之和。激活函數(shù)用于限制神經(jīng)元輸出振幅。
神經(jīng)元還可以用如下公式表示
激活函數(shù)主要有閾值函數(shù)、分段線性函數(shù)、非線性轉(zhuǎn)移函數(shù)三種主要形式。
一般來說,神經(jīng)網(wǎng)絡(luò)在系統(tǒng)中的工作方式是:接受外界環(huán)境的完全或者不完全的狀態(tài)輸入,并通過神經(jīng)網(wǎng)絡(luò)進(jìn)行計算,輸出強(qiáng)化系統(tǒng)所需的Q值或V值。人工神經(jīng)網(wǎng)絡(luò)是對人腦若干基本特性通過教學(xué)方法進(jìn)行的抽象和模擬,是一種模仿人腦結(jié)構(gòu)及功能的非線性信息處理系統(tǒng)。
2.2 強(qiáng)化學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)的融合
經(jīng)過研究發(fā)現(xiàn),神經(jīng)網(wǎng)絡(luò)的眾多優(yōu)點(diǎn),可以滿足強(qiáng)化學(xué)習(xí)研究的需要。首先,由于神經(jīng)網(wǎng)絡(luò)模仿人的大腦,采用自適應(yīng)算法,使得Agent智能系統(tǒng)更能適應(yīng)環(huán)境的變化。此外,神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的容錯能力,這樣可以根據(jù)對象的主要特征來進(jìn)行較為精確的模式識別。最后,神經(jīng)網(wǎng)絡(luò)又有自學(xué)習(xí),自組織能力和歸納能力的特點(diǎn),不僅增強(qiáng)了Agent對不確定環(huán)境的處理能力,而且保證了強(qiáng)化學(xué)習(xí)算法的收斂性。神經(jīng)網(wǎng)絡(luò)也有無導(dǎo)師學(xué)習(xí)機(jī)制,正好適用于強(qiáng)化學(xué)習(xí)。
強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的融合重點(diǎn)在于如何運(yùn)用神經(jīng)網(wǎng)絡(luò)多重特性,能夠快速高效地促進(jìn)Agent智能系統(tǒng)經(jīng)歷強(qiáng)化學(xué)習(xí)后,選擇一條最優(yōu)行為策略來滿足目標(biāo)需求。強(qiáng)化學(xué)習(xí)的環(huán)境是不確定的,無法通過正例、反例告知采取何種行為。Agent必須通過不斷試錯才能找到最優(yōu)行為策略。但是在此過程中,會遇到許多問題,比如輸出連續(xù)的動作空間問題,但可利用神經(jīng)網(wǎng)絡(luò)的泛化特征,實現(xiàn)了輸出在一定范圍內(nèi)的連續(xù)動作空間值[2]。所以,簡單的講,將神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)相融合,主要是利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的存儲能力和函數(shù)估計能力。目前,在函數(shù)估計強(qiáng)化學(xué)習(xí)研究上,神經(jīng)網(wǎng)絡(luò)是研究熱點(diǎn)之一。
3 馬爾科夫決策過程
本文主要論述馬爾科夫型環(huán)境下的強(qiáng)化學(xué)習(xí),可以通過馬爾科夫決策過程進(jìn)行建模。下面給出其形式定義:
基本的POMDP由四個元組成:。S是指一個環(huán)境狀態(tài)集,可以是有限的,可列的或者任意非空集;A為Agent行為集合,用A(s)表示在狀態(tài)s處可用的決策集;獎賞函數(shù)R(s,a):[A×S]->Real;T:[A×S]->PD(S);T(s,a,s')為Agent在狀態(tài)s采用a動作使環(huán)境狀態(tài)轉(zhuǎn)移到s'的概率。
一個有限的馬爾科夫決策過程有5元組成:;前四個元與上述是一致的,V為準(zhǔn)則函數(shù)或者目標(biāo)函數(shù)[3],常用準(zhǔn)則函數(shù)有期望折扣總報酬、期望總報酬和平均報酬等并且可以是狀態(tài)值函數(shù)或狀態(tài)-動作對值函數(shù)。
馬爾科夫決策過程的本質(zhì)是:當(dāng)前的狀態(tài)轉(zhuǎn)變?yōu)榱硪粋€狀態(tài)的概率和獎賞值只取決于當(dāng)前的狀態(tài)和選擇的動作,與過去的動作和狀態(tài)無關(guān)。所以,在馬爾科夫環(huán)境下,已知狀態(tài)轉(zhuǎn)移概率函數(shù)T和獎賞函數(shù)R,可以借助于動態(tài)規(guī)劃技術(shù)求解最優(yōu)行為策略。
4 改進(jìn)的強(qiáng)化學(xué)習(xí)算法
到目前為止,強(qiáng)化學(xué)習(xí)領(lǐng)域提出的強(qiáng)化學(xué)習(xí)算法層出不窮,如Sutton提出的TD算法[6],Watkins提出的Q-Learning算法[7],Rummery和Niranjan于1994提出的Sarsa算法[8],以及Dyna-Q學(xué)習(xí)算法[9]等。致力于這方面研究的研究人員,都在極力尋找一種既能保證收斂性,又能提高收斂速度的新型學(xué)習(xí)算法。本文主要在基于神經(jīng)網(wǎng)絡(luò)的特性,研究并提出改進(jìn)的強(qiáng)化學(xué)習(xí)算法。
4.1 基于模糊神經(jīng)網(wǎng)絡(luò)的Q([λ])學(xué)習(xí)算法
Q學(xué)習(xí)算法是強(qiáng)化學(xué)習(xí)領(lǐng)域重要的學(xué)習(xí)算法之一[7,10],它利用函數(shù)Q(x,a)來表達(dá)與狀態(tài)相對應(yīng)的各個動作的評估。Q學(xué)習(xí)算法的基本內(nèi)容為:
(1)任意初始化一個Q(x,a)
(2)初始化 s
(3)從決策集中隨即選擇一個動作a
(4)采取動作策略a,觀察[r,][s]'的值
(5)計算 [Qs,aQs,a+αr+γmaxa'Qs',a'-Qs,a], (11)
(7)重復(fù)(2)-(6)步,直到s終結(jié)。
式(11)使用下一狀態(tài)的估計來更新Q函數(shù),稱為一步Q學(xué)習(xí)。將TD([λ])的思想引入Q學(xué)習(xí)過程,形成一種增量式多步Q學(xué)習(xí),簡稱Q([λ])學(xué)習(xí)[11]。步驟與Q算法類似,其計算公式如下:
如果 [s=st,a=at],則[Qst,at=Qst,at+αtγt+γtetst+at]; (12)
4.2 基于BP神經(jīng)網(wǎng)絡(luò)的Sarsa算法
描述如下:(1)H是用于保存最近訪問的Q值,當(dāng)滿的時候送至神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
如果表H已滿,則利用H中的樣本對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,版本號自動增加1
若網(wǎng)絡(luò)隊列q也已滿,則隊尾元素出隊,把新訓(xùn)練的神經(jīng)網(wǎng)絡(luò)入隊q;
清空訓(xùn)練集;
該算法的主要貢獻(xiàn)是引入神經(jīng)網(wǎng)絡(luò)隊列保存大量的Q值表,從來降低了保存大量Q值所要花費(fèi)大量的內(nèi)存空間,更重要的是解決了單個神經(jīng)網(wǎng)絡(luò)“增量式”學(xué)習(xí)所帶來的“遺忘”問題。
5 強(qiáng)化學(xué)習(xí)應(yīng)用
由于強(qiáng)化學(xué)習(xí)在算法和理論方面的研究越來越深入,在大空間、復(fù)雜非線性控制,機(jī)器人控制、組合優(yōu)化和調(diào)度等領(lǐng)域呈現(xiàn)出良好的學(xué)習(xí)性能,使得強(qiáng)化學(xué)習(xí)在人工智能,控制系統(tǒng),游戲以及優(yōu)化調(diào)度等領(lǐng)域取得了若干的成功應(yīng)用,而本文主要介紹基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)算法在某些領(lǐng)域的應(yīng)用。
在非線性控制系統(tǒng)方面,張濤等人[2]將BP網(wǎng)絡(luò)運(yùn)用于 Q-Learning算法中,成功解決了連續(xù)狀態(tài)空間的倒立擺平衡控制問題和連續(xù)狀態(tài)空間輸入、連續(xù)動作空間輸出的問題,從而提高了強(qiáng)化學(xué)習(xí)算法的實際應(yīng)用價值;在機(jī)器人控制方面,應(yīng)用更為廣泛,Nelson[13]等人考慮了基于模糊邏輯和強(qiáng)化學(xué)習(xí)的智能機(jī)器人導(dǎo)航問題,并且段勇等人[4]基于該理論,成功地將模糊神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)結(jié)合起來,采用殘差算法保證函數(shù)逼近的快速性和收斂性,有效地解決了復(fù)雜環(huán)境下機(jī)器人導(dǎo)航的問題。在游戲方面,Tesauro采用三層BP神經(jīng)網(wǎng)絡(luò)把棋盤上的棋子位置和棋手的獲勝概率聯(lián)系起來,通過訓(xùn)練取得了40盤比賽中只輸一盤的好戰(zhàn)績[14]。在優(yōu)化調(diào)度方面,主要包括車間作業(yè)調(diào)度,電梯調(diào)度以及網(wǎng)絡(luò)路由選擇等,Robert Crites等[15]將強(qiáng)化學(xué)習(xí)和前饋神經(jīng)網(wǎng)絡(luò)融合利用,以最終實驗結(jié)果表明為依據(jù),證明了該算法是目前高層建筑電梯調(diào)度算法中最優(yōu)算法之一。
6 結(jié)束語
本文將強(qiáng)化學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)相融合,介紹利用神經(jīng)網(wǎng)絡(luò)強(qiáng)大的存儲能力、泛化能力及函數(shù)估計能力,可以解決強(qiáng)化學(xué)習(xí)領(lǐng)域遇到的連續(xù)狀態(tài)和動作輸入、輸出的問題,學(xué)習(xí)狀態(tài)空間過大的問題以及不確定環(huán)境處理的問題等?;诖?,主要論述了三種神經(jīng)網(wǎng)絡(luò)和強(qiáng)化學(xué)習(xí)的改進(jìn)算法,它們都綜合了神經(jīng)網(wǎng)絡(luò)的特性。最后,簡單介紹了目前基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)應(yīng)用的成功實例。目前,利用神經(jīng)網(wǎng)絡(luò)進(jìn)行強(qiáng)化學(xué)習(xí)依然是研究熱點(diǎn)課題之一。
參考文獻(xiàn):
[1] 高陽,陳世福,陸鑫. 強(qiáng)化學(xué)習(xí)研究綜述[J].自動化學(xué)報,2004,30(1):86-100.
[2] 張濤,吳漢生.基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)算法實現(xiàn)倒立擺控制[J].計算機(jī)仿真,2006,23(4):298-300.
[3] 林聯(lián)明,王浩,王一雄.基于神經(jīng)網(wǎng)絡(luò)的Sarsa強(qiáng)化學(xué)習(xí)算法[J].計算機(jī)技術(shù)與發(fā)展,2006,16(1):30-32.
[4] 段勇,徐心如.基于模糊神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)及其在機(jī)器人導(dǎo)航中的應(yīng)用[J].控制與決策,2007,22(5):525-529.
[5] 劉忠,李海紅,劉全.強(qiáng)化學(xué)習(xí)算法研究[J].計算機(jī)工程與設(shè)計,2008,29(22):5805-5809.
[6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning,1988,3:9-44.
[7] Watkins P.Dayan.Q-Learning.Machine Learning,1992,8(3):279-292.
[8] Rummery G,Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166,Cambridge University Engineering Department,1994.
[9] Sutton R S,Barto A G, Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine,1991,12(2):19-22.
[10] Sutton R S, Barto A G. Reinforcement Learning: An introduction[M].Cambridge:MIT Press ,1998.
[11] Peng J , Dayan P. Q-learning [J]. Machine Learning,1992,8(3):279-292.
[12] Kelley H J , Cliff E M, Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences, 1981, 29(3):277-288.
[13] NELSON H C, YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems, Man and Cybernetics, Part B: Cybernetics,1999,29(2):314-321.
人工神經(jīng)網(wǎng)絡(luò)是近年來迅猛發(fā)展的前沿課題,它對突破現(xiàn)有科學(xué)技術(shù)的瓶頸起到重大的作用。本文剖析了人工神經(jīng)網(wǎng)絡(luò)的特征、模型結(jié)構(gòu)以及未來的發(fā)展趨勢。
【關(guān)鍵詞】人工神經(jīng)網(wǎng)絡(luò) 神經(jīng)元 矩陣
1 人工神經(jīng)網(wǎng)絡(luò)概述
人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種用計算機(jī)網(wǎng)絡(luò)系統(tǒng)模擬生物神經(jīng)網(wǎng)絡(luò)的智能神經(jīng)系統(tǒng),它是在現(xiàn)代神經(jīng)生物學(xué)研究成果的基礎(chǔ)上發(fā)展起來的,模擬人腦信息處理機(jī)制的一種網(wǎng)絡(luò)系統(tǒng),它不但具有處理數(shù)值數(shù)據(jù)的計算能力,而且還具有處理知識的學(xué)習(xí)、聯(lián)想和記憶能力。
人工神經(jīng)網(wǎng)絡(luò)模擬了大腦神經(jīng)元的組織方式,反映了人腦的一些基本功能,為研究人工智能開辟了新的途徑。它具有以下基本特征:
1.1 并行分布性
因為人工神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元排列并不是雜亂無章的,往往是以一種有規(guī)律的序列排列,這種結(jié)構(gòu)非常適合并行計算。同時如果將每一個神經(jīng)元看作是一個基本的處理單元,則整個系統(tǒng)可以是一個分布式處理系統(tǒng),使得計算快速。
1.2 可學(xué)習(xí)性和自適應(yīng)性
一個相對很小的人工神經(jīng)網(wǎng)絡(luò)可存儲大量的專家知識,并能根據(jù)學(xué)習(xí)算法,或利用指導(dǎo)系統(tǒng)模擬現(xiàn)實環(huán)境(稱為有教師學(xué)習(xí)),或?qū)斎脒M(jìn)行自適應(yīng)學(xué)習(xí)(稱為無教師學(xué)習(xí)),可以處理不確定或不知道的事情,不斷主動學(xué)習(xí),不斷完善知識的存儲。
(3)魯棒性和容錯性
由于采用大量的神經(jīng)元及其相互連接,具有聯(lián)想映射與聯(lián)想記憶能力,容錯性保證網(wǎng)絡(luò)將不完整的、畸變的輸入樣本恢復(fù)成完整的原型,魯棒性使得網(wǎng)絡(luò)中的神經(jīng)元或突觸遭到破壞時網(wǎng)絡(luò)仍然具有學(xué)習(xí)和記憶能力,不會對整體系統(tǒng)帶來嚴(yán)重的影響。
1.3 泛化能力
人工神經(jīng)網(wǎng)絡(luò)是大規(guī)模的非線性系統(tǒng),提供了系統(tǒng)協(xié)同和自組織的潛力,它能充分逼近任意復(fù)雜的非線性關(guān)系。如果輸入發(fā)生較小變化,則輸出能夠保持相當(dāng)小的差距。
1.4 信息綜合能力
任何知識規(guī)則都可以通過對范例的學(xué)習(xí)存儲于同一個神經(jīng)網(wǎng)絡(luò)的各連接權(quán)值中,能同時處理定量和定性的信息,適用于處理復(fù)雜非線性和不確定對象。
2 人工神經(jīng)網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)是在對人腦思維方式研究的基礎(chǔ)上,將其抽象模擬反映人腦基本功能的一種并行處理連接網(wǎng)絡(luò)。神經(jīng)元是神經(jīng)網(wǎng)絡(luò)的基本處理單元。
在神經(jīng)網(wǎng)絡(luò)的發(fā)展過程中,從不同角度對神經(jīng)網(wǎng)絡(luò)進(jìn)行了不同層次的描述和模擬,提出了各種各樣的神經(jīng)網(wǎng)絡(luò)模型,其中最具有代表性的神經(jīng)網(wǎng)絡(luò)模型有:感知器、線性神經(jīng)網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)、反饋神經(jīng)網(wǎng)絡(luò)等等。
3 神經(jīng)元矩陣
神經(jīng)元矩陣是神經(jīng)網(wǎng)絡(luò)模型的一種新構(gòu)想,是專門為神經(jīng)網(wǎng)絡(luò)打造的一個矩陣,它符合神經(jīng)元的一切特征。
神經(jīng)元矩陣采用矩陣形式,它可為n維向量組成。引入向量觸頭和信使粒的概念,向量觸頭可生長,即長度可變,方向可變,信使??伞坝问帯痹诰仃囍校⒏鞣N聯(lián)系。如圖1即是神經(jīng)元矩陣模型
(1)容器可產(chǎn)生一種無形的約束力,使系統(tǒng)得以形成,容器不是全封閉的,從而保證系統(tǒng)與外界的溝通和交互;各向量間可用相互作用的力來聯(lián)系,而各個信使粒則受控于容器、中空向量以及其它的信使粒。各神經(jīng)元之間自主交互,神經(jīng)元矩陣是一種多層次的管理,即一層管理一層。系統(tǒng)具有明顯的層級制和分塊制,每層每塊均獨(dú)立且協(xié)同工作,即每層每塊均含組織和自組織因素。
(2)向量觸頭是中空的,信使??梢酝ㄟ^向量或存儲于向量中,所以又稱為中空向量。向量存儲了信使粒后,可以吸引更多的信使粒在附近,或使鄰近向量轉(zhuǎn)向、伸長,進(jìn)而形成相對穩(wěn)定的信息通路。
(3)當(dāng)兩條或更多的信息通路匯集時,可能伴隨著通路的增強(qiáng)、合并,以及信使粒的聚集、交換,這是神經(jīng)元矩陣運(yùn)算的一種主要形式。通路的形成過程,也就是是神經(jīng)元矩陣分塊、分層、形成聯(lián)接的過程,也為矩陣系統(tǒng)宏觀管理、層級控制的實現(xiàn)奠定了基礎(chǔ)。
神經(jīng)元矩陣亦是一種具有生物網(wǎng)絡(luò)特征的數(shù)學(xué)模型,綜合了數(shù)學(xué)上矩陣和向量等重要概念,是一種立體的矩陣結(jié)構(gòu)。尤其是將矩陣的分塊特性和向量的指向特征結(jié)合起來,更好的體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的整體性和單元獨(dú)立性,系統(tǒng)的組織和自組織特征也更為凸顯。信使粒以“點(diǎn)”的數(shù)學(xué)概念,增強(qiáng)了系統(tǒng)的信息特征,尤其是增強(qiáng)了矩陣的存儲和運(yùn)算功能。
4 人工神經(jīng)網(wǎng)絡(luò)的發(fā)展趨勢
人工神經(jīng)網(wǎng)絡(luò)是邊緣叉科學(xué),它涉及計算機(jī)、人工智能、自動化、生理學(xué)等多個學(xué)科領(lǐng)域,研究它的發(fā)展具有非常重要意義。針對神經(jīng)網(wǎng)絡(luò)的社會需求以及存在的問題,今后神經(jīng)網(wǎng)絡(luò)的研究趨勢主要側(cè)重以下幾個方面。
4.1 增強(qiáng)對智能和機(jī)器關(guān)系問題的認(rèn)識
人腦是一個結(jié)構(gòu)異常復(fù)雜的信息系統(tǒng),我們所知道的唯一智能系統(tǒng),隨著信息論、控制論、計算機(jī)科學(xué)、生命科學(xué)的發(fā)展,人們越來越驚異于大腦的奇妙。對人腦智能化實現(xiàn)的研究,是神經(jīng)網(wǎng)絡(luò)研究今后的需要增強(qiáng)的地發(fā)展方向。
4.2 發(fā)展神經(jīng)計算和進(jìn)化計算的理論及應(yīng)用
利用神經(jīng)科學(xué)理論的研究成果,用數(shù)理方法探索智能水平更高的人工神經(jīng)網(wǎng)絡(luò)模型,深入研究網(wǎng)絡(luò)的算法和性能,使離散符號計算、神經(jīng)計算和進(jìn)化計算相互促進(jìn),開發(fā)新的網(wǎng)絡(luò)數(shù)理理論。
4.3 擴(kuò)大神經(jīng)元芯片和神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的作用
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)體現(xiàn)了結(jié)構(gòu)和算法的統(tǒng)一,是硬件和軟件的混合體,神經(jīng)元矩陣即是如此。人工神經(jīng)網(wǎng)絡(luò)既可以用傳統(tǒng)計算機(jī)來模擬,也可以用集成電路芯片組成神經(jīng)計算機(jī),甚至還可以生物芯片方式實現(xiàn),因此研制電子神經(jīng)網(wǎng)絡(luò)計算機(jī)潛力巨大。如何讓傳統(tǒng)的計算機(jī)、人工智能技術(shù)和神經(jīng)網(wǎng)絡(luò)計算機(jī)相融合也是前沿課題,具有十分誘人的前景。
4.4 促進(jìn)信息科學(xué)和生命科學(xué)的相互融合
信息科學(xué)與生命科學(xué)的相互交叉、相互促進(jìn)、相互滲透是現(xiàn)代科學(xué)的一個顯著特點(diǎn)。神經(jīng)網(wǎng)絡(luò)與各種智能處理方法有機(jī)結(jié)合具有很大的發(fā)展前景,如與專家系統(tǒng)、模糊邏輯、遺傳算法、小波分析等相結(jié)合,取長補(bǔ)短,可以獲得更好的應(yīng)用效果。
參考文獻(xiàn)
[1]鐘珞.饒文碧.鄒承明著.人工神經(jīng)網(wǎng)絡(luò)及其融合應(yīng)用技術(shù).科學(xué)出版社.
傳統(tǒng)軋制力模型研究
影響軋制力的因素數(shù)量多且關(guān)系復(fù)雜,如:軋件的化學(xué)成分、軋制溫度、速度、軋輥直徑等。這些因素與軋制力之間多數(shù)為復(fù)雜的非線性關(guān)系;其中主要由是變形區(qū)長度與軋件厚度的比值決定的。
國內(nèi)某廠熱軋機(jī)組采用的是經(jīng)典的軋制力數(shù)學(xué)模型,其基本形式為[3]
RBF(Radial Basis Function)網(wǎng)絡(luò),即徑向基函數(shù)神經(jīng)網(wǎng)絡(luò),是由J.Moody和C.Darken于20世紀(jì)80年代提出的一種神經(jīng)網(wǎng)絡(luò),它是具有單隱層的三層前饋網(wǎng)絡(luò),其結(jié)構(gòu)如圖4所示。
在MATLAB中,徑向基函數(shù)(RBF)網(wǎng)絡(luò)的設(shè)計采用的是神經(jīng)網(wǎng)絡(luò)工具箱中的newrb()函數(shù)。仿真是同BP網(wǎng)絡(luò)仿真所用的函數(shù)一樣,用函數(shù)sim()實現(xiàn)的。
在MATLAB仿真過程中,采用與BP網(wǎng)絡(luò)模型同樣的輸入項、輸出項,最小誤差為0.005,擴(kuò)散速度為0.8,最大神經(jīng)元數(shù)為12。
本文依據(jù)傳統(tǒng)軋制力公式對國內(nèi)某連軋廠的熱連軋機(jī)組軋制力進(jìn)行了理論計算,并且通過數(shù)據(jù)的采集、處理確立了輸入樣本。接著相繼建立了基于BP神經(jīng)網(wǎng)絡(luò)的軋制力模型和基于RBF神經(jīng)網(wǎng)絡(luò)軋制力模型,并在此基礎(chǔ)上利用MATLAB軟件進(jìn)行了仿真。通過對仿真結(jié)果進(jìn)行比較分析,可以得出以下結(jié)論:
由圖3.4、圖3.2和圖2.1的對比,可以看出基于神經(jīng)網(wǎng)絡(luò)(BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò))的軋制力模型的預(yù)報精度大大高于傳統(tǒng)理論模型的預(yù)報精度,可以較好地滿足軋制力預(yù)報要求。但是,建立神經(jīng)網(wǎng)絡(luò)軋制力模型需要解決如何合理選擇各參數(shù)和如何提高預(yù)報精度的問題,并存在如何選擇軋制力影響因素作為輸入量以提高模型精度的問題。
由圖3.4和圖3.2對比,可以看出RBF神經(jīng)網(wǎng)絡(luò)預(yù)報模型的預(yù)報精度總體來說高于BP神經(jīng)網(wǎng)絡(luò)預(yù)報模型的預(yù)報精度。
由仿真結(jié)果對比可知,RBF神經(jīng)網(wǎng)絡(luò)預(yù)報模型偏差的平均值要比BP網(wǎng)絡(luò)模型小20%,而BP神經(jīng)網(wǎng)絡(luò)預(yù)報模型的均方差比RBF網(wǎng)絡(luò)模型小2%,絕對最大偏差小12%;換句話說,RBF網(wǎng)絡(luò)預(yù)報模型的預(yù)報精度要高些,而BP網(wǎng)絡(luò)預(yù)報模型的“平滑度”要比RBF好些。
由于BP網(wǎng)絡(luò)在訓(xùn)練過程中極易陷入局部極小,所以在達(dá)到最大訓(xùn)練次數(shù)時,7個機(jī)架BP網(wǎng)絡(luò)預(yù)報模型的訓(xùn)練時間為107.86秒,而同樣情況下,RBF網(wǎng)絡(luò)預(yù)報模型的訓(xùn)練時間僅為4.016秒。所以使用RBF神經(jīng)網(wǎng)絡(luò)可以大大縮短模型的訓(xùn)練時間。
[1]P.G.J.1isboa編著,邢春潁等澤.現(xiàn)代神經(jīng)網(wǎng)絡(luò)應(yīng)用,北京:電子工業(yè)出版社,1996 Siemens AG.Intelligent answer to HSM control problems.Steel Times International.1996
[2]Kumpati S Narendra,Kannan Parthasarathy,Identification and Control of Dynamical Systems Using Neural Networks,IEEE Trans.on Neural Networks.1990
80年代初,在美國、日本、接著在我國國內(nèi)都掀起了一股研究神經(jīng)網(wǎng)絡(luò)理論和神經(jīng)計算機(jī)的熱潮,并將神經(jīng)網(wǎng)絡(luò)原理應(yīng)用于圖象處理、模式識別、語音綜合及機(jī)器人控制等領(lǐng)域。近年來,美國等先進(jìn)國家又相繼投入巨額資金,制定出強(qiáng)化研究計劃,開展對腦功能和新型智能計算機(jī)的研究。
人腦是自生命誕生以來,生物經(jīng)過數(shù)十億年漫長歲月進(jìn)化的結(jié)果,是具有高度智能的復(fù)雜系統(tǒng),它不必采用繁復(fù)的數(shù)字計算和邏輯運(yùn)算,卻能靈活處理各種復(fù)雜的,不精確的和模糊的信息,善于理解語言、圖象并具有直覺感知等功能。
人腦的信息處理機(jī)制極其復(fù)雜,從結(jié)構(gòu)上看它是包含有140億神經(jīng)細(xì)胞的大規(guī)模網(wǎng)絡(luò)。單個神經(jīng)細(xì)胞的工作速度并不高(毫秒級),但它通過超并行處理使得整個系統(tǒng)實現(xiàn)處理的高速性和信息表現(xiàn)的多樣性。
因此,從信息處理的角度對人腦進(jìn)行研究,并由此研制出一種象人腦一樣能夠“思維”的智能計算機(jī)和智能信息處理方法,一直是人工智能追求的目標(biāo)。
神經(jīng)網(wǎng)絡(luò)就是通過對人腦的基本單元---神經(jīng)元的建模和聯(lián)結(jié),來探索模擬人腦神經(jīng)系統(tǒng)功能的模型,并研制一種具有學(xué)習(xí)、聯(lián)想、記憶和模式識別等智能信息處理功能的人工系統(tǒng)。本文介紹神經(jīng)網(wǎng)絡(luò)的特點(diǎn)以及近年來有關(guān)神經(jīng)網(wǎng)絡(luò)與混沌理論、模糊計算和遺傳算法等相結(jié)合的混合神經(jīng)網(wǎng)絡(luò)研究的動態(tài)。
一.神經(jīng)網(wǎng)絡(luò)和聯(lián)結(jié)主義
回顧認(rèn)知科學(xué)的發(fā)展,有所謂符號主義和聯(lián)結(jié)主義兩大流派。符號主義從宏觀層次上,撇開人腦的內(nèi)部結(jié)構(gòu)和機(jī)制,僅從人腦外在表現(xiàn)出來的智能現(xiàn)象出發(fā)進(jìn)行研究。例如,將記憶、判斷、推理、學(xué)習(xí)等心理活動總結(jié)成規(guī)律、甚至編制成規(guī)則,然后用計算機(jī)進(jìn)行模擬,使計算機(jī)表現(xiàn)出各種智能。
符號主義認(rèn)為,認(rèn)識的基本元素是符號,認(rèn)知過程是對符號表示的運(yùn)算。人類的語言,文字的思維均可用符號來描述,而且思維過程只不過是這些符號的存儲、變換和輸入、輸出而已。以這種方法實現(xiàn)的系統(tǒng)具有串行、線性、準(zhǔn)確、簡潔、易于表達(dá)的特點(diǎn),體現(xiàn)了邏輯思維的基本特性。七十年代的專家系統(tǒng)和八十年代日本的第五代計算機(jī)研究計劃就是其主要代表。
聯(lián)接主義則與其不同,其特點(diǎn)是從微觀出發(fā)。聯(lián)接主義認(rèn)為符號是不存在的,認(rèn)知的基本元素就是神經(jīng)細(xì)胞(神經(jīng)元),認(rèn)知過程是大量神經(jīng)元的聯(lián)接,以及這種聯(lián)接所引起的神經(jīng)元的不同興奮狀態(tài)和系統(tǒng)所表現(xiàn)出的總體行為。八十年代再度興起的神經(jīng)網(wǎng)絡(luò)和神經(jīng)計算機(jī)就是這種聯(lián)接主義的代表。
神經(jīng)網(wǎng)絡(luò)的主要特征是:大規(guī)模的并行處理和分布式的信息存儲,良好的自適應(yīng)、自組織性,以及很強(qiáng)的學(xué)習(xí)功能、聯(lián)想功能和容錯功能。與當(dāng)今的馮.諾依曼式計算機(jī)相比,更加接近人腦的信息處理模式。主要表現(xiàn)如下:
神經(jīng)網(wǎng)絡(luò)能夠處理連續(xù)的模擬信號。例如連續(xù)灰度變化的圖象信號。
能夠處理混沌的、不完全的、模糊的信息。
傳統(tǒng)的計算機(jī)能給出精確的解答,神經(jīng)網(wǎng)絡(luò)給出的是次最優(yōu)的逼近解答。
神經(jīng)網(wǎng)絡(luò)并行分布工作,各組成部分同時參與運(yùn)算,單個神經(jīng)元的動作速度不高,但總體的處理速度極快。
神經(jīng)網(wǎng)絡(luò)信息存儲分布于全網(wǎng)絡(luò)各個權(quán)重變換之中,某些單元障礙并不影響信息的完整,具有魯棒性。
傳統(tǒng)計算機(jī)要求有準(zhǔn)確的輸入條件,才能給出精確解。神經(jīng)網(wǎng)絡(luò)只要求部分條件,甚至對于包含有部分錯誤的輸入,也能得出較好的解答,具有容錯性。
神經(jīng)網(wǎng)絡(luò)在處理自然語言理解、圖象模式識別、景物理解、不完整信息的處理、智能機(jī)器人控制等方面有優(yōu)勢。
符號主義和聯(lián)接主義兩者各有特色,學(xué)術(shù)界目前有一種看法:認(rèn)為基于符號主義得傳統(tǒng)人工智能和基于聯(lián)接主義得神經(jīng)網(wǎng)絡(luò)是分別描述人腦左、右半腦的功能,反映了人類智能的兩重性:精確處理和非精確處理,分別面向認(rèn)識的理性和感性兩個方面,兩者的關(guān)系應(yīng)該是互補(bǔ)而非互相代替。理想的智能系統(tǒng)及其表現(xiàn)的智能行為應(yīng)是兩者相互結(jié)合的結(jié)果。
接下去的問題是,符號AI和聯(lián)接AI具體如何結(jié)合,兩者在智能系統(tǒng)中相互關(guān)系如何?分別扮演什么角色?目前這方面發(fā)表的文獻(xiàn)很多,大致有如下幾種類型:
1.松耦合模型:符號機(jī)制的專家系統(tǒng)與聯(lián)接機(jī)制的神經(jīng)網(wǎng)絡(luò)通過一個中間媒介(例如數(shù)據(jù)文件)進(jìn)行通訊。
2.緊耦合模型:與松耦合模型相比較,其通訊不是通過外部數(shù)據(jù)進(jìn)行,而是直接通過內(nèi)部數(shù)據(jù)完成,具有較高的效率。其主要類型有嵌入式系統(tǒng)和黑板結(jié)構(gòu)等。
3.轉(zhuǎn)換模型:將專家系統(tǒng)的知識轉(zhuǎn)換成神經(jīng)網(wǎng)絡(luò),或把神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換成專家系統(tǒng)的知識,轉(zhuǎn)換前的系統(tǒng)稱為源系統(tǒng),轉(zhuǎn)換后的系統(tǒng)稱為目標(biāo)系統(tǒng),由一種機(jī)制轉(zhuǎn)成另一種機(jī)制。如果源系統(tǒng)是專家系統(tǒng),目標(biāo)系統(tǒng)是神經(jīng)網(wǎng)絡(luò),則可獲得學(xué)習(xí)能力及自適應(yīng)性;反之,可獲得單步推理能力、解釋能力及知識的顯式表示。當(dāng)然,轉(zhuǎn)換需要在兩種的機(jī)制之間,確定結(jié)構(gòu)上的一致性,目前主要問題是還沒有一種完備而精確的轉(zhuǎn)換方法實現(xiàn)兩者的轉(zhuǎn)換。有待進(jìn)一步研究。
4.綜合模型:綜合模型共享數(shù)據(jù)結(jié)構(gòu)和知識表示,這時聯(lián)接機(jī)制和符號機(jī)制不再分開,兩者相互結(jié)合成為一個整體,既具有符號機(jī)制的邏輯功能,又有聯(lián)接機(jī)制的自適應(yīng)和容錯性的優(yōu)點(diǎn)和特點(diǎn)。例如聯(lián)接主義的專家系統(tǒng)等。
近年來神經(jīng)網(wǎng)絡(luò)研究的另一個趨勢,是將它與模糊邏輯、混沌理論、遺傳進(jìn)化算法等相結(jié)合,即所謂“混合神經(jīng)網(wǎng)絡(luò)”方法。由于這些理論和算法都是屬于仿效生物體信息處理的方法,人們希望通過她們之間的相互結(jié)合,能夠獲得具有有柔性信息處理功能的系統(tǒng)。下面分別介紹。
二.混沌理論與智能信息處理
混沌理論是對貌似無序而實際有序,表面上看來是雜亂無章的現(xiàn)象中,找出其規(guī)律,并予以處理的一門學(xué)科。早在七十年代,美國和歐洲的一些物理學(xué)家、生物學(xué)家、數(shù)學(xué)家就致力于尋求在許許多多不同種類的不規(guī)則性之間的聯(lián)系。生物學(xué)家發(fā)現(xiàn)在人類的心臟中有混沌現(xiàn)象存在,血管在顯微鏡下交叉纏繞,其中也有驚人的有序性。在生物腦神經(jīng)系統(tǒng)中從微觀的神經(jīng)膜電位到宏觀的腦電波,都可以觀察到混沌的性態(tài),證明混沌也是神經(jīng)系統(tǒng)的正常特性。
九十年代開始,則更進(jìn)一步將混沌和神經(jīng)網(wǎng)絡(luò)結(jié)合起來,提出多種混沌神經(jīng)網(wǎng)絡(luò)模型,并探索應(yīng)用混沌理論的各種信息處理方法。例如,在神經(jīng)元模型中,引入神經(jīng)膜的不應(yīng)性,研究神經(jīng)元模型的混沌響應(yīng),研究在神經(jīng)網(wǎng)絡(luò)的方程中,不應(yīng)性項的定標(biāo)參數(shù),不定性時間衰減常數(shù)等參數(shù)的性質(zhì),以及這些參數(shù)于神經(jīng)網(wǎng)絡(luò)混沌響應(yīng)的關(guān)系,并確定混沌---神經(jīng)網(wǎng)絡(luò)模型具有混沌解的參數(shù)空間。經(jīng)過試驗,由這種混沌神經(jīng)網(wǎng)絡(luò)模型所繪出的輸出圖形和腦電圖極為相似。
現(xiàn)代腦科學(xué)把人腦的工作過程看成為復(fù)雜的多層次的混沌動力學(xué)系統(tǒng)。腦功能的物理基礎(chǔ)是混沌性質(zhì)的過程,腦的工作包含有混沌的性質(zhì)。通過混沌動力學(xué),研究、分析腦模型的信息處理能力,可進(jìn)一步探索動態(tài)聯(lián)想記憶、動態(tài)學(xué)習(xí)并應(yīng)用到模式識別等工程領(lǐng)域。例如:
對混沌的隨機(jī)不規(guī)則現(xiàn)象,可利用混沌理論進(jìn)行非線性預(yù)測和決策。
對被噪聲所掩蓋的微弱信號,如果噪聲是一種混沌現(xiàn)象,則可通過非線性辨識,有效進(jìn)行濾波。
利用混沌現(xiàn)象對初始值的敏銳依賴性,構(gòu)成模式識別系統(tǒng)。
研究基于混沌---神經(jīng)網(wǎng)絡(luò)自適應(yīng)存儲檢索算法。該算法主要包括三個步驟,即:特征提取、自適應(yīng)學(xué)習(xí)和檢索。
模式特征提取采用從簡單的吸引子到混沌的層次分支結(jié)構(gòu)來描述,這種分支結(jié)構(gòu)有可能通過少數(shù)幾個系統(tǒng)參數(shù)的變化來加以控制,使復(fù)雜問題簡單化。自適應(yīng)學(xué)習(xí)采用神經(jīng)網(wǎng)絡(luò)的誤差反傳學(xué)習(xí)法。檢索過程是通過一個具有穩(wěn)定吸引子的動力學(xué)系統(tǒng)來完成,即利用輸入的初始條件與某個吸引子(輸出)之間的存在直接對應(yīng)關(guān)系的方法進(jìn)行檢索。利用這種方法可應(yīng)用于模式識別。例如黑白圖象的人臉識別。
三.模糊集理論與模糊工程
八十年代以來在模糊集理論和應(yīng)用方面,也有很大進(jìn)展。1983年美國西海岸AI研究所發(fā)表了稱為REVEAL的模糊輔助決策系統(tǒng)并投入市場,1986年美國將模糊邏輯導(dǎo)入OPS---5,并研究成功模糊專家系統(tǒng)外殼FLOPS,1987年英國發(fā)表采用模糊PROLOG的智能系統(tǒng)FRIL等。除此通用工具的研制以外,各國還開發(fā)一系列用于專用目的的智能信息處理系統(tǒng)并實際應(yīng)用于智能控制、模式識別、醫(yī)療診斷、故障檢測等方面。
模糊集理論和神經(jīng)網(wǎng)絡(luò)雖然都屬于仿效生物體信息處理機(jī)制以獲得柔性信息處理功能的理論,但兩者所用的研究方法卻大不相同,神經(jīng)網(wǎng)絡(luò)著眼于腦的微觀網(wǎng)絡(luò)結(jié)構(gòu),通過學(xué)習(xí)、自組織化和非線性動力學(xué)理論形成的并行分析方法,可處理無法語言化的模式信息。而模糊集理論則著眼于可用語言和概念作為代表的腦的宏觀功能,按照人為引入的隸屬度函數(shù),邏輯的處理包含有模糊性的語言信息。
神經(jīng)網(wǎng)絡(luò)和模糊集理論目標(biāo)相近而方法各異。因此如果兩者相互結(jié)合,必能達(dá)到取長補(bǔ)短的作用。將模糊和神經(jīng)網(wǎng)絡(luò)相結(jié)合的研究,約在15年前便已在神經(jīng)網(wǎng)絡(luò)領(lǐng)域開始,為了描述神經(jīng)細(xì)胞模型,開始采用模糊語言,把模糊集合及其運(yùn)算用于神經(jīng)元模型和描述神經(jīng)網(wǎng)絡(luò)系統(tǒng)。目前,有關(guān)模糊---神經(jīng)網(wǎng)絡(luò)模型的研究大體上可分為兩類:一類是以神經(jīng)網(wǎng)絡(luò)為主,結(jié)合模糊集理論。例如,將神經(jīng)網(wǎng)絡(luò)參數(shù)模糊化,采用模糊集合進(jìn)行模糊運(yùn)算。另一類以模糊集、模糊邏輯為主,結(jié)合神經(jīng)網(wǎng)絡(luò)方法,利用神經(jīng)網(wǎng)絡(luò)的自組織特性,達(dá)到柔性信息處理的目的。
與神經(jīng)網(wǎng)絡(luò)相比,模糊集理論和模糊計算是更接近實用化的理論,特別近年來美國和日本的各大公司都紛紛推出各種模糊芯片,研制了型號繁多的模糊推理板,并實際應(yīng)用于智能控制等各個應(yīng)用領(lǐng)域,建立“模糊工程”這樣一個新領(lǐng)域。日本更首先在模糊家電方面打開市場,帶有模糊控制,甚至標(biāo)以神經(jīng)---模糊智能控制的洗衣機(jī)、電冰箱、空調(diào)器、攝象機(jī)等已成為新一代家電的時髦產(chǎn)品。我國目前市場上也有許多洗衣機(jī),例如榮事達(dá)洗衣機(jī)就是采用模糊神經(jīng)網(wǎng)絡(luò)智能控制方式的洗衣機(jī)。
四.遺傳算法
遺傳算法(GeneticAlgorithm:GA)是模擬生物的進(jìn)化現(xiàn)象(自然、淘汰、交叉、突然變異)的一種概率搜索和最優(yōu)化方法。是模擬自然淘汰和遺傳現(xiàn)象的工程模型。
GA的歷史可追溯到1960年,明確提出遺傳算法的是1975年美國Michigan大學(xué)的Holland博士,他根據(jù)生物進(jìn)化過程的適應(yīng)現(xiàn)象,提出如下的GA模型方案:
1.將多個生物的染色體(Chromosmoe)組成的符號集合,按文字進(jìn)行編碼,稱為個體。
2.定義評價函數(shù),表示個體對外部環(huán)境的適應(yīng)性。其數(shù)值大的個體表示對外部環(huán)境的適應(yīng)性高,它的生存(子孫的延續(xù))的概率也高。
3.每個個體由多個“部分”組合而成,每個部分隨機(jī)進(jìn)行交叉及突然變異等變化,并由此產(chǎn)生子孫(遺傳現(xiàn)象)。
4.個體的集合通過遺傳,由選擇淘汰產(chǎn)生下一代。
遺傳算法提出之后,很快得到人工智能、計算機(jī)、生物學(xué)等領(lǐng)域科學(xué)家的高度重視,并在各方面廣泛應(yīng)用。1989年美國Goldberg博士發(fā)表一本專著:“GeneticAlgorithmsinSearch,OptimizationandMachineLearning”。出版后產(chǎn)生較大影響,該書對GA的數(shù)學(xué)基礎(chǔ)理論,GA的基本定理、數(shù)理分析以及在搜索法、最優(yōu)化、機(jī)器學(xué)習(xí)等GA應(yīng)用方面進(jìn)行了深入淺出的介紹,并附有Pascal模擬程序。
1985年7月在美國召開第一屆“遺傳算法國際會議”(ICGA)。以后每隔兩年召開一次。近年來,遺傳算法發(fā)展很快,并廣泛應(yīng)用于信息技術(shù)的各個領(lǐng)域,例如:
智能控制:機(jī)器人控制。機(jī)器人路徑規(guī)劃。
工程設(shè)計:微電子芯片的布局、布線;通信網(wǎng)絡(luò)設(shè)計、濾波器設(shè)計、噴氣發(fā)動機(jī)設(shè)計。
圖象處理:圖象恢復(fù)、圖象識別、特征抽取。
調(diào)度規(guī)劃:生產(chǎn)規(guī)劃、調(diào)度問題、并行機(jī)任務(wù)分配。
優(yōu)化理論:TSP問題、背包問題、圖劃分問題。
人工生命:生命的遺傳進(jìn)化以及自增殖、自適應(yīng);免疫系統(tǒng)、生態(tài)系統(tǒng)等方面的研究。
神經(jīng)網(wǎng)絡(luò)、模糊集理論和以遺傳算法為代表的進(jìn)化算法都是仿效生物信息處理模式以獲得智能信息處理功能的理論。三者目標(biāo)相近而方法各異;將它們相互結(jié)合,必能達(dá)到取長補(bǔ)短、各顯優(yōu)勢的效果。例如,遺傳算法與神經(jīng)網(wǎng)絡(luò)和模糊計算相結(jié)合方面就有:
神經(jīng)網(wǎng)絡(luò)連續(xù)權(quán)的進(jìn)化。
傳統(tǒng)神經(jīng)網(wǎng)絡(luò)如BP網(wǎng)絡(luò)是通過學(xué)習(xí),并按一定規(guī)則來改變數(shù)值分布。這種方法有訓(xùn)練時間過長和容易陷入局部優(yōu)化的問題。采用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)可以克服這個缺點(diǎn)。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的進(jìn)化。
目前神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計全靠設(shè)計者的經(jīng)驗,由人事先確定,還沒有一種系統(tǒng)的方法來確定網(wǎng)絡(luò)結(jié)構(gòu),采用遺傳算法可用來優(yōu)化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)規(guī)則的進(jìn)化。
關(guān)鍵詞:矢量量化;自組織特征映射神經(jīng)網(wǎng)絡(luò);圖像壓縮;主元分析
中圖分類號:TP183文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2008)36-2731-02
The Vector Quantization Based on PCA/SOFM Hybrid Neural Network
HUNG Cui-cui, ZHANG Jian
(Liaoning University of Technology Electronic and Information Engineering College, Jinzhou 121001, China)
Abstract: In order to improve the two main shortcomings of the Kohonen's self-organizing feature map(SOFM) that are high computation complexity and poor codebook quality, the author proposes a vector quantization algorithm based on PCA/SOFM hybrid neural network in this paper. Descend the dimension of imported vectors by using the principal component analysis (PCA) linear neural network. And then, use SOFM neural network to vector quantization. By modifying the learning-rate parameter, topology field weight and initial codebook of the SOFM neural network to optimize network. Simulation results demonstrate that the image compression algorithm can shorten the time and improve the performance of codebook.
Key words: Vector quantization(VQ); Self-organizing feature map neural network (SOFM); image compression; Principle component analysis(PCA)
1 引言
矢量量化[1,2]技術(shù)是一種利用圖像數(shù)據(jù)空間相關(guān)性的高效有損壓縮方法,它具有壓縮比大,編碼速度快等優(yōu)點(diǎn),目前己廣泛用于信號識別、語音編碼、圖像壓縮等領(lǐng)域中。矢量量化優(yōu)越性的體現(xiàn)離不開性能良好的碼書,因而,矢量量化的關(guān)鍵是如何設(shè)計一個最佳碼書,使得用該碼書中的碼字表征輸入矢量空間分布時所引起的量化平均失真最小。近年幾來,許多學(xué)者將SOFM神經(jīng)網(wǎng)絡(luò)應(yīng)用于碼書的設(shè)計[3]。但SOFM算法存在收斂速度慢、計算量大等缺點(diǎn)。陸哲明和孫圣和針對SOFM基本算法的計算量大采用了快速搜索算法,為了提高碼書性能對SOFM基本算法的權(quán)值調(diào)整方法作了一些改進(jìn)[4]。目前越來越多的研究人員把目光投向?qū)⑹噶苛炕c其他的編碼方法相結(jié)合[5]。例如,矢量量化與小波變換結(jié)合的算法[6],分形變換與矢量量化相結(jié)合的算法[7]。PCA是一種有效的圖像變換編碼算法,它能夠提取圖像數(shù)據(jù)的主特征分量,因此能夠降低圖像輸入數(shù)據(jù)維數(shù)。SOFM算法用于圖像矢量量化則具有不易受初始碼書的影響,同時能夠保持圖像數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)等優(yōu)點(diǎn)。為此本文將兩者結(jié)合,提出了PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)圖像混合編碼算法。先用PCA對圖像進(jìn)行降維處理,再用SOFM神經(jīng)網(wǎng)絡(luò)進(jìn)行碼書設(shè)計。本文還對碼書的初始化的選擇問題和神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)進(jìn)行研究。實驗表明,該算法不但大大降低了計算量,而且提高了碼書的性能。
2 PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)的算法
盡管SOFM神經(jīng)網(wǎng)絡(luò)比起LBG算法有很大優(yōu)勢,但SOFM算法仍然存在收斂速度慢。計算量大等缺點(diǎn)。因此本文將PCA與SOFM神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)。PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,先用PCA線性神經(jīng)網(wǎng)絡(luò)對輸入矢量降維處理,從而使得壓縮圖像達(dá)到最小失真。然后用SOFM神經(jīng)網(wǎng)絡(luò)進(jìn)行碼書設(shè)計, PCA線性神經(jīng)網(wǎng)絡(luò)采用Sanger提出的廣義Hebb算法[8]。
2.1 基本PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)算法
1) PCA網(wǎng)絡(luò)權(quán)值Wpi,j和SOFM網(wǎng)絡(luò)權(quán)值初始化;
2) PCA網(wǎng)絡(luò)輸出矢量Yp(t):
(1)
N為PCA神經(jīng)網(wǎng)絡(luò)輸入矢量Xp的維數(shù)。
3) Wpi,j網(wǎng)絡(luò)權(quán)值調(diào)整:
(2)
4) 重復(fù)步驟(2)至(3),直至算法收斂。輸出矢量Ypi(t),并將此作為SOFM的輸入Xi(t);
5) 計算矢量Xi(t)與權(quán)值矢量Wi,j(t)的距離:
(3)
6) 選擇具有最小距離的輸出節(jié)點(diǎn),j*作為獲勝節(jié)點(diǎn),即:
(4)
7) Wij(t) 網(wǎng)絡(luò)權(quán)值調(diào)整:
(5)
8) 重復(fù)步驟(5)至(7),直至算法收斂。
9) 取輸入訓(xùn)練矢量集的下一個輸入矢量,回到步驟(2)反復(fù)進(jìn)行,直到足夠的學(xué)習(xí)次數(shù)或滿足規(guī)定的終止條件為止。
10) 保存所有權(quán)值Wij的值,即設(shè)計碼書。
2.2 PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)的初始化和改進(jìn)
在PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)算法中網(wǎng)絡(luò)的初始化、鄰域函數(shù)和學(xué)習(xí)率函數(shù)非常重要,它直接影響到網(wǎng)絡(luò)的收斂速度和碼書的性能。本文要對這幾個參數(shù)進(jìn)行優(yōu)化以提高壓縮速度和壓縮性能。本文采用一種改進(jìn)的隨機(jī)選取法,使空間分配均勻,不會出現(xiàn)碼字空間分的過細(xì)或過粗的現(xiàn)象。首先,按k維矢量所有元素中最重要的單個元素(即k維歐氏空間中最敏感的方向)大小排序;然后按順序每隔n個矢量取一個矢量作為初始碼書的一個碼字,完成碼書的初始化(n=訓(xùn)練序列中矢量的總數(shù)/碼書的大?。?。
由SOFM基本算法可知,權(quán)矢量Wi(t+1)的更新實質(zhì)上是權(quán)矢量Wit和訓(xùn)練矢量Xi(t)的加權(quán)和。其中學(xué)習(xí)率因子和鄰域函數(shù)非常重要,它們決定算法的收斂速度。下面推導(dǎo)最優(yōu)的學(xué)習(xí)率因子α(t)。由式(5)得:
(6)
可以總結(jié)得:
(7)
令多項式的各項相等可得到最優(yōu)學(xué)習(xí)率因子:
(8)
其鄰域函數(shù)取為:
(9)
式中,hcc典型地取為0.8。T為最大迭代次數(shù),初始值σ0和最終值σT典型地取為0.8和0.1。
3 實驗結(jié)果
為了驗證算法的有效性,本文把基本SOFM編碼算法、基本PCA/SOFM混合神經(jīng)網(wǎng)絡(luò)編碼算法和改進(jìn)PCA/SOFM算法分別用于圖像的壓縮編碼。本文采用的是512×512像素,256級灰度的Lena圖像用于訓(xùn)練圖像進(jìn)行碼書設(shè)計。首先將圖像分為4×4子塊,然后將每一小塊的16個像素灰度值作一個訓(xùn)練矢量,送入PCA線性神經(jīng)網(wǎng)絡(luò)。PCA線性神經(jīng)網(wǎng)絡(luò)輸出節(jié)點(diǎn)為8維PCA變換系數(shù)矢量,同時將它作為SOFM神經(jīng)網(wǎng)絡(luò)的輸入矢量,用于進(jìn)行碼本設(shè)計。進(jìn)過多次實驗,取其平均值作為實驗結(jié)果,圖3給出了各種算法在相同壓縮比的情況下恢復(fù)圖像的對比。表1給出了各算法編碼后的尖峰信噪比PSNR和碼書設(shè)計時間的比較。
從測試的結(jié)果可以看出改進(jìn)PCA/SOFM算法優(yōu)于基本SOFM算法和基本PCA/SOFM算法,該算法縮短了碼書設(shè)計的時間,圖像的恢復(fù)質(zhì)量有所提高,取得了令人滿意的結(jié)果。從而證明本文提出的算法是一種行之有效的方法。
4 結(jié)束語