前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)過擬合的表現(xiàn)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);RBF神經(jīng)網(wǎng)絡(luò);損傷識(shí)別;損傷預(yù)測
Abstract:In this paper, the BP neural network and the RBF neural network are compared combined with practical engineering examples. The analysis result shows that the RBF neural network was closer to the actural working conditions of structure.Then, the Least squares method was used to fit and predict the deflection damage parameters.Finally, the predicted data was recognised by using RBF neural network, to achieve the objectve of prevention.
Keywords: BP neural network; RBF neural network; damage recognition; damage prediction
中圖分類號(hào):TU74文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):
目前,神經(jīng)網(wǎng)絡(luò)由于自身的特性,在損傷模式識(shí)別領(lǐng)域中有著越來越廣泛的應(yīng)用。當(dāng)橋梁結(jié)構(gòu)出現(xiàn)損傷時(shí),結(jié)構(gòu)中的各個(gè)參量或部分參量將表現(xiàn)出與正常狀態(tài)下的不同特征。橋梁損傷識(shí)別的主要任務(wù)就是如何找到損傷的特征描述,并利用其進(jìn)行損傷診斷和結(jié)構(gòu)安全度的評(píng)估。前向BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)的學(xué)習(xí)算法屬于有教師型的。這種算法模型具有很好的推廣能力,用于損傷模式識(shí)別的效果比較好。訓(xùn)練好的BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)計(jì)算速度快、內(nèi)存消耗低,可用于實(shí)時(shí)監(jiān)測和診斷。以下,著重介紹BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)。
1基于BP算法的多層前饋網(wǎng)絡(luò)模型
采用BP算法的多層前饋網(wǎng)絡(luò)是至今為止應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò),BP網(wǎng)絡(luò)是一種具有三層或三層以上的神經(jīng)網(wǎng)絡(luò),包括輸入層、中間層(隱層)和輸出層。上下層之間實(shí)現(xiàn)全連接,而每層神經(jīng)元之間無連接。在多層前饋網(wǎng)絡(luò)的應(yīng)用中,以單隱層網(wǎng)絡(luò)的應(yīng)用最為普遍。一般習(xí)慣將單隱層前饋網(wǎng)絡(luò)稱為三層前饋網(wǎng)或三層感知器。
2徑向基函數(shù)(RBF)網(wǎng)絡(luò)
徑向基函數(shù)(Radial-Basis Function,RBF)網(wǎng)絡(luò)包括三層,輸入層由信號(hào)源節(jié)點(diǎn)(感知單元)組成,它們將網(wǎng)絡(luò)與外界環(huán)境連結(jié)起來;徑向基隱層含S1個(gè)神經(jīng)元,線性輸出層含S2個(gè)神經(jīng)元。分別是兩層網(wǎng)絡(luò)的權(quán)值和閾值;S1、S2是兩層的神經(jīng)元的個(gè)數(shù);是兩層的輸出;P是輸入;下標(biāo)表示量的行列數(shù)。隱層中的神經(jīng)元采用徑向基傳遞函數(shù)()。輸出層中的神經(jīng)元采用線性傳遞函數(shù)()。
3小溝橋橋跨結(jié)構(gòu)損傷識(shí)別模型
小溝橋的各個(gè)子系統(tǒng)運(yùn)行以來,工作狀態(tài)良好,性能可靠。經(jīng)過比對(duì)實(shí)驗(yàn),該系統(tǒng)能夠真實(shí)的反映橋梁的各個(gè)待測參數(shù),并且具有自動(dòng)歸納分類的功能。小溝橋右幅橋在某兩年24個(gè)月的數(shù)據(jù)訓(xùn)練樣本格式為,輸入向量依次為撓度、振動(dòng)、應(yīng)力、溫度、載重、通行量,目標(biāo)向量是撓度和應(yīng)變兩項(xiàng)的期望輸出值(“0”表示完好狀態(tài),“1”表示危險(xiǎn)狀態(tài))。同時(shí),對(duì)模型進(jìn)行損傷仿真的模擬訓(xùn)練。接下來,借助于MATLAB7里所對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)工具箱,分別用BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)對(duì)以上表1所規(guī)定的數(shù)據(jù)樣本進(jìn)行網(wǎng)絡(luò)訓(xùn)練。
3.1基于BP網(wǎng)絡(luò)的損傷識(shí)別
由于網(wǎng)絡(luò)輸入變量已經(jīng)確定,需要進(jìn)行歸一化處理,這里將其變換在[0,1]的范圍內(nèi),經(jīng)過歸一化處理的數(shù)據(jù)對(duì)于神經(jīng)網(wǎng)絡(luò)更容易訓(xùn)練和學(xué)習(xí)。利用以下代碼來創(chuàng)建以上剛剛設(shè)計(jì)的網(wǎng)絡(luò)。
Threshold=[01;01; 01;01;01;01]
net=newff(threshold,[13,2],{‘tansig’,‘logsig’},‘trainlm’);
其中,變量threshold定義了輸入向量的最大值和最小值。接下來,對(duì)所建網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過調(diào)整,使網(wǎng)絡(luò)的輸出誤差達(dá)到最小,滿足實(shí)際應(yīng)用的要求。訓(xùn)練函數(shù)trainlm是利用Levenberg-Marquardt算法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的。
網(wǎng)絡(luò)訓(xùn)練結(jié)果為:
TRAINLM, Epoch 0/1 000, MSE 0.471 248/0.001, Gradient 2.116 8/1e−010
TRAINLM, Epoch 19/1 000, MSE 0.000 158 792/0.001, Gradient 0.037 399 1/1e−010
TRAINLM, Performance goal met.
經(jīng)過19次訓(xùn)練后,網(wǎng)絡(luò)的性能就達(dá)到了要求,并利用原始樣本輸入數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練,得到逼近誤差曲線。
3.2基于RBF網(wǎng)絡(luò)的損傷識(shí)別
利用函數(shù)newrb創(chuàng)建一個(gè)徑向基神經(jīng)網(wǎng)絡(luò),調(diào)用格式為:
[net,tr]=newrb(P,T,GOAL,SPREAD,MN,DF);
在網(wǎng)絡(luò)設(shè)計(jì)過程中,需要用不同的SPREAD值進(jìn)行嘗試,以確定一個(gè)最優(yōu)值。最終,確定網(wǎng)絡(luò)創(chuàng)建函數(shù)為:net=newrb (P, T, 0,0.2,25,5);
通過上述代碼,創(chuàng)建了一個(gè)目標(biāo)誤差為0、徑向基函數(shù)分布密度為0.2、中間層神經(jīng)元個(gè)數(shù)最大值為25、顯示間隔為5的RBF網(wǎng)絡(luò)。當(dāng)中間層神經(jīng)元個(gè)數(shù)增至25時(shí),網(wǎng)絡(luò)輸出的誤差SSE已經(jīng)非常小了,數(shù)量級(jí)為10−31。
以訓(xùn)練樣本對(duì)上面建立的RBF網(wǎng)絡(luò)進(jìn)行測試,得到逼近誤差曲線數(shù)量級(jí)為10−16。因此,可以判定經(jīng)過訓(xùn)練后,網(wǎng)絡(luò)是可以滿足要求的。
3.3BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)比對(duì)
綜合對(duì)比兩種網(wǎng)絡(luò)的訓(xùn)練誤差、逼近誤差等,發(fā)現(xiàn)BP網(wǎng)絡(luò)由于收斂速度慢、較長的訓(xùn)練時(shí)間、網(wǎng)絡(luò)往往存在很大的冗余性,在一定程度上增加了網(wǎng)絡(luò)學(xué)習(xí)的負(fù)擔(dān),并且網(wǎng)絡(luò)的學(xué)習(xí)和記憶具有不穩(wěn)定性。因此,BP網(wǎng)絡(luò)明顯不如RBF網(wǎng)絡(luò),認(rèn)為用RBF網(wǎng)絡(luò)更能準(zhǔn)確地評(píng)估橋跨結(jié)構(gòu)的損傷,接近于實(shí)際工作狀態(tài)。
3.4最小二乘擬合的Matlab設(shè)計(jì)與實(shí)現(xiàn)
Matlab軟件是集數(shù)值計(jì)算、符號(hào)運(yùn)算及出色的圖形處理、程序語言設(shè)計(jì)等強(qiáng)大功能于一體的科學(xué)計(jì)算語言。由于撓度是橋梁工作性能的一個(gè)重要參數(shù),它更加直接地反應(yīng)了橋梁結(jié)構(gòu)的工作狀況,所以接下來以撓度數(shù)據(jù)為例運(yùn)用最小二乘法進(jìn)行曲線擬合,并預(yù)測。
確定參量的測量值:
=[1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9];
=[11.83 12.48 11.84 11.97 11.76 11.48 11.68 11.89 12.57 11.49 11.52 11.59 11.45 11.61 11.53 11.83 12.52 12.41 12.13 11.95 12.26];
用Matlab語言中的plot函數(shù)的曲線散點(diǎn)趨勢圖,以此圖對(duì)比典型曲線圖,選擇合適的經(jīng)驗(yàn)公式,確定多項(xiàng)式的擬合次數(shù),多次實(shí)驗(yàn)后,確定為4;
Matlab系統(tǒng)設(shè)計(jì)polyfit函數(shù)采用最小二乘法原理對(duì)給定的數(shù)據(jù)組進(jìn)行多項(xiàng)式擬合,最后給出擬合的多項(xiàng)式系數(shù),溫度擬合曲線的多項(xiàng)式為:
并擬合接下來的兩個(gè)月的撓度值;
同理,對(duì)振動(dòng)、應(yīng)力、溫度、載重、通行量項(xiàng)目的數(shù)據(jù)進(jìn)行擬合。
3.5對(duì)預(yù)測數(shù)據(jù)進(jìn)行損傷評(píng)估
以表3中最后兩列的預(yù)測數(shù)據(jù)作為輸入量,即
p_test=[12.11 3.31 0.91 7.66 162.9534 30.5539;
11.93 3.32 0.92 −3.12 162.6354 30.5567];
經(jīng)過歸一化處理后為P_test,利用先前所建立的RBF網(wǎng)絡(luò)來進(jìn)行損傷評(píng)估,y=sim(net,P_test);
得到兩個(gè)指標(biāo)的損傷指數(shù)分別為:[0.2187e−0080.0001e−008;−0.0144e−0080.0629e−008],數(shù)量級(jí)為10−8,接近于“0”,表明結(jié)構(gòu)在接下來的兩個(gè)月應(yīng)該處于完好狀態(tài)。
4結(jié)束語
針對(duì)小溝橋的歷史數(shù)據(jù),分別用BP網(wǎng)絡(luò)和RBF網(wǎng)絡(luò)對(duì)樣本數(shù)據(jù)進(jìn)行損傷訓(xùn)練、測試。綜合對(duì)比后,采用RBF網(wǎng)絡(luò)對(duì)橋跨結(jié)構(gòu)進(jìn)行損傷評(píng)估,并作為后續(xù)對(duì)橋梁結(jié)構(gòu)進(jìn)行整體評(píng)估的兩個(gè)底層指標(biāo)。
采用最小二乘法對(duì)24個(gè)月以來的歷史數(shù)據(jù)進(jìn)行曲線擬合,預(yù)測出后續(xù)的兩組數(shù)據(jù);然后對(duì)預(yù)測出來的兩組數(shù)據(jù)進(jìn)行損傷識(shí)別,得出兩個(gè)指標(biāo)的損傷指數(shù),從而真正達(dá)到預(yù)測,進(jìn)而達(dá)到預(yù)防的目的。
參考文獻(xiàn):
[1] 飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.3:89~108
[2] 胡伍生.神經(jīng)網(wǎng)絡(luò)理論及其工程應(yīng)用[M].北京:測繪出版社,2006:63~83
[3] 王可,毛志.基于Matlab實(shí)現(xiàn)最小二乘曲線擬合[J].北京廣播學(xué)院學(xué)報(bào)(自然科學(xué)版),2002,12(2):52~56
[4] 李麗,王振領(lǐng).MATLAB工程計(jì)算機(jī)應(yīng)用[M].北京:人民郵電出版社,2001
關(guān)鍵詞: 鐵路交通; 信息預(yù)測; 數(shù)據(jù)融合; 神經(jīng)網(wǎng)絡(luò)
在城市地鐵交通中,各車站交通流量信息(如候乘數(shù)量、下車數(shù)量等) 的準(zhǔn)確預(yù)測有利于地鐵運(yùn)行高效、及時(shí)地調(diào)度,從而既達(dá)到增加效益的經(jīng)濟(jì)目的,又可以更好地滿足人們的乘車需求。傳統(tǒng)的預(yù)測方法有回歸分析算法以及Kalman 濾波等。這些方法假定過程是平穩(wěn)的,系統(tǒng)是線性的,系統(tǒng)的干擾是白噪聲,因此在線性系統(tǒng)平穩(wěn)的隨機(jī)時(shí)間序列預(yù)測中能夠獲得滿意的結(jié)果。然而,交通問題是有人參與的主動(dòng)系統(tǒng),具有非線性和擾動(dòng)性強(qiáng)的特征,前述方法難以奏效,表現(xiàn)為以下缺點(diǎn): ① 每次采樣的數(shù)據(jù)變化較小時(shí)適用,數(shù)據(jù)變化大誤差就大; ② 預(yù)測值的變化總是滯后于實(shí)測值的變化; ③ 無法消除奇異信息的影響?;谛〔ǚ治龅膭?dòng)態(tài)數(shù)據(jù)預(yù)測方法以小波變換后的數(shù)據(jù)進(jìn)行預(yù)測,克服了傳統(tǒng)預(yù)測方法不能消除奇異信息的缺點(diǎn), 有效地預(yù)測動(dòng)態(tài)的流量信息[ 1 ] 。但該方法只能對(duì)單個(gè)的數(shù)據(jù)序列進(jìn)行處理,而事實(shí)上能夠用于預(yù)測的數(shù)據(jù)可以是多方面的。
數(shù)據(jù)融合(Data2Fusion) 技術(shù)起源并發(fā)展于軍事領(lǐng)域,主要用于目標(biāo)的航跡跟蹤、定位與身份識(shí)別以及態(tài)勢評(píng)估等[ 2 ] 。傳統(tǒng)的數(shù)據(jù)融合技術(shù)大多采用概率理論(如Bayes 決策理論) 對(duì)多種信息的獲取與處理進(jìn)行研究,從而去掉信息的無用成分,保留有用成分[ 3 ] 。在信息處理中,分別運(yùn)用各種體現(xiàn)數(shù)據(jù)不同屬性特征的方法處理(如預(yù)測) 后進(jìn)行融合是一個(gè)有待深入研究的問題。為了充分利用各方面已有的數(shù)據(jù),獲得可靠的交通流量動(dòng)態(tài)預(yù)測,本文借鑒數(shù)據(jù)融合的基本思想,提出了在數(shù)據(jù)處理方法上的融合預(yù)測方法。
1 流量融合預(yù)測模型
1. 1 預(yù)測模型的結(jié)構(gòu)
由于預(yù)測對(duì)象的復(fù)雜性,為了表現(xiàn)與預(yù)測對(duì)象相關(guān)聯(lián)的其他對(duì)象或?qū)傩?,每個(gè)關(guān)聯(lián)對(duì)象(屬性) 用一個(gè)時(shí)間序列來表示,作為預(yù)測對(duì)象的相關(guān)序列。所有用于預(yù)測的相關(guān)序列構(gòu)成預(yù)測對(duì)象的相關(guān)序列集。由于在預(yù)測中具有不同的作用,各相關(guān)序列將使用不同的處理和預(yù)測方法。在相關(guān)序列集上的地鐵客流量融合預(yù)測模型結(jié)構(gòu),如圖1 所示。
下面針對(duì)城市地鐵車站客流量的預(yù)測進(jìn)行論述。
1. 2 構(gòu)造相關(guān)序列集
為了預(yù)測車站(序號(hào)為0)在第i 天t 時(shí)刻的流量^F0 i(t) ( 實(shí)測值為F0 i(t)) ,設(shè)t 時(shí)刻^F0 i(t)的相關(guān)時(shí)間序列集為f(t) = {fj(t) ,1 ≤ j ≤ n} ( 1 ) 式中,fj(t)為t時(shí)刻^F0 i(t)的相關(guān)時(shí)間序列; n 為相關(guān)時(shí)間序列數(shù)。
為了獲得精確的預(yù)測,可以根據(jù)關(guān)聯(lián)特性構(gòu)造任意多個(gè)相關(guān)時(shí)間序列。本文意在闡明本算法的基本思想,將流量數(shù)據(jù)僅僅構(gòu)造為3 類相關(guān)序列:當(dāng)前序列、歷史序列和鄰站序列。
當(dāng)前序列 預(yù)測時(shí)刻t之前本站最近k次流量按時(shí)間先后記錄下來的數(shù)據(jù)構(gòu)成的時(shí)間序列為當(dāng)前序列,即
f1 (t) = { F0 i(t -l),1 ≤ l ≤ k} ( 2 )
該序列數(shù)據(jù)的主要影響因素是時(shí)刻,同時(shí)還受人為、氣溫、天氣等其他擾動(dòng)因素的影響,數(shù)據(jù)分布的非線性特性較大,頻帶較寬。第l 班列車的流量如圖2 所示。
歷史序列 同為工作日或同為節(jié)假日的相鄰數(shù)天,其流量曲線形狀相對(duì)類似,流量曲線相似的日期在預(yù)測中具有較大的參考意義。本站最近m 天在時(shí)刻t 的流量按日期先后記錄下來的數(shù)據(jù)構(gòu)成的時(shí)間序列為歷史序列,即f2 (t) = { F0 i-p(t) ,1 ≤ p ≤ m} ( 3 )
工作日和節(jié)假日流量差別較大,可將它們分類處理。該序列整體分布較平穩(wěn),有震蕩,但頻帶較窄。第p個(gè)工作日在時(shí)刻t的流量如圖3 所示。
鄰站序列 圖4 為本站與鄰近2 個(gè)車站24 h 的流量曲線經(jīng)DB2 小波3 層變換后的近似分量,可見各分量關(guān)聯(lián)性較大。如果根據(jù)以前的數(shù)據(jù)將各鄰近車站相互關(guān)系解算出來,就可以利用這種函數(shù)關(guān)系預(yù)測時(shí)刻t在本站的流量。最近m天在時(shí)刻t 的流量按日期先后記錄下來的各鄰站歷史序列為本站的鄰站序列,即
qf2 +q(t) = { Fi-p(t) ,1 ≤ p ≤ m,1 ≤ q ≤ s} ( 4 )
q式中, Fi-p(t)表示第q個(gè)鄰近站的第(i -p)天的流量;s 表示鄰近站數(shù)。
1.3 相關(guān)序列的預(yù)測
由于各相關(guān)序列在預(yù)測中具有不同的影響,且分布規(guī)律和特點(diǎn)差異較大,因而各序列使用不同的預(yù)測方法。本文對(duì)當(dāng)前序列進(jìn)行小波分解后用Kalman 預(yù)測,對(duì)歷史序列直接進(jìn)行Kalman 預(yù)測,對(duì)鄰站序列用冪級(jí)數(shù)多項(xiàng)式進(jìn)行擬合。
1.3.1 小波分析
根據(jù)設(shè)置的分解指數(shù)η對(duì)序列進(jìn)行小波N 尺度分解,得到一組低頻信號(hào)和N 組高頻信號(hào),對(duì)這N + 1 組信號(hào)分別用Mallat 塔式算法重構(gòu)到原尺度上,得到N + 1 組在原始尺度上的經(jīng)過分解重構(gòu)處理的信號(hào)。分別對(duì)信號(hào)用Kalman 濾波進(jìn)行預(yù)測,得到N + 1 個(gè)預(yù)測值,再將這N + 1 個(gè)預(yù)測值用權(quán)系數(shù)合成最終的預(yù)測值。具體算法請(qǐng)參見文獻(xiàn)[1 ]。
1.3.2 Kalman 濾波離散線性Kalman 濾波方程為
F(t) = Φ(t -1) F(t -1) + W(t -1)( 5 ) 式中,Φ (t) 為系統(tǒng)狀態(tài)轉(zhuǎn)移量; W(t) 為系統(tǒng)誤差。Kalman 濾波通過t -1 時(shí)刻的狀態(tài)F(t -1)估計(jì)t 時(shí)刻的狀態(tài)F(t) 。具體算法請(qǐng)參見文獻(xiàn)[1 ]。
1.3.3 多項(xiàng)式擬合
分別對(duì)各鄰站序列用冪級(jí)數(shù)多項(xiàng)式擬合本站數(shù)據(jù),擬合模型如下
n
i
p
^Fp(t) = αp,i(t) F(t) ( 6 )
i=0
i
6 式中, Fp (t)為對(duì)第p個(gè)鄰站在時(shí)刻t 的流量的i 次i 冪;αp,i(t)為Fp (t)的系數(shù)。當(dāng)n= 2 時(shí),上述擬合算法簡化為線性回歸模型。
1.4 流量的融合預(yù)測設(shè)預(yù)測對(duì)象共有n個(gè)相關(guān)的時(shí)間序列fi(t) ,經(jīng)過預(yù)處理分別為fi(t) ,融合預(yù)測模型可表示^F(t)在f(t)上的映射,即^F(t) =ζ(f(t)) =ζ(f1 (t) ,f2 (t) ,fn(t)) ( 7 ) 式中,ζ(·)表示映射關(guān)系。特別地,式(7)可簡化為如下的線性映射組合^F(t) = αi(t)ξ(fi(t)) ( 8 ) i=16
式中,αi(t)為t 時(shí)刻的序列fi (t)的權(quán)系數(shù);ξ(fi (t)) 為以fi (t)為依據(jù)的局部預(yù)測值。為了確定上述算法中映射關(guān)系ζ(·),本文采用神經(jīng)網(wǎng)絡(luò)進(jìn)行解算。
2 模型的神經(jīng)網(wǎng)絡(luò)解算
神經(jīng)網(wǎng)絡(luò)是由大量簡單的神經(jīng)元以某種拓?fù)浣Y(jié)構(gòu)廣泛地相互連接而成的非線性動(dòng)力學(xué)系統(tǒng)[4 ]。神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)融合技術(shù)中具有無法替代的作用,通過神經(jīng)網(wǎng)絡(luò)對(duì)各相關(guān)序列的局部預(yù)測進(jìn)行最終融合,具體過程如下。
2.1 數(shù)據(jù)的局部處理
廣州市地鐵某站一個(gè)方向的流量數(shù)據(jù)是以每班列車到站上車的人數(shù)記錄的(流量單位:人/班) 。根據(jù)2002 年5 月1 日 2003 年3 月2 日的流量數(shù)據(jù),運(yùn)用本文算法進(jìn)行預(yù)測。按照1.2 節(jié)的方法構(gòu)造了4 個(gè)相關(guān)序列:當(dāng)前序列f1 (t) 、歷史序列f2 (t)以及相鄰2 個(gè)車站的鄰站序列f3 (t)和f4 (t) 。 2.2 神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)
因?yàn)? 層神經(jīng)網(wǎng)絡(luò)可以一致逼近任何非線性函數(shù)[5 ]。采用具有單隱層的3 層神經(jīng)網(wǎng)絡(luò)作為模型,即輸入層、隱層和輸出層。
以各相關(guān)序列的局部預(yù)測值作為輸入向量,實(shí)測值F(t)為期望輸出,有4 個(gè)輸入節(jié)點(diǎn),1 個(gè)輸出節(jié)點(diǎn)。隱層神經(jīng)元數(shù)量關(guān)系到網(wǎng)絡(luò)的訓(xùn)練速度和精度問題。對(duì)于一定數(shù)量的樣本,需要一定數(shù)量的隱層神經(jīng)元數(shù), 神經(jīng)元少了,不能反映樣本的規(guī)律;多了,則神經(jīng)網(wǎng)絡(luò)以過于復(fù)雜的非線性關(guān)系來擬合輸入輸出之間的關(guān)系,使得模型的學(xué)習(xí)時(shí)間大大增加。本例中,8 個(gè)隱層神經(jīng)元數(shù)是最好的。以誤差平方和SSE(Sum2Squared Error ) 作為訓(xùn)練評(píng)價(jià)標(biāo)準(zhǔn), SSE = p j (Ypj-Opj)2 ,其中Ypj和Opj分別為輸出層第j個(gè)神經(jīng)元的第p個(gè)樣本的期望輸出和實(shí)際輸出(本例中j= 1 ,p= 60) 。
用MATLAB 的ANN 工具箱構(gòu)造神經(jīng)網(wǎng)絡(luò)。隱層神經(jīng)元的激勵(lì)函數(shù)為tansig 函數(shù)( 正切S 型傳遞函數(shù)),輸出層神經(jīng)元的激勵(lì)函數(shù)為purelin 函數(shù)(線性傳遞函數(shù)),這樣整個(gè)網(wǎng)絡(luò)的輸出可以取任意值。采取批處理學(xué)習(xí)方式和快速BP 算法訓(xùn)練。
2. 3 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
將網(wǎng)絡(luò)的訓(xùn)練標(biāo)準(zhǔn)SSE 設(shè)為64(60 組訓(xùn)練樣本), 利用上述樣本對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練6 000 次時(shí)網(wǎng)絡(luò)的權(quán)值和閾值將達(dá)到最佳值,即達(dá)到了訓(xùn)練目標(biāo)。神經(jīng)網(wǎng)絡(luò)訓(xùn)練目標(biāo)接近過程,如圖5 所示。
從圖5 中可以看出,訓(xùn)練開始時(shí),網(wǎng)絡(luò)收斂速度較快,接近目標(biāo)時(shí)收斂速度會(huì)減慢??梢?,訓(xùn)練次數(shù)越多,得到的結(jié)果越好。當(dāng)然,這是以訓(xùn)練時(shí)間的增長作為代價(jià)的。
3 實(shí)驗(yàn)對(duì)比分析
采用本文算法和傳統(tǒng)的Kalman 算法分別對(duì)2003 年3 月2 日的各整點(diǎn)時(shí)刻的流量進(jìn)行預(yù)測。算法各時(shí)刻均通過訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)預(yù)測,預(yù)測與實(shí)測結(jié)果的比較,如圖6 所示。
傳統(tǒng)的Kalman 濾波是直接在當(dāng)前序列的基礎(chǔ)上進(jìn)行預(yù)測的, 預(yù)測與實(shí)測結(jié)果的比較如圖7 所示。2 種預(yù)測方法的誤差指標(biāo)對(duì)比見表1 。
表1 實(shí)驗(yàn)結(jié)果對(duì)比
比較可得,由于傳統(tǒng)的Kalman 預(yù)測方法只能以某一類序列的數(shù)據(jù)作為預(yù)測基礎(chǔ),無法利用其他序列信息,且對(duì)變化大的數(shù)據(jù)采樣要求較高,因而具有較大的誤差,而本文所述方法有效地克服了這些缺點(diǎn)。
4 結(jié)論
通過分析城市地鐵站客流量的相互關(guān)系和特點(diǎn), 在對(duì)流量信息進(jìn)行以預(yù)測為目的相關(guān)序列集構(gòu)造的基礎(chǔ)上,提出了一種基于數(shù)據(jù)融合的預(yù)測模型。該預(yù)測模型不僅是一個(gè)多信息接收和處理的融合模型,而且還是一個(gè)動(dòng)力學(xué)系統(tǒng),網(wǎng)絡(luò)的訓(xùn)練樣本也是動(dòng)態(tài)的,如果訓(xùn)練的次數(shù)適當(dāng),預(yù)測的精度也可以隨之變化調(diào)整。實(shí)驗(yàn)結(jié)果表明,基于數(shù)據(jù)融合的預(yù)測與傳統(tǒng)的預(yù)測方法相比,由于充分利用了所有預(yù)測信息,在預(yù)測的準(zhǔn)確程度上有較大提高。
參考文獻(xiàn):
[1 ] 李存軍, 等. 基于小波分析的交通流量預(yù)測方法[J ] . 計(jì)算機(jī)應(yīng)用, 2003 , 23(12) : 7 —8.
[2 ] 權(quán)太范. 信息融合: 神經(jīng)網(wǎng)絡(luò) 模糊推理理論與應(yīng)用[M] . 北京: 國防工業(yè)出版社, 2002.
[3 ] . 信息融合技術(shù)[ M ] . 北京: 國防工業(yè)出版社, 1996.
[關(guān)鍵詞] 藥品;神經(jīng)網(wǎng)絡(luò);組合預(yù)測;需求預(yù)測
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2014 . 08. 051
[中圖分類號(hào)] TP183 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1673 - 0194(2014)08- 0084- 05
0 引 言
隨著人工智能技術(shù)的發(fā)展,人工神經(jīng)網(wǎng)絡(luò)得到了廣泛研究和應(yīng)用。由于神經(jīng)網(wǎng)絡(luò)具有良好的學(xué)習(xí)能力和較強(qiáng)的非線性處理能力、不依賴于特定數(shù)學(xué)模型等優(yōu)勢,其作為一種預(yù)測方法已被廣泛應(yīng)用于許多領(lǐng)域。
在醫(yī)藥企業(yè)、醫(yī)藥衛(wèi)生管理領(lǐng)域,藥品需求預(yù)測一直是管理部門關(guān)心的熱點(diǎn)問題。藥品需求除了受由藥品自身屬性影響外,還受國家政策或醫(yī)藥行業(yè)規(guī)定等因素的影響,如藥品在某地區(qū)是否中標(biāo)、是否為處方藥等;同時(shí),制藥企業(yè)自身制定的定價(jià)、渠道以及促銷等營銷策略和銷售團(tuán)隊(duì)的組建制度也對(duì)藥品需求產(chǎn)生不同程度的影響。藥品需求特征的多樣性,決定了藥品需求預(yù)測本質(zhì)上是一個(gè)復(fù)雜的非線性系統(tǒng)建模問題。
國內(nèi)外眾多學(xué)者對(duì)藥品需求預(yù)測進(jìn)行了深入的研究,產(chǎn)生了一批有價(jià)值的研究成果。目前,藥品需求預(yù)測的主要方法包括:回歸分析法、時(shí)間序列分析法、神經(jīng)網(wǎng)絡(luò)、遺傳算法等。這些方法從不同角度出發(fā)建模,均取得一定效果,尤其是BP神經(jīng)網(wǎng)絡(luò),已經(jīng)在藥品預(yù)測研究中取得了眾多應(yīng)用。盡管相關(guān)討論和研究不斷增多,但是目前常用的神經(jīng)網(wǎng)絡(luò)預(yù)測方法普遍存在以下問題:由于藥品需求特征頗為復(fù)雜的特殊性,運(yùn)用單項(xiàng)預(yù)測方法對(duì)其進(jìn)行預(yù)測無法涵蓋其較多的特征信息,通常表現(xiàn)為對(duì)某類特定的藥品預(yù)測效果良好,而對(duì)其他藥品則預(yù)測性能較差,從一定程度上限制了預(yù)測模型的適用范圍。
本文采用基于神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型來解決上述問題。組合預(yù)測方法(combined forecasting)是指通過一定數(shù)學(xué)方法將不同的單項(xiàng)預(yù)測模型組合起來,綜合利用各種單項(xiàng)預(yù)測方法所提供的信息,從而達(dá)到提高預(yù)測精度的目的。組合預(yù)測方法最早由Bates和Granger[1]于1969年提出,他們認(rèn)為對(duì)于一個(gè)包含系統(tǒng)獨(dú)立信息的單項(xiàng)預(yù)測方法,與預(yù)測精度較小的預(yù)測方法進(jìn)行組合預(yù)測完全可以增強(qiáng)系統(tǒng)的預(yù)測性能。
考慮到各種神經(jīng)網(wǎng)絡(luò)預(yù)測方法的特點(diǎn)及其適用范圍,本文選擇BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法、RBF神經(jīng)網(wǎng)絡(luò)預(yù)測方法和基于廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)3種常用的神經(jīng)網(wǎng)絡(luò)預(yù)測方法作為組合預(yù)測模型中的單項(xiàng)預(yù)測方法。在此基礎(chǔ)上,用平均絕對(duì)相對(duì)誤差(MAPE)和方差為衡量標(biāo)準(zhǔn),并根據(jù)設(shè)置的閾值對(duì)單項(xiàng)預(yù)測方法進(jìn)行篩選,最后選取了MAPE作為最優(yōu)準(zhǔn)則計(jì)算得到權(quán)重,從而建立組合預(yù)測模型,在提高組合預(yù)測模型精度的同時(shí),使得組合預(yù)測模型具有現(xiàn)實(shí)意義。實(shí)驗(yàn)結(jié)果表明,本文提出的模型的預(yù)測精度高于傳統(tǒng)的線性組合模型的預(yù)測精度。
1 相關(guān)工作
基于神經(jīng)網(wǎng)絡(luò)的預(yù)測方法具有很多其他預(yù)測方法所不具備的優(yōu)點(diǎn),近年來越來越被人們所關(guān)注。吳正佳 等(2010)[2]針對(duì)某備貨型企業(yè)的產(chǎn)品需求量,建立了基于良好學(xué)習(xí)能力的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,并通過實(shí)證分析與簡單移動(dòng)平滑法和加權(quán)移動(dòng)平滑法的預(yù)測結(jié)果相比較,結(jié)果表明BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果比其他兩種更為有效果。童明榮 等(2007)[3]提出一種季節(jié)性RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,對(duì)具有季節(jié)性的產(chǎn)品月度市場需求進(jìn)行預(yù)測,最后利用構(gòu)建好的RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行仿真實(shí)驗(yàn),并與ARIMA模型、分組回歸模型等常用季節(jié)預(yù)測模型做對(duì)比分析,結(jié)果表明前者的預(yù)測誤差均方差最小,預(yù)測精度較高。Maria Cleofé(2005)[4]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)對(duì)圣保羅地區(qū)的降雨量進(jìn)行預(yù)測,并通過實(shí)證分析與其他線性回歸模型作對(duì)比評(píng)價(jià),實(shí)驗(yàn)結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)有著更好地預(yù)測效果。此外還有其他很多學(xué)者在交通、航運(yùn)、氣候等多個(gè)領(lǐng)域運(yùn)用神經(jīng)網(wǎng)絡(luò)進(jìn)行了預(yù)測[5-7],不在此贅述。
針對(duì)藥品銷量預(yù)測這一特定問題,國內(nèi)外部分學(xué)者也做了一定的研究工作,試圖尋找合適的預(yù)測方法對(duì)藥品需求做出較為準(zhǔn)確的預(yù)測。馬新強(qiáng) 等(2008)[8]提出了一種基于BP神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測模型,該文先利用數(shù)據(jù)倉庫及數(shù)據(jù)挖掘技術(shù)分析提取了相關(guān)有效的藥品銷售信息作為研究對(duì)象,在此基礎(chǔ)上利用BP神經(jīng)網(wǎng)絡(luò)對(duì)其進(jìn)行預(yù)測,最后在較為精確銷售量的基礎(chǔ)上提出了一種優(yōu)化的生產(chǎn)決策系統(tǒng)方法。王憲慶 等(2009)[9]利用BP神經(jīng)網(wǎng)絡(luò)模型對(duì)藥品超市的藥品銷售情況進(jìn)行預(yù)測并做了相關(guān)實(shí)證分析,該文通過觀察藥品預(yù)測的顯著性差異評(píng)價(jià)模型的性能,最終取得了良好的效果,支持了其BP神經(jīng)網(wǎng)絡(luò)非常適用于資金有限、倉儲(chǔ)量不大的藥品超市的結(jié)論。劉德玲(2012)[10]提出了一種針對(duì)大范圍內(nèi)的藥品銷售的預(yù)測方法。該文利用遺產(chǎn)算法優(yōu)化支持向量機(jī)藥品銷售預(yù)測方式進(jìn)行預(yù)測,提高了藥品銷售預(yù)測的精確度,得到了較為滿意的結(jié)果。
盡管有關(guān)研究不斷增多,但由于藥品需求特征頗為復(fù)雜的特殊性,運(yùn)用單項(xiàng)預(yù)測方法對(duì)其進(jìn)行預(yù)測無法涵蓋其較多的特征信息,從一定程度上限制了預(yù)測模型的適用范圍。本文根據(jù)藥品需求高度非線性的特點(diǎn)選取了3種不同特性神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測方法,每種神經(jīng)網(wǎng)絡(luò)都有其所針對(duì)的藥品需求特征,并在此基礎(chǔ)上建立組合預(yù)測模型,擴(kuò)大了藥品預(yù)測模型的適應(yīng)范圍,對(duì)于提高藥品預(yù)測精度和預(yù)測穩(wěn)定性具有重要意義。
2 基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測模型的建立
基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測模型的具體步驟如下:
(1)數(shù)據(jù)異常點(diǎn)預(yù)處理。為提高組合預(yù)測模型的適用范圍和預(yù)測精度,本文運(yùn)用基于距離的異常點(diǎn)檢測方法對(duì)存在異常點(diǎn)的藥品需求數(shù)據(jù)進(jìn)行異常點(diǎn)修復(fù),得到正常的需求數(shù)據(jù)。
(2)單項(xiàng)預(yù)測方法的選取。針對(duì)藥品需求的不同特征,選取3種不同特性的神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測方法,以此作為組合預(yù)測模型單項(xiàng)預(yù)測方法的篩選基礎(chǔ)。
(3)單項(xiàng)預(yù)測方法的篩選與變權(quán)重的計(jì)算。因?yàn)椴煌幤肪邆洳煌枨筇卣?,在進(jìn)行組合預(yù)測時(shí)仍需要在已選取單項(xiàng)預(yù)測方法的基礎(chǔ)上再次篩選合適的單項(xiàng)預(yù)測方法進(jìn)行組合,以相對(duì)誤差為最優(yōu)準(zhǔn)則,通過求解二次規(guī)劃問題得到權(quán)重并按照一定的變權(quán)規(guī)則進(jìn)行變權(quán)。
(4)根據(jù)權(quán)重建立組合模型進(jìn)行預(yù)測。
2.1 藥品數(shù)據(jù)異常點(diǎn)預(yù)處理
在藥品銷售數(shù)據(jù)中,由于特殊事件(如鋪貨)等原因,個(gè)別數(shù)據(jù)會(huì)表現(xiàn)出明顯突變,導(dǎo)致藥品歷史數(shù)據(jù)存在異常點(diǎn),掩蓋了數(shù)據(jù)本身的規(guī)律。本文通過基于距離的異常點(diǎn)檢測方法和多項(xiàng)式擬合方法對(duì)藥品數(shù)據(jù)做預(yù)處理,具體處理步驟如下:
首先,選擇一個(gè)較大的數(shù)(如1010)將缺失數(shù)據(jù)補(bǔ)足,然后運(yùn)用基于距離的異常點(diǎn)檢測方法進(jìn)行檢測。第一步,對(duì)藥品需求數(shù)據(jù)進(jìn)行歸一化處理并計(jì)算出各個(gè)數(shù)據(jù)之間的距離,得到距離矩陣P。計(jì)算公式如下:
Pij=|xi-xj|,i,j=1,…,n(1)
式中,xi表示時(shí)間序列中第i期的數(shù)據(jù),Pij表示時(shí)間序列中i期數(shù)據(jù)與j期數(shù)據(jù)之差的絕對(duì)值。距離矩陣P的第i列表示時(shí)間序列第i期數(shù)據(jù)與長度為n的時(shí)間序列中所有數(shù)據(jù)(包括第i期數(shù)據(jù)本身)的距離。
P=p11,p12,…,p1np21,p22,…,p2n… … … …pn1,pn2,…,pnn(2)
通過設(shè)置距離閾值d,計(jì)算出所有滿足Pij>d的距離個(gè)數(shù),記di,得到判別矩陣D。
D=[d1,d2,d3,…,dn](3)
將di與閾值f進(jìn)行比較,若大于f,則識(shí)別該點(diǎn)為異常點(diǎn),否則為正常值。最后利用多項(xiàng)式擬合方法,將檢測出來的異常點(diǎn)作擬合處理,得到建模需要的正常數(shù)據(jù)。
2.2 單項(xiàng)預(yù)測方法的選取
藥品需求預(yù)測是一個(gè)復(fù)雜的非線性系統(tǒng)建模問題,相對(duì)于傳統(tǒng)分析方法(如指數(shù)平滑方法、ARMA模型、MTV模型),神經(jīng)網(wǎng)絡(luò)依據(jù)數(shù)據(jù)本身的內(nèi)在聯(lián)系建模,具有良好的自組織、自適應(yīng)性,以及抗干擾能力以及非線性映射能力,能夠較好地解決非線性數(shù)據(jù)擬合問題。
本文選取3種具有不同特征的神經(jīng)網(wǎng)絡(luò)模型,即BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)和GRNN廣義回歸神經(jīng)網(wǎng)絡(luò),綜合其各自優(yōu)勢建立組合預(yù)測模型,提升整個(gè)預(yù)測模型的泛化能力,提高預(yù)測精度與預(yù)測穩(wěn)定性。
2.2.1 基于BP神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測方法
BP神經(jīng)網(wǎng)絡(luò)由Rumelhard和McClelland于1986年提出,它是一種典型的多層前向型神經(jīng)網(wǎng)絡(luò)。藥品銷售記錄作為BP神經(jīng)網(wǎng)絡(luò)輸入值,藥品需求預(yù)測即為BP神經(jīng)網(wǎng)絡(luò)輸出值。當(dāng)輸入節(jié)點(diǎn)數(shù)為m,輸出節(jié)點(diǎn)數(shù)為n時(shí),BP神經(jīng)網(wǎng)絡(luò)就表達(dá)了從m個(gè)自變量到n個(gè)因變量的非線性函數(shù)映射關(guān)系。
BP神經(jīng)網(wǎng)絡(luò)側(cè)重對(duì)全樣本的學(xué)習(xí),因此適合對(duì)樣本整體特征相近的時(shí)間序列進(jìn)行預(yù)測,即適應(yīng)受某一特定因素影響顯著,且該影響因素相對(duì)穩(wěn)定的藥品預(yù)測。
2.2.2 基于RBF神經(jīng)網(wǎng)絡(luò)的藥品需求預(yù)測方法
徑向基函數(shù)(RBF,Radical Basis Function)由Powell于1985年首次提出,它是一種三層前饋網(wǎng)絡(luò),即輸入層、隱含層和輸出層。從輸入層到隱含層是一個(gè)非線性到線性的變換過程,從隱含層到輸出層是一個(gè)線性處理過程。RBF神經(jīng)網(wǎng)絡(luò)在處理非線性問題時(shí),引入RBF核函數(shù)將非線性空間映射到線性空間,極大地提高了非線性處理能力,且RBF神經(jīng)網(wǎng)絡(luò)采用自組織有監(jiān)督的學(xué)習(xí)算法進(jìn)行訓(xùn)練,其訓(xùn)練收斂速度具有顯著的優(yōu)勢。
RBF神經(jīng)網(wǎng)絡(luò)具有很好的非線性處理能力,其學(xué)習(xí)算法屬于局部激活性較高的高斯函數(shù),對(duì)于相似的樣本有著較高的逼近能力,因此適用于受會(huì)隨時(shí)間變化而較為顯著變化的因素影響的藥品需求預(yù)測。
2.2.3 基于GRNN的藥品需求預(yù)測方法
廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN,Generalized Regression Neural Network)由美國學(xué)者Donald F. Specht在1991年提出,它是徑向基神經(jīng)網(wǎng)絡(luò)的一種。GRNN具有很強(qiáng)的非線性映射能力和柔性網(wǎng)絡(luò)結(jié)構(gòu)以及高度的容錯(cuò)性和魯棒性,適用于解決非線性問題。
GRNN在逼近能力和學(xué)習(xí)速度上較RBF網(wǎng)絡(luò)有更強(qiáng)的優(yōu)勢,網(wǎng)絡(luò)最后收斂于樣本量積聚較多的優(yōu)化回歸面,并且在樣本數(shù)據(jù)較少時(shí),預(yù)測效果也較好。此外,網(wǎng)絡(luò)還可以處理不穩(wěn)定數(shù)據(jù)。因此GRNN適用于數(shù)據(jù)不全、異常點(diǎn)較多的藥品。
綜上所述,3種神經(jīng)網(wǎng)絡(luò)都具有良好的非線性處理及預(yù)測能力,因?yàn)閷W(xué)習(xí)算法的不同有著各自側(cè)重的學(xué)習(xí)方向,皆為應(yīng)用廣泛的預(yù)測方法,且對(duì)各自適應(yīng)范圍內(nèi)有著較好的預(yù)測效果。因此本文選擇BP神經(jīng)網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)以及廣義回歸神經(jīng)網(wǎng)絡(luò)作為單項(xiàng)預(yù)測方法,并在此基礎(chǔ)上建立組合預(yù)測模型。
2.3 單項(xiàng)預(yù)測方法的篩選與變權(quán)系數(shù)的計(jì)算
本文在已選取3種單項(xiàng)預(yù)測方法的基礎(chǔ)上,再根據(jù)合適的MAPE和誤差方差篩選出組合模型中的單項(xiàng)預(yù)測方法,計(jì)算出變權(quán)系數(shù)。假設(shè)藥品需求的實(shí)際時(shí)間序列為y(t),t=1,2,…,N,N+1,…,N+T,其中t表示預(yù)測區(qū)間,T表示預(yù)測步長。
(1)單項(xiàng)方法篩選
單項(xiàng)方法進(jìn)一步篩選的具體步驟為:
①預(yù)先設(shè)置選擇單項(xiàng)方法MAPE閾值m 和誤差方差閥值ε
②進(jìn)行逐期單步預(yù)測,預(yù)測序列為:
{i(t),i=1,2,…,n;t=N+1,…,N+T}
③計(jì)算n種單項(xiàng)方法的相對(duì)誤差ei(t)、誤差方差εi(t)和MAPE。其中,單項(xiàng)預(yù)測方法的相對(duì)誤差序列為:
ei(t)=i=1,2,…,n;t=N+1,…,N+T(4)
單項(xiàng)預(yù)測方法的誤差方差為:
εi(t)=(5)
單項(xiàng)預(yù)測方法的MAPE為:
MAPEi(t)=ei(j),(i=1,2,…,n;t=N+1,…,N+T)(6)
④若MAPEi(t)
(2)變權(quán)系數(shù)的計(jì)算
本文考慮預(yù)測效果,選用基于相對(duì)誤差為最優(yōu)準(zhǔn)則的最優(yōu)加權(quán)法進(jìn)行計(jì)算。
假設(shè)從n中方法中篩選出p(p≤n)種單項(xiàng)預(yù)測方法,則組合模型第t+1期的權(quán)系數(shù)w(t+1)由相對(duì)誤差ei(1),…,ei(t)決定,其中i=1,…,p。變權(quán)規(guī)則如表1所示。
權(quán)系數(shù)具體計(jì)算過程如下:
①設(shè)組合權(quán)重wi為方法mi在組合預(yù)測方法中權(quán)重,則組合預(yù)測方法第t期相對(duì)誤差為:
e(t)=wi*ei(t),i=1,2,…,p(7)
②組合模型前t期的相對(duì)誤差平方和為:
e2=e(1)2+e(2)2+…+e(t)2(8)
令w=[w1,w2,…,wP]T,
E=e1(1),e2(1),…,ep(1)e1(2),e2(2),…,ep(2) … … … …e1(t),e2(t),…,ep(t)
建立如下目標(biāo)規(guī)劃:
min P=e2=wT*ET*E*w
s.t. wi=1(9)
③求解該目標(biāo)規(guī)劃得到變權(quán)系數(shù)w。
2.4 建立組合模型進(jìn)行預(yù)測
組合預(yù)測模型可表示為:
式中, wi(t)表示第t期單項(xiàng)方法mi的變權(quán)系數(shù),(t)表示第t期組合預(yù)測方法的預(yù)測值。根據(jù)該模型對(duì)藥品進(jìn)行預(yù)測。
3 實(shí)驗(yàn)與分析
本文以上海市某制藥企業(yè)月度銷售額為藥品需求預(yù)測的實(shí)證數(shù)據(jù),根據(jù)銷售地區(qū)的不同抽取有代表性的藥品銷售數(shù)據(jù),其中選取上海地區(qū)10種藥品,北京地區(qū)4種藥品及全區(qū)域銷售數(shù)據(jù)12種藥品,數(shù)據(jù)長度皆為30(2009-1至2011-6)。
數(shù)據(jù)選擇依據(jù)如下:①藥品銷售有一定的連續(xù)性,為公司主推或在某地區(qū)主推藥品,具有代表性及預(yù)測意義;②在考慮異常點(diǎn)和數(shù)據(jù)缺失時(shí),選取異常點(diǎn)和缺失數(shù)據(jù)較少的藥品。
3.1 單項(xiàng)方法篩選和變權(quán)系數(shù)計(jì)算
根據(jù)不同銷售區(qū)域藥品需求的具體情況,設(shè)定單一省市藥品的MAPE閾值和方差閾值分別為20%和0.1;設(shè)定公司的MAPE閾值和方差閾值分別為30%和0.1。shy03和all03的單項(xiàng)預(yù)測方法選取結(jié)果如表2 所示。
利用單項(xiàng)預(yù)測方法的6期預(yù)測結(jié)果計(jì)算組合預(yù)測模型的3期權(quán)重,選相對(duì)誤差最優(yōu)準(zhǔn)則進(jìn)行權(quán)重計(jì)算,運(yùn)用MATLAB的二次規(guī)劃函數(shù)quadprog求解。變權(quán)規(guī)則及權(quán)重計(jì)算結(jié)果如表3所示。
3.2 預(yù)測模型的精度比較
本文選取平均絕對(duì)相對(duì)誤差(MAPE)和預(yù)測有效度兩個(gè)指標(biāo)來綜合評(píng)價(jià)模型的預(yù)測精度。當(dāng)MAPE越小時(shí),說明預(yù)測精度越高。然而當(dāng)實(shí)際值非常小時(shí),即使是預(yù)測值與真實(shí)值之差較小,其平均絕對(duì)相對(duì)誤差也會(huì)很大,而預(yù)測有效度能很好地避免此類問題,故我們引入預(yù)測有效度來綜合評(píng)價(jià)預(yù)測精度,預(yù)測有效度越大,預(yù)測精度越高。
用單項(xiàng)預(yù)測方法BP、RBF、GRNN與組合預(yù)測方法單一省市和全區(qū)域藥品銷售預(yù)測值的MAPE和有效度,對(duì)MAPE和有效度的情況進(jìn)行統(tǒng)計(jì)并且計(jì)算MAPE和有效度的平均值,比較結(jié)果如表4所示。
可以看出,運(yùn)用組合預(yù)測方法對(duì)單一省市的14種藥品進(jìn)行需求預(yù)測時(shí),MAPE小于標(biāo)準(zhǔn)值20%的有8個(gè),占藥品總數(shù)的57.14%,優(yōu)于BP(7)、RBF(4)、GRNN(6)方法;14種藥品的MAPE平均值為19.81%,優(yōu)于BP(26.71%)、RBF(28.45%)、GRNN(40.59%)方法。預(yù)測有效度大于標(biāo)準(zhǔn)值0.5的有11個(gè),占藥品總數(shù)的78.57%,優(yōu)于BP(8)、RBF(10)、GRNN(8)方法;14種藥品的預(yù)測有效度平均值為0.62,優(yōu)于BP(0.57)、RBF(0.61)、GRNN(0.57)方法。
此外,運(yùn)用組合預(yù)測方法對(duì)全區(qū)域銷售的12種藥品進(jìn)行需求預(yù)測時(shí),MAPE小于標(biāo)準(zhǔn)值30%的有7個(gè),占藥品總數(shù)的58.33%,優(yōu)于BP(4)、RBF(6)、GRNN(3)方法;12種藥品的MAPE平均值為25.22%,優(yōu)于BP(35.90%)、RBF(32.07%)、GRNN(70.59%)方法。預(yù)測有效度大于標(biāo)準(zhǔn)值0.45的有10個(gè),占藥品總數(shù)的83.33%,優(yōu)于BP(7)、RBF(9)、GRNN(5)方法;12種藥品的預(yù)測有效度平均值為0.58,優(yōu)于BP(0.46)、RBF(0.56)、GRNN(0.49)方法。
通過上述實(shí)證結(jié)果,從整體上看,組合預(yù)測方法的預(yù)測精度優(yōu)于單項(xiàng)預(yù)測方法,而且模型的適用范圍較廣。
3.3 預(yù)測模型的穩(wěn)定性比較
本文選擇預(yù)測誤差的方差作為評(píng)價(jià)模型穩(wěn)定性的指標(biāo)。將單項(xiàng)預(yù)測方法BP、RBF、GRNN與組合預(yù)測方法的誤差方差進(jìn)行比較,單一省市和全區(qū)域的比較結(jié)果如表5所示。
可以看出,運(yùn)用組合預(yù)測方法對(duì)單一省市的14種藥品進(jìn)行需求預(yù)測時(shí),誤差方差小于標(biāo)準(zhǔn)值0.1的有12種,占藥品總數(shù)的85.71%,優(yōu)于BP(10)、RBF(11)、GRNN(10)方法;此外,14種藥品誤差方差平均值為0.0263,優(yōu)于BP(0.0613)、RBF(0.0361)、GRNN(0.0522)方法。運(yùn)用組合預(yù)測方法對(duì)全區(qū)域銷售的12種藥品進(jìn)行需求預(yù)測時(shí),誤差方差小于標(biāo)準(zhǔn)值0.1的有11個(gè),占總數(shù)的91.67%,優(yōu)于BP(9)、RBF(10)、GRNN(8)方法,此外,14種藥品的誤差方差平均值為0.031 0,優(yōu)于BP(0.092 7)、RBF(0.033 5)、GRNN(0.065 0)方法。因此從整體上看,組合預(yù)測方法的預(yù)測穩(wěn)定性優(yōu)于單項(xiàng)預(yù)測方法。
4 總結(jié)及展望
本文選擇3種具有不同適應(yīng)特征的神經(jīng)網(wǎng)絡(luò)模型作為單項(xiàng)預(yù)測方法,建立了基于神經(jīng)網(wǎng)絡(luò)的藥品需求組合預(yù)測模型,以上海市某藥企的實(shí)際銷售數(shù)據(jù)作為實(shí)證對(duì)象,驗(yàn)證了該模型在預(yù)測精度和預(yù)測穩(wěn)定性上均優(yōu)于單項(xiàng)預(yù)測方法。當(dāng)然,雖然建立的神經(jīng)網(wǎng)絡(luò)組合模型在一定程度上彌補(bǔ)了現(xiàn)有方法的不足,擴(kuò)大了預(yù)測方法的適用范圍,但在研究過程中依然存在亟待解決的問題:
(1)單項(xiàng)預(yù)測方法的參數(shù)優(yōu)化有待進(jìn)一步研究。本文在參數(shù)優(yōu)化時(shí),大部分采用遍歷法和經(jīng)驗(yàn)法進(jìn)行設(shè)置,缺乏相應(yīng)理論依據(jù)和方法指導(dǎo)。如何采用合適參數(shù)尋優(yōu)方法進(jìn)行參數(shù)確定是下一步亟待解決的問題。
(2)進(jìn)行組合預(yù)測時(shí),選擇合適的最優(yōu)準(zhǔn)則有待于進(jìn)一步研究。本文選取相對(duì)誤差作為最優(yōu)準(zhǔn)則進(jìn)行需求預(yù)測,該準(zhǔn)則的選取忽視了量綱統(tǒng)一性,未來的研究應(yīng)該綜合考慮量綱統(tǒng)一、預(yù)測誤差和預(yù)測穩(wěn)定性,使組合預(yù)測方法更科學(xué)、更合理。
主要參考文獻(xiàn)
[1]J M Bates,C W J Granger.The Combination of Forecasts[J]. Operations Research Quarterly,1969,20(4):451-468.
[2]吳正佳,王文,周進(jìn).BP神經(jīng)網(wǎng)絡(luò)在備貨型企業(yè)銷售預(yù)測中的應(yīng)用[J].工業(yè)工程,2010(1):105-108.
[3]童明榮,薛恒新,劉路冰.基于季節(jié)性RBF神經(jīng)網(wǎng)絡(luò)的月度市場需求預(yù)測研究[J].運(yùn)籌與管理,2007(3),146-150.
[4]Maria Cleofé,R Valverde.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J].Journal of Hydrology,2005,1(20):146-162.
[5]A A Khan,K E Marion,C Bil. The Prediction of Ship Motions and Attitudes Using Artificial Neural Networks[C].19th National Conference of the Australian Society for Operations Research, Melbourne, Victoria, 2007.
[6]D C Park,El-Sharkawi.Electric Load Forecasting Using an Artificial Neural Network[J].IEEE Transaction on Power Systems, 1991, 6(2):442-449.
[7]Maria Cleofé, Valverde Ramírez.Artificial Neural Network Technique for Rainfall Forecasting Applied to the S?觔o Paulo Region[J]. Journal of Hydrology , 2005, 301(20):146-162.
[8]馬新強(qiáng),黃羿.基于BP神經(jīng)網(wǎng)絡(luò)的藥品銷售預(yù)測模型設(shè)計(jì)[J].重慶文理學(xué)院學(xué)報(bào),2008(2):64-66.
[關(guān)鍵詞]人力資源管理;人力資源需求預(yù)測;BP神經(jīng)網(wǎng)絡(luò)
[中圖分類號(hào)]F270.7[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]2095-3283(2013)01-00-02
一、 應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的必要性
隨著經(jīng)濟(jì)全球化和信息技術(shù)的加快發(fā)展,我國企業(yè)面臨著更為嚴(yán)峻的競爭壓力。為了適應(yīng)現(xiàn)代市場需求,企業(yè)必須優(yōu)化配置人力資源,并科學(xué)制定人力資源規(guī)劃。其中,科學(xué)的人力資源需求預(yù)測是人力資源開發(fā)和規(guī)劃的基礎(chǔ),對(duì)人力資源管理活動(dòng)將產(chǎn)生持續(xù)和重要的影響。
企業(yè)人力資源需求預(yù)測分析方法多種多樣。在進(jìn)行人力資源需求預(yù)測時(shí),企業(yè)要考慮的因素復(fù)雜多變,如企業(yè)的目標(biāo)和經(jīng)營戰(zhàn)略、生產(chǎn)狀況的變化、工作設(shè)計(jì)或組織結(jié)構(gòu)的變化等,而且各種影響因素與預(yù)測結(jié)果之間的相關(guān)性難以用定量的方法表示出來,是非線性相互制約的映射關(guān)系。將BP神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于人力資源需求預(yù)測領(lǐng)域,彌補(bǔ)和改進(jìn)了人力資源需求預(yù)測分析方法,能較好地實(shí)現(xiàn)各指標(biāo)與需求結(jié)果之間非線性關(guān)系的映射,對(duì)企業(yè)人力資源決策具有一定的參考和指導(dǎo)作用。
二、BP神經(jīng)網(wǎng)絡(luò)的基本原理
人工神經(jīng)網(wǎng)絡(luò),簡稱神經(jīng)網(wǎng)絡(luò),是一種包括許多簡單的非線性計(jì)算單元或聯(lián)結(jié)點(diǎn)的非線性動(dòng)力系統(tǒng),是用大量簡單的處理單元廣泛連接組成的復(fù)雜網(wǎng)絡(luò)。Back-Propagation Network,簡稱為BP網(wǎng)絡(luò),即基于誤差反向傳播算法的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最成功和廣泛的人工神經(jīng)網(wǎng)絡(luò)。它由輸入層、隱含層和輸出層組成。隱含層可以是一層或多層。BP神經(jīng)網(wǎng)絡(luò)自身具有的非線性映射、自學(xué)習(xí)、自適應(yīng)能力、容易實(shí)現(xiàn)并行計(jì)算等優(yōu)點(diǎn),彌補(bǔ)和改進(jìn)了供應(yīng)商選擇和評(píng)價(jià)方法,能較好地實(shí)現(xiàn)各指標(biāo)與評(píng)價(jià)結(jié)果之間非線性關(guān)系的映射。
基于BP神經(jīng)網(wǎng)絡(luò),構(gòu)建供應(yīng)商的選擇評(píng)價(jià)模型,其基本思想為:假設(shè)輸入變量為X=(X1,X2,···,Xi)',隱含層輸出變量為Y=(Y1,Y2,···,Yj)',輸出層變量為Z=(Z1,Z2,···,Zl)',期望輸出的目標(biāo)變量為T=(T1,T2,···,Tl)',Wij、Wjl分別為輸入層到隱含層、隱含層到輸出層的連接權(quán)值(如圖1所示)。對(duì)于i個(gè)輸入學(xué)習(xí)樣本X1,X2,···,Xi,已知與其對(duì)應(yīng)的輸出樣本為Z1,Z2,···,Zl。通過BP算法的學(xué)習(xí),沿著負(fù)梯度方向不斷調(diào)整和修正網(wǎng)絡(luò)連接權(quán)值Wij和Wjl,使網(wǎng)絡(luò)的實(shí)際輸出Z逐漸逼近目標(biāo)矢量T,也就是使網(wǎng)絡(luò)輸出層的誤差平方和達(dá)到最小。
圖1三層BP網(wǎng)絡(luò)結(jié)構(gòu)圖三、BP神經(jīng)網(wǎng)絡(luò)在企業(yè)人力資源需求預(yù)測中的應(yīng)用
根據(jù)上述BP神經(jīng)網(wǎng)絡(luò)主要思想,以A公司為例,分析如何運(yùn)用MATLAB工具箱實(shí)現(xiàn)基于BP神經(jīng)網(wǎng)絡(luò)的企業(yè)人力資源需求預(yù)測。
1.樣本數(shù)據(jù)處理
選取年份、產(chǎn)值、資產(chǎn)總計(jì)、利潤4個(gè)指標(biāo)作為輸入向量,從業(yè)人員作為目標(biāo)向量(見表1)。在對(duì)BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練前,應(yīng)該對(duì)數(shù)據(jù)進(jìn)行歸一化處理,使那些比較大的輸入仍落在傳遞函數(shù)梯度大的地方。本例采用MATLAB工具箱中的premnmx()函數(shù)把數(shù)據(jù)歸一到[-1,1]之間,如表2所示。
對(duì)于BP網(wǎng)絡(luò),有一個(gè)非常重要的定理。即對(duì)于任何在閉區(qū)間內(nèi)的一個(gè)連續(xù)函數(shù)都可以用單隱層的BP網(wǎng)絡(luò)逼近,因而一個(gè)三層BP網(wǎng)絡(luò)就可以完成任意的n維到m維的映射。本例采用單隱層的BP網(wǎng)絡(luò)進(jìn)行從業(yè)人員預(yù)測。由于輸入樣本為4維的輸入向量,因此,輸入層一共有4個(gè)神經(jīng)元,網(wǎng)絡(luò)只有1個(gè)輸出數(shù)據(jù),則輸出層只有1個(gè)神經(jīng)元。隱含層神經(jīng)元個(gè)數(shù)根據(jù)最佳隱含層神經(jīng)元數(shù)經(jīng)驗(yàn)公式取15個(gè)。因此,網(wǎng)絡(luò)應(yīng)該為4×15×1的結(jié)構(gòu)。隱含層神經(jīng)元的傳遞函數(shù)為S型正切函數(shù)tansig(),輸出層神經(jīng)元的傳遞函數(shù)為線性激活函數(shù)purelin()。
3.BP網(wǎng)絡(luò)訓(xùn)練及仿真
建立網(wǎng)絡(luò)后,對(duì)表2中的數(shù)據(jù)進(jìn)行訓(xùn)練,訓(xùn)練參數(shù)的設(shè)定如表3所示,其他參數(shù)取默認(rèn)值。
訓(xùn)練次數(shù)12100012目標(biāo)誤差120.00112學(xué)習(xí)速率120.01訓(xùn)練結(jié)果如圖1所示,可見經(jīng)過52次訓(xùn)練后,網(wǎng)絡(luò)的目標(biāo)誤差達(dá)到要求。
圖1訓(xùn)練結(jié)果網(wǎng)絡(luò)訓(xùn)練結(jié)束后,運(yùn)用MATLAB工具箱中的sim()函數(shù),將經(jīng)過歸一化后的數(shù)據(jù)表2進(jìn)行仿真模擬,獲得網(wǎng)絡(luò)的輸出,然后將運(yùn)算結(jié)果通過postmnmx()函數(shù)進(jìn)行反歸一化處理,得到BP網(wǎng)絡(luò)預(yù)測值,最后檢查BP網(wǎng)絡(luò)預(yù)測值和實(shí)際從業(yè)人員數(shù)之間的誤差是否符合要求,如表4所示。
4.預(yù)測結(jié)果評(píng)價(jià)
圖2反映了該BP網(wǎng)絡(luò)較好地逼近了輸入矢量,即年份、產(chǎn)值(萬元)、資產(chǎn)總計(jì)(萬元)和利潤(萬元)與目標(biāo)矢量,即從業(yè)人員(人)之間的線性關(guān)系。用BP神經(jīng)網(wǎng)絡(luò)對(duì)現(xiàn)有人力資源狀況進(jìn)行分析擬合,是人力資源需求預(yù)測的較理想方法。與傳統(tǒng)的人力資源需求預(yù)測方法相比,將BP神經(jīng)網(wǎng)絡(luò)用于人力資源需求預(yù)測,克服了輸入矢量和目標(biāo)矢量非線性、不符合統(tǒng)計(jì)規(guī)律的問題。BP神經(jīng)網(wǎng)絡(luò)模型良好的容錯(cuò)和自學(xué)習(xí)能力,調(diào)用MATLAB工具箱函數(shù),使預(yù)測過程更易實(shí)現(xiàn),可以更好地對(duì)人力資源進(jìn)行規(guī)劃,提高人力資源預(yù)測精度。
圖2BP神經(jīng)網(wǎng)絡(luò)的函數(shù)逼近結(jié)果將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于企業(yè)人力資源需求預(yù)測,能較好地建立起各影響因素與預(yù)測結(jié)果之間的非線性關(guān)系,是企業(yè)預(yù)測人力資源需求的一種較理想的方法。但BP神經(jīng)網(wǎng)絡(luò)也存在著一些不足和問題。主要表現(xiàn)在學(xué)習(xí)速率太小可能會(huì)造成訓(xùn)練時(shí)間過長;BP算法可以使權(quán)值收斂到某個(gè)值,但并不能保證其為誤差平面的全局最小值;網(wǎng)絡(luò)隱含層的層數(shù)和單元數(shù)的選擇一般是根據(jù)經(jīng)驗(yàn)或者通過反復(fù)實(shí)驗(yàn)確定,網(wǎng)絡(luò)往往存在很大的冗余性,在一定程度上也增加了網(wǎng)絡(luò)學(xué)習(xí)的負(fù)擔(dān)。因此,BP神經(jīng)網(wǎng)絡(luò)在企業(yè)人力資源需求預(yù)測領(lǐng)域的應(yīng)用仍需根據(jù)企業(yè)自身實(shí)際情況做進(jìn)一步的改進(jìn)和完善。
[參考文獻(xiàn)]
[1]飛思科技產(chǎn)品研發(fā)中心神經(jīng)網(wǎng)絡(luò)理論與MATLAB7實(shí)現(xiàn)[M]北京:電子工業(yè)出版社,2005.
[2](美)海金(Simon Haykin)神經(jīng)網(wǎng)絡(luò)原理(原書第2版)[M]葉世偉,史忠植譯北京:機(jī)械工業(yè)出版社,2004.
[3]叢爽面向MATLAB工具箱的神經(jīng)網(wǎng)絡(luò)理論與應(yīng)用[M]中國科學(xué)技術(shù)大學(xué)出版社,1998.
[4]劉躍基于BP神經(jīng)網(wǎng)絡(luò)的人力資源估價(jià)研究[J]統(tǒng)計(jì)與信息論壇,2007(1):96-99.
[5]艷明四種人力資源的定量預(yù)測方法及評(píng)述[J]統(tǒng)計(jì)與決策,2008(7):30-32.
[6]國家統(tǒng)計(jì)局固定資產(chǎn)投資統(tǒng)計(jì)司,中國行業(yè)企業(yè)信息中心中國大型房地產(chǎn)與建筑業(yè)企業(yè)年鑒[M]北京:中國大地出版社,2003-2008.
[7]王文富企業(yè)人力資源預(yù)測與規(guī)劃研究[D]天津大學(xué),2004.
關(guān)鍵詞:壁紙識(shí)別;BP神經(jīng)網(wǎng)絡(luò);不變矩
中圖分類號(hào):TP391.41
貼標(biāo)的識(shí)別以往是通過人工識(shí)別,人為因素影響大,識(shí)別速度慢,精度低,不能滿足大批量生產(chǎn)的需要。因此,在經(jīng)濟(jì)社會(huì)高速發(fā)展的今天,此方法越來越不能滿足壁紙行業(yè)發(fā)展的需要。隨著計(jì)算機(jī)的發(fā)展,通過計(jì)算機(jī)智能識(shí)別壁紙的紋理就成為可能,主要思路是將壁紙拍攝獲知的圖像進(jìn)行紋理特征的提取,只要建立足夠的特征庫,就可以把需要判別的壁紙圖片輸入計(jì)算機(jī),通過檢索來判別該壁紙是哪種材種。因此,本文引入圖像處理技術(shù)和BP神經(jīng)網(wǎng)絡(luò)技術(shù),提出一種壁紙貼標(biāo)自動(dòng)識(shí)別算法,以解決貼標(biāo)大批量生產(chǎn)的需要。
1 壁紙紋理特征的提取
不變矩是指物體圖像經(jīng)過平移,旋轉(zhuǎn)以及比例變換仍保持不變的矩特征量,設(shè)物體的二維離散圖像函數(shù)用f(x,y)表示,其(p+q)階矩定義為:
(1)
相應(yīng)的(p+q)階中心矩定義為:
(2)
其中,x0=m10/m00,y0=m01/m00,x0表示二維圖像的灰度在水平方向上的重心,y0表示二維圖像的灰度在垂直方向上的重心。
HuM.K.等人利用二階、三階中心矩得到了7個(gè)不變矩特征參數(shù),具體如下:
Φk=|log|Φk,k=1,2,3,4,5,6,7 (3)
在本設(shè)計(jì)的實(shí)驗(yàn)中要求樣本的尺寸是256×256,從每一類原始樣本中采集100個(gè)能表現(xiàn)該樣本紋理的圖片,形成識(shí)別樣本庫,之后提取了所有樣本的不變矩紋理特征。
圖1 壁紙樣本圖片
2 BP-神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計(jì)
2.1 BP神經(jīng)網(wǎng)絡(luò)概述
BP神經(jīng)網(wǎng)絡(luò)(Back Propagation)是1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種基于誤差逆?zhèn)鞑ニ惴ǖ亩鄬忧梆伾窠?jīng)網(wǎng)絡(luò),目前廣泛應(yīng)用于分類、識(shí)別、函數(shù)逼近等領(lǐng)域。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,包括輸入層、輸出層和隱含層。
圖2 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
BP學(xué)習(xí)算法的工作過程由正向傳播和反向傳播組成。正向傳播過程是指輸入信號(hào)從輸入層經(jīng)隱含層,在輸出層產(chǎn)生輸出信號(hào)。如果輸出層不能得到期望的輸出信號(hào),輸出信號(hào)將反向傳播,將誤差信號(hào)沿原有路徑返回,并按照一定規(guī)則修改網(wǎng)絡(luò)參數(shù),逐漸地向輸入層傳播去進(jìn)行計(jì)算,正向傳播和反向傳播兩個(gè)過程的反復(fù)運(yùn)用,直到誤差信號(hào)滿足要求。
2.2 BP神經(jīng)網(wǎng)絡(luò)分類器設(shè)計(jì)
2.2.1 網(wǎng)絡(luò)輸入節(jié)點(diǎn)數(shù)的設(shè)計(jì)
輸入層節(jié)點(diǎn)數(shù)主要根據(jù)數(shù)據(jù)特征向量的維數(shù)來確定,本文輸入節(jié)點(diǎn)數(shù)為不變矩特征向量的維數(shù),即輸入節(jié)點(diǎn)數(shù)為7。
2.2.2 網(wǎng)絡(luò)隱含層數(shù)的設(shè)計(jì)
通常情況下,增加網(wǎng)絡(luò)的隱含層數(shù)可以使網(wǎng)絡(luò)誤差降低,提高網(wǎng)絡(luò)的精度,但同時(shí)也使網(wǎng)絡(luò)變得復(fù)雜化,使得網(wǎng)絡(luò)的訓(xùn)練時(shí)間增加,而且容易出現(xiàn)網(wǎng)絡(luò)過擬合的情況。有研究表明,具有Sigmoid非線性函數(shù)的3層BP神經(jīng)網(wǎng)絡(luò)能夠逼近任何連續(xù)函數(shù)。因此,本研究中神經(jīng)網(wǎng)絡(luò)分類器的隱含層數(shù)選為3層。
2.2.3 網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的設(shè)計(jì)
在確定BP神經(jīng)網(wǎng)絡(luò)隱含層數(shù)后,下一步就需要確定隱含層節(jié)點(diǎn)數(shù)。隱含層神經(jīng)元個(gè)數(shù)一般由 是公式確定,其中n是隱含層神經(jīng)元個(gè)數(shù),n0是輸入層神經(jīng)元個(gè)數(shù),n1是輸出神經(jīng)元個(gè)數(shù),a∈(1~10)。
2.2.4 網(wǎng)絡(luò)輸出層的設(shè)計(jì)
輸出層的節(jié)點(diǎn)數(shù)是根據(jù)BP神經(jīng)網(wǎng)絡(luò)分類器的輸出類別數(shù)量決定,也就是說,輸出層的節(jié)點(diǎn)數(shù)應(yīng)為類別總數(shù)。例如,本研究需要將待識(shí)別的壁紙樣本分成8大類,那么輸出層節(jié)點(diǎn)數(shù)應(yīng)設(shè)置為8,并將每類對(duì)應(yīng)的目標(biāo)向量依次設(shè)置為[1 0 0 0 0 0 0 0]T、[0 1 0 0 0 0 0 0]T、[0 0 1 0 0 0 0 0]T、[0 0 0 1 0 0 0 0]T、[0 0 0 0 1 0 0 0]T、[0 0 0 0 0 1 0 0]T、[0 0 0 0 0 0 1 0]T、[0 0 0 0 0 0 0 1]T,對(duì)應(yīng)目標(biāo)向量的數(shù)目為對(duì)應(yīng)輸入壁紙樣本的數(shù)目,即目標(biāo)向量與輸入壁紙樣本是相互對(duì)應(yīng)的。
本文BP神經(jīng)網(wǎng)絡(luò)分類器采用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行設(shè)計(jì),訓(xùn)練函數(shù)選擇Trainlm,訓(xùn)練次數(shù)為200,誤差為0.001,將壁紙樣本其分成訓(xùn)練樣本與測試樣本2部分,并利用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行自動(dòng)識(shí)別,識(shí)別率達(dá)到90.0%。
3 結(jié)束語
實(shí)驗(yàn)結(jié)果表明不變矩紋理特征參數(shù)可以用于表征壁紙樣本,使用本文設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)分類器可以有效識(shí)別不同種類的壁紙樣本。
參考文獻(xiàn):
[1]高雋.人工神經(jīng)網(wǎng)絡(luò)原理及仿真實(shí)例[M].北京:機(jī)械工業(yè)出版社,2003:55-63.
[2]楊斐,王坤明,馬欣.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)分類器識(shí)別交通標(biāo)志[J].計(jì)算機(jī)工程,2000(10):120-121.
[3]Yaping JIANG,Zuxin XU,Hailong YIN.Study on improved BP artificial neural networks in eutrophication assessment of China eastern lakes [J].Journal of Hydrodynamics,2006(03):528-532.
[4]嚴(yán)曉梅,耿國華,周明全.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的指紋自動(dòng)分類器[J].微計(jì)算機(jī)信息,2007(01):281-282+288.
[5]李梅,孟凡玲,李群.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的地下水環(huán)境脆弱性評(píng)價(jià)[J].河海大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(03):245-249.
[6]閔惜琳,劉國華.用MATLAB神經(jīng)網(wǎng)絡(luò)工具箱開發(fā)BP網(wǎng)絡(luò)應(yīng)用[J].計(jì)算機(jī)應(yīng)用,2001(08):163-164.
關(guān)鍵詞 基本藥物 采購行為 BP神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):F713.54 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-1533(2013)05-0047-05
2009年國家基本藥物制度實(shí)施后,國家將執(zhí)行基本藥物集中采購作為實(shí)施基本藥物制度的評(píng)價(jià)標(biāo)準(zhǔn)之一,于是各省將原有的藥品集中采購分為基本藥物和非基本藥物兩類。2010年11月,國務(wù)院《建立和規(guī)范政府辦基層醫(yī)療衛(wèi)生機(jī)構(gòu)基本藥物采購機(jī)制的指導(dǎo)意見》,旨在對(duì)現(xiàn)階段較為無序的藥品采購行為進(jìn)行規(guī)范,推行科學(xué)合理的采購模式,對(duì)基本藥物采購方面的研究開始得到關(guān)注。
現(xiàn)行采購模式是省集中采購平臺(tái)通過統(tǒng)計(jì)各基層醫(yī)院上報(bào)的用藥需求之后,再統(tǒng)籌面向中標(biāo)企業(yè)進(jìn)行集中采購。但是,作為基本藥物集中招標(biāo)采購體系中繼招標(biāo)過程之后的重要環(huán)節(jié),采購過程并未得到足夠的重視,基于基本藥物采購行為的微觀研究的理論和文獻(xiàn)更是少之又少。在缺乏科學(xué)理論和方法支持下的采購決策,容易受主觀如采購主體尋租以及客觀如廠商合謀等因素干擾而不穩(wěn)定,這種不穩(wěn)定帶來的滯后效應(yīng)會(huì)掣肘社區(qū)衛(wèi)生服務(wù)中心對(duì)基本藥物的需求預(yù)測,繼而帶來后續(xù)基本藥物的供需矛盾。除此之外,采購量錯(cuò)誤統(tǒng)計(jì)或填寫不夠準(zhǔn)確的偶然誤差將會(huì)進(jìn)一步加劇這個(gè)矛盾。基本藥物集中招標(biāo)采購體系下的基本藥物采購在執(zhí)行過程中有必要加強(qiáng)監(jiān)督管理和調(diào)控。因此,尋找合理與靈活的理論和方法來保證基本藥物的采購決策行為的穩(wěn)定性就成為關(guān)注點(diǎn)。
由于BP (Back Propagation)神經(jīng)網(wǎng)絡(luò)模型尚未在基本藥物招標(biāo)采購體系中進(jìn)行相關(guān)的理論研究和應(yīng)用探索,未能發(fā)揮其在其他領(lǐng)域中發(fā)揮出的功效。本文針對(duì)這一環(huán)節(jié)進(jìn)行探索,擬在建立BP 神經(jīng)網(wǎng)絡(luò)模型的基礎(chǔ)上,統(tǒng)計(jì)分析社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)的藥品使用等特征后,將BP神經(jīng)網(wǎng)絡(luò)模型運(yùn)用到社區(qū)醫(yī)療機(jī)構(gòu)的需求預(yù)測中來,使采購主體在決策時(shí)能有更多的支持信息,實(shí)現(xiàn)采購數(shù)量科學(xué)化,從而保證社區(qū)醫(yī)療機(jī)構(gòu)對(duì)基本藥物的供應(yīng)充足,以期從這一環(huán)節(jié)上減輕民眾對(duì)基本藥物的獲取負(fù)擔(dān),使整個(gè)基本藥物的供應(yīng)實(shí)現(xiàn)資源優(yōu)化配置,也可為基本藥物集中采購的理論和方法提供借鑒和參考。
1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測功能的研究
由于人工神經(jīng)網(wǎng)絡(luò)是非線性、非局域性和非定常性的復(fù)雜網(wǎng)絡(luò)系統(tǒng),具有并行分布的信息處理結(jié)構(gòu)和自適應(yīng)的腦模式的信息處理的本質(zhì)與能力,它可以通過“自學(xué)習(xí)”或“訓(xùn)練”掌握大量的知識(shí),完成特定的工作。人工神經(jīng)網(wǎng)絡(luò)對(duì)建立預(yù)測模型十分有效,它能從數(shù)據(jù)樣本中自動(dòng)學(xué)習(xí)以前的經(jīng)驗(yàn)而無需復(fù)雜的查詢和表述過程,并自動(dòng)地逼近那些最佳的數(shù)據(jù)蘊(yùn)含的規(guī)律,它在時(shí)間序列預(yù)測方面,尤其是高復(fù)雜度的非線性時(shí)間序列方面明顯優(yōu)于傳統(tǒng)的預(yù)測方法。在預(yù)測方面,目前應(yīng)用最廣泛且較為成功的是前向神經(jīng)網(wǎng)絡(luò)。
1.1 BP神經(jīng)網(wǎng)絡(luò)基本理論
BP神經(jīng)網(wǎng)絡(luò)也稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),為有監(jiān)督的學(xué)習(xí),是梯度下降法在多層前饋網(wǎng)絡(luò)中的應(yīng)用。它有一個(gè)輸入層、一個(gè)輸出層、一個(gè)或多個(gè)隱含層。每一層上包含若干個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)代表一個(gè)神經(jīng)元。同一層上的各節(jié)點(diǎn)之間無連接關(guān)系,相鄰層采取全互連。信息從輸入層開始在各層之間單向傳播,依次經(jīng)過各隱含層,最后到達(dá)輸出層。
BP算法的學(xué)習(xí)過程是一個(gè)反復(fù)迭代的過程,由正向傳播和反向傳播組成。其算法的基本思想是根據(jù)網(wǎng)絡(luò)輸出層的誤差,從輸出層開始反過來調(diào)整網(wǎng)絡(luò)的權(quán)值和閥值,最后使得輸出的均方誤差最小。經(jīng)過對(duì)一定數(shù)量樣本進(jìn)行反饋學(xué)習(xí)后,網(wǎng)絡(luò)所持的權(quán)值便是網(wǎng)絡(luò)通過自適應(yīng)學(xué)習(xí)得到的正確的內(nèi)部表示。這時(shí)將待識(shí)別樣本的特征數(shù)據(jù)輸入訓(xùn)練好的網(wǎng)絡(luò),則網(wǎng)絡(luò)就可以對(duì)樣本的屬性進(jìn)行自動(dòng)推理和識(shí)別。在非線性建模方法中,神經(jīng)網(wǎng)絡(luò)理論證明了在選擇適當(dāng)?shù)碾[層數(shù)及相應(yīng)的神經(jīng)元數(shù)目下,前饋神經(jīng)網(wǎng)絡(luò)能以任意精度逼近任意非線性函數(shù)[1]。
1.2 BP神經(jīng)網(wǎng)絡(luò)在預(yù)測領(lǐng)域的實(shí)現(xiàn)
由于BP學(xué)習(xí)算法本質(zhì)上是一個(gè)非線性優(yōu)化問題,網(wǎng)絡(luò)模型的確立分為兩個(gè)階段:學(xué)習(xí)階段和檢驗(yàn)階段。學(xué)習(xí)階段是通過對(duì)歷史資料的學(xué)習(xí),使己有的模式以權(quán)系數(shù)的方式存儲(chǔ)于網(wǎng)絡(luò)之中,這實(shí)質(zhì)上是一個(gè)擬合的過程;檢驗(yàn)階段是將已有歷史數(shù)據(jù)輸入網(wǎng)絡(luò)之中,檢驗(yàn)網(wǎng)絡(luò)輸出與實(shí)測值的誤差是否達(dá)到一定的精度要求,如果滿足要求,則BP網(wǎng)絡(luò)可以被用于預(yù)測。采用BP網(wǎng)絡(luò)學(xué)習(xí)方法進(jìn)行模擬分析,構(gòu)造BP網(wǎng)絡(luò)的基本步驟是:
1) 確定BP網(wǎng)絡(luò)的輸入向量、輸出向量的維數(shù)和隱含層數(shù)及節(jié)點(diǎn)數(shù);
2) 確定隱含層傳遞函數(shù)和輸出層傳遞函數(shù)關(guān)系;
3) 將網(wǎng)絡(luò)學(xué)習(xí)樣本劃分為學(xué)習(xí)段和檢驗(yàn)段;
4) 訓(xùn)練網(wǎng)絡(luò),擬合學(xué)習(xí)段時(shí)間序列,使其誤差平方和達(dá)到最??;
5) 用檢驗(yàn)段數(shù)據(jù)檢驗(yàn)訓(xùn)練好的網(wǎng)絡(luò)模型,利用該模型對(duì)未來進(jìn)行預(yù)測。
1.3 BP神經(jīng)網(wǎng)絡(luò)在醫(yī)藥行業(yè)的應(yīng)用
BP神經(jīng)網(wǎng)絡(luò)在醫(yī)藥行業(yè)的應(yīng)用包括藥品采購資金管理、醫(yī)療器材需求和藥品銷售預(yù)測3個(gè)方面。據(jù)文獻(xiàn)報(bào)道[2-3],出于降低庫存,提高管理有效性和運(yùn)作靈活性的目的,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對(duì)研究對(duì)象的歷史數(shù)據(jù)進(jìn)行分析,得出預(yù)測值,并與經(jīng)驗(yàn)性的實(shí)際值進(jìn)行對(duì)比,發(fā)現(xiàn)基于BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,可以有效節(jié)約采購和生產(chǎn)安排的不穩(wěn)定性,降低庫存,從而節(jié)約成本,提高效益。
2 BP神經(jīng)網(wǎng)絡(luò)在湖北省基本藥物采購量預(yù)測中的應(yīng)用
2011年3月13日,湖北省政府辦公廳印發(fā)《湖北省基層醫(yī)療衛(wèi)生機(jī)構(gòu)基本藥物集中采購管理辦法(試行)》,標(biāo)志著該省建立和規(guī)范基本藥物統(tǒng)一招標(biāo)采購新機(jī)制的出臺(tái)[4]。在該辦法中,實(shí)行以省為單位集中采購、統(tǒng)一配送,與藥品生產(chǎn)企業(yè)簽訂購銷合同,一次完成采購全過程,最大限度地降低采購成本,促進(jìn)基本藥物生產(chǎn)和供應(yīng)。
2.1 湖北省基本藥物采購量預(yù)測模型的建立
2.1.1 研究對(duì)象及數(shù)據(jù)準(zhǔn)備
湖北省每月采購的基本藥物品種有1 000種之多,從理論上來說,為了更好地估計(jì)湖北省的基本藥物采購量的預(yù)測值,需要將每種藥物根據(jù)其歷史采購量來建立預(yù)測模型,如此一來會(huì)帶來巨大的工作量。因此,應(yīng)選擇使用頻率比較高、采購比較頻繁、使用特點(diǎn)具有相似性的一大類藥物品種來進(jìn)行研究。綜合對(duì)湖北省每月采購?fù)▓?bào)的分析,選定藥物大類為抗生素類。樣本納入標(biāo)準(zhǔn)為統(tǒng)計(jì)期內(nèi)的采購時(shí)間是連續(xù)的,并且屬于同一大類的不同規(guī)格。
本文建模對(duì)象及數(shù)據(jù)見表1。
2.1.2 基本藥物采購量神經(jīng)網(wǎng)絡(luò)預(yù)測模型的實(shí)現(xiàn)
在進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測之前,為避免原始數(shù)據(jù)過大造成網(wǎng)絡(luò)麻痹,要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理,對(duì)于預(yù)測值,由于變化幅度較大,也不宜直接作為神經(jīng)網(wǎng)絡(luò)的輸出。對(duì)于單極型Sigmoid函數(shù)來說,應(yīng)用如下歸一化處理公式對(duì)樣本數(shù)據(jù)進(jìn)行歸一化處理:
2.2 實(shí)證檢驗(yàn)
湖北省基本藥物采購量神經(jīng)網(wǎng)絡(luò)模型就是利用神經(jīng)網(wǎng)絡(luò)的非線性特性去逼近一個(gè)時(shí)間序列或一個(gè)時(shí)間序列的變形,通過神經(jīng)網(wǎng)絡(luò)清晰的邏輯關(guān)系,利用過去時(shí)刻的值去表達(dá)未來時(shí)刻的值。本文以湖北省部分基本藥物品種采購量為數(shù)據(jù),以月度基本藥物采購量為預(yù)測目標(biāo),用上述的建模方法建立月度基本藥物采購量預(yù)測模型。
第一步,建立預(yù)測模型,對(duì)歸一化的數(shù)據(jù)用MATLAB中提供的函數(shù)進(jìn)行學(xué)習(xí)(圖1),學(xué)習(xí)程序如下:
net=newff(minmax(P), [8 1], {'tansig', 'purelin'}, 'traingdx', 'learngdm');
net.trainparam.epochs=10 000;
net.trainparam.goal=0.005;
net.trainparam.show=500;
[net, tr]=train(net, P, T);
首先,我們?cè)O(shè)定的隱層節(jié)點(diǎn)數(shù)為8,目標(biāo)誤差為0.005,學(xué)習(xí)率設(shè)置為0.01,網(wǎng)絡(luò)經(jīng)過222次迭代之后達(dá)到了指定精度,誤差為0.004 966 8。再分別設(shè)定隱層節(jié)點(diǎn)數(shù)為:6,8,12,15,20;目標(biāo)誤差不變,仍為0.005,學(xué)習(xí)結(jié)果如表2所示。
結(jié)合學(xué)習(xí)次數(shù)和誤差的比較,可以得出在隱層節(jié)點(diǎn)數(shù)設(shè)為15時(shí),學(xué)習(xí)效果較好。
由17個(gè)月樣本藥品的采購量數(shù)據(jù)P為訓(xùn)練值,以第17個(gè)月的采購量為目標(biāo)值,進(jìn)行訓(xùn)練。由于2012年12月的采購量未知,如果要預(yù)測第18個(gè)月采購量則無法用實(shí)際的數(shù)據(jù)進(jìn)行檢驗(yàn)。因此在預(yù)測值調(diào)整為第17個(gè)月的采購量數(shù)據(jù)。測試程序如下:B=sim(net, T)。
誤差為[0.024 9, -0.118 5, -0.170 7, -0.242 2, -0.040 5, 0.143 9, -0.047 5, 0.078 3, -0.066 6, -0.057 3, -0.036 6, 0.003 2, -0.043 6, -0.009 9, 0.020 5, -0.031 0, -0.016 8, 0.057 3, -0.025 1, 0.018 0, 0.036 4, -0.218 0, -0.159 0, -0.112 9, -0.014 81, -0.120 8, 0.134 9, -0.043 6]。誤差均在可接受的范圍內(nèi),認(rèn)可數(shù)據(jù)已得到很好的訓(xùn)練,具備較好的仿真能力。
學(xué)習(xí)的誤差基本上在我們可以接受的范圍內(nèi),其學(xué)習(xí)效果如圖2所示。通過前面己經(jīng)驗(yàn)證,該網(wǎng)絡(luò)的學(xué)習(xí)能力以及預(yù)測能力有很大的優(yōu)越性。
2.3 預(yù)測結(jié)果分析
通過反歸一化公式:得到第17個(gè)月即2012年11月各藥品的采購值。將2012年11月的實(shí)際采購量與實(shí)證檢驗(yàn)建立模型后所得到的預(yù)測中結(jié)果進(jìn)行比較,結(jié)果見表3。
從表3中我們可以看出,除了個(gè)別品種誤差較大以外,如注射用苯唑西林鈉為530.21%、硫酸奈替米星注射液為52.60%,阿莫西林膠囊為42.89%,BP神經(jīng)網(wǎng)絡(luò)模型對(duì)基本藥物的采購量的預(yù)測誤差率大多數(shù)在10%以下,經(jīng)Excel數(shù)據(jù)分析工具中成對(duì)雙樣本均值t檢驗(yàn)分析,結(jié)果見表4。
因?yàn)镻 > 0.05,故預(yù)測值與實(shí)際值均值差異無統(tǒng)計(jì)學(xué)意義。
模型預(yù)測結(jié)果是比較令人滿意的。由于在本次研究中藥品采購量的變化是在時(shí)間序列上面進(jìn)行的,所采取的預(yù)測方法是單步預(yù)測,每月的藥物采購量還要受很多因素影響,不可能做到預(yù)測結(jié)果與實(shí)際的數(shù)據(jù)完全一致。除此之外,基本藥物制度實(shí)施的時(shí)間并不長,在湖北省基本藥物集中采購平臺(tái)上所獲取采購量的數(shù)據(jù)時(shí)間范圍也不長,所以個(gè)別藥品誤差的較大偏倚也在預(yù)料之中。
根據(jù)計(jì)算得出的結(jié)果,可以很好地預(yù)測一個(gè)月或幾個(gè)月內(nèi)內(nèi)湖北省的基本藥物采購量,相關(guān)基本藥物生產(chǎn)企業(yè)可以根據(jù)預(yù)測結(jié)果做好生產(chǎn)計(jì)劃安排和原料采購等工作,提高企業(yè)生產(chǎn)運(yùn)作效率和經(jīng)濟(jì)效益;基本醫(yī)療機(jī)構(gòu)可以根據(jù)情況調(diào)整藥物儲(chǔ)備和使用量,以使基本藥物的利用率和可及性都能得到很好的保障。
3 總結(jié)與展望
本文對(duì)湖北省2011年5月-2012年11月抗生素大類的部分基本藥物品種的采購量預(yù)測進(jìn)行了定量分析,主要采用了BP神經(jīng)網(wǎng)絡(luò)法進(jìn)行預(yù)測的實(shí)證研究,不僅簡化了網(wǎng)絡(luò)結(jié)構(gòu),而且提高了預(yù)測精度。結(jié)果比較理想,說明本文所建立的基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有較好的預(yù)測能力和推廣潛力。
1) 采購決策行為是由主觀因素及客觀因素相互影響共同構(gòu)成,具有動(dòng)態(tài)性和復(fù)雜性等特點(diǎn)。人工神經(jīng)網(wǎng)絡(luò)作為高度非線性體系,能夠?qū)τ绊懖少徯袨榈母髯兞恐g的非線性關(guān)系進(jìn)行高精度的逼近,從而實(shí)現(xiàn)預(yù)測功能。
2) 實(shí)證表明,人工神經(jīng)網(wǎng)絡(luò)雖然存在不足,但其優(yōu)勢還是顯而易見的。人工神經(jīng)網(wǎng)絡(luò)是一個(gè)高度自動(dòng)化的系統(tǒng),只要有基本藥物的歷史采購量,通過神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和仿真,達(dá)到滿意精度后即可輸出特定時(shí)間點(diǎn)的采購量,為基本藥物采購決策提供科學(xué)的信息支持。但由于影響基本藥物采購的各因素并不明了,難以對(duì)基藥采購量的波動(dòng)情況進(jìn)行解釋,無法提供有意義的干預(yù)措施。
3) 由于社區(qū)衛(wèi)生服務(wù)機(jī)構(gòu)長期以來缺乏對(duì)藥品使用數(shù)據(jù)的收集,在對(duì)其藥品需求分析時(shí)沒有足夠多的信息予以支持,所以在對(duì)BP神經(jīng)網(wǎng)絡(luò)的推廣應(yīng)用中,需要保證社區(qū)醫(yī)療機(jī)構(gòu)對(duì)藥品使用數(shù)據(jù)的收集、整理與統(tǒng)計(jì),從而增加預(yù)測的準(zhǔn)確性。
4) 加強(qiáng)有關(guān)基本藥物采購分析的理論研究?;舅幬锊煌谝话闵唐罚涔┬桕P(guān)系雖然較為穩(wěn)定,但是在現(xiàn)存醫(yī)患信息極不對(duì)稱的情況下,由于誘導(dǎo)需求、道德風(fēng)險(xiǎn)等問題造成劣品驅(qū)逐良品的現(xiàn)象,而對(duì)基本藥物的可及性和供需帶來不必要的風(fēng)險(xiǎn)。現(xiàn)行的有關(guān)基本藥物采購理論還需進(jìn)一步完善。
5) 對(duì)基本藥物采購量分析方法的探索。本文運(yùn)用BP神經(jīng)網(wǎng)絡(luò)在基本藥物采購量短期預(yù)測上面進(jìn)行一次有益的探索,結(jié)論雖然具備理論指導(dǎo)意義和實(shí)際應(yīng)用價(jià)值。但是由于BP神經(jīng)網(wǎng)絡(luò)無法探知對(duì)變量造成波動(dòng)的影響因素,若從現(xiàn)實(shí)意義進(jìn)行指導(dǎo),還需要結(jié)合其他的分析方法如多元回歸分析、主成分分析等方法來相互補(bǔ)充,揚(yáng)長避短。
參考文獻(xiàn)
[1] 王維, 賀京同, 張建勛, 等. 人工神經(jīng)網(wǎng)絡(luò)在非線性經(jīng)濟(jì)預(yù)測中的應(yīng)用[J]. 系統(tǒng)工程學(xué)報(bào), 2000, 15(2): 202-207.
[2] 劉衛(wèi)紅, 崔振霞. 基于BP神經(jīng)網(wǎng)絡(luò)的藥品采購資金管理研究[J]. 中國鄉(xiāng)鎮(zhèn)企業(yè)會(huì)計(jì), 2012, 20(1): 70-71.
[3] 張俊才, 黃萬杰. BP神經(jīng)網(wǎng)絡(luò)在醫(yī)療器材需求預(yù)測中的應(yīng)用[J]. 醫(yī)療衛(wèi)生裝備, 2004, 25(4): 8-9.
(黑龍江民族職業(yè)學(xué)院,黑龍江 哈爾濱 150066)
摘 要:盈余預(yù)測具有引導(dǎo)投資者投資行為的作用,因此受到投資者的廣泛重視。然而,國內(nèi)對(duì)公司未來盈利進(jìn)行預(yù)測的研究還相當(dāng)少。提出了以決策樹作為基分類器,采用集成學(xué)習(xí)方法,利用上市某公司2001至2005年的財(cái)務(wù)數(shù)據(jù)對(duì)該上市公司在2006年的盈利狀況進(jìn)行預(yù)測研究。首先,采用有放回的隨機(jī)抽樣技術(shù)分別從訓(xùn)練樣本和測試樣本中產(chǎn)生50個(gè)訓(xùn)練子集和1個(gè)測試集;然后利用決策樹,采用CHAID算法對(duì)50個(gè)訓(xùn)練子集分別進(jìn)行訓(xùn)練,得到50個(gè)基決策樹分類器;通過采用Bagging方法,構(gòu)建決策樹集成模型。所得到的集成模型在測試集上的分類準(zhǔn)確率達(dá)到96%以上,通過比較由不同數(shù)目的基分類器構(gòu)成的集成模 型和單個(gè)分類器的預(yù)測準(zhǔn)確率,證明了該集成模型的預(yù)測準(zhǔn)確率高且穩(wěn)定。
關(guān)鍵詞 :神經(jīng)網(wǎng)絡(luò);集成學(xué)習(xí);盈利預(yù)測
中圖分類號(hào):F275文獻(xiàn)標(biāo)志碼:A文章編號(hào):1000-8772(2014)31-0253-02
收稿日期:2014-10-28
作者簡介:潘道華(1981-),女,漢族,黑龍江哈爾濱人,研究生,主要研究方向:人工智能、數(shù)據(jù)挖掘與決策支持。
1 引言
公司的財(cái)務(wù)狀況及其未來盈利情況不但對(duì)公司的管理層十分重要,而且對(duì)其他投資者也非常重要。如果能夠利用公司以往的財(cái)務(wù)報(bào)表數(shù)據(jù)和其它一些宏觀經(jīng)濟(jì)數(shù)據(jù)(如GDP、CPI、利率等)及早準(zhǔn)確預(yù)測公司未來的盈利狀況的話,那么就可以更有效地對(duì)公司進(jìn)行管理和指導(dǎo)投資者的投資行為。但是,一個(gè)公司的財(cái)務(wù)報(bào)表往往只反映了公司在過去的財(cái)政年度內(nèi)的經(jīng)營狀況,并不反映出公司在下一年中的管理情況。因而,一個(gè)公司的財(cái)務(wù)狀況與其未來盈利之間的關(guān)系并沒有那么明顯,它受到很多因素的影響,要構(gòu)建一個(gè)精確的模型反映它們之間的關(guān)系是很困難的。針對(duì)此情況,本文提出采用決策樹集成方法,構(gòu)建模型來刻畫公司財(cái)務(wù)狀況與其未來盈利之間的關(guān)系,利用上市公司已有的財(cái)務(wù)數(shù)據(jù),并結(jié)合主要的宏觀經(jīng)濟(jì)變量來預(yù)測公司未來的盈利狀況,這必將是公司財(cái)務(wù)處理的一個(gè)新發(fā)展。
數(shù)據(jù)挖掘技術(shù)越來越多地被用于預(yù)測研究。集成學(xué)習(xí)方法作為數(shù)據(jù)挖掘技術(shù)中一種較新的方法,由于其在提高預(yù)測的準(zhǔn)確性上的優(yōu)點(diǎn),正被越來越多的研究者使用。
盡管許多領(lǐng)域都應(yīng)用集成學(xué)習(xí)方法來進(jìn)行研究,但在對(duì)公司未來盈利的預(yù)測研究上還很少,在國內(nèi)尚未見到任何報(bào)導(dǎo)。雖然Takashi Washio等人對(duì)日本上市公司的未來盈利狀況進(jìn)行了研究,但是他們只是將盈利狀況分為兩種情況來進(jìn)行研究。本文通過利用集成學(xué)習(xí)方法,考慮宏觀經(jīng)濟(jì)對(duì)公司盈利可能造成的影響,提出將宏觀經(jīng)濟(jì)變量納入變量體系,同時(shí),為了使結(jié)果更有指導(dǎo)意義,將上市公司的每股收益(EPS)指標(biāo)將公司盈利的情況劃分為三類,即EPS為負(fù),EPS大于均值及EPS介于二者之間,對(duì)其進(jìn)行預(yù)測研究。
2 研究方法
2.1神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是由大量并行分布式處理單元組成的簡單處理單元[1]。由于神經(jīng)網(wǎng)絡(luò)具有非線性,自學(xué)習(xí)能力、自適應(yīng)性強(qiáng)和容錯(cuò)性高等優(yōu)點(diǎn),因而被廣泛用于各種非線性預(yù)測問題。
所有神經(jīng)網(wǎng)絡(luò)都有一個(gè)輸入層和輸出層,一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)可以包含一個(gè)或多個(gè)隱含層。神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)是通過調(diào)整連接權(quán)重和偏差實(shí)現(xiàn)的。Cybenko等人證明了如果神經(jīng)網(wǎng)絡(luò)利用一個(gè)有界的,連續(xù)的,非遞減的激活函數(shù)時(shí),只要不對(duì)隱含層的神經(jīng)元數(shù)進(jìn)行限制,一個(gè)三層網(wǎng)絡(luò)(包含一個(gè)隱含層)就能夠?qū)W習(xí)任意一個(gè)在輸入和輸出空間的連續(xù)映射[2]。在實(shí)際應(yīng)用中用的最多的是BP神經(jīng)網(wǎng)絡(luò)。
BP神經(jīng)網(wǎng)絡(luò)是一種基于誤差后向傳播算法(BP算法)的多層感知器網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)的激活函數(shù)一般采用Log-Sigmoid或Tangent Sigmoid等可微函數(shù)。BP算法分為兩個(gè)階段。第一階段是前向過程,逐層計(jì)算各神經(jīng)元的輸出值,第二階段是誤差后向傳播過程,從后向前逐層傳播輸出層的誤差并據(jù)此修正各層權(quán)重,直到輸出結(jié)果滿足預(yù)先設(shè)定的精度要求或達(dá)到算法設(shè)定的最大循環(huán)次數(shù)。
2.2神經(jīng)網(wǎng)絡(luò)集成
如何根據(jù)觀測數(shù)據(jù)學(xué)習(xí)得到精確估計(jì)是機(jī)器學(xué)習(xí)領(lǐng)域中人們非常關(guān)注的一個(gè)問題,機(jī)器學(xué)習(xí)的一個(gè)重要目標(biāo)就是對(duì)新的測試樣本盡可能給出最精確的估計(jì)。構(gòu)造一個(gè)高精度估計(jì)是一件相當(dāng)困難的事情,然而產(chǎn)生多個(gè)只比隨機(jī)猜測好的粗糙估計(jì)卻很容易。傳統(tǒng)的機(jī)器學(xué)習(xí)方法是在一個(gè)由各種可能的函數(shù)構(gòu)成的空間中尋找最接近實(shí)際分類函數(shù)的分類器。常用的單個(gè)分類器模型主要有決策樹、人工神經(jīng)網(wǎng)絡(luò)等。
集成學(xué)習(xí)(ensemble learning)的基本思想是在對(duì)新的實(shí)例進(jìn)行分類的時(shí)候,把若干個(gè)單個(gè)分類器集成起來,通過對(duì)多個(gè)分類器的分類結(jié)果按某種方式來進(jìn)行組合,決定最終的分類,以取得比單個(gè)分類器更好的結(jié)果。如果把單個(gè)分類器比作一個(gè)決策者的話,集成學(xué)習(xí)方法就相當(dāng)于多個(gè)決策者共同進(jìn)行一項(xiàng)決策。
盡管單個(gè)神經(jīng)網(wǎng)絡(luò)在處理非線性問題上表現(xiàn)良好,但是用單個(gè)神經(jīng)網(wǎng)絡(luò)來進(jìn)行預(yù)測,一個(gè)不足的地方就是結(jié)果的穩(wěn)定性差。因?yàn)樯窠?jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果受網(wǎng)絡(luò)各層之間的初始權(quán)重影響很大。為了克服這一不足,本文利用集成學(xué)習(xí)的思想,采用以BP神經(jīng)網(wǎng)絡(luò)作為基分類器的神經(jīng)網(wǎng)絡(luò)集成方法來對(duì)公司未來盈利狀況進(jìn)行預(yù)測。
以神經(jīng)網(wǎng)絡(luò)作為基分類器構(gòu)建集成模型的方法主要有Bagging和Boosting。本文選擇采用Bagging方法,因?yàn)锽agging方法較易于實(shí)現(xiàn),而且不容易產(chǎn)生過擬合現(xiàn)象。對(duì)一個(gè)已知的有n個(gè)數(shù)據(jù)元素的數(shù)據(jù)集,Bagging法的原理是[1]:對(duì)每次循環(huán)(=1,2,…,),采用有放回的隨機(jī)抽樣方法從數(shù)據(jù)集中抽取m個(gè)數(shù)據(jù)形成訓(xùn)練集(mn),分類器模型從中學(xué)習(xí)。為了對(duì)一個(gè)未知的元素X分類,每個(gè)都返回一個(gè)分類值,將該分類值看成是一票,而最后的集成分類器,通過統(tǒng)計(jì)這些投票,將X歸為得票最多的那一類。
3 研究步驟與具體實(shí)例分析
3.1樣本選取
本文采用的上市公司數(shù)據(jù)樣本來自天軟數(shù)據(jù)庫。在剔除了財(cái)務(wù)變量有大量缺失值后,樣本共包含從2001年至2006年的深市和滬市A股的1174家上市公司。其中,滬市上市公司734家,深市440家。本文選取了反映上市公司償債能力,成長能力,經(jīng)營能力,資本結(jié)構(gòu),盈利能力,現(xiàn)金流,每股指標(biāo)等方面的29個(gè)財(cái)務(wù)變量作為初始變量。此外,為了研究宏觀經(jīng)濟(jì)環(huán)境對(duì)公司未來盈利的影響,相應(yīng)的選擇了2001年至2006年的三個(gè)宏觀經(jīng)濟(jì)變量:國內(nèi)生產(chǎn)總值增長率(GDP),居民消費(fèi)價(jià)格指數(shù)增長率(CPI)及一年期金融機(jī)構(gòu)貸款基準(zhǔn)利率。這幾個(gè)變量都與公司的盈利狀況有著密切的關(guān)系。國內(nèi)生產(chǎn)總值反映了整個(gè)國家的經(jīng)濟(jì)狀況,而居民消費(fèi)價(jià)格指數(shù)是反映居民購買并用于消費(fèi)的商品和服務(wù)項(xiàng)目價(jià)格水平的變動(dòng)趨勢和變動(dòng)幅度的相對(duì)數(shù),它可以全面反映多種市場價(jià)格變動(dòng)因素及其對(duì)居民實(shí)際生活的影響程度。一年期金融機(jī)構(gòu)貸款基準(zhǔn)利率會(huì)影響公司的營運(yùn)成本,會(huì)對(duì)公司的利潤產(chǎn)生直接的影響。所有變量見附表。
為了預(yù)測未來公司的盈利狀況,本文將數(shù)據(jù)樣本分為訓(xùn)練樣本和測試樣本。其中,訓(xùn)練樣本由2001年至2005年的公司樣本數(shù)據(jù)用有放回的隨機(jī)抽樣方法得到,每個(gè)訓(xùn)練樣本包含1000個(gè)觀測,測試樣本是用相同方法得到的上市公司在2006年的數(shù)據(jù)樣本,包含400個(gè)觀測。
3.2指標(biāo)選擇
對(duì)于初始變量表,變量之間存在著相關(guān)性。雖然神經(jīng)網(wǎng)絡(luò)對(duì)變量間的相關(guān)性具有較強(qiáng)的容忍度,但是,變量太多會(huì)增加網(wǎng)絡(luò)的復(fù)雜度,還有可能使網(wǎng)絡(luò)過適應(yīng),從而使得網(wǎng)絡(luò)在測試樣本上的表現(xiàn)很差,而且并不是變量越多,神經(jīng)網(wǎng)絡(luò)的預(yù)測精度就越大,所以適當(dāng)選擇具有代表性的指標(biāo)變量既可以達(dá)到與用所有變量相同的預(yù)測精度,又能降低網(wǎng)絡(luò)的復(fù)雜度,避免使網(wǎng)絡(luò)陷入過適應(yīng),提高網(wǎng)絡(luò)的訓(xùn)練速度。
然而,運(yùn)用神經(jīng)網(wǎng)絡(luò)方法,對(duì)輸入變量的選取目前并沒有一個(gè)公認(rèn)的方法。為了從眾多的初始變量中選擇具有代表性的變量,本文利用spss Clementine11.1數(shù)據(jù)挖掘軟件包選項(xiàng)面板中的建模欄中的特征選擇節(jié)點(diǎn)來對(duì)變量進(jìn)行篩選。通過構(gòu)建一個(gè)帶有特征選擇節(jié)點(diǎn)的流,可以為每一訓(xùn)練集篩選出重要的變量。利用篩選出來的變量和全部變量分別對(duì)訓(xùn)練樣本進(jìn)行訓(xùn)練,得到兩種神經(jīng)網(wǎng)絡(luò)模型,分別對(duì)測試樣本進(jìn)行分類,并分別構(gòu)建集成模型。
3.3 建立模型
本文是對(duì)2001年至2005年上市公司的數(shù)據(jù)樣本進(jìn)行訓(xùn)練得到單個(gè)神經(jīng)網(wǎng)絡(luò)模型,用該模型對(duì)測試樣本進(jìn)行預(yù)測。如何產(chǎn)生不同的分類模型是影響集成模型準(zhǔn)確性的一個(gè)重要因素[4]。以下四種方法——不同的初始條件,不同的網(wǎng)絡(luò)結(jié)構(gòu),不同的訓(xùn)練數(shù)據(jù),不同的訓(xùn)練算法常用來產(chǎn)生分類模型。本文采用不同的訓(xùn)練數(shù)據(jù)和不同的網(wǎng)絡(luò)結(jié)構(gòu)這兩種方式結(jié)合得到基神經(jīng)網(wǎng)絡(luò)。
按照Bagging方法的要求,本文采用有放回隨機(jī)抽樣方法,從訓(xùn)練樣本中隨機(jī)抽取了15個(gè)子訓(xùn)練集,并用相同的方法從測試集中抽取了400個(gè)樣本數(shù)據(jù)組成測試集。每個(gè)子訓(xùn)練集含有1000個(gè)樣本,它們均由2001至2005年的200個(gè)公司樣本組成。利用特征選擇節(jié)點(diǎn)在每個(gè)訓(xùn)練集上選出的變量分別在這15個(gè)子樣本上進(jìn)行訓(xùn)練得到子分類器,然后用這些子分類器對(duì)測試樣本進(jìn)行分類。采用多數(shù)投票法對(duì)子分類器進(jìn)行集成,得到集成方法在測試集上的預(yù)測結(jié)果。
3.4 結(jié)果分析
為了比較集成模型與單個(gè)神經(jīng)網(wǎng)絡(luò)預(yù)測準(zhǔn)確率的差異,按照單個(gè)神經(jīng)網(wǎng)絡(luò)模型預(yù)測準(zhǔn)確率按升序進(jìn)行排序,分別計(jì)算了由7個(gè)、9個(gè)、11個(gè)、13個(gè)、15個(gè)基神經(jīng)網(wǎng)絡(luò)模型構(gòu)成的集成模型的預(yù)測準(zhǔn)確率,集成模型,不論是由用全部變量進(jìn)行訓(xùn)練得到的基神經(jīng)網(wǎng)絡(luò)構(gòu)建還是由用篩選出的變量進(jìn)行訓(xùn)練得到的構(gòu)建,都顯示出了很高的準(zhǔn)確率,而且得到的預(yù)測準(zhǔn)確率相當(dāng)穩(wěn)定。
4 結(jié)論
本文利用神經(jīng)網(wǎng)絡(luò)集成的方法,以上市公司過去的財(cái)務(wù)數(shù)據(jù)和宏觀經(jīng)濟(jì)數(shù)據(jù)為樣本,對(duì)上市公司的未來盈利狀況進(jìn)行預(yù)測。研究結(jié)果表明,相比于單個(gè)神經(jīng)網(wǎng)絡(luò)模型,盡管選用7個(gè)預(yù)測精度最差的單個(gè)神經(jīng)網(wǎng)絡(luò)作為基神經(jīng)網(wǎng)絡(luò),其集成網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率仍然很高,因而集成方法得到的結(jié)果更穩(wěn)定,更具有說服力。
由于上市公司管理水平的差異,影響公司盈利狀況的因素又多,所以要想較好的刻畫它們對(duì)盈利狀況的影響,是一個(gè)很有挑戰(zhàn)性的問題。本文的研究結(jié)果還表明,采用神經(jīng)網(wǎng)絡(luò)集成方法來研究未來盈利狀況是可行的。進(jìn)一步的研究可以從以下幾個(gè)方面考慮:
(1)變量的選取。為了使預(yù)測更為準(zhǔn)確,在建模時(shí),需要考慮更多的影響因素。由于公司盈利狀況跟公司的管理水平直接相關(guān),因此,如何合理選取量化一些有關(guān)公司治理的指標(biāo)變量,將它們加入到模型中去,是一個(gè)值得深入研究的問題。
(2)產(chǎn)生集成神經(jīng)網(wǎng)絡(luò)的方法。除了Bagging方法,還有其他產(chǎn)生集成神經(jīng)網(wǎng)絡(luò)的方法,比如Boosting方法。不同的方法會(huì)得到不同的結(jié)果,從而通過比較不同的結(jié)果,可以得到一個(gè)用來研究此類問題的最好的方法。
參考文獻(xiàn):
[1] Lars Kar Hansen, Peter Salamon. Neural network ensembles,IEEE transactions on pattern analysis and machine intelligence,vol.12, pp993-1001, 1990.
[2] Li-Chiu Chia,Tseng-Chung Tang. Artificial neural networks in reorganization outcome and investment of distressed firms: The Taiwanese case, Expert Systems with Applications, vol.29,pp641-652, 2005.
[3] Jiawei Han Micheline Kamber, data mining; concepts and tech-niques(second edition)[M].北京:機(jī)械工業(yè)出版社,2006.
關(guān)鍵詞:GPS;高程擬合;大地高;正常高;擬合精度
Abstract: This paper discussed in detail the problems of GPS leveling survey, summarizes the commonly used methods of GPS height fitting, quasi geoid instances to two surface, polyhedral function, BP neural network method to fit the calculation by using MATLAB language program, analysis and draw some conclusions.
Key words: GPS; height; geodetic height; normal height; fitting accuracy
中圖分類號(hào):P228.4 文獻(xiàn)標(biāo)識(shí)碼: A文章編號(hào):2095-2104(2012)01-0020-02
一、引言
由于精度的限制,長期以來,工程應(yīng)用領(lǐng)域在利用GPS測量中平面位置信息的同時(shí),浪費(fèi)掉了大量高程信息。因此,GPS測高在一定程度上取代幾何水準(zhǔn)的限制性和可行性一直受到各方面關(guān)注。利用GPS水準(zhǔn)進(jìn)行測高,主要是通過GPS水準(zhǔn)擬合所測區(qū)域的高程異常分布,將GPS所測點(diǎn)的大地高轉(zhuǎn)化為正常高。由GPS得到正常高,其精度取決于多方面因素,本文采用多種擬合模型,對(duì)大范圍GPS水準(zhǔn)實(shí)測數(shù)據(jù)做了實(shí)驗(yàn)研究,對(duì)其結(jié)果進(jìn)行了比較,討論了相關(guān)問題,得出了具有實(shí)際應(yīng)用的參考意見。
二、似大地水準(zhǔn)面的模擬與GPS高程擬合
GPS高程測量的基本原理
由高程系統(tǒng)的理論可知,測站點(diǎn)的大地高H與正常高h(yuǎn)之間有如下關(guān)系:
h=H-ζ (1)
式中ζ稱為高程異常。
由(1)式可看出, 若能求出GPS點(diǎn)的高程異常,就可確定GPS點(diǎn)的正常高h(yuǎn)。因此,高程異常的確定成為GPS高程轉(zhuǎn)換的關(guān)鍵。
縱觀高程異常的確定方法,可以分為幾何解析法和重力法兩類。
幾何解析法是用一個(gè)1次或高次的解析多項(xiàng)式擬合出測區(qū)的似大地水準(zhǔn)面,進(jìn)而內(nèi)插出GPS點(diǎn)上的高程異常值。
GPS重力高程是用重力資料求定點(diǎn)的高程異常,結(jié)合GPS求出的大地高,再求出點(diǎn)的正常高(或正高)的一種方法,應(yīng)用中需結(jié)合地形數(shù)字模型和地球重力場模型數(shù)據(jù)。對(duì)于一般工程單位而言,無法獲得必要的重力數(shù)據(jù),故重力法難于普及。
本文主要研究從幾何觀點(diǎn)出發(fā)推求大地水準(zhǔn)面的方法,此類方法的基本思想如下:
假設(shè)在測區(qū)內(nèi)有若干個(gè)既進(jìn)行了GPS測量又聯(lián)測了水準(zhǔn)高程的GPS點(diǎn),那么可利用大地高和高程異常之間的關(guān)系,推算出各水準(zhǔn)重合點(diǎn)的上的高程異常,利用這些離散數(shù)據(jù)點(diǎn)上的異常值,可以擬合出測區(qū)所在局部區(qū)域的似大地水準(zhǔn)面,進(jìn)而可以內(nèi)插出未知點(diǎn)上的高程異常,實(shí)現(xiàn)橢球高向正常高的轉(zhuǎn)換。
幾種常用的擬合方法
繪等值線圖法
這是最早的GPS水準(zhǔn)方法。其原理是:設(shè)在某一測區(qū),有m個(gè)GPS點(diǎn),用幾何水準(zhǔn)聯(lián)測其中n個(gè)點(diǎn)的正常高,根據(jù)GPS觀測獲得的點(diǎn)的大地高,按(1)式求出n個(gè)已知點(diǎn)的高程異常。然后,選定適合的比例尺,按n個(gè)已知點(diǎn)的平面坐標(biāo)(平面坐標(biāo)經(jīng)GPS網(wǎng)平差后獲得),展繪在圖紙上,并標(biāo)注上相應(yīng)的高程異常,再用1~5cm的等高距,繪出測區(qū)的高程異常圖。在圖上內(nèi)插出未聯(lián)測幾何水準(zhǔn)的(m-n)個(gè)點(diǎn)的高程異常,從而求出這些待求點(diǎn)的正常高。
三次樣條曲線擬合
當(dāng)測線長,已知點(diǎn)多,ζ變化大時(shí),如果進(jìn)行整體擬合,精度較低,若分段擬合計(jì)算,則分段點(diǎn)上將不連續(xù),且影響擬合精度,這時(shí)宜用三次樣條曲線擬合。
多面函數(shù)擬合
多面函數(shù)是從幾何觀點(diǎn)出發(fā),解決根據(jù)數(shù)據(jù)點(diǎn)形成一個(gè)平差的數(shù)學(xué)曲面問題。其理論根據(jù)是認(rèn)為“任何一個(gè)圓滑的數(shù)學(xué)表面總可以用一系列有規(guī)則的數(shù)學(xué)表面總和,以任意的精度逼近”。它在每個(gè)數(shù)據(jù)點(diǎn)上同各個(gè)已知點(diǎn)分別建立函數(shù)關(guān)系(這種函數(shù)稱為核函數(shù),其表現(xiàn)形式為一規(guī)則的數(shù)學(xué)曲面),將這些規(guī)則的數(shù)學(xué)曲面按一定的比例疊加起來,就可以擬合出任何不規(guī)則的曲面,且能達(dá)到較好的擬合效果。多面函數(shù)的核函數(shù)可以按幾何關(guān)系確定,它是距離的函數(shù),且顧及了待定點(diǎn)和已知點(diǎn)間的相關(guān)關(guān)系,起權(quán)系數(shù)矩陣作用。
加權(quán)平均值法擬合
采用加權(quán)平均值法推算未知點(diǎn)的高程異常進(jìn)行GPS高程轉(zhuǎn)換時(shí),必須使水準(zhǔn)重合點(diǎn)沿控制網(wǎng)比較均勻地分布,使推算點(diǎn)位于已知點(diǎn)所圍成的多邊形內(nèi),否則不能保證內(nèi)插點(diǎn)上計(jì)算結(jié)果的可靠性。另外,還應(yīng)使多邊形范圍內(nèi)有一定數(shù)量的水準(zhǔn)重合點(diǎn),并盡可能地均勻分布。一些實(shí)驗(yàn)與分析資料顯示,控制網(wǎng)中水準(zhǔn)重合點(diǎn)的數(shù)量越多,密度越大,分布情況越好,利用加權(quán)平均值法求得的高程異常值的準(zhǔn)確程度越高 (即GPS大地高轉(zhuǎn)換為正常高的實(shí)際精度越高)。一般要求一個(gè)網(wǎng)中水準(zhǔn)重合點(diǎn)的數(shù)量要保持在10個(gè)左右,至少為 6個(gè)。
曲面擬合法
當(dāng)GPS點(diǎn)布設(shè)成一定區(qū)域面時(shí),可以應(yīng)用數(shù)學(xué)曲面擬合法求定待定點(diǎn)的正常高。其原理是:根據(jù)測區(qū)中已知點(diǎn)的平面坐標(biāo)(X,Y),或大地坐標(biāo)(B,L)和ζ值,用數(shù)值擬合法,擬合出測區(qū)似大地水準(zhǔn)面,再內(nèi)插出待求點(diǎn)的ζ,從而求出待求點(diǎn)的正常高。
神經(jīng)網(wǎng)絡(luò)法
人工神經(jīng)網(wǎng)絡(luò)是一門新興交叉科學(xué),它是生物神經(jīng)系統(tǒng)的一種高度簡化后的近似,是處理非線形映射問題的有效工具?;谏窠?jīng)網(wǎng)絡(luò)來轉(zhuǎn)換GPS高程是一種自適應(yīng)的映射方法,設(shè)作假設(shè),理論上比較合理,能避開未知因素的影響,減少人為構(gòu)造的數(shù)學(xué)模型的誤差。
擬合法進(jìn)行GPS高程轉(zhuǎn)換的幾個(gè)問題
(1)擬合函數(shù)的選取。大范圍GPS水準(zhǔn)高程異常分布的嚴(yán)格確定是十分困難的,高程異常的確定不僅取決與地球內(nèi)部密度變化而且還取決地形起伏等各種因素。因此,用一種數(shù)學(xué)函數(shù)去擬合測區(qū)中給定的高程異常點(diǎn),其模型誤差是不可避免的,選取模型誤差較小的擬合方程來描述其高程異常分布是一種相對(duì)合理的方法。
(2)如果選擇的擬合模型較好,能否較準(zhǔn)確的擬合出該測區(qū)的局部似大地水準(zhǔn)面的關(guān)鍵在于已知高程異常值的準(zhǔn)確性。采用擬合法確定地面點(diǎn)的正常高是建立在兩個(gè)前提基礎(chǔ)上的:平差后的GPS高程觀測值具有很高的精度,可以看作是精確值;已知高程控制點(diǎn)上的正常高亦可看成精確值。
(3)GPS網(wǎng)中水準(zhǔn)點(diǎn)的選擇和分布。水準(zhǔn)點(diǎn)的分布對(duì)于擬合效果有著至關(guān)重要的影響。原則上要求水準(zhǔn)重合點(diǎn)的分布盡可能的均勻,而且在網(wǎng)的邊界上布設(shè)水準(zhǔn)重合點(diǎn),這樣可以大大降低內(nèi)插出的非重合點(diǎn)上的高程異常的不可靠性。
三、實(shí)驗(yàn)研究
為研究擬合模型,水準(zhǔn)點(diǎn)的精度及布設(shè)形式對(duì)擬合精度的影響,本文利用上述模型中的曲面擬合法、多面擬合法及神經(jīng)網(wǎng)絡(luò)法,用MATLAB語言編程實(shí)現(xiàn)了對(duì)某GPS網(wǎng)的高程擬合。
(1)實(shí)驗(yàn)區(qū)概況
該GPS控制網(wǎng)共有15個(gè)點(diǎn)與水準(zhǔn)點(diǎn)重合,控制面積為150k m2, 測區(qū)水準(zhǔn)點(diǎn)分布圖如圖1,高程成果表見表1。
圖1點(diǎn)位分布圖
測區(qū)高程成果表表1
從表 1 中的高程異常值可知,該測區(qū)的局部似大地水準(zhǔn)面較為平緩,且沒有顯現(xiàn)孤值性,均可參加擬合計(jì)算。
(2)為了選擇較好的擬合方案,對(duì)如下的幾種情況做了計(jì)算,并分析比較擬合結(jié)果。
(1)隨機(jī)選擇10個(gè)已知點(diǎn),用二次曲面、多面函數(shù)、BP網(wǎng)絡(luò)進(jìn)行擬合,結(jié)果見表2。
(2)選擇10個(gè)分布比較均勻的已知點(diǎn),用二次曲面、多面函數(shù)、BP網(wǎng)絡(luò)進(jìn)行擬合,結(jié)果見表3。
不同模型隨機(jī)選點(diǎn)擬合結(jié)果 表2
不同模型均勻選點(diǎn)擬合結(jié)果表3
四、結(jié)論
從上面擬合結(jié)果比較得出如下結(jié)論:
(1)某一區(qū)域的GPS高程擬合與模型的選擇有很大關(guān)系,選擇某一模型的時(shí)候,既要橫向比較,即同一模型不同條件比較,也要縱向比較,即不同模型之間比較。
(2)GPS水準(zhǔn)高程擬合精度與已知點(diǎn)的精度有關(guān)。當(dāng)已知點(diǎn)精度降低時(shí),待定點(diǎn)精度明顯降低,要得到較高精度的GPS水準(zhǔn)高程,就需要保證已知點(diǎn)精度。
(3)已知點(diǎn)的位置對(duì)GPS水準(zhǔn)高程擬合的精度影響很大。待定點(diǎn)精度在很大程度上取決與已知點(diǎn)的分布狀況。在進(jìn)行GPS水準(zhǔn)高程擬合時(shí),一定要使已知點(diǎn)均勻分布整個(gè)測區(qū),并具有一定的代表性。
(4)在較大范圍內(nèi),用神經(jīng)網(wǎng)絡(luò)方法轉(zhuǎn)換GPS高程優(yōu)于二次曲面和多面函數(shù)法,所獲得的正常高可滿足各種大比例尺測圖的精度要求。
參考文獻(xiàn):
[1]陶本藻,蔡風(fēng)萍 大范圍GPS水準(zhǔn)擬合模型的選取及其實(shí)驗(yàn)研究[J].工程勘察,2005,(1)。
[2]李崇貴,牟玉香,趙書河用嶺估計(jì)研究不完全三維趨勢面在GPS工程水準(zhǔn)測量中的應(yīng)用[J].測繪通報(bào),1998,(8)。
關(guān)鍵詞: 高維BP神經(jīng)網(wǎng)絡(luò); 粒子群算法; 神經(jīng)網(wǎng)絡(luò); 結(jié)構(gòu)優(yōu)化
中圖分類號(hào): TN711?34; TP311 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)03?0157?03
Research on a neural network structure optimization method based on
high?dimensional particle swarm optimization
HUANG Yu1, 2
(1. College of Computer Science, Chongqing University, Chongqing 400044, China; 2. Yibin Vocational and Technical College, Yibin 644003, China)
Abstract: In order to eliminate the shortcomings of the traditional BP neural network in the operation process, a neural network optimization method based on the high?dimensional particle swarm optimization algorithm is proposed. The acceleration constant with random variation is introduced into the high?dimensional PSO algorithm to acquire the optimal weight to optimize and train the BP neural network. The optimized high?dimensional BP neural network is applied to the automatic detection of the traffic incident. The trained data is performed with class test with the detection and training algorithm, and its result is compared with those tested with the traditional BP neural network algorithm and classical event detection algorithm. The results show that the detection rate and performance of the algorithm optimized with high?dimensional particle swarm optimization BP neural network algorithm are better than those optimized with BP neural network algorithm and classical algorithm, the values of 2 test samples are different with the expected values of 97 and 50 test samples, the rest samples can meet the test requirement, and the average optimal testing time is half of the detection time of the traditional BP neural network. The optimized BP neural network algorithm has excellent performance.
Keywords: high?dimensional BP neural network; particle swarm optimization; neural network; structure optimization
0 引 言
目前關(guān)于高維多目標(biāo)優(yōu)化問題的理論和方法大都限于少數(shù)幾種算法,如NSGA?II算法,粒子群優(yōu)化(PSO)算法。粒子群優(yōu)化算法是Kennedy等受到飛鳥集群活動(dòng)的啟發(fā)而提出的一類新興的基于集群智能優(yōu)化算法[1?5]。相比進(jìn)化算法,PSO具有易于實(shí)現(xiàn)和收斂速度快等優(yōu)勢。近年來PSO在多目標(biāo)優(yōu)化領(lǐng)域的研究上取得了較大進(jìn)展[6?9],在神經(jīng)網(wǎng)絡(luò)訓(xùn)練、復(fù)雜函數(shù)優(yōu)化、圖像處理、工業(yè)系統(tǒng)優(yōu)化等領(lǐng)域應(yīng)用廣泛[10],PSO在特性的函數(shù)優(yōu)化問題上更是發(fā)揮著重要作用,這些特性函數(shù)通常具備維數(shù)高、非線性、規(guī)模大、非凸和不可微等特點(diǎn),一般計(jì)算方法運(yùn)算困難。針對(duì)粒子群優(yōu)化算法的優(yōu)點(diǎn)以及傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)存在的諸如較慢的收斂速度、較低的學(xué)習(xí)效率,并且在計(jì)算過程中較難計(jì)算出局部極小值等問題[11?14],提出一種基于高維粒子群算法的神經(jīng)網(wǎng)絡(luò)優(yōu)化方法,結(jié)合二者優(yōu)點(diǎn)使其更好地應(yīng)用于實(shí)際中。
1 基于高維PSO算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化
1.1 高維PSO算法簡介
粒子群算法是一種集群行為的計(jì)算方法,在不局限于二維空間,考慮高維時(shí),即是高維PSO算法。設(shè)搜索空間為[D]維,粒子集群是由[M]個(gè)粒子組成,其中,第[i]個(gè)粒子的空間位置表示為[Xi=xi1,xi2,…,xiD,i=][1,2,…,M,]其飛行速度應(yīng)表示為[Vi=][vi1,vi2,…,viD。]將空間位置和飛行速度數(shù)值代入優(yōu)化目標(biāo)函數(shù)中,從而計(jì)算出用于衡量[x]優(yōu)劣的適應(yīng)值。假設(shè)粒子[i]搜索到的最優(yōu)位置為[Pi=pi1,pi2,…,piD,]整個(gè)粒子群搜索到的最優(yōu)位置記為[PK=pK1,pK2,…,pKD。]此時(shí),對(duì)于每一代粒子,其第[d]維[1≤d≤D]的速度和位置根據(jù)式(1),式(2)迭代:
[vktt+1=ut?vitt+c1r1pid-xidt+c2r2pid-xidt] (1)
[xidt+1=xidt+vidt+1] (2)
[ut=umax-umax-umintitmax] (3)
式中:[ut]代表慣性權(quán)值數(shù)值,一般為線性慣性權(quán)值,慣性權(quán)值的作用是提高粒子群算法的全局、局部優(yōu)化能力;[t]代表現(xiàn)在的迭代次數(shù);[itmax]代表迭代的最大次數(shù);[c1]和[c2]代表學(xué)習(xí)因子;[r1,r2]代表在[0,1] 范圍內(nèi)變化的兩個(gè)隨機(jī)數(shù)值。
粒子位置的更新如圖1所示。
1.2 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)上一般由輸入層、隱含層、輸出層三層構(gòu)成,屬于多層前饋神經(jīng)網(wǎng)絡(luò),包括輸入信號(hào)前向傳遞和誤差反向傳播兩個(gè)過程。BP神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用在各種預(yù)測模型中。網(wǎng)絡(luò)結(jié)構(gòu)一般只需單個(gè)隱含層就能以任意精度逼近任意有理函數(shù)。訓(xùn)練樣本的輸入、輸出向量的維數(shù)分別決定了網(wǎng)絡(luò)的輸入、輸出層神經(jīng)節(jié)點(diǎn)個(gè)數(shù),典型的只有單個(gè)隱含層、單個(gè)輸出的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
在圖2中,[xi=x1,x2,…,xn]代表一組BP神經(jīng)網(wǎng)絡(luò)的輸入向量;[y]代表一組BP神經(jīng)網(wǎng)絡(luò)的目標(biāo)輸出值;[wij]代表輸入層和隱含層兩層級(jí)之間的連接權(quán)值;[wj1]代表隱含層和輸出層兩層級(jí)之間的連接權(quán)值。[aj,b]分別為隱含層和輸出層的節(jié)點(diǎn)閾值。若設(shè)隱含層節(jié)點(diǎn)個(gè)數(shù)為[m,]則[j=1,2,…,m=1,]在輸入信號(hào)前向傳遞過程中,[xi]從輸入層逐層傳輸?shù)诫[含層和輸出層,由傳輸過程中各層連接權(quán)值矢量、閾值矢量和相應(yīng)的激勵(lì)函數(shù)計(jì)算,得出輸出層的預(yù)測輸出值[Y,]若預(yù)測值[y]與目標(biāo)值[Y]之間有誤差,則誤差部分轉(zhuǎn)入反向逐層傳遞,沿誤差減小的方向調(diào)整網(wǎng)絡(luò)各層連接的權(quán)值、閾值。反復(fù)執(zhí)行以上過程,使得BP神經(jīng)網(wǎng)絡(luò)的預(yù)測值不斷逼近實(shí)際輸出值。
1.3 PSO算法的優(yōu)化
在實(shí)驗(yàn)過程中,種群的中間粒子更容易得到全局最優(yōu)位置而不是PSO算法中的所有粒子。因此,本文基于PSO算法并采用慣性因子[σ,]慣性因子更容易追蹤種群中最優(yōu)粒子的位置并確保速度連續(xù)變化,即粒子下一時(shí)段的運(yùn)行速度是在上一時(shí)段\行速度的基礎(chǔ)上迭代產(chǎn)生的,提高了PSO算法的性能,該優(yōu)化算法稱為帶慣性項(xiàng)的粒子群算法。采用慣性因子[σ]后,新的粒子速度公式為:
[Vidt+1=σVidt+c1r1Pid-Xidt+c2r2Pgd-Xidt] (4)
優(yōu)化后的PSO算法更容易找到最優(yōu)位置。在最優(yōu)位置找尋過程中,如果粒子探索的程度是在新的方向則被稱為探測,而仍然在原始軌跡搜索則稱為開發(fā)。探測和開發(fā)是找尋最優(yōu)位置的必經(jīng)過程,調(diào)整粒子探測和開發(fā)程度可以更好地找尋最優(yōu)位置并達(dá)到優(yōu)化效果。所以,常將隨機(jī)變化的加速常數(shù)[c1]和[c2]應(yīng)用到帶慣性項(xiàng)的粒子群算法,代表粒子向個(gè)體極值和全局極值推進(jìn)過程中的隨機(jī)加速權(quán)值,從而動(dòng)態(tài)改變探測和開發(fā)所占的比例,使其盡快找到全局最優(yōu)位置,該優(yōu)化算法稱為引入慣性項(xiàng)和隨機(jī)加速常數(shù)的粒子群算法。其中,加速常數(shù)[c1]和[c2]定義為:
[c1=random(a)+tTmax] (5)
[c2=random(b)-tTmax] (6)
式中:[random(a)]和[random(b)]代表系統(tǒng)隨機(jī)生成的數(shù);[t,Tmax]代表當(dāng)前進(jìn)化代數(shù)和最大進(jìn)化代數(shù)。
1.4 BP網(wǎng)絡(luò)權(quán)值優(yōu)化方法
由BP網(wǎng)絡(luò)的三層結(jié)構(gòu)可知,用[ujht]代表輸入層和隱含層的網(wǎng)絡(luò)權(quán)值,[wkj(t)]代表隱含層和輸出層的網(wǎng)絡(luò)權(quán)值,[θk]代表輸出節(jié)點(diǎn)閾值,[θj]代表隱含層節(jié)點(diǎn)閾值。具體更新公式如下:
[wkjt+1=wkjt+αδkHj] (7)
[ujht+1=ujht+αkσjIh] (8)
[θKt+1=θKt+βδk] (9)
[θjt+1=θjt+βσj] (10)
式中:[Hj]代表隱含層節(jié)點(diǎn)[j]的輸出信號(hào);[Ih]代表輸入層節(jié)點(diǎn)[h]的輸入信號(hào);[δk]代表輸出層節(jié)點(diǎn)[k]的誤差;[σj]代表隱含層節(jié)點(diǎn)[j]的誤差;[α, β]代表學(xué)習(xí)參數(shù),參數(shù)取值范圍為0.1~0.9。
1.5 高維粒子群BP的算法實(shí)現(xiàn)
高維粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)需要確定網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),根據(jù)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)確定粒子搜索空間的維數(shù),即粒子長度,以誤差均方值作為基準(zhǔn)調(diào)節(jié)BP網(wǎng)絡(luò)中的權(quán)值和閾值,以粒子群優(yōu)化的適應(yīng)度函數(shù)作為BP網(wǎng)絡(luò)誤差的反傳函數(shù),據(jù)此建立誤差均方值與粒子群優(yōu)化的適應(yīng)度函數(shù)的對(duì)等關(guān)系,目標(biāo)函數(shù)的表達(dá)式如下:
[fi=1Nk=1Nyk-ymk2] (11)
式中:[N]代表總訓(xùn)練樣本數(shù);[fi]代表目標(biāo)函數(shù)的誤差平方和;[y(k)]代表目標(biāo)函數(shù)的目標(biāo)輸出值;[ym(k)]代表目標(biāo)函數(shù)的實(shí)際輸出值。
改進(jìn)粒子群算法尋優(yōu)的具體步驟如下:
(1) 初始化粒子群參數(shù)。初始化粒子群規(guī)模、最大迭代次數(shù)[Tmax、]學(xué)習(xí)因子[c1]和[c2、]慣性權(quán)重[wmax]和[wmin]在特定位置與速度范圍內(nèi)隨機(jī)初始化位置向量和速度向量。
(2) 初始化BP神經(jīng)網(wǎng)絡(luò)。由實(shí)際情況確定BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),并建立下一步運(yùn)算的網(wǎng)絡(luò)模型,進(jìn)一步明確粒子維度。
(3) 輸入網(wǎng)絡(luò)訓(xùn)練樣本。通過步驟(1),步驟(2)初始化的位置向量輸入網(wǎng)絡(luò)訓(xùn)練樣本,確定網(wǎng)絡(luò)的權(quán)值和閾值,計(jì)算出期望輸出的誤差均方值和實(shí)際輸出的誤差均方值,由二者的誤差均方值可以得到粒子群的適應(yīng)度函數(shù)。在粒子群適應(yīng)度函數(shù)的基礎(chǔ)上結(jié)合位置和慣性因子可以計(jì)算粒子新的運(yùn)動(dòng)位置和運(yùn)動(dòng)速度。
(4) 迭代運(yùn)算。確定每個(gè)粒子的個(gè)體極值和全局極值:粒子[i]的適應(yīng)度值[fi]與個(gè)體最優(yōu)值[Pbest]比較,如果小于[Pbest]則取代它作為當(dāng)前的個(gè)體最優(yōu);適應(yīng)度值[fi]與全局極值[gbest]比較, 如果小于[gbest]則取代它作為當(dāng)前的全局最優(yōu)。當(dāng)停止迭代時(shí),會(huì)得到粒子在全局的最優(yōu)位置,此時(shí)需要把該數(shù)值作為BP網(wǎng)絡(luò)的最后權(quán)重值,映射為BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值。
(5) 將樣本數(shù)據(jù)源中訓(xùn)練樣本輸入到已確定的網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,用測試樣本做預(yù)測。
2 高維粒子群BP算法實(shí)例仿真
高維粒子群BP算法仿真實(shí)驗(yàn)的實(shí)驗(yàn)數(shù)據(jù)采集自沈陽市和平區(qū)易發(fā)生交通擁堵的某一路段,采集方式是在測試車輛上安裝激光測距儀和 GPS設(shè)備,采樣時(shí)間設(shè)置為2 s,采樣時(shí)間段為早、中、晚高峰期三小時(shí)的時(shí)間區(qū)間,并多次測量采集數(shù)據(jù),選擇每組中發(fā)生事件的實(shí)驗(yàn)數(shù)據(jù)為6 rain,參照上述標(biāo)準(zhǔn)共采集150組樣本數(shù)據(jù),把樣本數(shù)據(jù)歸一化。將100組訓(xùn)練數(shù)據(jù)、50組測試數(shù)據(jù)輸入到Matlab進(jìn)行運(yùn)算,電腦內(nèi)存為8 GB,利用本文的高維粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化算法訓(xùn)練,最后將測試樣本分類判別,檢驗(yàn)最后的計(jì)算性能。部分原始樣本數(shù)據(jù)見表1。
設(shè)置高維粒子群算法的參數(shù),其中,種群數(shù)量設(shè)置為[m=30,]維數(shù)設(shè)置為[D=12×13+13×4+4=212,]加速因子設(shè)置為[c1=c2=1.50,]慣性因子設(shè)置為[ω=0.720,]速度最大值[Vmax=1,]速度最小值[Vmin=-1,]位置最大值為5,位置最小值為?5,最大迭代次數(shù)[N=100。]當(dāng)計(jì)算循環(huán)過程達(dá)到終止迭代次數(shù)時(shí)則終止計(jì)算。
通常采用交通事件的檢測率(DR)、平均檢測時(shí)間(MTTD)、誤判率(FAR)評(píng)價(jià)交通事件自動(dòng)檢測的算法效率。通過采用本文優(yōu)化的計(jì)算方法對(duì)采集到的數(shù)據(jù)進(jìn)行分類訓(xùn)練等一系列計(jì)算分析,并將最終分析結(jié)果和經(jīng)典事件檢測算法、BP神經(jīng)網(wǎng)絡(luò)算法比較。結(jié)果表明,經(jīng)過優(yōu)化后的高維粒子群BP神經(jīng)網(wǎng)絡(luò)的檢測率、算法性能均優(yōu)于經(jīng)典算法和BP神經(jīng)網(wǎng)絡(luò)算法,其中97,50個(gè)測試樣本中僅有2個(gè)測試樣本與應(yīng)該達(dá)到的數(shù)值不一致,其他樣本都滿足測試要求,并且平均優(yōu)化測試時(shí)間是傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)檢測時(shí)間的一半,結(jié)果對(duì)比見表2。
3 結(jié) 語
本文基于高S粒子群算法的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化方法,改進(jìn)了傳統(tǒng)運(yùn)算方法的檢測時(shí)間長、收斂速度慢的缺點(diǎn),且容易實(shí)現(xiàn),是一種新興的群智能優(yōu)化算法,優(yōu)化全面,適用范圍廣泛,具有較高的精度和較好的擬合性能。
參考文獻(xiàn)
[1] 姚爾果,閆秋粉,南振岐,等.基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)模型研究[J].佳木斯大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,31(1):107?109.
[2] 謝錚桂,鐘少丹,韋玉科.改進(jìn)的粒子群算法及收斂性分析[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(1):46?49.
[3] 閏紀(jì)如.粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)在交通流預(yù)測中的應(yīng)用[D].杭州:浙江工業(yè)大學(xué),2013.
[4] 劉洪波,王秀坤,孟軍.神經(jīng)網(wǎng)絡(luò)基于粒子群優(yōu)化的學(xué)習(xí)算法研究[J].小型微型計(jì)算機(jī)系統(tǒng),2005,26(4):638?640.
[5] 胡衛(wèi)東,曹文貴.基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)在邊坡穩(wěn)定性評(píng)價(jià)中的應(yīng)用[J].湖南理工學(xué)院學(xué)報(bào)(自然科學(xué)版),2014,27(2):71?77.
[6] 劉坤,譚營,何新貴.基于粒子群優(yōu)化的過程神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,47(2):238?244.
[7] 徐以山,曾碧,尹秀文,等.基于改進(jìn)粒子群算法的BP神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(35):233?235.
[8] 張德慧,張德育,劉清云,等.基于粒子群算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化技術(shù)[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(5):1322?1328.
[9] 肖俊生,任諱龍,李文濤.基于粒子群算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)漏鋼預(yù)報(bào)的研究[J].計(jì)算機(jī)測量與控制,2015,23(4):1302?1305.
[10] 沈?qū)W利,張紅巖,張紀(jì)鎖.改進(jìn)粒子群算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010(2):57?61.
[11] 江麗,王愛平.基于粒子群與BP混合算法的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法[J].計(jì)算機(jī)應(yīng)用,2012,32(z2):13?15.
[12] 徐大明,周超,孫傳恒,等.基于粒子群優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的水產(chǎn)養(yǎng)殖水溫及pH預(yù)測模型[J].漁業(yè)現(xiàn)代化,2016,43(1):24?30.
級(jí)別:部級(jí)期刊
榮譽(yù):中國期刊全文數(shù)據(jù)庫(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國優(yōu)秀期刊遴選數(shù)據(jù)庫
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:北大期刊
榮譽(yù):百種重點(diǎn)期刊