公務(wù)員期刊網(wǎng) 精選范文 卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)主題范文,僅供參考,歡迎閱讀并收藏。

卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

第1篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

(江蘇科技大學(xué)電子信息學(xué)院,江蘇鎮(zhèn)江212003)

摘要:在實(shí)際交通環(huán)境中,由于運(yùn)動(dòng)模糊、背景干擾、天氣條件以及拍攝視角等因素,所采集的交通標(biāo)志的圖像質(zhì)量往往不高,這就對(duì)交通標(biāo)志自動(dòng)識(shí)別的準(zhǔn)確性、魯棒性和實(shí)時(shí)性提出了很高的要求。針對(duì)這一情況,提出一種基于深層卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識(shí)別方法。該方法采用深層卷積神經(jīng)網(wǎng)絡(luò)的有監(jiān)督學(xué)習(xí)模型,直接將采集的交通標(biāo)志圖像經(jīng)二值化后作為輸入,通過卷積和池采樣的多層處理,來模擬人腦感知視覺信號(hào)的層次結(jié)構(gòu),自動(dòng)地提取交通標(biāo)志圖像的特征,最后再利用一個(gè)全連接的網(wǎng)絡(luò)實(shí)現(xiàn)交通標(biāo)志的識(shí)別。實(shí)驗(yàn)結(jié)果表明,該方法利用卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)能力,自動(dòng)地提取交通標(biāo)志的特征,避免了傳統(tǒng)的人工特征提取,有效地提高了交通標(biāo)志識(shí)別的效率,具有良好的泛化能力和適應(yīng)范圍。

關(guān)鍵詞 :交通標(biāo)志;識(shí)別;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí)

中圖分類號(hào):TN911.73?34;TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004?373X(2015)13?0101?06

收稿日期:2015?01?09

基金項(xiàng)目:國家自然科學(xué)基金面上項(xiàng)目(61371114)

0 引言

隨著智能汽車的發(fā)展,道路交通標(biāo)志的自動(dòng)識(shí)別[1?3]作為智能汽車的基本技術(shù)之一,受到人們的高度關(guān)注。道路交通標(biāo)志識(shí)別主要包括兩個(gè)基本環(huán)節(jié):首先是交通標(biāo)志的檢測,包括交通標(biāo)志的定位、提取及必要的預(yù)處理;其次是交通標(biāo)志的識(shí)別,包括交通標(biāo)志的特征提取和分類。

如今,交通標(biāo)志的識(shí)別方法大多數(shù)都采用人工智能技術(shù),主要有下述兩類形式[4]。一種是采用“人工特征+機(jī)器學(xué)習(xí)”的識(shí)別方法,如基于淺層神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)的特征識(shí)別等。在這種方法中,主要依靠先驗(yàn)知識(shí),人工設(shè)計(jì)特征,機(jī)器學(xué)習(xí)模型僅負(fù)責(zé)特征的分類或識(shí)別,因此特征設(shè)計(jì)的好壞直接影響到整個(gè)系統(tǒng)性能的性能,而要發(fā)現(xiàn)一個(gè)好的特征,則依賴于研究人員對(duì)待解決的問題的深入理解。另一種形式是近幾年發(fā)展起來的深度學(xué)習(xí)模型[5],如基于限制波爾茲曼機(jī)和基于自編碼器的深度學(xué)習(xí)模型以及卷積神經(jīng)網(wǎng)絡(luò)等。在這種方法中,無需構(gòu)造任何的人工特征,而是直接將圖像的像素作為輸入,通過構(gòu)建含有多個(gè)隱層的機(jī)器學(xué)習(xí)模型,模擬人腦認(rèn)知的多層結(jié)構(gòu),逐層地進(jìn)行信息特征抽取,最終形成更具推廣性和表達(dá)力的特征,從而提升識(shí)別的準(zhǔn)確性。

卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)模型之一,是一種多層的監(jiān)督學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),它利用一系列的卷積層、池化層以及一個(gè)全連接輸出層構(gòu)建一個(gè)多層的網(wǎng)絡(luò),來模仿人腦感知視覺信號(hào)的逐層處理機(jī)制,以實(shí)現(xiàn)視覺特征信號(hào)的自動(dòng)提取與識(shí)別。本文將深層卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于道路交通標(biāo)志的識(shí)別,通過構(gòu)建一個(gè)由二維卷積和池化處理交替組成的6層網(wǎng)絡(luò)來逐層地提取交通標(biāo)志圖像的特征,所形成的特征矢量由一個(gè)全連接輸出層來實(shí)現(xiàn)特征的分類和識(shí)別。實(shí)驗(yàn)中將加入高斯噪聲、經(jīng)過位移、縮放和旋轉(zhuǎn)處理的交通標(biāo)志圖像以及實(shí)際道路采集交通標(biāo)志圖像分別構(gòu)成訓(xùn)練集和測試集,實(shí)驗(yàn)結(jié)果表明,本文所采用的方法具有良好的識(shí)別率和魯棒性。

1 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及原理

1.1 深度學(xué)習(xí)

神經(jīng)科學(xué)研究表明,哺乳動(dòng)物大腦皮層對(duì)信號(hào)的處理沒有一個(gè)顯示的過程[5],而是通過信號(hào)在大腦皮層復(fù)雜的層次結(jié)構(gòu)中的遞進(jìn)傳播,逐層地對(duì)信號(hào)進(jìn)行提取和表述,最終達(dá)到感知世界的目的。這些研究成果促進(jìn)了深度學(xué)習(xí)這一新興研究領(lǐng)域的迅速發(fā)展。

深度學(xué)習(xí)[4,6?7]的目的就是試圖模仿人腦感知視覺信號(hào)的機(jī)制,通過構(gòu)建含有多個(gè)隱層的多層網(wǎng)絡(luò)來逐層地對(duì)信號(hào)特征進(jìn)行新的提取和空間變換,以自動(dòng)學(xué)習(xí)到更加有效的特征表述,最終實(shí)現(xiàn)視覺功能。目前深度學(xué)習(xí)已成功地應(yīng)用到語音識(shí)別、圖像識(shí)別和語言處理等領(lǐng)域。在不同學(xué)習(xí)框架下構(gòu)建的深度學(xué)習(xí)結(jié)構(gòu)是不同的,如卷積神經(jīng)網(wǎng)絡(luò)就是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型。

1.2 卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)及原理

卷積神經(jīng)網(wǎng)絡(luò)受視覺系統(tǒng)的結(jié)構(gòu)啟發(fā)而產(chǎn)生,第一個(gè)卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型是在Fukushima 的神經(jīng)認(rèn)知機(jī)中提出的[8],基于神經(jīng)元之間的局部連接和分層組織圖像轉(zhuǎn)換,將有相同參數(shù)的神經(jīng)元應(yīng)用于前一層神經(jīng)網(wǎng)絡(luò)的不同位置,得到一種平移不變神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)形式。后來,LeCun 等人在該思想的基礎(chǔ)上,用誤差梯度設(shè)計(jì)并訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)[9?10],在一些模式識(shí)別任務(wù)上得到優(yōu)越的性能。

卷積神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一種有監(jiān)督的深度學(xué)習(xí)算法,無需事先知道輸入與輸出之間精確的數(shù)學(xué)表達(dá)式,只要用已知的模式對(duì)卷積神經(jīng)網(wǎng)絡(luò)加以訓(xùn)練,就可以學(xué)習(xí)到輸入與輸出之間的一種多層的非線性關(guān)系,這是非深度學(xué)習(xí)算法不能做到的。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)是由一系列的卷積和池化層以及一個(gè)全連接的輸出層組成,可以采用梯度下降法極小化誤差函數(shù)對(duì)網(wǎng)絡(luò)中的權(quán)值和閾值參數(shù)逐層反向調(diào)節(jié),以得到網(wǎng)絡(luò)權(quán)值和閾值的最優(yōu)解,并可以通過增加迭代次數(shù)來提高網(wǎng)絡(luò)訓(xùn)練的精度。

1.2.1 前向傳播

在卷積神經(jīng)網(wǎng)絡(luò)的前向傳播中,輸入的原始圖像經(jīng)過逐層的卷積和池化處理后,提取出若干特征子圖并轉(zhuǎn)換成一維特征矢量,最后由全連接的輸出層進(jìn)行分類識(shí)別。

在卷積層中,每個(gè)卷積層都可以表示為對(duì)前一層輸入圖像的二維卷積和非線性激勵(lì)函數(shù),其表達(dá)式可用式(1)表示:

式中:Yj 表示輸出層中第j 個(gè)輸出;Y l + 1i 是前一層(l + 1層)

的輸出特征(全連接的特征向量);n 是輸出特征向量的長度;Wij 表示輸出層的權(quán)值,連接輸入i 和輸出j ;bj表示輸出層第j 個(gè)輸出的閾值;f (?) 是輸出層的非線性

1.2.2 反向傳播

在反向傳播過程中,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法采用類似于BP神經(jīng)網(wǎng)絡(luò)的梯度最速下降法,即按極小化誤差的方法反向傳播調(diào)整權(quán)值和閾值。網(wǎng)絡(luò)反向傳播回來的誤差是每個(gè)神經(jīng)元的基的靈敏度[12],也就是誤差對(duì)基的變化率,即導(dǎo)數(shù)。下面將分別求出輸出層、池采樣層和卷積層的神經(jīng)元的靈敏度。

(1)輸出層的靈敏度

對(duì)于誤差函數(shù)式(6)來說,輸出層神經(jīng)元的靈敏度可表示為:

在前向傳播過程中,得到網(wǎng)絡(luò)的實(shí)際輸出,進(jìn)而求出實(shí)際輸出與目標(biāo)輸出之間的誤差;在反向傳播過程中,利用誤差反向傳播,采用式(17)~式(20)來調(diào)整網(wǎng)絡(luò)的權(quán)值和閾值,極小化誤差;這樣,前向傳播和反向傳播兩個(gè)過程反復(fù)交替,直到達(dá)到收斂的要求為止。

2 深層卷積神經(jīng)網(wǎng)絡(luò)的交通標(biāo)志識(shí)別方法

2.1 應(yīng)用原理

交通標(biāo)志是一種人為設(shè)計(jì)的具有特殊顏色(如紅、黃、白、藍(lán)、黑等)和特殊形狀或圖形的公共標(biāo)志。我國的交通標(biāo)志主要有警告、禁令、指示和指路等類型,一般采用顏色來區(qū)分不同的類型,用形狀或圖形來標(biāo)示具體的信息。從交通標(biāo)志設(shè)計(jì)的角度來看,屬于不同類型(不同顏色)的交通標(biāo)志在形狀或圖形上有較大的差異;屬于相同類型(相同顏色)的標(biāo)志中同類的指示信息標(biāo)志在形狀或圖形上比較接近,如警告標(biāo)志中的平面交叉路口標(biāo)志等。因此,從機(jī)器視覺的角度來分析,同類型中同類指示信息的標(biāo)志之間會(huì)比不同類型的標(biāo)志之間更易引起識(shí)別錯(cuò)誤。換句話說,相比于顏色,形狀或圖形是正確識(shí)別交通標(biāo)志的關(guān)鍵因素。

因此,在應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別交通標(biāo)志時(shí),從提高算法效率和降低錯(cuò)誤率綜合考慮,將交通標(biāo)志轉(zhuǎn)換為灰度圖像并作二值化處理后作為卷積神經(jīng)網(wǎng)絡(luò)的輸入圖像信息。圖2給出了應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)識(shí)別交通標(biāo)志的原理圖。該網(wǎng)絡(luò)采用了6層交替的卷積層和池采樣層來逐層提取交通標(biāo)志的特征,形成的特征矢量由一個(gè)全連接的輸出層進(jìn)行識(shí)別。圖中:W1i(i=1,2,…,m1),W1(j j=1,2,…,m2),…,W1k(k=1,2,…,m(n?1))分別表示卷積層L1,L3,…,Ln - 1 的卷積核;Input表示輸入的交通標(biāo)志圖像;

Pool表示每個(gè)池采樣層的采樣池;map表示逐層提取的特征子圖;Y 是最終的全連接輸出。

交通標(biāo)志識(shí)別的判別準(zhǔn)則為:對(duì)于輸入交通標(biāo)志圖像Input,網(wǎng)絡(luò)的輸出矢量Y = [y1,y2 ,…,yC ],有yj = Max{y1,y2 ,…,yC},則Input ∈ j,即判定輸入的交通標(biāo)志圖像Input為第j 類交通標(biāo)志。

2.2 交通標(biāo)志識(shí)別的基本步驟

深層神經(jīng)網(wǎng)絡(luò)識(shí)別交通標(biāo)志主要包括交通標(biāo)志的訓(xùn)練與識(shí)別,所以將交通標(biāo)志識(shí)別歸納為以下4個(gè)步驟:(1) 圖像預(yù)處理:利用公式Gray= 0.299R +0.587G + 0.114B 將彩色交通標(biāo)志圖像轉(zhuǎn)換為灰度圖像,再利用鄰近插值法將交通標(biāo)志圖像規(guī)格化,最后利用最大類間方差將交通標(biāo)志圖像二值化。

(2)網(wǎng)絡(luò)權(quán)值和閾值的初始化:利用隨機(jī)分布函數(shù)將權(quán)值W 初始化為-1~1之間的隨機(jī)數(shù);而將閾值b 初始化為0。

(3)網(wǎng)絡(luò)的訓(xùn)練:利用經(jīng)過預(yù)處理的交通標(biāo)志圖像構(gòu)成訓(xùn)練集,對(duì)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過網(wǎng)絡(luò)前向傳播和反向傳播的反復(fù)交替處理,直到滿足識(shí)別收斂條件或達(dá)到要求的訓(xùn)練次數(shù)為止。

(4)交通標(biāo)志的識(shí)別:將實(shí)際采集的交通標(biāo)志圖像經(jīng)過預(yù)處理后,送入訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行交通標(biāo)志特征的提取,然后通過一個(gè)全連接的網(wǎng)絡(luò)進(jìn)行特征分類與識(shí)別,得到識(shí)別結(jié)果。

3 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)主要選取了我國道路交通標(biāo)志的警告標(biāo)志、指示標(biāo)志和禁令標(biāo)志三類中較常見的50幅圖像??紤]到在實(shí)際道路中采集到的交通標(biāo)志圖像會(huì)含有噪聲和出現(xiàn)幾何失真以及背景干擾等現(xiàn)象,因此在構(gòu)造網(wǎng)絡(luò)訓(xùn)練集時(shí),除了理想的交通標(biāo)志以外,還增加了加入高斯噪聲、經(jīng)過位移、旋轉(zhuǎn)和縮放處理和實(shí)際采集到的交通標(biāo)志圖像,因此最終的訓(xùn)練樣本為72個(gè)。其中,加入的高斯噪聲為均值為0,方差分別為0.1,0.2,0.3,圖像的位移、旋轉(zhuǎn)、縮放的參數(shù)分別隨機(jī)的分布在±10,±5°,0.9~1.1的范圍內(nèi)。圖3給出了訓(xùn)練集中的交通標(biāo)志圖像的示例。圖4是在實(shí)際道路中采集的交通標(biāo)志圖像構(gòu)成的測試集的示例。

在實(shí)驗(yàn)中構(gòu)造了一個(gè)輸入為48×48個(gè)神經(jīng)元、輸出為50 個(gè)神經(jīng)元的9 層網(wǎng)絡(luò)。網(wǎng)絡(luò)的輸入是像素為48 × 48 的規(guī)格化的交通標(biāo)志圖像,輸出對(duì)應(yīng)于上述的50種交通標(biāo)志的判別結(jié)果。網(wǎng)絡(luò)的激活函數(shù)采用S型函數(shù),如式(2)所示,其輸出范圍限制在0~1之間。

圖6是交通標(biāo)志的訓(xùn)練總誤差EN 曲線。在訓(xùn)練開始的1 500次,誤差能迅速地下降,在迭代2 000次以后是一個(gè)平穩(wěn)的收斂過程,當(dāng)?shù)?0萬次時(shí),總誤差EN可以達(dá)到0.188 2。

在交通標(biāo)志的測試實(shí)驗(yàn)中,為了全面檢驗(yàn)卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別性能,分別針對(duì)理想的交通標(biāo)志,加入高斯噪聲、經(jīng)過位移、旋轉(zhuǎn)和比例縮放以及采集的交通標(biāo)志圖像進(jìn)行實(shí)驗(yàn),將以上測試樣本分別送入到網(wǎng)絡(luò)中識(shí)別,表2給出了測試實(shí)驗(yàn)結(jié)果。

綜合分析上述實(shí)驗(yàn)結(jié)果,可以得到以下結(jié)論:(1)在卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過程中,整個(gè)網(wǎng)絡(luò)的誤差曲線快速平穩(wěn)的下降,體現(xiàn)出卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)具有良好的收斂性。

(2)經(jīng)逐層卷積和池采樣所提取的特征具有比例縮放和旋轉(zhuǎn)不變性,因此對(duì)于旋轉(zhuǎn)和比例縮放后的交通標(biāo)志能達(dá)到100%的識(shí)別率。

(3)與傳統(tǒng)的BP網(wǎng)絡(luò)識(shí)別方法[11]相比較,卷積神經(jīng)網(wǎng)絡(luò)能夠達(dá)到更深的學(xué)習(xí)深度,即在交通標(biāo)志識(shí)別時(shí)能夠得到更高的所屬類別概率(更接近于1),識(shí)別效果更好。

(4)卷積神經(jīng)網(wǎng)絡(luò)對(duì)實(shí)際采集的交通標(biāo)志圖像的識(shí)別率尚不能達(dá)到令人滿意的結(jié)果,主要原因是實(shí)際道路中采集的交通標(biāo)志圖像中存在著較嚴(yán)重的背景干擾,解決的辦法是增加實(shí)際采集的交通標(biāo)志訓(xùn)練樣本數(shù),通過網(wǎng)絡(luò)的深度學(xué)習(xí),提高網(wǎng)絡(luò)的識(shí)別率和魯棒性。

4 結(jié)論

本文將深層卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于道路交通標(biāo)志的識(shí)別,利用卷積神經(jīng)網(wǎng)絡(luò)的深層結(jié)構(gòu)來模仿人腦感知視覺信號(hào)的機(jī)制,自動(dòng)地提取交通標(biāo)志圖像的視覺特征并進(jìn)行分類識(shí)別。實(shí)驗(yàn)表明,應(yīng)用深層卷積神經(jīng)網(wǎng)絡(luò)識(shí)別交通標(biāo)志取得了良好的識(shí)別效果。

在具體實(shí)現(xiàn)中,從我國交通標(biāo)志的設(shè)計(jì)特點(diǎn)考慮,本文將經(jīng)過預(yù)處理二值化的圖像作為網(wǎng)絡(luò)的輸入,主要是利用了交通標(biāo)志的形狀信息,而基本略去了顏色信息,其優(yōu)點(diǎn)是在保證識(shí)別率的基礎(chǔ)上,可以簡化網(wǎng)絡(luò)的結(jié)構(gòu),降低網(wǎng)絡(luò)的計(jì)算量。在實(shí)際道路交通標(biāo)志識(shí)別中,將形狀信息和顏色信息相結(jié)合,以進(jìn)一步提高識(shí)別率和對(duì)道路環(huán)境的魯棒性,是值得進(jìn)一步研究的內(nèi)容。

此外,本文的研究沒有涉及到道路交通標(biāo)志的動(dòng)態(tài)檢測,這也是今后可以進(jìn)一步研究的內(nèi)容。

參考文獻(xiàn)

[1] 劉平華,李建民,胡曉林,等.動(dòng)態(tài)場景下的交通標(biāo)識(shí)檢測與識(shí)別研究進(jìn)展[J].中國圖象圖形學(xué)報(bào),2013,18(5):493?503.

[2] SAHA S K,DULAL C M,BHUIYAN A A. Neural networkbased sign recognition [J]. International Journal of ComputerApplication,2012,50(10):35?41.

[3] STALLKAMP J,SCHLIOSING M,SALMENA J,et al. Man vs.computer:benchmarking machine learning algorithms for traf?fic sign recognition [J]. Neural Network,2012,32(2):323?332.

[4] 中國計(jì)算機(jī)學(xué)會(huì).深度學(xué)習(xí):推進(jìn)人工智能夢想[EB/OL].[2013?06?10].http://ccg.org.cn.

[5] 鄭胤,陳權(quán)崎,章毓晉.深度學(xué)習(xí)及其在目標(biāo)和行為識(shí)別中的新進(jìn)展[J].中國圖象圖形學(xué)報(bào),2014,19(2):175?184.

[6] FUKUSHIMA K. Neocognition:a self ? organizing neural net?work model for a mechanism of pattern recognition unaffectedby shift in position [J]. Biological Cybernetics,1980,36(4):193?202.

[7] LECUN Y,BOTTOU L,BENGIO Y,et al. Gradient ? basedlearning applied to document recognition [J]. IEEE Journal andMagazines,1989,86(11):2278?2324.

[8] LECUN Y,BOTTOU L,BENGIO Y,et al. Backpropagationapplied to handwritten zip code recognition [J]. Neural Compu?tation,1989,1(4):541?551.

[9] CIRESAN D,MEIER U,MAsci J,et al. Multi?column deepneural network for traffic sign classification [J]. Neural Net?works,2012,32(2):333?338.

[10] NAGI J,DUCATELLE F,CARO D,et al. Max?pooling con?volution neural network for vision?based hand gesture recogni?tion [C]// 2011 IEEE International Conference on Signal andImage Processing Application. Kuala Lumpur:IEEE,2011,342?347.

[11] 楊斐,王坤明,馬欣,等.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)分類器識(shí)別交通標(biāo)志[J].計(jì)算機(jī)工程,2003,29(10):120?121.

[12] BUVRIE J. Notes on convolutional neural networks [EB/OL].[2006?11?12]. http://cogprints.org/5869/.

[13] 周開利,康耀紅.神經(jīng)網(wǎng)絡(luò)模型及其Matlab 仿真設(shè)計(jì)[M].北京:清華大學(xué)出版社,2005.

[14] 孫志軍,薛磊,許陽明,等.深度學(xué)習(xí)研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2012,29(8):2806?2810.

[15] 劉建偉,劉媛,羅雄麟.深度學(xué)習(xí)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2014(7):1921?1930.

第2篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

摘要:

針對(duì)帶鋼表面缺陷檢測系統(tǒng)的速度滯后,精度偏低等問題,在分析成像理論和圖像檢測理論的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了一種帶鋼表面缺陷高速高精度在線檢測系統(tǒng).該系統(tǒng)首先采用大功率半導(dǎo)體均勻發(fā)光激光器技術(shù)、高速線掃描成像技術(shù)和基于圖形處理器的Gabor紋理濾波技術(shù)實(shí)現(xiàn)了高速高分辨率的圖像采集和處理,然后采用基于嵌套循環(huán)的K-折交叉驗(yàn)證、信息增益率和BP神經(jīng)網(wǎng)絡(luò)方法構(gòu)建了高準(zhǔn)確率的分類器,以達(dá)到對(duì)帶鋼表面缺陷高速高精度在線檢測.實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)滿足了現(xiàn)有帶鋼生產(chǎn)速度的要求,具有較高的精度和準(zhǔn)確率.

關(guān)鍵詞:

圖像采集和處理;圖像檢測;Gabor紋理濾波;神經(jīng)網(wǎng)絡(luò)

0引言

鋼鐵企業(yè)為了提高競爭力,對(duì)帶鋼的生產(chǎn)提出了新的要求,也對(duì)帶鋼表面檢測系統(tǒng)提出了更高的要求,既要有更高的檢測速度還要有更加準(zhǔn)確的檢測精度[1].而與此同時(shí),跟隨機(jī)器視覺技術(shù)的發(fā)展,帶鋼表面檢測系統(tǒng)也得到了廣泛的研究與應(yīng)用[2].主要研究包括:①光源技術(shù).由于帶鋼檢測對(duì)光源要求頻度高、體積小,這限制了傳統(tǒng)光源在其應(yīng)用[3],激光具有方向性好、亮度高、體積小等優(yōu)點(diǎn),被廣泛應(yīng)用于帶鋼檢測應(yīng)用中,國內(nèi)的徐科等[4]提出熱軋鋼檢測中用綠光作為激光光源,但激光照明需解決均勻性問題.②掃描技術(shù).由于電荷耦合元件能夠?qū)崿F(xiàn)實(shí)時(shí)檢測,成為目前研究和應(yīng)用的主流技術(shù)[5].但是,CCD電荷耦合器需在同步時(shí)鐘的控制下,以行為單位一位一位地輸出信息,速度較慢,而互補(bǔ)金屬氧化物半導(dǎo)體光電傳感器采集光信號(hào)的同時(shí)就可以取出電信號(hào),還能同時(shí)處理各單元的圖像信息,速度比CCD電荷耦合器快很多[6].③圖像處理算法.受限于帶鋼加工過程的特性,帶鋼表面呈現(xiàn)出隨機(jī)紋理的特點(diǎn),對(duì)于隨機(jī)紋理圖像的處理分析,目前常用的方法有共生矩陣法、頻域?yàn)V波法、分形法等.作為頻域?yàn)V波法的代表,二維Gabor濾波器有著與生物視覺系統(tǒng)相近的特點(diǎn)[7],廣泛應(yīng)用于紋理圖像的處理分析.但是,CPU很難滿足現(xiàn)在的帶鋼檢測的實(shí)時(shí)要求[8].④分類算法.特征選擇的主流算法是主成分分析和信息增益.主成分分析存在特征向量方向不一致的問題,而且如何確定主成分存在主觀性[9].信息增益可以衡量特征的優(yōu)劣,利用它可對(duì)特征進(jìn)行排序,方便后面的特征選擇,但信息增益適用于離散特征,信息增益率既適用于離散特征也適用于連續(xù)特征[10],被廣泛應(yīng)用于特征選擇的過程中.圖像分類算法主流算法包括支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò).支持向量機(jī)不適用于大樣本的分類問題[11].BP神經(jīng)網(wǎng)絡(luò)方法具有能夠解決非線性分類問題,對(duì)噪聲不敏感等優(yōu)點(diǎn),被廣泛應(yīng)用于帶鋼檢測中,如王成明等[12]提出的基于BP神經(jīng)網(wǎng)絡(luò)的帶鋼表面質(zhì)量檢測方法等,但是BP神經(jīng)網(wǎng)絡(luò)的超參的設(shè)定往往具有隨機(jī)性,這嚴(yán)重影響了分類效果[13].本文首先介紹了帶鋼表面缺陷高速高分辨率成像系統(tǒng)的設(shè)計(jì),針對(duì)光源的不均勻性、圖像處理速度慢等問題,提出改進(jìn)方法,然后介紹了分類器的構(gòu)建,針對(duì)樣本劃分的隨機(jī)性、特征選擇的隨機(jī)性以及BP神經(jīng)網(wǎng)絡(luò)超參設(shè)定的隨機(jī)性問題,做出改進(jìn),最后介紹試驗(yàn)結(jié)果.

1帶鋼表面缺陷高速高分辨率的成像系統(tǒng)的設(shè)計(jì)

1)大功率半導(dǎo)體均勻發(fā)光激光器技術(shù).激光能夠保證帶鋼表面缺陷的檢出率[14],本系統(tǒng)選用808nm半導(dǎo)體激光器作為照明源,出光功率可達(dá)30W,亮度可達(dá)1500流明.激光照明需解決均勻性的問題,本文采用了基于鮑威爾棱鏡的激光線發(fā)生辦法,解決了激光照明的均勻性問題,其光路如圖1所示.該方法首先在激光聚焦位置放置圓形球面透鏡,負(fù)責(zé)將發(fā)散的激光束匯聚成準(zhǔn)平行光,同時(shí)控制光柱的粗細(xì),然后,利用鮑威爾棱鏡的擴(kuò)散效果對(duì)圓柱的一個(gè)方向進(jìn)行擴(kuò)束,最終形成激光線.為保證亮度及寬度的適應(yīng)性,激光器出光口距離圓透鏡、鮑威爾棱鏡的距離可以精密調(diào)整.為了降低反射亮度損失,在透鏡表面鍍上808±5nm的T≥99%的增透膜.

2)基于GPU的Gabor紋理濾波技術(shù).二維Ga-bor濾波器具有易于調(diào)諧方向、徑向頻率帶寬及中心頻率等特征,本文采用該方法來進(jìn)行圖像處理,二維Gabor函數(shù)為guv(x,y)=k2σ2exp-N2(x2+y2)2σ[]2×expi(k•()xy[])-exp-σ2{()}2(1)其中:k=kxk()y=kvcosψμkvsinψ()μ;kv=2-v+22π;ψμ=μπN;v的取值決定了Gabor濾波的波長;μ的取值表示Gabor核函數(shù)的方向;N為總的方向數(shù).設(shè)f(x,y)為圖像函數(shù),guv(x,y)為卷積函數(shù),則卷積輸出N(u,v)可表示為N(u,v)=f(x,y)*guv(x,y)(2)二維Gabor濾波算法計(jì)算量較大,為了保證了帶鋼表面缺陷檢測的實(shí)時(shí)性,采用基于GPU的并行處理架構(gòu),其計(jì)算流程如圖2所示.GPU的算法分為兩個(gè)流程:訓(xùn)練過程主要針對(duì)無缺陷圖像進(jìn)行,通過訓(xùn)練完成紋理圖像的背景建模,一方面消除背景變化帶來的干擾,另一方面形成有效的Gabor卷積參數(shù),以便在檢測過程中得到最優(yōu)的檢出效果.檢測過程對(duì)實(shí)際拍攝的缺陷圖像進(jìn)行分析,首先按照GPU的核心數(shù)和緩存大小對(duì)圖像進(jìn)行分解,本文所有GPU的核心數(shù)為1024,顯存2G,因此將原始圖像分解為1000塊,分別加載到1000個(gè)核心中,同時(shí)并發(fā)運(yùn)行卷積運(yùn)算.最后將各個(gè)窗口的卷積結(jié)果合并到一起,得到完成的濾波結(jié)果,最后借助于背景模式,將背景的干擾消除,得到干凈的缺陷區(qū)域.

3)成像系統(tǒng).根據(jù)缺陷檢測的精度要求(1800m/min的檢測速度,0.25mm的精度),帶鋼的規(guī)格要求(1900mm規(guī)格),對(duì)帶鋼進(jìn)行成像系統(tǒng)設(shè)計(jì).基于互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)的成像芯片具有速度快,用電低等優(yōu)勢.選用兩個(gè)4K線掃描CMOS相機(jī)作為成像核心器件,選用CameraLinkFull接口作為數(shù)據(jù)輸出.兩個(gè)4K掃描中間重疊100mm作為圖像拼接區(qū).兩組線激光光源與線掃描組成系統(tǒng)的主要成像模塊.成像系統(tǒng)結(jié)構(gòu)如圖3所示.

2構(gòu)建分類器

檢測缺陷類別及其特征描述如表1所示.

1)訓(xùn)練集和樣本集劃分.主要缺陷類別有5個(gè),每個(gè)類別收集樣本7000,共計(jì)35000個(gè)樣本.為了避免訓(xùn)練集和樣本集劃分的盲目性,采用10-折交叉驗(yàn)證的方式劃分訓(xùn)練集和測試集,即將樣本集分成10份,從中選1份為測試集,剩下的為訓(xùn)練集,如圖4所示,究竟選擇哪一份作為測試集,需在后面的嵌套循環(huán)中實(shí)現(xiàn).

2)特征選擇.缺陷區(qū)域的長度、寬度、面積、區(qū)域?qū)Ρ榷鹊裙灿?jì)138個(gè)特征形成初始特征集合,利用信息增益率來對(duì)各個(gè)特征排序.設(shè)樣本集T的某個(gè)特征子集S中,相異值構(gòu)成集合A,集合A把特征子集S劃分為多個(gè)子集{S1,S2,Sv,…},|Sv|、|S|為集和大小,信息增益率的公式為Gainration(S,A)=Gain(S,A)Intrinsiclnfo(S,A)(3)式中Gain(S,A)為信息增益,是分裂前的信息減去分裂后的信息,公式為Gain(S,A)=InfoBefore(S)-InfoAfter(S)=Entropy(S)-∑v∈Values(A)|Sv||S|Entropy(Sv)(4)式中Entropy(S)為集合S的熵,公式為Entropy(S)=Entropy(p1,p2,…,pm)=-∑mi=1pilogpi(5)式中pi為第i個(gè)類別的概率.式(3)中,Intrinsiclnfo(S,A)為內(nèi)在信息,公式為Intrinsiclnfo(S,A)=∑v∈Values(A)|Sv||S|log(|Sv||S|)(6)利用信息增益率對(duì)特征進(jìn)行排序,再利用循環(huán)(從1到138循環(huán))實(shí)現(xiàn)最優(yōu)的特征個(gè)數(shù)的確定.

3)BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的確定.BP神經(jīng)網(wǎng)絡(luò)應(yīng)用到帶鋼表面質(zhì)量檢測上具有很多優(yōu)勢,但也存在一些問題,主要體現(xiàn)在隱含層節(jié)點(diǎn)數(shù)選取的盲目性和初始權(quán)值選取的隨機(jī)性.對(duì)于隱含層節(jié)點(diǎn)數(shù)確定問題,利用隱含層節(jié)點(diǎn)數(shù)常用計(jì)算公式[15](2(m+n)+1,n+槡m+a,log2n,n為輸入層節(jié)點(diǎn)數(shù),m為輸出層節(jié)點(diǎn)數(shù),a為的[1,10]常數(shù))求得節(jié)點(diǎn)數(shù)的可能取值集合n1,求得該集合最大值n1-max和最小值n1-min,從n1-min開始到n1-max,利用循環(huán),節(jié)點(diǎn)數(shù)逐個(gè)增加,確定最優(yōu)的隱含層節(jié)點(diǎn)數(shù)[16];

4)BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值的選?。?dāng)隱含層節(jié)點(diǎn)數(shù)確定后,需要確定輸入層和隱含層之間、隱含層和輸出層之間的初始權(quán)值.首先生成10組隨機(jī)數(shù)數(shù)組,利用循環(huán)確定最優(yōu)的隨機(jī)數(shù)數(shù)組.

5)判別標(biāo)準(zhǔn)和嵌套循環(huán).上述各循環(huán)中,分類效果好與壞的判別標(biāo)準(zhǔn)是分類的總體精度,公式為OA=∑niin(7)式中:nii為樣本被預(yù)測為類別i,n為樣本個(gè)數(shù).上述各循環(huán)組合在一起就是一個(gè)嵌套循環(huán),其N-S盒圖如圖5所示,最外層是測試集和訓(xùn)練集的10折交叉驗(yàn)證,第1層是確定最優(yōu)的特征數(shù),第3層是確定最優(yōu)的隱含層節(jié)點(diǎn)數(shù),第4、5層是確定最優(yōu)的輸入層和隱含層、隱含層和輸出層的初始權(quán)值[17-20].經(jīng)以上循環(huán),確定D3作為測試集,最優(yōu)特征數(shù)為23個(gè),最優(yōu)的隱含層節(jié)點(diǎn)數(shù)是46個(gè),同時(shí)也確定了最優(yōu)的初始權(quán)值,對(duì)應(yīng)的3層BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型如圖6所示.

3實(shí)驗(yàn)結(jié)果

1)鮑威爾棱鏡與柱透鏡進(jìn)行對(duì)比在實(shí)際工作距離1.5m處,采用0.1m為間隔使用光功率計(jì)測試光源功率,如圖7所示,橫軸為測試點(diǎn),縱軸為測試點(diǎn)的光功率.實(shí)驗(yàn)表明,鮑威爾棱鏡均勻性優(yōu)于柱透鏡.

2)Gabor濾波方法與其他方法比較將動(dòng)態(tài)閾值法+Blob分析法(方法A)和灰度共生矩陣紋理背景消除法(方法B)兩種方法與Gabor濾波方法進(jìn)行比較,如圖8所示.由于缺陷與背景灰度相近(圖(a)),致使方法A缺陷丟失(圖(b)),由于缺陷與背景紋理相近(圖(d)),致使方法B產(chǎn)生噪聲(圖(e)),Gabor方法取得了不錯(cuò)的效果(圖(e)、(圖(f))).

3)GPU與CPU比較以4096×4096的圖像為例,選10幅有代表性圖像,利用CPU(最新的inteli7-2600處理器,4核8線程,2.6GHz,內(nèi)存8G)和GPU(nVidiaGTX970,4G緩存顯卡)進(jìn)行Ga-bor運(yùn)算,計(jì)算時(shí)間如表2所示,GPU計(jì)算效率明顯優(yōu)于CPU,其中CPU的平均耗時(shí)為290.4ms,而GPU的平均耗時(shí)為31.7ms.

4)檢測效果在產(chǎn)線速度為1775m/min,最小檢測缺陷的尺寸為0.25mm的檢測系統(tǒng)中,對(duì)帶鋼的主要4種類型缺陷進(jìn)行檢測統(tǒng)計(jì),檢測結(jié)果如表3所示.可計(jì)算出整體檢出率99.9%,檢測準(zhǔn)確率99.4%.

4結(jié)論

本文提出將基于鮑威爾棱鏡的大功率激光器應(yīng)用到光源的設(shè)計(jì)中,保證光源光照的均勻性;提出了新的帶鋼表面缺陷檢測系統(tǒng)的成像系統(tǒng)結(jié)構(gòu)設(shè)計(jì),保證了快速、高精度的生成圖像;提出了基于GPU的二維Gabor濾波圖像處理的算法,滿足了實(shí)時(shí)處理的要求;提出了基于嵌套循環(huán)的分類器擇優(yōu)算法,避免了樣本集選擇、特征選擇和BP神經(jīng)網(wǎng)絡(luò)參數(shù)設(shè)定的盲目性.借助上述技術(shù),系統(tǒng)實(shí)現(xiàn)了較好的效果,滿足當(dāng)前帶鋼生產(chǎn)的檢測需求.

參考文獻(xiàn):

[1]張長富.中國鋼鐵工業(yè)運(yùn)行情況和發(fā)展展望[J].中國鋼鐵業(yè),2013(4):5-8.

[2]劉彩章.基于機(jī)器視覺的帶鋼表面缺陷成像系統(tǒng)理論與實(shí)驗(yàn)研究[D].武漢:武漢科技大學(xué),2012:2-4.

[3]高瑀含,安志勇,李娜娜等.高斯光束整形系統(tǒng)的光學(xué)設(shè)計(jì)[J].光學(xué)精密工程,2011,19(7):1464-1471.

[4]徐科,楊朝霖,周鵬.熱軋帶鋼表面缺陷在線檢測的方法與工業(yè)應(yīng)用[J].機(jī)械工程學(xué)報(bào),2009,45(4):111-114.

[5]李霞.基于CCD的鋼板測寬儀系統(tǒng)設(shè)計(jì)[D].秦皇島:燕山大學(xué),2014:5-10.

[6]石東新,傅新宇,張遠(yuǎn).CMOS與CCD性能及高清應(yīng)用比較[J].通訊技術(shù),2010,43(12):174-179.

[7]高梓瑞.Gabor濾波器在紋理分析中的應(yīng)用研究[D].武漢:武漢理工大學(xué),2012:6-10.

[8]王成順.表面缺陷檢測GPU并行圖像處理技術(shù)[D].合肥:合肥工業(yè)大學(xué),2012:3-6.

[9]徐永智,華慧川.對(duì)主成分分析三點(diǎn)不足的改進(jìn)[J].科技管理研究,2009(6):128-130.

[10]李佳龍,閻威武,白曉慧,等.基于數(shù)據(jù)驅(qū)動(dòng)與信息增益率多指標(biāo)決策模型的生活飲用水水質(zhì)評(píng)估[J].大連理工大學(xué)學(xué)報(bào),2016,56(1):92-96.

[11]張曉雷.支持向量機(jī)若干問題的研究[D].北京:清華大學(xué),2012:1-20.

[12]王成明,顏云輝,李駿,等.基于BP神經(jīng)網(wǎng)絡(luò)的冷軋帶鋼表面質(zhì)量檢測研究[J].機(jī)械設(shè)計(jì)與制造,2007(6):106-108.

[13]高正中,張曉燕,龔群英.基于BP神經(jīng)網(wǎng)絡(luò)的超聲波流量計(jì)的設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2016,39(16):6-9.

[14]周洋,何平安,蔣千年等.激光束整形光學(xué)系統(tǒng)的設(shè)計(jì)與研究[J].光學(xué)與光電技術(shù),2006,4(2):26-28.

[15]飛思科技產(chǎn)品研發(fā)中心.神經(jīng)網(wǎng)絡(luò)理論與Matlab7實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2005.

[16]沈花玉,王兆霞,高成耀等.BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定[J].天津理工大學(xué)學(xué)報(bào),2008,24(5):13-15.

[17]文冬林.BP神經(jīng)網(wǎng)絡(luò)中一種逃離局部極小點(diǎn)的方法研究[D].貴陽:貴州大學(xué),2008.

[18]甘勝豐.帶鋼表面缺陷圖像檢測與分類方法研究[D].北京:中國地質(zhì)大學(xué),2013:3-20.

[19]吳彬彬.機(jī)器視覺方法在帶鋼表面缺陷檢測中的應(yīng)用研究[D].武漢:武漢科技大學(xué),2015:4-50.

第3篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

基于圖像理解的汽車牌照自動(dòng)識(shí)別系統(tǒng)是智能交通系統(tǒng)一個(gè)重要分支,有著非常廣泛的應(yīng)用前景,而把汽車牌照從復(fù)雜的汽車圖像中分割出來是汽車牌照自動(dòng)識(shí)別系統(tǒng)必須解決的關(guān)鍵問題。在過去的十幾年中,各國的科研人員提出了不少提取汽車牌照的方法。Choi和Kim提出利用Hough變換尋找垂直邊緣提取汽車牌照的方法,此方法由于許多汽車前部散熱器產(chǎn)生的垂直邊緣和某些牌照邊框的扭曲或某些汽車牌照沒有邊框而魯棒性較差。S.K.Kim和H.J.Kim提出的基于遺傳算法分割提取汽車牌照的方法,最大缺點(diǎn)是耗時(shí)長,難以進(jìn)行實(shí)時(shí)處理。S.H.Park提出的一種基于神經(jīng)網(wǎng)絡(luò)提取汽車牌照的方法,使用二個(gè)時(shí)延神經(jīng)網(wǎng)絡(luò)在水平和垂直方向?qū)斎雸D像進(jìn)行濾波,得到牌照的候選區(qū)域,然后利用牌照的長寬比、面積、面積與周長比來區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。此方法要求圖像中的牌照尺寸基本不變,一旦圖像中的牌照尺寸發(fā)生了較大的變化,必須對(duì)神經(jīng)網(wǎng)絡(luò)重新進(jìn)行訓(xùn)練。T.R.Crimmins提出了一種數(shù)字形態(tài)學(xué)方法,此方法用不同尺寸的每個(gè)可能字符作為結(jié)構(gòu)元素,采用擊中擊不中方法先提取輸入圖像中的字符,再根據(jù)牌照字符的語法得到汽車牌照,這種方法計(jì)算量非常大且易受噪聲影響。C.H.Poon提出了一種灰值形態(tài)學(xué)方法,它通過檢測字符中的直線段和字符間的空間來提取牌照,這種方法耗時(shí)較多,且沒有利用版照的尺寸信息。C.M.Hwang提出了空間頻率方法,它利用牌照區(qū)域內(nèi)空間頻率變化大的特性,對(duì)圖像進(jìn)行一階差分。差分圖在牌照區(qū)域內(nèi)形成多個(gè)峰,然后利用峰的幅度、寬度和密度區(qū)分真正的牌照區(qū)域與類牌照區(qū)域。這種方法具耗時(shí)少、抗噪能力強(qiáng)的優(yōu)點(diǎn)。本文提出的灰值形態(tài)學(xué)方法僅利用了牌照區(qū)域內(nèi)空間頻率變化大的特性而且利用了牌照區(qū)域字符筆劃具有高曲的特性,因而比單純的空間頻率方法更加有效。通過建立牌照與卷積算子形態(tài)學(xué)結(jié)構(gòu)元素尺寸的相互關(guān)系。本文提出的方法對(duì)不同尺寸牌照具有很好的魯棒性。

1 數(shù)字形態(tài)學(xué)

數(shù)字形態(tài)學(xué)是一種重要的數(shù)字圖像處理方法和理論。在數(shù)字形態(tài)學(xué)中,兩種最基本的變換或運(yùn)算是腐蝕和膨脹,其它形態(tài)學(xué)變換都可通過它們來定義。下面列出了一些灰值形態(tài)學(xué)變換的定義。

圖像f(x,y)平移(a,b)定義為:

f(a,b)(x,y)=f(x-a,y-b)

圖像f(x,y)相對(duì)于原點(diǎn)的反射為:

f^(x,y)=f(-x,-y)

二幅圖像f(x,y)和g(x,y)的最小記為(f∧g)(x,y)。

當(dāng)(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內(nèi)時(shí):

(f∧g)(x,y)=min{f(x,y),g(x,y)}

否則:

(f∧g)(x,y)=0

二幅圖像f(x,y)和g(x,y)的最大記為(f∨g)(x,y)。

當(dāng)(x,y)位于圖像f的定義域D(f)和圖像g的定義域D(g)的交集D(f)∩D(g)內(nèi)時(shí):

(f∨g)(x,y)=max{f(x,y),g(x,y)}

當(dāng)(x,y)∈D(f)且(x,y)∈D(g)時(shí)

(f∨g)(x,y)=f(x,y)

當(dāng)(x,y)∈D(g)且(x,y)∈D(f)時(shí)

(f∨g)(x,y)=g(x,y)

f(x,y)被g(x,y)膨脹定義為:

(fg)(x,y)=max{f(x-a,y-b)+g(a,b)}

(a,b)∈D(g)

f(x,y)被g(x,y)腐蝕定義為:

(fg)(x,y)=max{f(x-a,y-b)-g(a,b)}

(a,b)∈D(g)

開運(yùn)算定義:

fog=(fg)g

閉運(yùn)算定義:

f·g=(fg)g

Top-Hat變換定義:

Hat(f,g)=f-fog

與Top-Hat變換相對(duì)的是波谷檢測器(Valley變換),其定義為:

Valley(f,g)=(f·g)-f

形態(tài)學(xué)梯度有下面三種形式:

Grad(f)=f-(fg)

Grad(f)=(fg)-f

Grad(f)={[(fg)-(fg)]}/2

2 牌照提取算法

在牌照提取算法中,需要用到卷積、模板卷積和卷積投影等概念。下面對(duì)它們進(jìn)行定義。

對(duì)于圖像[aij]m×n,i=0...m-1,j=0...n-1,模板[aij]p×q。p<m,q<n,其卷積、模板卷積和卷積投影都是一維數(shù)組。

水平模板卷積

垂直模板卷積投影vmp:

水平模板卷積投影hmp:

圖1中牌照區(qū)域的長為173象素、高為36象素。從左到右、從上到下的8條曲線依次為牌照區(qū)域灰度圖第10~17條水平方向的灰度值。通過觀察發(fā)現(xiàn),在牌照區(qū)域的水平方向不令空間頻率變化大,而且具有許多陡峭的峰(欲)和高曲率點(diǎn)。而灰值形態(tài)學(xué)的梯度變換可以對(duì)圖像進(jìn)行高通濾波,灰值形態(tài)學(xué)的Top-Hat變換和Valley變換可以撮高曲率點(diǎn)、波峰和波谷。

進(jìn)行形態(tài)學(xué)變換,需要考慮二個(gè)因素:結(jié)構(gòu)元素和變換類型。變換類型準(zhǔn)備采用灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換。結(jié)果元素采用n×1的維水平結(jié)構(gòu),以提取水平方向上的高頻分量、波峰和波谷。結(jié)構(gòu)元素的大小n對(duì)Top-Hat變換和Valley變換的結(jié)果結(jié)構(gòu)元素的大小n對(duì)Top-Hat變換和Valley變換的結(jié)果有著很大的影響,因此問題的關(guān)鍵是怎樣確定n。

    分析圖1中水平方向的灰度曲線,發(fā)現(xiàn)在穿過字符的水平線上,灰度曲線波峰的寬度與字符垂直筆劃的寬度存在著某種線性關(guān)系。根據(jù)中國汽車牌照的一般規(guī)范,牌照上字符的垂直筆劃寬度與牌照的寬度也存在著某種線性關(guān)系。結(jié)構(gòu)元素的尺寸n與灰度曲線波峰的寬度又可建立一種線性關(guān)系。因此可建立n與牌照寬度w的一種近似線性的關(guān)系:

n=Integer{(w/k)+b}

式中的Integer()表示對(duì)括號(hào)內(nèi)的值取整。w、b都為整數(shù)。根據(jù)經(jīng)驗(yàn)令w、b分別為25和0,則:

n=Integer(w/25)

由上式可知,當(dāng)牌照的寬度w變化25個(gè)象素時(shí),結(jié)構(gòu)元素的大小n才變化1個(gè)單位,也就是說n對(duì)w不是很敏感。

牌照區(qū)域提取算法包括以下幾步:

(1)縮小圖像:對(duì)輸入的灰值汽車圖像進(jìn)行隔行隔列抽樣,得到一幅大小為四分之一原因的新圖像。接下列抽樣,得到一幅大小為四分之一原圖的新圖像。接下來的處理均在新圖像上進(jìn)行,這樣可以大大減少處理時(shí)間,提高算法的效率。根據(jù)形態(tài)學(xué)的尺度變換兼容性原理,對(duì)圖像縮?。ǚ糯螅┖笤龠M(jìn)行形態(tài)學(xué)變換,只要對(duì)結(jié)構(gòu)元素做相應(yīng)的變換,結(jié)果不變。

(2)水平分割:對(duì)汽車圖像進(jìn)行水平分割,得到幾個(gè)可能含牌照的水平區(qū)域。

(3)垂直分割:對(duì)第(2)步所得到的每一個(gè)水平區(qū)域進(jìn)行垂直分割,得到一些牌照的候選區(qū)域。

(4)牌照區(qū)域甄別:分析各個(gè)候選區(qū)域得出真正的牌照區(qū)域。

    2.1 水平分割

分別對(duì)汽車圖像進(jìn)行灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換,如圖2。一般來說,在大多數(shù)汽車車牌照自動(dòng)識(shí)別系統(tǒng)應(yīng)用中,CCD攝取的汽車圖像中牌照的大致寬度和高度是已知的。如果牌照的寬度為w∈(a,b),則取水平模板m×1,其中m=(a+b)/2。用模板分別對(duì)圖像的梯度圖、Top-Hat變換圖和Valley變換圖進(jìn)行水平模板卷積。對(duì)每幀變換圖取每一行模板水平卷積的最大值,得到1個(gè)一維數(shù)組,3幅變換圖共得到3個(gè)一維數(shù)組g1,ti和vi,其中i大于等于1,而小于等于圖像的高度,其曲線如圖2的b、c、d。觀察圖2可以發(fā)現(xiàn),由于受車體上其它字符和車前燈等因素的影響,僅僅依靠梯度圖較難對(duì)牌照進(jìn)行水平定位,而結(jié)合Top-Hat變換圖和Valley變換圖,能更好地對(duì)牌照進(jìn)行水平定位。據(jù)此,構(gòu)成了1個(gè)一維數(shù)組pi。

pi=gi×ti×vi

其曲線如圖3。取圖3中最高峰的位置作為牌照的水平中線,為了確保不會(huì)出錯(cuò),把次高峰也作為牌照的另一備選位置。了高峰和次高峰的位置,分割出2個(gè)寬為汽車圖像寬度,高為牌照的最大可能高度b的區(qū)域,如圖4中的a和b。

2.2 垂直分割

對(duì)圖4中的a和b二個(gè)區(qū)域分別進(jìn)行灰值形態(tài)學(xué)的梯度變換、Top-Hat變換和Valley變換,并在垂直方向?qū)ψ儞Q圖進(jìn)行卷積得到3個(gè)一維數(shù)組gi、ti和vi,其中i大于等于1,而小于等于圖像的寬度w,其曲線如圖5和圖6。qi=gi×ti×vi

的曲線如圖7。利用下面的公式分別對(duì)圖4中的a和b進(jìn)行垂直分割。

{(m,n)|qi>kT,i=m...n,n-m+1∈(a,b)}

其中:T=Max(qi),k為一經(jīng)驗(yàn)值,(a,b)為牌照的寬度范圍。

i=l...w

分割結(jié)果如圖8所示。

2.3 牌照區(qū)域甄別

第4篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

 

AI從誕生到現(xiàn)在已經(jīng)有60年的時(shí)間,期間經(jīng)歷兩輪起落,呈階梯式進(jìn)化,走到今天進(jìn)入第三個(gè)黃金期。如果按照其智能科技水平劃分,今天的人工智能尚處在狹義智能向廣義智能進(jìn)階的階段,還是一名不折不扣的“少年”,未來擁有無限的可能和巨大的上升空間。

 

AI是一門交叉的學(xué)科:人工智能由不同的技術(shù)領(lǐng)域組成,如機(jī)器學(xué)習(xí)、語言識(shí)別、圖像識(shí)別、自然語言處理等。而同時(shí),它也是一門交叉學(xué)科,屬于自然科學(xué)和社會(huì)科學(xué)的交叉,涉及到哲學(xué)和認(rèn)知科學(xué)、數(shù)學(xué)、神經(jīng)生理學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、信息論、控制論、不定性論等學(xué)科。人工智能領(lǐng)域的技術(shù)壁壘是比較高的,并且會(huì)涉及到多學(xué)科協(xié)作的問題,對(duì)任何公司來說,想做好人工智能將是一門大工程。未來不大可能出現(xiàn)一個(gè)公司能包攬整個(gè)人工智能產(chǎn)業(yè)每一個(gè)部分的工作,更可能的模式將是一個(gè)公司專注于一個(gè)相對(duì)細(xì)分的領(lǐng)域,通過模塊化協(xié)作的形式實(shí)現(xiàn)人工智能領(lǐng)域的不同應(yīng)用。

 

進(jìn)化史呈階梯狀,以階段突破式為成長模式:人工智能的發(fā)展經(jīng)歷了兩次黃金和低谷期,

 

現(xiàn)在正經(jīng)歷著第三個(gè)黃金期。1956年,麥卡賽、明斯基、羅切斯特和申農(nóng)等年輕科學(xué)家在達(dá)特茅斯一起聚會(huì),并首次提出了“人工智能”這一術(shù)語,標(biāo)志著人工智能的誕生。第二年,由 Rosenblatt 提出 Perceptron 感知機(jī),標(biāo)志著第一款神經(jīng)網(wǎng)絡(luò)誕生。1970年,因?yàn)橛?jì)算能力沒能突破完成大規(guī)模數(shù)據(jù)訓(xùn)練,人工智能的第一個(gè)黃金期到此結(jié)束。

 

后直到1982年德普霍爾德神經(jīng)網(wǎng)絡(luò)的提出,人工智能進(jìn)入第二個(gè)黃金期,之后BP算法的出現(xiàn)使大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練成為可能,人工智能的發(fā)展又一次進(jìn)入。1990年,因?yàn)槿斯ぶ悄苡?jì)算機(jī)和DARPA沒能實(shí)現(xiàn),政府撤資,人工智能又一次進(jìn)入低估。2006年,隨著“深度學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò)取得突破性進(jìn)展,人工智能又一次進(jìn)入黃金時(shí)期。

 

AI將由狹義智能向廣義智能進(jìn)化,雖然人工智能的誕生已經(jīng)有60年的時(shí)間但如果把它比喻成一個(gè)人的話,當(dāng)前的他應(yīng)該還未成年。按照人工智能的“智能”程度,可以將其分成狹義智能、廣義智能、超級(jí)智能三個(gè)大的發(fā)展階段,現(xiàn)階段的圖像與語音識(shí)別水平標(biāo)志著人類已經(jīng)基本實(shí)現(xiàn)狹義智能,正在向廣義智能的階段邁進(jìn)。

 

狹義智能:即當(dāng)前的技術(shù)已經(jīng)實(shí)現(xiàn)的智能水平,包括計(jì)算智能與感知智能兩個(gè)子階段,計(jì)算智能指的機(jī)器開始具備計(jì)算與傳遞信息的功能,感知智能指機(jī)器開始具備“眼睛”和“耳朵”,即具備圖像識(shí)別與語音識(shí)別的能力,并能以此為判斷采取一些行動(dòng)。

 

廣義智能:指的是機(jī)器開始具備認(rèn)知能力,能像人類一樣獲取信息后主動(dòng)思考并主動(dòng)采取行動(dòng)。在這個(gè)階段,機(jī)器可以全面輔助或代替人類工作。

 

超級(jí)智能:這個(gè)階段的機(jī)器幾乎在所有領(lǐng)域都比人類聰明,包括科學(xué)創(chuàng)新、通識(shí)和社交技能等。這個(gè)階段目前離我們還比較遙遠(yuǎn),到時(shí)候人類的文明進(jìn)步和跨越或許將有賴于機(jī)器,而機(jī)器人意識(shí)的倫理問題也許將在這個(gè)階段成為主要問題。

 

推薦引擎及協(xié)同過濾可以分析更多的數(shù)據(jù)

 

智能助手并不只局限于Siri等手機(jī)語音助手。微軟率先在win10 系統(tǒng)中加入個(gè)人智能助理Cortana,標(biāo)志著個(gè)人PC端智能助理的出現(xiàn);圖靈機(jī)器人以云服務(wù)的方式進(jìn)入海爾智能家居、博世m(xù)ySPIN車載系統(tǒng),預(yù)示著多場景人工智能解決方案的潮流。初步實(shí)現(xiàn)人機(jī)交互的智能助手系統(tǒng),已經(jīng)被應(yīng)用于智能客服、聊天機(jī)器人、家用機(jī)器人、微信管理平臺(tái)、車載系統(tǒng)、智能家居系統(tǒng)、智能手機(jī)助理等多個(gè)軟硬件領(lǐng)域。

 

垂直類網(wǎng)站及社交平臺(tái)可以借助智能助手系統(tǒng)打造高專業(yè)度的“在線專家”以提升平臺(tái)價(jià)值;企業(yè)可以借助以“語義識(shí)別”為基礎(chǔ)的智能助手系統(tǒng),打造智能客服,效率遠(yuǎn)高于傳統(tǒng)的以“關(guān)鍵詞對(duì)應(yīng)”為技術(shù)支持的客服系統(tǒng)。

 

推薦引擎,是主動(dòng)發(fā)現(xiàn)用戶當(dāng)前或潛在需求,并主動(dòng)推送信息給用戶的信息網(wǎng)絡(luò)。挖掘用戶的喜好和需求,主動(dòng)向用戶推薦其感興趣或者需要的對(duì)象。傳統(tǒng)推薦引擎通常利用用戶在平臺(tái)上的歷史記錄進(jìn)行推薦,效率低、匹配度不高。目前隨著大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的推進(jìn),推薦引擎及協(xié)同過濾可以分析更多的數(shù)據(jù),乃至全網(wǎng)數(shù)據(jù),并模擬用戶的需求,真正達(dá)到按需推薦。全球最大的正版流媒體音樂服務(wù)平臺(tái)Spotify也利用卷積神經(jīng)網(wǎng)絡(luò)參與建設(shè)其音樂推薦引擎;谷歌也提出利用深度學(xué)習(xí)方法來學(xué)習(xí)標(biāo)簽進(jìn)行推薦建設(shè)。出品紙牌屋的全球最大在線影片租賃公司Netflix 也利用深度學(xué)習(xí)網(wǎng)絡(luò)分析客戶消費(fèi)的大數(shù)據(jù),還計(jì)劃構(gòu)建一個(gè)在AWS云上的以GPU為基礎(chǔ)的神經(jīng)網(wǎng)絡(luò)。

 

“餐廳推薦引擎”Nara,便是一個(gè)利用AI技術(shù)的推薦引擎。在上線之初,Nara 就取得了400萬美元的投資。Nara 的數(shù)據(jù)庫中有超過100000家餐廳的信息,并利用特有的“Nara神經(jīng)網(wǎng)絡(luò)”,學(xué)習(xí)使用者的偏好,最終達(dá)到“電腦幫你點(diǎn)餐”的目的。

 

而今年3月22日,國內(nèi)AI領(lǐng)軍企業(yè)阿里巴巴旗下的阿里云數(shù)加啟動(dòng)“個(gè)性化推薦”引擎對(duì)外公測,該引擎用于幫助創(chuàng)業(yè)者可以快速獲得媲美淘寶天貓的個(gè)性化服務(wù)能力。阿里云數(shù)加上的推薦引擎能夠以更低的成本完成開發(fā),節(jié)省程序量達(dá)到90%,推薦引擎的搭建時(shí)間將由幾個(gè)月縮短到幾天。

 

對(duì)于不了解算法的人,只能實(shí)現(xiàn)標(biāo)簽規(guī)則類的推薦,但如果要做成機(jī)械化、類似協(xié)同過濾的算法,創(chuàng)業(yè)公司需要配置大量的算法工程師,人力成本很高?,F(xiàn)在用了數(shù)加的推薦引擎,商家只需要做數(shù)據(jù)的ETL加工,推薦的結(jié)果集、訓(xùn)練集都不用處理,只需要調(diào)整參加即可得到推薦結(jié)果。

 

AI帶給人們新的視覺???

 

醫(yī)療:為健康診斷和藥品研發(fā)插上高飛的翅膀

 

健康診斷有望迎來新紀(jì)元,海量的病歷數(shù)據(jù)和醫(yī)學(xué)界的新研究成果,單靠人工很難及時(shí)篩選并利用,而引入人工智能技術(shù)將充分發(fā)揮這些信息的價(jià)值。例如著名的個(gè)人健康管理產(chǎn)品公司W(wǎng)elltok將 IBM的Watson功能融入旗下產(chǎn)品 CafeWell Concierge APP中,借助 Watson 的認(rèn)知計(jì)算能力理解人類語言,實(shí)現(xiàn)與用戶溝通的能力,從大量數(shù)據(jù)中進(jìn)行分析并為用戶提供健康管理相關(guān)的答案和建議,實(shí)現(xiàn)健康管理、慢病恢復(fù)訓(xùn)練、健康食譜等功能,這一領(lǐng)域的良好前景使 Wellltok公司近年的融資額連創(chuàng)新高。另外,2015年IBM斥資10億美元收購醫(yī)療影像與臨床系統(tǒng)提供商Merge,將研究如何實(shí)現(xiàn) Watson的“辨讀”醫(yī)學(xué)影像功能。此外,AI 還可以從醫(yī)療中心獲得的健康數(shù)據(jù),通過大數(shù)據(jù)分析,實(shí)現(xiàn)根據(jù)分析患者行為來制定個(gè)性化治療方案的功能。

 

智能家居:天花板尚遠(yuǎn),AI有望成為核心

 

行業(yè)天花板尚遠(yuǎn),增速有望保持在 50%左右, 《鋼鐵俠》中的“Jarvis”作為智能管家,除了起到鋼鐵俠的小秘書的作用,還幫主人打理著日常生活,向我們展示了一個(gè)理想中的智能家居系統(tǒng)。雖然我們目前可能離那個(gè)無所不能的智能管家還很遙遠(yuǎn),但智能家居對(duì)我們生活的變革確實(shí)已經(jīng)開始了。根據(jù)《2012-2020 年中國智能家居市場發(fā)展趨勢及投資機(jī)會(huì)分析報(bào)告》的預(yù)測,我國智能家居市場在 2016年將達(dá)到605.7億的規(guī)模,同比增長50.15%,到2020年市場規(guī)模將達(dá)到3294億,年均增速將保持在50%左右,具備充足的向上延伸空間。而智能家居想達(dá)到“Jarvis”般的終極效果,必然需要引入AI技術(shù),實(shí)現(xiàn)家居的感應(yīng)式控制甚至自我學(xué)習(xí)能力。

 

AI有望成為智能家居的核心,實(shí)現(xiàn)家居自我學(xué)習(xí)與控制。按照智能家居的發(fā)展進(jìn)度,大致可以分為四個(gè)階段:手機(jī)控制、多控制結(jié)合、感應(yīng)式控制、系統(tǒng)自我學(xué)習(xí)。當(dāng)前的發(fā)展水平還處在手機(jī)控制向多控制結(jié)合的過度階段。而從多控制結(jié)合向感應(yīng)式控制甚至自我學(xué)習(xí)階段進(jìn)化時(shí),AI將發(fā)揮主要功能。到今天為止,家居的實(shí)體功能已經(jīng)較為全面,未來的發(fā)展重點(diǎn)可能在于如何使之升級(jí)改造,實(shí)現(xiàn)家居的自我行為及協(xié)作,因此未來AI在智能家居領(lǐng)域的應(yīng)用有望成為其核心價(jià)值。AI對(duì)智能家居的重構(gòu)可以深入到方方面面,包括:控制主機(jī)、照明系統(tǒng)、影音系統(tǒng)、環(huán)境監(jiān)控、防盜監(jiān)控、門窗控制、能源管理、空調(diào)系統(tǒng)、花草澆灌、寵物看管等等。

 

無人駕駛:政策漸萌芽,AI決定可靠性

 

優(yōu)點(diǎn)多、動(dòng)機(jī)足、政策漸萌芽。據(jù)麥肯錫的調(diào)查顯示,如果能解放駕駛員的雙手,一輛無人駕駛汽車內(nèi)的乘客通過移動(dòng)互聯(lián)網(wǎng)使用數(shù)字媒體服務(wù)的時(shí)間多一分鐘,每年全球數(shù)字媒體業(yè)務(wù)產(chǎn)生的利潤將增加 50億歐元。此外,由于自動(dòng)泊車無須為乘客下車預(yù)留開門空間,使得停車位空間可縮減至少15%。

 

如果無人駕駛汽車以及ADAS系統(tǒng)能夠?qū)⑹鹿拾l(fā)生率降低90%,即可挽回全美每年的損失約1千900億美金??梢哉f諸多的優(yōu)點(diǎn)使得無人駕駛技術(shù)的研發(fā)動(dòng)機(jī)還是相當(dāng)充分的,因此未來無人駕駛推行的力度應(yīng)該還會(huì)保持在一個(gè)比較高的水平。美國勒克斯研究公司曾預(yù)計(jì)無人駕駛汽車的市場規(guī)模在2030年將達(dá)到870億美元。

 

到目前為止,各國政府對(duì)于無人駕駛技術(shù)在政策上的支持正逐步放開,美國政府在年初剛剛宣布了40億美元的資助計(jì)劃;英國目前已經(jīng)不需要獲得額外批準(zhǔn)和履約保證即可進(jìn)行實(shí)際道路的無人駕駛汽車測試;而德國也在去年宣布將計(jì)劃設(shè)立無人駕駛汽車測試路段,供安裝有駕駛輔助系統(tǒng)或全自動(dòng)駕駛系統(tǒng)車輛行駛;歐盟總部正在就如何修改現(xiàn)行有關(guān)駕駛的法律法規(guī)從而支持自動(dòng)駕駛的發(fā)展展開討論和研究工作;日本也提出要在2020年之前實(shí)現(xiàn)自動(dòng)駕駛汽車方面的立法,并將自動(dòng)駕駛作為 2016年9月七國集團(tuán)交通部長會(huì)議的議題。

 

“無人汽車大腦”AI的智能程度決定了無人駕駛的可靠性。由于無人駕駛完全交由汽車的內(nèi)置程序負(fù)責(zé),因此AI就是無人汽車的大腦,而測距儀、雷達(dá)、傳感器、GPS等。設(shè)備都是AI的“眼睛”。AI的智能程度直接決定了無人駕駛汽車在不同的路況、不同的天氣、甚至一些探測設(shè)備出現(xiàn)故障的突況下能否及時(shí)做出正確的判斷并靈活調(diào)整行駛策略,最終決定了無人駕駛汽車當(dāng)前最亟待突破的可靠性。

 

NVIDIA 在2016年的 CES大會(huì)上了“Drive PX 2”車載計(jì)算機(jī),以及一套與之搭配的具有學(xué)習(xí)功能的自動(dòng)駕駛系統(tǒng)。該系統(tǒng)的亮點(diǎn)在于“自我學(xué)習(xí)”,通過讓車輛自行分析路面狀況,而不是在數(shù)據(jù)庫中尋找預(yù)先儲(chǔ)存的策略實(shí)現(xiàn)自動(dòng)駕駛,系統(tǒng)背后連接著名為NVIDIA DIGITS的深度學(xué)習(xí)訓(xùn)練平臺(tái),最終連接到NVIDIA DRIVENET神經(jīng)網(wǎng)絡(luò),為車輛的自我學(xué)習(xí)和完善提供支持。并且由于它是通過判斷物體的行進(jìn)軌跡而不是物體本身去計(jì)算路徑,因此在駕駛時(shí)受天氣影響較小。

 

AI 成必爭之地

 

目前全球AI主戰(zhàn)場依舊在歐美。Venture Scanner的統(tǒng)計(jì)顯示,根據(jù)從事 AI相關(guān)業(yè)務(wù)的公司數(shù)量來看,目前全球 AI的主戰(zhàn)場還是集中在北美和西歐地區(qū)。美國數(shù)量最多,達(dá)到450家左右的水平。而中國從事相關(guān)業(yè)務(wù)的公司數(shù)量還比較少,和俄羅斯、澳洲、部分歐洲國家及非洲南部國家水平接近,相比起歐美國家的AI公司數(shù)量,還有很大的提高空間。

 

Google:投資未來的人工智能帝國

 

建立Alphabet帝國,具備品牌背書效應(yīng)。2015年,谷歌成立母公司 Alphabet, 搜索、廣告、地圖、App、Youtube、安卓以及與之相關(guān)的技術(shù)基礎(chǔ)部門”仍屬于谷歌,而Calico、Nest、Google Fiber、Google Venture、Google Capital 及 Google X 都將獨(dú)立出來,成為 Alphabet 旗下的獨(dú)立公司。通過建立 Alphabet集團(tuán),谷歌將不同業(yè)務(wù)的研發(fā)獨(dú)立出來,以子公司的形式進(jìn)行業(yè)務(wù)開展,保留在Google這個(gè)品牌下的基本都是原有的傳統(tǒng)強(qiáng)勢業(yè)務(wù)。

 

而其它公司負(fù)責(zé)在各自的領(lǐng)域“打頭陣”,一旦業(yè)務(wù)研發(fā)成功,母公司連帶著google這個(gè)品牌都可以受益,而如果研發(fā)失敗,也不會(huì)公司的品牌造成多大的不良影響,建立了良好的品牌背書效應(yīng)。將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到所有產(chǎn)品之中,我們不難發(fā)現(xiàn),谷歌近年幾乎將人工智能滲透到了旗下的各類產(chǎn)品中,可謂是全線鋪開。正應(yīng)了谷歌 CEO的那句話:“我們將小心謹(jǐn)慎地將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到我們所有的產(chǎn)品之中?!备鶕?jù)當(dāng)前Alphabet 的集團(tuán)架構(gòu),我們將涉及到AI應(yīng)用的子公司情況以及相應(yīng)的業(yè)務(wù)開展情況羅列如下:

 

Nest:從事智能家居生態(tài)系統(tǒng)建設(shè)。2014 年谷歌以32億美元收購 Nest。Nest 生產(chǎn)智能恒溫器,它能夠?qū)W習(xí)用戶的行為習(xí)慣,并且根據(jù)他們的喜好去調(diào)節(jié)溫度。同時(shí),Nest 也提供火警探測器和家庭安全攝像頭等智能家居。

 

Google X:谷歌各類創(chuàng)新技術(shù)的“孵化池”。Google X開展的與AI有關(guān)的項(xiàng)目有:無人駕駛汽車、Project Wing 無人機(jī)送貨項(xiàng)目、對(duì)抗帕金森氏癥的 Liftware“反抖”湯匙、用于疾病預(yù)警和健康監(jiān)控的可穿戴設(shè)備、Project Titan 太陽能無人機(jī)項(xiàng)目、以及 Replicant 團(tuán)隊(duì)負(fù)責(zé)的機(jī)器人項(xiàng)目等。

 

Verily:從事生命科學(xué)業(yè)務(wù),即原來的 Google Life Science。代表產(chǎn)品有可以收集佩戴者體溫和血液酒精含量等生物數(shù)據(jù)的智能隱形眼鏡,以及監(jiān)控血液中納米粒子的智能腕表。

 

DeepMind:深度學(xué)習(xí)算法公司。2014年谷歌以4億美元收購了DeepMind。

 

DeepMind的算法源于兩種機(jī)器學(xué)習(xí)方法的結(jié)合:第一種是深度學(xué)習(xí),是受人腦啟發(fā)的一種結(jié)構(gòu)。深度學(xué)習(xí)系統(tǒng)能夠從大量的非結(jié)構(gòu)數(shù)據(jù)中獲取復(fù)雜信息。第二種是增強(qiáng)學(xué)習(xí),靈感源自動(dòng)物大腦中的神經(jīng)遞質(zhì)多巴胺獎(jiǎng)勵(lì)系統(tǒng),算法不斷通過試錯(cuò)來進(jìn)行學(xué)習(xí)。目前,DeepMind在深度學(xué)習(xí)上面的研究成果已經(jīng)開始用在谷歌的機(jī)器人項(xiàng)目中。

第5篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

關(guān)鍵詞:諧波電流;電力系統(tǒng);檢測

一、引言

近年來,隨著電力電子技術(shù)的迅速發(fā)展,各種新型電力電子器件相繼進(jìn)入市場,隨之而來的諧波污染日益嚴(yán)重,由電網(wǎng)諧波引起的電能質(zhì)量問題也日益受到重視,采用有源電力濾波器已成為諧波補(bǔ)償?shù)囊环N重要趨勢。其基本原理是從補(bǔ)償對(duì)象中檢測出諧波電流,由補(bǔ)償裝置產(chǎn)生一個(gè)與該諧波電流大小相等,極性相反的補(bǔ)償電流與其相抵消,其中,諧波電流的正確檢測是決定補(bǔ)償效果的重要環(huán)節(jié)。下面就分別論述一下目前這幾種諧波電流檢測方法。

二、諧波電流的檢測方法

(一)模擬濾波器

模擬濾波器的實(shí)現(xiàn)方法是:當(dāng)信號(hào)不含低于基頻的次諧波時(shí)采用低通濾波器,當(dāng)信號(hào)含有次諧波時(shí)采用帶通濾波器來獲得基波分量,用減法從信號(hào)中減去基波分量就得到分量。該方法具有簡單快速的優(yōu)點(diǎn),但是這種檢測方式有很多缺陷:對(duì)環(huán)境的依賴較高,當(dāng),電網(wǎng)頻率波動(dòng)或?yàn)V波器的元件參數(shù)變化時(shí)效果變差:無法分離出基波中的有功與無功分量;當(dāng)諧波頻率與基波接近時(shí),濾波器的歸一化截止頻率很小,波動(dòng)特性很差;特別是當(dāng)基波頻率不固定而在較大范圍波動(dòng)時(shí),濾波器設(shè)計(jì)非常困難。

(二)Fryze有功電流檢測

其原理是將負(fù)載電流分解為與電壓波形一致的分量,將其余分量為廣義無功電流(包括諧波電流)。它的缺點(diǎn)是:因?yàn)镕ryze的功率定義是建立在平均功率基礎(chǔ)上的,需要一個(gè)周期的積分,有至少一個(gè)周期的延時(shí),不適于負(fù)載變化頻繁的場合。而且只能同時(shí)檢測出諧波及無功電流,不能只檢測諧波電流或只檢測無功電流,有很大的局限性。

(三)基于FFT的諧波電流檢測

離散傅立葉變換DFT(DiscreteFourierTransform)在實(shí)際中非常重要,利用它可以計(jì)算信號(hào)的頻譜、功率譜和線性卷積等。但是當(dāng)N很大時(shí),DFT的計(jì)算量太大,這樣使DFT的應(yīng)用受到限制。1965年J.W.Colley和J.W.Tukey提出快速傅立葉變換,大大減少了計(jì)算量。FFT并不是DFT的另一種變換,而是為了減少DFT計(jì)算次數(shù)的一種有效的快速算法?;贔FTDE 的諧波電流檢測,是一種建立在傅立葉分析基礎(chǔ)上的數(shù)字化分析方法。其工作原理如圖1—2所示。其中i1表示負(fù)載電流,ic表示檢測所的諧波電流。

圖1的工作原理是:在同步脈沖作用下將模擬信號(hào)進(jìn)行離散化處理,通過模擬轉(zhuǎn)換器變?yōu)閿?shù)字量,再用數(shù)字分析的方法,快速傅立葉變換(FFT)進(jìn)行處理,最后得到各次諧波幅值和相位系數(shù),經(jīng)過低通濾波器(LPF)檢測出所需要的信號(hào),對(duì)于檢測出的信號(hào)作FFT反變換即得補(bǔ)償電流信號(hào)。如果需要得到其模擬量,需要用到

數(shù)摸轉(zhuǎn)換器再把數(shù)字量轉(zhuǎn)化為模擬量。采用這種方法需要有高精度的數(shù)摸轉(zhuǎn)換器,同時(shí)要求輸入信號(hào)有較高的信噪比。基于傅立葉的數(shù)學(xué)化分析方法,要求被補(bǔ)償?shù)牟ㄐ问侵芷谧兓?,否則會(huì)帶來較大的誤差。這種方法的優(yōu)點(diǎn)是可以選擇擬消除的諧波次數(shù),缺點(diǎn)是具有較長的時(shí)間延遲,實(shí)時(shí)性差,存在柵欄效應(yīng)和泄漏現(xiàn)象,使得算出的信號(hào)參數(shù):頻率、幅值和相位不準(zhǔn),尤其是相位誤差很大,無法滿足準(zhǔn)確的諧波測量要求。

(四)同步檢測法

對(duì)于同步檢測法用于不平衡三相系統(tǒng)中無功和諧波電流的補(bǔ)償,其基本思想是分別考慮各相情況,并把補(bǔ)償分量分配到三相中,統(tǒng)一確定各相補(bǔ)償電流。但是由于該檢測法實(shí)現(xiàn)根據(jù)總平均功率確定補(bǔ)償后電流,再計(jì)算出補(bǔ)償指令電流,而在計(jì)算補(bǔ)償后電流時(shí),不僅需要知道三相電路的平均功率,還需要知道每個(gè)相電壓的幅值,因此檢測過程中的延遲較大,也僅適用于三相電壓均為正弦波的情況,若電壓波形存在畸變,必將影響檢測精度。

(五)基于瞬時(shí)無功補(bǔ)償理論的檢測方法

(1)瞬時(shí)無功功率的基礎(chǔ)理論。三相電路瞬時(shí)無功功率理論首次于1983年由赤木泰文提出,以后該理論經(jīng)過不斷研究逐漸完善。赤木泰文最初提出的理論亦稱pq理論,是以瞬時(shí)實(shí)功率p和瞬時(shí)虛功率q的定義為基礎(chǔ),其主要一點(diǎn)不足是未對(duì)有關(guān)的電流量進(jìn)行定義。下面介紹以瞬時(shí)電流ip和iq為基礎(chǔ)的理論體系。設(shè)三相電路各相電壓和電流的瞬時(shí)值分別為 va、vb、vc和ia、ib、ic。分別為分析問題方便,把它們變換到α-β兩相正交的坐標(biāo)系上研究。由下面的變換可以得到α、β兩相瞬時(shí)電壓vα、vβ和α、β兩相瞬時(shí)電流iα、iβ。嚴(yán)格地講,基于瞬時(shí)無功功率理論的諧波電流檢測法僅適用于三相三線制、電源電壓為三相對(duì)稱無畸變、三相負(fù)荷平衡的負(fù)載諧波電流的檢測。所以,在有源電力諧波濾波器設(shè)計(jì)中必須針對(duì)具體電網(wǎng)和負(fù)載的特點(diǎn)采取相應(yīng)措施來消除或減小各種不利因數(shù)的影響:①變流器盡可能采用三相三線制接法的橋式電路,從而避免零序電流的存在。②如果只需要諧波電流的檢測,則只要一組與電源同頻率的三相對(duì)稱正弦電壓,此電壓不必是負(fù)荷的實(shí)際供電電源電壓。因此,為了避免變流器網(wǎng)側(cè)電源電壓波形畸變嚴(yán)重,可采取下列措施之一:A、三相電源電壓經(jīng)過低通濾波器濾除高次諧波后再參與諧波電流的檢測運(yùn)算,此時(shí)要求三相所用的低通濾波器特性一致;B、運(yùn)用鎖相技術(shù)產(chǎn)生三相正弦電壓,再參與瞬時(shí)諧波電流的檢測運(yùn)算。

二、結(jié)語

本文從理論上對(duì)有源電力濾波器的實(shí)現(xiàn)技術(shù)和控制策略進(jìn)行研究,提出了以上幾種有源電力濾波器諧波電流的檢測方法。由于這幾種檢測方法在應(yīng)用中都有其局限性,因此,針對(duì)有源電力濾波器的檢測技術(shù)和控制策略還需要做進(jìn)一步的探索。隨著計(jì)算機(jī)運(yùn)算速度的提高和高速微處理器(DSP)的出現(xiàn),為控制系統(tǒng)的數(shù)字化奠定了基礎(chǔ)。有源電力濾波器要求其控制電路必須能完成實(shí)時(shí)檢測、計(jì)算并做出決策,這就為計(jì)算機(jī)開辟了嶄新的應(yīng)用領(lǐng)域,必將為有源電力濾波器的實(shí)用化發(fā)揮越來越重要的作用。

參考文獻(xiàn):

[1] 吳競昌.供電系統(tǒng)諧波.北京: 中國電力出版社,1998

[2] IEC1000-3-2, Electromagnetic Compatibility-Part 3: Linits-section 2:Limits for harmonic crrentemissions (equipmentinputcurrent <16A per phase)[s].March,1995

[3] 中國國家標(biāo)準(zhǔn)GB/T14549-93. 電能質(zhì)量公用電網(wǎng)諧波 . 中國標(biāo)準(zhǔn)出版社 ,1994

[4] 肖國春等. 電能質(zhì)量控制技術(shù)的發(fā)展. 江蘇機(jī)械制造與自動(dòng)化,2001年第1期

第6篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

    可以看出,krisch算子的運(yùn)算量比較大。其次在邊緣檢測中邊緣定位能力和噪聲抑制能力方面,有的算子邊緣定位能力強(qiáng),有的抗噪聲能力比較好:roberts算子利用局部差分算子尋找邊緣,邊緣定位精度較高,但容易丟失一部分邊緣,同時(shí)由于沒經(jīng)過圖像平滑計(jì)算,不能抑制噪聲。該算子對(duì)具有陡峭的低噪聲圖像響應(yīng)最好;sobel算子和prewitt算子都是對(duì)圖像進(jìn)行差分和濾波運(yùn)算,差別只是平滑部分的權(quán)值有些差異,對(duì)噪聲具有一定的抑制能力,不能完全排除檢測結(jié)果中出現(xiàn)偽邊緣。這兩個(gè)算子的邊緣定位比較準(zhǔn)確和完整,但容易出現(xiàn)邊緣多像素寬。對(duì)灰度漸變和具有噪聲的圖像處理的較好;krisch算子對(duì)8個(gè)方向邊緣信息進(jìn)行檢測,因此有較好的邊緣定位能力,并且對(duì)噪聲有一定的抑制作用,該算子的邊緣定位能力和抗噪聲能力比較理想;laplacian算子是二階微分算子,對(duì)圖像中的階躍型邊緣點(diǎn)定位準(zhǔn)確且具有旋轉(zhuǎn)不變性即無方向性。但該算子容易丟失一部分邊緣的方向信息,造成不連續(xù)的檢測邊緣,同時(shí)抗噪聲能力比較差,比較適用于屋脊型邊緣檢測(將在第3節(jié)中討論)。 2.2  最優(yōu)算子     最優(yōu)算子又可以分為馬爾算子(log濾波算子)、坎尼(canny)邊緣檢測、曲面擬合法。 torre和poggio[5]提出高斯函數(shù)是接近最優(yōu)的平滑函數(shù),marr和hildreth應(yīng)用gaussian函數(shù)先對(duì)圖像進(jìn)行平滑,然后采用拉氏算子根據(jù)二階導(dǎo)數(shù)過零點(diǎn)來檢測圖像邊緣,稱為log算子。對(duì)于log算子數(shù)學(xué)上已經(jīng)證明[6],它是按照零交叉檢測階躍邊緣的最佳算子。但在實(shí)際圖像當(dāng)中,高斯濾波的零交叉點(diǎn)不一定全部是邊緣點(diǎn),還需要進(jìn)一步確定真?zhèn)蝃7];坎尼把邊緣檢測問題轉(zhuǎn)換為檢測單位函數(shù)極大值問題,根據(jù)邊緣檢測的有效性和定位的可靠性,研究了最優(yōu)邊緣檢測器所需的特性,推導(dǎo)出最優(yōu)邊緣檢測器的數(shù)學(xué)表達(dá)式。與坎尼密切相關(guān)的還有deriche算子和沈俊算子,它們在廣泛的意義下是統(tǒng)一的;曲面擬合的基本思想是用一個(gè)平滑的曲面與待測點(diǎn)周圍某鄰域內(nèi)像素的灰度值進(jìn)行擬合,然后計(jì)算此曲面的一階或二階導(dǎo)數(shù)。該方法依賴于基函數(shù)的選擇,實(shí)際應(yīng)用中往往采用低階多項(xiàng)式。 2.3  多尺度方法     早期邊緣檢測的主要目的是為了處理好尺度上的檢測和定位之間的矛盾,忽略了在實(shí)際圖像中存在的多種干擾邊緣,往往影響到邊緣的正確檢測和定位。     rosenfeld等[8]首先提出要把多個(gè)尺寸的算子檢測到的邊緣加以組合;marr倡導(dǎo)同時(shí)使用多個(gè)尺度不同的算子,并提出了一些啟發(fā)性的組合規(guī)則。這一思想后來經(jīng)witkin等發(fā)展成了尺度空間濾波理論,說明了不同尺度上的零交叉的因果性;lu jain對(duì)二維信號(hào)進(jìn)行了類似的研究;yuille和poggio證明了對(duì)于任意維信號(hào),當(dāng)用高斯函數(shù)濾波時(shí),尺度圖中包含了數(shù)目最小的零交叉,并且可以由粗到細(xì)地跟蹤這些零交叉。     多尺度信號(hào)處理不僅可以辨識(shí)出信號(hào)中的重要特征,而且能以不同細(xì)節(jié)程度來構(gòu)造信號(hào)的描述,在高層視覺處理中有重要的作用。     其中小波變換是近年得到廣泛應(yīng)用的數(shù)學(xué)工具。與傅立葉變換和窗口傅立葉變換相比,小波變換是時(shí)間和頻率的局域變換,因而能有效地從信號(hào)中提取信息,它通過伸縮和平移等運(yùn)算功能對(duì)函數(shù)或信號(hào)進(jìn)行多尺度細(xì)化分析,解決了傅立葉變換不能解決的很多困難問題,因而被譽(yù)為“數(shù)學(xué)顯微鏡”。信號(hào)突變點(diǎn)檢測及由邊緣點(diǎn)重建原始信號(hào)或圖像是小波變換應(yīng)用的一個(gè)很重要的方面。 從邊緣檢測的角度看,小波變換有以下幾個(gè)優(yōu)點(diǎn):     (1)小波分解提供了一個(gè)數(shù)學(xué)上完備的描述;     (2)小波變換通過選取合適的濾波器,可以極大地減小或去除所提取的不同特征之間的相關(guān)性;     (3)具有“變焦”特性:在低頻段可用高頻分辨率和低時(shí)間分辨率;在高頻段可用低頻分辨率和高時(shí)間分辨率;     (4)小波變換可通過快速算法來實(shí)現(xiàn)。     文獻(xiàn)[9]提出了一種基于層間相關(guān)性的小波邊緣檢測算法,依據(jù)的是信號(hào)主要分布在低頻部分或低尺度部分,而噪聲分布于高頻部分或高尺度部分的特點(diǎn)。另外小波變換具有較強(qiáng)的去相關(guān)性,變換后的小波系數(shù)之間仍然存在大量的相關(guān)性質(zhì),即小波系數(shù)在不同分辨率下的對(duì)應(yīng)系數(shù)之間具有較強(qiáng)的相關(guān)性或稱層間的相關(guān)性。通過對(duì)比該方法能夠較好多的防止噪聲干擾,又能有效地保留圖像邊緣。 2.4  自適應(yīng)平滑濾波方法     該方法是邊緣檢測的一個(gè)重要方法[10],無論是對(duì)于灰度圖象處理還是距離圖像和平面曲線處理都是非常有效的。它的優(yōu)點(diǎn)是:     (1)平滑濾波的迭代運(yùn)算使信號(hào)的邊緣得到銳化,此時(shí)再進(jìn)行邊緣檢測,可以得到很高的邊緣定位精度;     (2)通過自適應(yīng)迭代平滑,實(shí)現(xiàn)了將高斯平滑之后的階躍邊緣、屋頂狀邊緣和斜坡邊緣都轉(zhuǎn)化為理想的階躍邊緣,提高了圖像的信噪比;     (3)經(jīng)過多次迭代運(yùn)算,圖像按邊緣分塊實(shí)現(xiàn)自適應(yīng)平滑,但不會(huì)使邊緣模糊;     (4)應(yīng)用自適應(yīng)平滑濾波得到一種新的圖像尺度空間描述。 2.5  其他方法     近年來隨著模糊數(shù)學(xué)、神經(jīng)網(wǎng)絡(luò)的發(fā)展,人們不斷探索將其應(yīng)用于圖像的邊緣檢測中。文獻(xiàn)[11]和[12]依據(jù)模糊理論討論了邊緣檢測算法的抗噪性和檢測速度問題,并證明了模糊集合理論能較好地描述人類視覺中的模糊性和隨機(jī)性;應(yīng)用人工神經(jīng)網(wǎng)絡(luò)提取圖像邊緣成為新的研究分支,目前已提出了很多算法,具有計(jì)算簡單功能強(qiáng)的特點(diǎn),但是速度慢,穩(wěn)定性差。但是神經(jīng)網(wǎng)絡(luò)邊緣檢測可以避免自適應(yīng)確定閾值的問題,具有較好的容錯(cuò)性和聯(lián)想功能。 2.6  邊緣檢測的步驟     邊緣檢測分為彩色圖像邊緣檢測和灰度圖像邊緣檢測兩種,由于彩色圖像有八種彩色基,在邊緣檢測時(shí)選用不同的彩色基將直接影響實(shí)時(shí)性、兼容性和檢測效果,因此本文只限于灰度圖像的邊緣檢測研究,其步驟如圖2.1所示。

   

其中邊緣定位是對(duì)邊緣圖像進(jìn)行處理,以得到單像素寬的二值邊緣圖像,通常使用的技術(shù)是閾值法和零交叉法。邊緣定位后往往存在一些小的邊緣片斷,通常是由于噪聲等因素引起的,為了形成有意義的邊緣需要對(duì)定位后的邊緣進(jìn)行鏈接。通常有兩種算法:局部邊緣鏈接和全局邊緣鏈接。 3  邊緣模型的分類及性能分析     本小節(jié)從邊緣檢測“兩難”問題出發(fā),總結(jié)了實(shí)際圖像中可能出現(xiàn)的七種邊緣類型,并分別給出了數(shù)學(xué)模型描述,最后分析比較了不同邊緣類型表現(xiàn)出的特性及不同類型的邊緣定位與平滑尺度的關(guān)系。 3.1  邊緣檢測的“兩難”問題     首先來了解一下邊緣檢測的常用定義[13]:邊緣檢測是根據(jù)引起圖像灰度變化的物理過程來描述圖像中灰度變化的過程。引起圖像灰度不連續(xù)性的物理過程可能是幾何方面的(深度的不連續(xù)性、表面取向、顏色和紋理的不同),也可能是光學(xué)方面的(表面反射、非目標(biāo)物體產(chǎn)生的陰影及內(nèi)部倒影等)。這些景物特征混在一起會(huì)使隨后的解釋變得非常困難,且實(shí)際場合中圖像數(shù)據(jù)往往被噪聲污染。信號(hào)的數(shù)值微分的病態(tài)問題:輸入信號(hào)的一個(gè)很小的變化就會(huì)引起輸出信號(hào)大的變化。令 f(x)為輸入信號(hào),假設(shè)由于噪聲的影響,使 f(x)發(fā)生了一個(gè)很小的變動(dòng):               式(3.1)     其中 ε<<1。對(duì)式(3.1)兩邊求導(dǎo)數(shù)則:          式(3.2)     由式(3.2)可以看到,若w足夠大,即噪聲為高頻噪聲時(shí),會(huì)嚴(yán)重影響信號(hào)  f(x)的微分輸出,進(jìn)而影響邊緣檢測的結(jié)果。為了使微分正則化,則需要先對(duì)圖像進(jìn)行平滑。然而圖像平滑會(huì)引起信息丟失,并且會(huì)使圖像平面的主要結(jié)構(gòu)發(fā)生移位。另外若使用的微分算子不同,則同一幅圖像會(huì)產(chǎn)生不同的邊緣,因此噪聲消除與邊緣定位是兩個(gè)相互矛盾的部分,這就是邊緣檢測中的“兩難”[14,15]。 3.2  邊緣分類及性能分析     圖像中的邊緣通常分為:階躍邊緣、斜坡邊緣、三角型屋脊邊緣、方波型屋脊邊緣、樓梯邊緣、雙階躍邊緣和雙屋脊邊緣[1]。     (1)階躍邊緣     模型為: f(x)=cl(x) ,其中 c>0為邊緣幅度, 為階躍函數(shù)。若存在噪聲,可以選用大尺度的模板平滑圖像,不會(huì)影響邊緣的定位。     (2)斜坡邊緣     理想的斜坡邊緣模型為:,其中s為邊緣幅度,d為邊緣寬度。斜坡邊緣的檢測不僅跟尺度有關(guān),還與邊緣本身的寬度有關(guān),若邊緣寬度比較小,則在小的平滑尺度下也能檢測到邊緣;無論是檢測極值點(diǎn)還是過零點(diǎn),邊緣的定位都沒有隨著尺度的變化而變化。因此,對(duì)于斜坡邊緣若存在噪聲,可以選用大尺度的模板平滑圖像。而不會(huì)影響到邊緣定位。     (3)三角型屋脊邊緣     模型為:,其中s為邊緣幅度,d為邊緣寬度。對(duì)于三角型屋脊邊緣若存在噪聲可以選用大尺度的平滑模板,而不會(huì)影響邊緣的定位。     (4)方波型屋脊邊緣     方波型屋脊邊緣的模型為:,其中s為邊緣幅度,d為邊緣寬度。對(duì)于方波型屋脊邊緣檢測,不僅與平滑尺度有關(guān),還與邊緣寬度有關(guān),若存在噪聲,可以選用大尺度的平滑模板,而不會(huì)影響邊緣的定位。     (5)樓梯邊緣     樓梯邊緣模型為:,其中c1、c2、l均為常數(shù)。這種檢測的特點(diǎn)是平滑后的樓梯邊緣不能準(zhǔn)確定位,必須對(duì)檢測到的邊緣位置進(jìn)行移位校正。     (6)雙階躍邊緣     雙階躍邊緣與方波型屋脊邊緣相同,不同之處為:雙階躍邊緣的邊緣點(diǎn)為x=-d/2與 x=d/2,而方波型屋脊邊緣的邊緣點(diǎn)為 x=0。雙階躍邊緣的兩個(gè)邊緣點(diǎn)通過檢測一階導(dǎo)數(shù)的兩個(gè)極值點(diǎn)和二階導(dǎo)數(shù)的兩個(gè)過零點(diǎn)獲得。因此對(duì)于雙階躍邊緣大尺度下不能準(zhǔn)確定位,必須對(duì)檢測到的邊緣位置進(jìn)行移位校正。     (7)雙屋脊邊緣     模型為:,     其中:

第7篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

論文摘要: 當(dāng)點(diǎn)擴(kuò)展函數(shù)未知或不確知的情況下, 從觀察到的退化圖像中恢復(fù)原始圖像的過程稱為圖像盲復(fù)原。近年來, 圖像盲復(fù)原算法得到了廣泛的研究。本文在介紹了盲圖像恢復(fù)算法的現(xiàn)狀的基礎(chǔ)上進(jìn)一步研究其的發(fā)展方向。

一、引言

圖像恢復(fù)是圖像處理中的一大領(lǐng)域,有著廣泛的應(yīng)用,正成為當(dāng)前研究的熱點(diǎn)。圖像恢復(fù)的主要目的是使退化圖像經(jīng)過一定的加工處理,去掉退化因素,以最大的保真度恢復(fù)成原來的圖像。傳統(tǒng)的圖像恢復(fù)假設(shè)圖像的降質(zhì)模型是己知的。而許多情況下,圖像的降質(zhì)模型未知或具有較少的先驗(yàn)知識(shí),必須進(jìn)行所謂的盲恢復(fù)。其重要性和艱巨性而成為一個(gè)研究熱點(diǎn)。目前所能獲取的觀測圖像是真實(shí)圖像經(jīng)過觀測系統(tǒng)成像的結(jié)果。由于觀測系統(tǒng)本身物理特性的限制,同時(shí)受觀測環(huán)境的影響,觀測圖像和真實(shí)圖像之間不可避免地存在著偏差和失真,稱觀測系統(tǒng)對(duì)真實(shí)圖像產(chǎn)生了降質(zhì)。圖像恢復(fù)的目的就是根據(jù)降質(zhì)的觀測圖像分析和計(jì)算得出真實(shí)圖像。

二、圖像盲恢復(fù)算法的現(xiàn)狀

總體來說, 圖像盲復(fù)原方法主要分為以下兩類: 一是首先利用真實(shí)圖像的特別特征估計(jì)PSF,然后借助估計(jì)得到的PSF,采用經(jīng)典的圖像復(fù)原方法進(jìn)行圖像的復(fù)原。這類方法將PSF的估計(jì)與圖像的復(fù)原過程分為2個(gè)不同的過程,因而具有較少計(jì)算量的特點(diǎn);二是PSF辨識(shí)和真實(shí)圖像估計(jì)相結(jié)合,同時(shí)辨識(shí)PSF和真實(shí)圖像。這類算法較為復(fù)雜,計(jì)算量較大。另外,對(duì)于點(diǎn)擴(kuò)展函數(shù)也考慮了空間變化的復(fù)雜情況。針對(duì)目前的盲復(fù)原算法的現(xiàn)狀,根據(jù)退化模型的特點(diǎn), 重新將算法分為空間不變的單通道盲復(fù)原算法、空間不變多通道盲復(fù)原算法和空間變化圖像盲復(fù)原算法3類。

(一)單通道空間不變圖像盲復(fù)原算法

在這類算法中, 最為常用的是參數(shù)法和迭代法。

1)參數(shù)法。所謂參數(shù)法, 即模型參數(shù)法, 就是將PSF和真實(shí)圖像用某一類模型加以描述, 但模型的參數(shù)需要進(jìn)行辨識(shí)。在參數(shù)法中, 典型的有先驗(yàn)?zāi):孀R(shí)法和ARMA 參數(shù)估計(jì)法, 前者先辨識(shí)PSF的模型參數(shù),后辨識(shí)真實(shí)圖像, 屬于第1 種類型的圖像盲復(fù)原算法, 因而計(jì)算量較小;后者同時(shí)辨識(shí)PSF和真實(shí)圖像模型參數(shù), 屬于第2種類型圖像盲復(fù)原算法。

2)迭代法。所謂的迭代法, 不是通過建立模型而是通過算法的迭代過程, 加上有關(guān)真實(shí)圖像和PSF的約束來同時(shí)辨識(shí)PSF和真實(shí)圖像的方法。迭代法是單通道

圖像盲復(fù)原算法中應(yīng)用最廣泛的一類算法, 它不需建立模型, 也不要求PSF 為最小相位系統(tǒng), 因而跟實(shí)際更為接近。在這類算法中, 迭代盲復(fù)原算法(IBD), 基于非負(fù)性和決策域的遞歸逆濾波器算法(NAR2R IF) ,基于高階統(tǒng)計(jì)特性的最小

熵算法等最為典型。

(二)多通道二維圖像盲復(fù)原

多通道二維圖像盲復(fù)原, 這類方法將數(shù)字通訊領(lǐng)域應(yīng)用的一維多通道盲原分離算法擴(kuò)展到二維情況并用于圖像的盲恢復(fù)。這類算法中有兩種代數(shù)方法, 一種是先辨識(shí)模糊函數(shù), 再采用常規(guī)的恢復(fù)算法進(jìn)行復(fù)原;另一種是直接對(duì)逆濾波器進(jìn)行估計(jì)。此類算法的優(yōu)點(diǎn)在于不需對(duì)初始圖像進(jìn)行估計(jì), 也不存在穩(wěn)定性和收斂性問題,對(duì)圖像以及模糊函數(shù)的約束是松弛的,算法具有一般性。但是第1種算法要求采用復(fù)原算法具有收斂性;第2種算法對(duì)噪聲敏感。

(三)空間改變的圖像盲復(fù)原方法

在許多實(shí)際的應(yīng)用中, 模糊往往是空間變化的,但由于處理工作的難度, 目前的研究較少,基本有相關(guān)轉(zhuǎn)換恢復(fù)和直接法兩類。

相關(guān)轉(zhuǎn)換恢復(fù)的基本思想是區(qū)域分割, 即將整幅圖像分為若干局部區(qū)域, 然后假設(shè)在各個(gè)局部區(qū)域模糊是空間不變的, 利用空間不變的圖像復(fù)原有關(guān)算法進(jìn)行復(fù)原。這類方法都是基于窗口的模糊辨識(shí)技術(shù), 圖像的估計(jì)取決于窗口的大小, 由于模糊參數(shù)是連續(xù)變化的, 在范圍較大時(shí)空間不變的假設(shè)是不成立的, 因而模糊的估計(jì)精度較差, 而且這種方法只能針對(duì)部分空間變化的模糊進(jìn)行處理, 缺乏通用性; 其次在區(qū)域的邊上存在振鈴現(xiàn)象。

直接法的基本思想是直接對(duì)圖像進(jìn)行處理。如采用簡化的二維遞推卡爾曼濾波器進(jìn)行圖像模型和模糊模型的直接轉(zhuǎn)換方法, 其缺點(diǎn)是只能針對(duì)有限的模型, 而且模型數(shù)增加, 計(jì)算量會(huì)顯著增大;采用共軛梯度迭代算法, 但只見到一個(gè)31×31 的文本圖像處理的結(jié)果報(bào)道,對(duì)于大圖像處理效果尚需進(jìn)一步的研究;將空間變化圖像系統(tǒng)建立成馬爾苛夫隨機(jī)模型,對(duì)復(fù)原過程,采用模擬退火算法進(jìn)行最大后驗(yàn)估計(jì)的方法,這種方法避免了圖像的窗口化, 并能克服模糊參數(shù)不連續(xù)性造成的影響,但這種方法只能局限于將模糊過程建立成單參數(shù)的馬爾苛夫隨機(jī)模型的情況,而且計(jì)算量也較大。

三、圖像盲恢復(fù)的應(yīng)用前景

(1)現(xiàn)有算法的改進(jìn)以及新的算法研究?,F(xiàn)有各種算法還存在許多不足,有必要對(duì)算法進(jìn)一步改進(jìn)。如IBD算法中, 如何選擇初始條件才能保證算法的收斂;如何選擇算法終止條件才能保證恢復(fù)的質(zhì)量; 如何選擇濾波器中的噪聲參數(shù)才能減少噪聲的影響。又如NAR2R IF算法中, 如何進(jìn)一步解決噪聲敏感問題,支持域的確定以及如何將算法擴(kuò)展到非均勻背景的情況等。提出新的算法更好地解決圖像盲復(fù)原問題, 也是今后研究的熱點(diǎn)。

(2)基于非線性退化模型的圖像盲復(fù)原算法。在實(shí)際應(yīng)用中,嚴(yán)格來講,所有的退化模型都是非線性的。對(duì)模型采用線性化的方法進(jìn)行近似處理,雖然算法簡單,但對(duì)非線性嚴(yán)重的情況處理效果并不理想。基于多項(xiàng)式以及神經(jīng)網(wǎng)絡(luò)兩種參數(shù)模型處理非線性信號(hào)盲分離算法,算法擴(kuò)展到二維圖像情況需要進(jìn)一步研究。研究基于非線性退化模型的圖像盲復(fù)原算法也是下一步研究方向之一。

(3)去噪處理算法研究。加性噪聲的存在,使圖像的復(fù)原問題變成了一個(gè)病態(tài)問題,而且由于一般假設(shè)只知道噪聲的統(tǒng)計(jì)特性,因此要從退化圖像中完全去除噪聲是不可能的。另外,由于噪聲的存在,恢復(fù)的效果并不理想,結(jié)合降噪的圖像盲恢復(fù)的算法研究有很現(xiàn)實(shí)的意義,這方面也進(jìn)行了部分工作。為克服噪聲的影響,一般采用先進(jìn)行降噪,后進(jìn)行復(fù)原;二是將降噪和復(fù)原同時(shí)進(jìn)行這兩類方法。目前,大多數(shù)算法中將噪聲描述成高斯噪聲進(jìn)行研究, 在實(shí)際應(yīng)用時(shí)有較大局限性。對(duì)于非高斯情況的研究采用基于噪聲的高階統(tǒng)計(jì)特性的去噪算法研究也是很重要的研究方向,也可采用其他類型的方法進(jìn)行降噪,利用自組織映射的非線性獨(dú)立組件分析方法進(jìn)行圖像降噪處理算法。

(4)實(shí)時(shí)處理算法。算法的的復(fù)雜性是制約算法應(yīng)用的一個(gè)重要方面??刹捎谜齽t化的離散周期Radon變換的方法將二維的卷積轉(zhuǎn)化為一維進(jìn)行處理,以提高算法的速度;也可采用神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)處理算法。算法的實(shí)時(shí)性是算法實(shí)際應(yīng)用的先決條件。

(5)應(yīng)用研究。算法的應(yīng)用是推動(dòng)算法研究的動(dòng)力。雖然圖像盲復(fù)原算法在天文學(xué)、醫(yī)學(xué)、遙感等方面獲得了較大的應(yīng)用, 但將算法應(yīng)用到一般的工業(yè)圖像實(shí)時(shí)檢測、機(jī)器視覺、網(wǎng)絡(luò)環(huán)境下的圖像傳輸恢復(fù)、刑事偵破等方面還有大量的工作要做。

參考文獻(xiàn):

[1] 薛梅,楊綠溪.用于含噪二值圖像的改進(jìn)NAS-RIF圖像盲復(fù)原算[J].數(shù)據(jù)處理.2006.17.(2).

第8篇:卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)范文

關(guān)鍵詞:紅棗(Ziziphus zizyphus);邊緣檢測;分級(jí)

中圖分類號(hào):S665.1;TP751.1文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):0439-8114(2014)10-2427-04

Grading Red Dates Based on the Size from Image Edge Detection

YAO Na,WU Gang,CHEN Jie

(College of Information Engineering,Tarim University,Alar843300,Xinjiang,China)

Abstract:Starting from the application area of research in computer vision, a method of using image edge detection to calculate the size of red dates and to classify red dates in the case of absenting decayed red dates was developed. Simulation of edge detection demonstrated the validity and superiority of the wavelet method and the simulation of grading detection proved that the new method was effective and rapid,providing the basis for the key design of red dates classifier.

Key words:red dates(Ziziphus zizyphus); edge detection; grading

基金項(xiàng)目:新疆生產(chǎn)建設(shè)兵團(tuán)青年科技創(chuàng)新資金專項(xiàng)(2013CB020)

新疆地區(qū)紅棗品種較多,有的品種含糖量高達(dá)34%,其營養(yǎng)豐富,受到人們的喜愛。目前,紅棗品種越來越多,其產(chǎn)量及銷售量也越來越高,紅棗采集后對(duì)其進(jìn)行分類是加工過程中很重要的工作環(huán)節(jié),最初的分揀都是由人工完成,一方面需要大量的人力資源;另一方面不能保證產(chǎn)品的安全。隨著科學(xué)技術(shù)的發(fā)展,農(nóng)業(yè)機(jī)械化的應(yīng)用越來越廣泛,研究者將重點(diǎn)關(guān)注紅棗自動(dòng)分級(jí),可以節(jié)省人力而實(shí)現(xiàn)農(nóng)業(yè)自動(dòng)化。李湘萍[1]介紹了紅棗分級(jí)機(jī)的工作原理;張保生等[2]將紅棗的形狀特征、顏色特征和紋理特征通過BP網(wǎng)絡(luò)算法進(jìn)行自動(dòng)分級(jí);趙文杰等[3]提出了以顏色作為特征利用支持向量機(jī)的方法進(jìn)行紅棗的缺陷識(shí)別,識(shí)別率可達(dá)96.2%;肖愛玲[4]對(duì)幾種典型的紅棗分級(jí)機(jī)的結(jié)構(gòu)進(jìn)行了介紹;肖愛玲等[5]對(duì)2011年前紅棗的分級(jí)技術(shù)及研究現(xiàn)狀進(jìn)行了總結(jié);沈從舉等[6]對(duì)紅棗分級(jí)機(jī)的研究狀態(tài)和應(yīng)用方法進(jìn)行了歸納。

目前,基于計(jì)算機(jī)視覺的方法具有智能化、精度高、損傷小等優(yōu)點(diǎn),該方法的核心部分在于選取什么特征以及利用何種算法對(duì)紅棗進(jìn)行判斷。研究者提出的方法具有一個(gè)共同特點(diǎn)是特征選取較多,比如同時(shí)提取顏色特征、形狀特征和紋理特征,因此計(jì)算量較大,分級(jí)機(jī)的設(shè)計(jì)組成對(duì)信息處理的硬件部分有較高的要求,在紅棗分級(jí)機(jī)的設(shè)計(jì)中存在兩方面的問題:一方面成本較高;另一方面硬件達(dá)不到設(shè)計(jì)的要求。小波變換對(duì)噪聲不敏感,邊緣檢測清晰,所以有不少研究者將不同的小波變換方法[7-10]應(yīng)用在圖像邊緣檢測中,經(jīng)仿真試驗(yàn)證明也適合應(yīng)用在紅棗的邊緣檢測中。因此,本研究提出一種簡單的分級(jí)方法來對(duì)紅棗進(jìn)行分級(jí),即以提取紅棗的邊緣特征,只有形狀特征,應(yīng)用小波變換的算法,減少了計(jì)算量。

1材料與方法

1.1材料

紅棗品種為新疆阿拉爾地區(qū)種植的駿棗,已經(jīng)過人為的挑揀,測試結(jié)果得分為優(yōu)等級(jí)的個(gè)數(shù)較多。

1.2檢測方法

在無腐爛的情況下,個(gè)體較大、飽滿的紅棗可分到較高的級(jí)別中,可用邊緣檢測方法對(duì)紅棗的邊緣進(jìn)行檢測,然后根據(jù)檢測出的邊緣再計(jì)算紅棗的面積,面積大于某一設(shè)定閾值的紅棗為優(yōu)等級(jí),其余為低級(jí)。

1.3小波邊緣檢測

小波變換可以解決時(shí)域和頻域的矛盾,可以將信號(hào)進(jìn)行更精確地分析。圖像中的邊緣點(diǎn)為灰度變化較大的像素點(diǎn),即一階微分極大值點(diǎn)或者二階微分過零點(diǎn)。圖像邊緣檢測可以通過小波的奇異性來檢測。設(shè)θ(x,y)為一個(gè)平滑的二維函數(shù),在考慮尺度參數(shù)的情況下,θa(x,y)=■■,■,那么二維小波的定義[11]為:

ψx(x,y)=■

ψy(x,y)=■

用矢量形式表示二維小波變換:

a■+■

=af■(x,y)■+f■(x,y)■

=af(x,y)[ψx(x,y)■+ψy(x,y)■]

=a[(fψx)(x,y)■+(fψy)(x,y)■]

=Wxa f(x,y)■+Wya f(x,y)■

=aΔ(fθa)(x,y)

fθa(x,y)表示圖像f(x,y)與平滑函數(shù)θa(x,y)卷積后的平滑圖像。梯度矢量的模值為:

■ (3)

梯度矢量與水平方向的夾角為:

α=Arg[Wa(x,y)]

=arctan■(4)

確定梯度矢量的模值極值后,再經(jīng)過閾值的處理,可以得到圖像的邊緣,不同的a可以實(shí)現(xiàn)多個(gè)不同尺度的檢測。圖像中目標(biāo)的方向性是重要的特征之一,作為小波的改進(jìn)方向,小波的應(yīng)用成為了一個(gè)研究熱點(diǎn),它能有較好的方向性分析,體現(xiàn)了圖像的方向性。任意方向小波變換[12]的定義為:(假設(shè)γ=0,θ∈[0,π)]

Wθa f(x,y)=f(x,y)*g(x,y,θ,γ)

=Wθa f(x,y)cosθ+Wθa f(x,y)sinθ

=||Wa f(x,y)||■?

cosθ+■sinθ (5)

=||Wa f(x,y)||(cos(Arg[Wa f(x,y)]))?

cosθ+sin(Arg[Wa f(x,y)])sinθ

=||Wa f(x,y)||(cosαcosθ+sinαsinθ)

=||Wa f(x,y)||cos(α-θ)

運(yùn)用小波方法對(duì)紅棗進(jìn)行邊緣檢測,為紅棗分級(jí)檢測解決基礎(chǔ)性的第一步難題,同時(shí)也用經(jīng)典的Prewitt算子、Roberts算子、Sobel算子、Log算子、Canny算子對(duì)紅棗進(jìn)行邊緣檢測以便比較分析各自的特點(diǎn)。

1.4分級(jí)檢測的過程

檢測紅棗邊緣后需要對(duì)紅棗的面積進(jìn)行計(jì)算,通過對(duì)邊緣點(diǎn)的長度進(jìn)行計(jì)算可以得出邊緣的長度,將紅棗的形狀假設(shè)為圓形,可以用圓周長將圓面積求出,即可以求出紅棗的面積。假設(shè)計(jì)算檢測出邊緣點(diǎn)的長度,紅棗的面積近似為:

s=■ (6)

因?yàn)檎麄€(gè)過程屬于比較過程,所以進(jìn)行近似計(jì)算不影響相對(duì)的比較。

整個(gè)分級(jí)檢測的仿真試驗(yàn)步驟為:

1)讀入紅棗圖像,將彩色RGB圖像轉(zhuǎn)為灰度圖像;

2)對(duì)紅棗灰度圖像求出小波變換的模值和梯度矢量與水平方向的夾角;

3)在水平方向、垂直方向、-45°方向和+45°方向4個(gè)方向上進(jìn)行搜索判斷模值和梯度方向的條件得到邊緣值,將得到的邊緣值進(jìn)行歸一化,設(shè)定閾值為0.18來判斷紅棗圖像的邊緣;

4)計(jì)算紅棗的邊緣長度,確定紅棗邊緣長度的閾值;

5)根據(jù)公式(6)計(jì)算紅棗的面積;大于邊緣長度閾值的對(duì)應(yīng)面積閾值的紅棗判定為優(yōu)良等級(jí)的紅棗,否則為較差等級(jí)的紅棗。

針對(duì)不同的分級(jí)機(jī)的機(jī)械設(shè)計(jì),紅棗面積的閾值的確定可以根據(jù)兩種方式:一種方式是針對(duì)分級(jí)機(jī)單個(gè)讀取紅棗圖像并直接進(jìn)行分級(jí)挑揀的情況,閾值根據(jù)經(jīng)驗(yàn)值來確定,比如某種品種的紅棗大小是在固定范圍內(nèi)波動(dòng),預(yù)先設(shè)定固定的閾值來進(jìn)行分級(jí)挑揀;另一種方式是針對(duì)分級(jí)機(jī)進(jìn)行大量紅棗圖像同時(shí)進(jìn)行讀取時(shí),遍歷全部紅棗圖像,找到最大面積的紅棗,然后閾值設(shè)定為最大值的80%,大于該閾值的紅棗判定為優(yōu)等級(jí),否則判定為較差等級(jí)。

2結(jié)果與分析

仿真試驗(yàn)中分別對(duì)單個(gè)紅棗和兩個(gè)紅棗為例進(jìn)行小波的邊緣檢測,并且將小波檢測結(jié)果與Prewitt算子、Roberts算子、Sobel算子、Log算子、Canny算子檢測結(jié)果進(jìn)行分析對(duì)比。

2.1 單個(gè)紅棗檢測結(jié)果

圖1為理想的情況,即一個(gè)紅棗全部被讀入沒有遮蓋的情況,也是正常情況下的邊緣檢測。由圖1可以看出,小波方法檢測出的曲線較少,輪廓清晰,輪廓線的連續(xù)性好,一方面有利于邊緣長度的計(jì)算;另一方面減少了曲線個(gè)數(shù)的計(jì)算,減少了整個(gè)方法的計(jì)算量。Sobel算子檢測出的紅棗圖像與小波的方法相比較,噪點(diǎn)較多,定位精度不夠高,邊緣比較模糊;Canny算子檢測到的邊緣雖然比較連續(xù),但是出現(xiàn)了由噪聲產(chǎn)生的偽邊緣,這樣在計(jì)算紅棗大小時(shí)會(huì)增加計(jì)算量,并且容易出錯(cuò);Prewitt算子和Roberts算子的檢測結(jié)果類似于Sobel算子的檢測結(jié)果,并且Roberts算子的檢測結(jié)果中邊緣斷點(diǎn)較多,給計(jì)算紅棗的長度帶來困難;Log算子的檢測結(jié)果邊緣較為連續(xù),有少量斷點(diǎn),與小波方法相比較紅棗內(nèi)部的噪點(diǎn)較多,復(fù)雜度僅次于Canny算子的方法檢測出的結(jié)果。根據(jù)邊緣檢測的效果和計(jì)算復(fù)雜度以及后期需要的算法的復(fù)雜度來比較這幾種方法的優(yōu)劣順序?yàn)樾〔?、Prewitt算子、Roberts算子、Sobel算子、Log算子、Canny算子。

2.2兩個(gè)有遮蓋的紅棗檢測結(jié)果

圖2為遮蓋的情況,因此單個(gè)紅棗的邊緣不能完全檢測出,但是根據(jù)周長閾值的比較結(jié)果,同樣可以算出單個(gè)紅棗的面積。由圖2可以看出,小波方法對(duì)于有遮蓋的紅棗檢測仍是輪廓清晰且連續(xù)性好,內(nèi)部曲線較少。Sobel算子檢測出的紅棗圖像與小波的方法相比較,噪點(diǎn)較多,邊緣斷點(diǎn)較多,邊緣比較模糊;Canny算子檢測到的邊緣過于模糊且斷點(diǎn)較多,還出現(xiàn)了由噪聲產(chǎn)生的偽邊緣,這樣在計(jì)算紅棗大小時(shí)對(duì)后期的算法要求較高,且容易出現(xiàn)錯(cuò)誤結(jié)果;Prewitt算子和Roberts算子的檢測結(jié)果類似于Sobel算子的檢測結(jié)果,Roberts算子的檢測結(jié)果中邊緣較為清楚;Log算子的檢測結(jié)果邊緣斷點(diǎn)較多,與小波方法相比較紅棗內(nèi)部的噪點(diǎn)較多,復(fù)雜度僅次于Canny算子的方法檢測出的結(jié)果。根據(jù)邊緣檢測的結(jié)果和計(jì)算復(fù)雜度以及后期算法的復(fù)雜度來比較這幾種方法的優(yōu)劣順序?yàn)樾〔āoberts算子、Prewitt算子、Sobel算子、Log算子、Canny算子。對(duì)于單個(gè)和兩個(gè)紅棗進(jìn)行檢測的仿真結(jié)果都說明:較于其他5種算子,小波方法均是最優(yōu)的。

研究中采集的紅棗圖像大小為442×398像素,閾值采用經(jīng)驗(yàn)值,實(shí)際的周長閾值映射到圖像中的周長為1 084像素,仿真試驗(yàn)結(jié)果判定為準(zhǔn)確可行,試驗(yàn)結(jié)果見表1。

3小結(jié)與討論

隨著自動(dòng)化技術(shù)在農(nóng)業(yè)產(chǎn)品中應(yīng)用越來越廣泛,其理論研究的方法也越來越多,從計(jì)算機(jī)視覺領(lǐng)域結(jié)合農(nóng)業(yè)自動(dòng)化技術(shù)提出了對(duì)紅棗加工有促進(jìn)作用的紅棗自動(dòng)分級(jí)的核心方法,對(duì)于紅棗生產(chǎn)的地區(qū)有重要意義。研究提出了利用方向小波方法對(duì)紅棗圖像進(jìn)行邊緣檢測進(jìn)而計(jì)算紅棗大小來對(duì)紅棗分級(jí)的方法,經(jīng)仿真試驗(yàn)證明小波變換方法的優(yōu)越性及整個(gè)方法的有效性和快速性。此研究是在假設(shè)紅棗無腐爛的情況下進(jìn)行分級(jí)的,所以有一定的局限性,但在下一步研究中可以彌補(bǔ)此點(diǎn)的不足,設(shè)置多個(gè)閾值可以將紅棗進(jìn)行多個(gè)等級(jí)的分揀。

參考文獻(xiàn):

[1] 李湘萍.6ZF-0.5型紅棗分級(jí)機(jī)的試驗(yàn)研究[J].山西農(nóng)機(jī),2000(14):3-5.

[2] 張保生,姚瑞央.基于BP神經(jīng)網(wǎng)絡(luò)算法的紅棗分級(jí)技術(shù)應(yīng)用[J].廣東農(nóng)業(yè)科學(xué),2010(11):282-283.

[3] 趙杰文,劉少鵬,鄒小波.基于機(jī)器視覺和支持向量機(jī)的缺陷棗的識(shí)別研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2008,39(3):113-115.

[4] 肖愛玲.幾種典型的紅棗分級(jí)機(jī)[J].新疆農(nóng)機(jī)化,2010(4):10-11.

[5] 肖愛玲,李偉.我國紅棗分級(jí)技術(shù)及紅棗分級(jí)機(jī)研究現(xiàn)狀[J].農(nóng)機(jī)化研究,2011(11):241-244.

[6] 沈從舉,賈首星,鄭炫,等.紅棗分級(jí)機(jī)械的現(xiàn)狀與發(fā)展[J].中國農(nóng)機(jī)化學(xué)報(bào),2013,34(1):26-30.

[7] 宋文龍,閔昆龍,邢奕,等.基于小波變換的自適應(yīng)閾值植物根系圖像邊緣檢測[J].北京科技大學(xué)學(xué)報(bào),2012,34(8):966-970.

[8] 王敬東,徐亦斌,.圖像小波邊緣檢測中邊界處理的研究[J].計(jì)算機(jī)工程,2007,33(5):161-163.

[9] 鮑雄偉.小波變換在圖像邊緣檢測中的應(yīng)用[J].電子設(shè)計(jì)工程,2012,20(14):160-162.

[10] 薄勝坤,張麗英.一種基于小波變換和Canny算子相結(jié)合的邊緣檢測方法[J].長春大學(xué)學(xué)報(bào),2012,22(10):1177-1180.