前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺研究領(lǐng)域主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:計算機視覺;定標(biāo)方法;應(yīng)用特點
中圖分類號:TP319文獻(xiàn)標(biāo)識碼:A文章編號:16727800(2012)007014902
作者簡介:許志雄(1968-),男,浙江紹興人,江漢石油鉆頭股份有限公司工程師,研究方向為計算機多媒體。
0引言
計算機技術(shù)的應(yīng)用在諸多領(lǐng)域占據(jù)了主要位置,并得到了人們的極大重視。在此形勢下,攝像機的高清晰度亦成為了人們追逐的目標(biāo),而在計算機視覺中的定標(biāo)方法有各種不同的處理方式,從而為攝像機的發(fā)展提供了一個絕好的機會。由此,計算機視覺中的攝像機定標(biāo)方法成為當(dāng)今世界攝像機研究領(lǐng)域里至關(guān)重要的一個方面,以攝像機得到的圖像信息作為出發(fā)點來計算三維空間中自然場景的幾何信息成為計算機視覺的基本任務(wù)之一,并且它的應(yīng)用特點也得到了人們的密切關(guān)注。
1攝像機視覺投影原理
透鏡成像的原理利用了光的折射現(xiàn)象,而攝像機的視覺投影原理和透鏡的成像原理相差無幾,只不過在一些細(xì)節(jié)上進(jìn)行了相應(yīng)的改變,使成像更加清晰,以更好地滿足人們的需求。攝像機視覺投影原理就是利用鏡頭的光學(xué)原理進(jìn)行視覺成像,而其中又有許多理論支持,包含鏡頭與焦距和視角。焦距是指鏡頭的焦點之間的距離,對于攝像機而言,就是指從鏡頭的中心位置到攝像管,也可以說是成像的位置之間的距離就是攝像機鏡頭的焦距,只有調(diào)整好了這兩者之間的距離,才能保證攝像機的攝像效果,這也是保證攝像機正常工作的首要任務(wù)。視角要受到鏡頭焦距的限制,由鏡頭焦距對攝像的大小情況而決定,攝影師們就是通過對焦距的不斷變換來改變對任務(wù)的造型,從而改變?nèi)藗兊囊曈X效果。對于拍攝相同距離的目標(biāo)而言,鏡頭焦距越大,攝像的水平視角就會變得越窄,這樣帶來的后果就是拍攝到的目標(biāo)的范圍就越小,使得拍攝效果大打折扣,從而給攝像機帶來不利的使用效益。因此,必須在兩者達(dá)到一個較好的組合效果之時,才能夠充分發(fā)揮攝像機的作用,并將攝像藝術(shù)發(fā)揮到極致。由此可見,計算機視覺中的攝像機定標(biāo)方法將會給攝像機的拍攝效果帶來巨大的轉(zhuǎn)變。
2計算機視覺中的攝像機定標(biāo)方法
2.1三維定標(biāo)法
在人們的平常思維中,凡是物體的影像必定是三維的,本文的理論研究也同樣基于這樣的想法。在討論單幅圖像的設(shè)計標(biāo)定之時,我們所追求的理論基礎(chǔ)就是需要攝像機的定標(biāo)物是人們所追求的那種三維的效果,在此基礎(chǔ)上再進(jìn)行相關(guān)的理論研究,以達(dá)到相得益彰的效果。在此過程中,首先要準(zhǔn)確定位定標(biāo)物上一些比較重要的點的三維坐標(biāo),這樣才能夠為后來的工作提供方便;然后在與定標(biāo)物相對應(yīng)的成像上找到相應(yīng)的點的位置,這是至關(guān)重要的一步,這也決定了后面成像的具體設(shè)計方法;最后在那些比較重要的點的圖像上標(biāo)出其具體的三維坐標(biāo),達(dá)到定標(biāo)物的實際成像效果圖,這樣就可以完全解決攝像機的成像問題了。這種定標(biāo)方法的基本原理就是充分分析定標(biāo)物的三維信息,同時與它的具體成像位置相關(guān)聯(lián),在這兩者之間形成一種具體的相對應(yīng)關(guān)系。由此我們可以充分利用計算機的快速運算,實現(xiàn)攝像的功能,并適時進(jìn)行程序功能改進(jìn),優(yōu)化定標(biāo)物參數(shù)的獲取方法,從而達(dá)到增加攝像機清晰度的目標(biāo)。
2.2平面定標(biāo)法
與上面的定標(biāo)方法相對立的一種方法就是多幅圖像的設(shè)計標(biāo)定。在這樣的時代背景下,人們的要求應(yīng)盡可能得到滿足,因而理論研究者會在這個方面下足功夫,弄懂這里面的個中玄機,利用多幅圖像對平面的定標(biāo)物來進(jìn)行物體的標(biāo)定工作,以達(dá)到攝像機定標(biāo)的目的。這樣的平面定標(biāo)方法就是充分利用平面物體的運動特性,在它和攝像機之間找到一個平衡點,觀察兩者的相對運動,這樣的定標(biāo)方法也給拍攝運動中的物體帶來了生機。此方法在實施之余也會帶給人們不一樣的感受,讓人們充分體會到攝像的魅力。當(dāng)然這種考慮運動的平面定標(biāo)法會受到特征點的增多的影響,隨著點的不斷增加,定標(biāo)情況就會越來越好,定標(biāo)物的精度也會不斷提高,于是在定標(biāo)物相同的前提下,平面定標(biāo)法自然就可以從定標(biāo)物上獲得更多的數(shù)據(jù)信息,為準(zhǔn)確對定標(biāo)物進(jìn)行定位測量提供了更多的依據(jù)。因此,這種方法的效果要比前面的方法好很多,得到推廣的力度也會大大增加,所得到的經(jīng)濟效益也會增加,設(shè)備的成本在原來的基礎(chǔ)上還有降低的趨勢。所以,理論研究者的研究領(lǐng)域就會逐漸向這一方面進(jìn)行轉(zhuǎn)變。
2.3兩步定標(biāo)法
有了前面的研究成果作支撐,攝像機定標(biāo)方法的進(jìn)一步研究就會顯得異常容易,人們的進(jìn)一步要求也會得到滿足,可謂一舉兩得。理論研究者們在有了豐富的理論和實踐基礎(chǔ)之后,利用直接線性的定標(biāo)方法進(jìn)行攝像機參數(shù)的進(jìn)一步優(yōu)化提高,通過透視原理來修改以前的參數(shù),然后將修正的參數(shù)進(jìn)行初始值的確認(rèn),把它們作為現(xiàn)在研究階段的起點,在這樣的起點之上綜合考慮各種外界因素,利用最優(yōu)化的計算機算法進(jìn)行攝像機成像程序的改進(jìn),把原來的程序進(jìn)行升級處理,使得定標(biāo)物的精確度得到進(jìn)一步的提高,這就是我們所提到的兩步定標(biāo)法。它的基本原理其實很簡單,只不過是充分利用了原有的理論,并進(jìn)行了一定的創(chuàng)新而已。但就是這樣的創(chuàng)新步伐的邁出,給計算機視覺中的攝像機定標(biāo)方法帶來了新的生機,也給攝像機鏡頭的優(yōu)化帶來了很多指導(dǎo)方法。在圖像中心到圖像點的距離保持不變的前提下,參數(shù)的數(shù)量會顯著減少,這樣不僅節(jié)省了材料的用量,而且還進(jìn)一步提高了攝像機的攝像清晰度,有效彌補了以前清晰度不高的缺點。這樣一來,攝像機的成像效果大大改進(jìn),于是才有了現(xiàn)代攝像機的高清效果,確實讓人們享受到了科技帶來的福音。
3計算機視覺中的攝像機定標(biāo)方法的應(yīng)用特點
3.1建立于主動視覺上的自我標(biāo)定
由于計算機視覺中攝像機定標(biāo)方法的不斷推廣,一些計算機技術(shù)在攝像機的制作過程中得到了較好的應(yīng)用。但是在這之中必不可少地存在一些制作人員或設(shè)計人員的主觀因素,這樣攝像機的標(biāo)定方法中就會形成形色各異的特點,而且彼此之間可能會出現(xiàn)較大的不同,特別是在主動視覺上的自我標(biāo)定。在主動視覺中,我們所用到的攝像機可以在一個被控制的平臺上被人們固定,利用計算機的高運算能力,計算機可以把平臺上所出現(xiàn)的參數(shù)精確地讀出來,我們只需要利用控制攝像機的運轉(zhuǎn)順序,讓攝像機作一定的周期運動,就可以在這個過程中得到更多的圖像,然后再利用所成的圖像和固定的攝像機的運動參數(shù)來確定攝像機的運動情況。這種自我標(biāo)定方法比較簡單,但是必須為人們提供精確控制攝像機運動的平臺,這種以主觀意識為主的標(biāo)定特點強化了個人的主觀能動性,讓人們更加易于接受。
3.2進(jìn)行有層次劃分的逐步標(biāo)定
近年來,人們對攝像技術(shù)的理論研究已經(jīng)日趨成熟,并根據(jù)自己的意愿進(jìn)行相關(guān)的研究工作,把自己的想法融入到攝像機的設(shè)計中,真正做到有層次的逐步標(biāo)定,把所要的標(biāo)定物以逐個擊破的方式實現(xiàn)有層次的程序算法,從而讓人們在邏輯上能夠有所認(rèn)識,并且易于接受,從而達(dá)到有層次劃分的逐步標(biāo)定的目的。分層逐步標(biāo)定法已為標(biāo)定研究領(lǐng)域中普遍認(rèn)同的方法之一,在實際的應(yīng)用中逐漸取代了直接標(biāo)定的方法。因為進(jìn)行有層次劃分的逐步標(biāo)定是符合人們的想法的,而且這種方法的特點是以射影標(biāo)定作為基礎(chǔ),以某一幅圖像作為基準(zhǔn)圖像,進(jìn)行其它圖像的射影對齊工作,從而將攝相機中成像未知參數(shù)的數(shù)量減少,更易于為人們所接受。可以說,進(jìn)行有層次劃分的逐步標(biāo)定是人們在實踐中得出的一套符合大勢所趨的標(biāo)定方法,為世人所推崇。
4結(jié)語
綜上所述,計算機視覺中攝像機定標(biāo)方法在人們的不斷認(rèn)識中得以應(yīng)用和推廣,在時代的不斷進(jìn)步中逐漸向前發(fā)展。同時,攝像機標(biāo)定方法的應(yīng)用特點也大相徑庭,各有千秋,從而實現(xiàn)百家爭鳴的態(tài)勢,進(jìn)一步推動計算機視覺中的攝像機研究工作的向前發(fā)展。
參考文獻(xiàn):
【關(guān)鍵字】非線性濾波 概率密度 重采樣 粒子退化
一、引言
粒子濾波(PF)是一種在處理非線性非高斯系統(tǒng)狀態(tài)估計問題時具有較好估計效果的方法,其原理是通過非參數(shù)蒙特卡洛方法實現(xiàn)貝葉斯濾波。其最早起源于Hammersley等人在20實際50年代末提出的順序重要性采樣(SIS)濾波思想。
但由于上述方法存在嚴(yán)重的樣本權(quán)值退化從而導(dǎo)致的粒子數(shù)匱乏現(xiàn)象,直到1993年Gordon等人將重采樣技術(shù)引入蒙特卡洛重要性采樣過程,提出一種Bootstrap濾波方法,從而奠定了粒子濾波算法的基礎(chǔ)。
二、基本粒子濾波算法
三、粒子濾波算法存在的主要問題及改進(jìn)
對于SIS算法來說,容易出現(xiàn)粒子的退化問題,目前存在的諸多對SIS算法的改進(jìn)中,能夠降低該現(xiàn)象影響的有效方法是選擇合適的重要性函數(shù)和采用重采樣方法。
針對狀態(tài)空間模型的改進(jìn)算法,如輔助變量粒子濾波算法(APF),局部線性化方法,代表的算法主要有EKF,UKF等。針對重采樣改進(jìn)方法,文獻(xiàn)通過將遺傳算法和進(jìn)化算法引入粒子濾波算法中,增加重采樣過程中粒子的多樣性。
然APF算法在過程噪聲較小時,可獲得比標(biāo)準(zhǔn)粒子濾波更高的濾波精度,在過程噪聲較大時,其效果則大大降低。采用局部線性化的方法EKF,UKF都是針對非線性系統(tǒng)的線性卡爾曼濾波方法的變形和改進(jìn),因此受到線性卡爾曼濾波算法的條件制約,而對于非高斯分布的狀態(tài)模型,其濾波性能變差。
將遺傳算法和進(jìn)化算法與粒子濾波結(jié)合的改進(jìn)粒子濾波算法,雖取得了較好的濾波效果,然而是以消耗過多計算資源為代價的。
四、粒子濾波的應(yīng)用
4.1 目標(biāo)跟蹤
對目標(biāo)進(jìn)行定位和跟蹤是典型的動態(tài)系統(tǒng)狀態(tài)估計問題,在諸如純角度跟蹤的運動模型中,采用粒子濾波方法進(jìn)行實現(xiàn)目標(biāo)跟蹤已獲得了較好的跟蹤精度,文獻(xiàn)研究了多目標(biāo)跟蹤與數(shù)據(jù)融合問題,文獻(xiàn)給出了基于粒子濾波的群目標(biāo)跟蹤算法。
4.2 計算機視覺
近年來,通過序列圖像對感興趣的區(qū)域進(jìn)行持續(xù)跟蹤問題引起人們廣泛關(guān)注,Isard M率先將粒子濾波算法引用了計算機視覺領(lǐng)域,Maccormick J較系統(tǒng)的總結(jié)了粒子濾波方法在計算機視覺中的應(yīng)用,從中可了解粒子濾波算法在該領(lǐng)域中的應(yīng)用成果和發(fā)展趨勢。
【關(guān)鍵詞】自動控制技術(shù);農(nóng)業(yè)自動化
由于歷史、觀念和技術(shù)等方面的原因, 我國傳統(tǒng)農(nóng)業(yè)機械與發(fā)達(dá)國家相比有很大差距,已遠(yuǎn)遠(yuǎn)不能適應(yīng)農(nóng)業(yè)的科技進(jìn)步。近些年來, 自動化的研究逐漸被人們所認(rèn)識, 自動控制在農(nóng)業(yè)上的應(yīng)用越來越受到重視。例如,把計算機技術(shù)、微處理技術(shù)、傳感與檢測技術(shù)、信息處理技術(shù)結(jié)合起來, 應(yīng)用于傳統(tǒng)農(nóng)業(yè)機械, 極大地促進(jìn)了產(chǎn)品性能的提高。我國農(nóng)業(yè)部門總結(jié)了一些地區(qū)的農(nóng)業(yè)自動化先進(jìn)經(jīng)驗(如臺灣地區(qū)的農(nóng)業(yè)生產(chǎn)自動化、漁業(yè)生產(chǎn)自動化、畜牧業(yè)生產(chǎn)自動化及農(nóng)產(chǎn)品貿(mào)易自動化)的開發(fā)與應(yīng)用情況, 同時也汲取了國外一些國家的先進(jìn)經(jīng)驗、技術(shù),如日本的四行半喂人聯(lián)合收割機是計算機控制的自動化裝置在半喂人聯(lián)合收割機中的應(yīng)用,英國通過對施肥機散播肥料的動力測量來控制肥料的精確使用量。這些技術(shù)和方法是我國農(nóng)業(yè)機械的自動化裝置得到了補充和新的發(fā)展,從而形成了一系列適合我國農(nóng)業(yè)特點的自動化控制技術(shù)。
1.已有的農(nóng)業(yè)機械及裝置的部分自動化控制
自動化技術(shù)提高了已有農(nóng)業(yè)機械及裝置的作業(yè)性能和操作性能。浙江省把自動化技術(shù)應(yīng)用于茶葉機械上,成功研制出6CRK-55型可編程控制加壓茶葉揉捻機,它利用計算機控制電功加壓機構(gòu),能根據(jù)茶葉的具體情況編制最佳揉捻程序?qū)崿F(xiàn)揉捻過程的自動控制,是機電一體化技術(shù)在茶葉機械上的首次成功應(yīng)用。
1.1應(yīng)用于拖拉機
在農(nóng)用拖拉機上已廣泛使用了機械油壓式三點聯(lián)結(jié)的位調(diào)節(jié)和力調(diào)節(jié)系統(tǒng)裝置, 現(xiàn)又在開發(fā)和采用性能更完善的電子油壓式三點聯(lián)結(jié)裝置。
1.2應(yīng)用于施肥播種機
根據(jù)行駛速度和檢測種子粒數(shù)來確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。
1.3應(yīng)用于谷物干燥機
不受外界條件干擾, 能自動維持熱風(fēng)溫度的裝置停電或干燥機過熱引起火災(zāi)時,自動掐斷燃料供給的裝置。
2.微灌自動控制技術(shù)
我國從20世紀(jì)年50代就開始進(jìn)行節(jié)水灌溉的研究與推廣據(jù)統(tǒng)計。到1992年,全國共有節(jié)水灌溉工程面積0.133億m2,其中噴灌面積80萬m2, 農(nóng)業(yè)節(jié)水工程取得了巨大的進(jìn)展。灌溉管理自動化是發(fā)展高效農(nóng)業(yè)的重要手段,高效農(nóng)業(yè)和精細(xì)農(nóng)業(yè)要求必須實現(xiàn)水資源的高效利用。采用遙感遙測等新技術(shù)監(jiān)測土壤墑性和作物生長情況,對灌溉用水進(jìn)行動態(tài)監(jiān)測預(yù)報,實現(xiàn)灌溉用水管理的自動化和動態(tài)管理。在微灌技術(shù)領(lǐng)域,我國先后研制和改進(jìn)了等流量滴灌設(shè)備、微噴灌設(shè)備、微灌帶、孔口滴頭、壓力補償式滴頭、折射式和旋轉(zhuǎn)式微噴頭、過濾器和進(jìn)排氣閥等設(shè)備,總結(jié)出了一套基本適合我國國情的微灌設(shè)計參數(shù)和計算方法,建立了一批新的試驗示范基地。在一些地區(qū)實現(xiàn)了自動化灌溉系統(tǒng),可以長時間地自動啟閉水泵和自動按一定的輪灌順序進(jìn)行灌溉。這種系統(tǒng)中應(yīng)用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。
3.自動控制技術(shù)在精準(zhǔn)農(nóng)業(yè)中的應(yīng)用
提起數(shù)字媒體,人們通常會想到傳媒行業(yè),其實數(shù)字媒體的應(yīng)用絕不局限于傳媒。隨著寬帶網(wǎng)絡(luò)的普及,人們在日常業(yè)務(wù)處理過程中,正面對越來越豐富的網(wǎng)上媒體和內(nèi)容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數(shù)字媒體方面的專家一起來分享這個繽紛的世界。
三維幾何建模與形狀表示
北京大學(xué)視覺與聽覺信息處理國家重點實驗室主任教育部長江學(xué)者獎勵計劃特聘教授 查紅彬
精彩問答
在背景比較復(fù)雜、有干擾的情況下模型檢索的效果怎么樣?
在模型檢索的時候并沒有考慮背景,因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的,但也可以做,但是要推廣到背景比較復(fù)雜的物體上識別可能有很大的問題,因為這時候匹配不僅僅是局部匹配,而是兩個子集和子集的匹配問題,到目前為止,我們只是做沒有背景的模型檢索。
為什么要重新談?wù)撊S形狀表示問題?在多媒體信息處理領(lǐng)域里面,有兩個比較重要的方向,這也是計算機科學(xué)技術(shù)領(lǐng)域里兩個重要的方向,一個是計算機視覺,一個是計算機圖形學(xué)。計算機視覺是從圖像中通過識別或重建處理,得到一個對對象物的描述。反過來說圖形學(xué),是對一個對象和場景的描述,通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程,這兩個領(lǐng)域之間有密切的關(guān)聯(lián)。
我們現(xiàn)在考慮計算機三維建?;蚰P偷拿枋觯紤]的不僅僅是計算機視覺或計算機圖形學(xué)所包含的內(nèi)容。這里面簡單列舉一下,比如基于模型的三維物體識別和場景識別,這兩個應(yīng)該是典型的計算機視覺里面考慮的應(yīng)用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設(shè)計、變形、動畫等等。除了兩個單獨研究的應(yīng)用之外,還要想怎么把兩者結(jié)合起來,把虛擬和真實的東西無縫連接到一起,這些都牽涉到三維模型。
我們考慮的三維模型跟以前相比,應(yīng)用領(lǐng)域大了很多,要達(dá)到這個要求,對模型的表達(dá)、形狀的表達(dá)也都有了更高的要求。
怎樣找到一些更新更有效地表達(dá)形式來符合這些要求呢?這里有四個方面,現(xiàn)在能不能建立一個形狀空間,把考慮的對象完整地在形狀空間里面表達(dá)出來。第二點就是針對形狀的特性,表達(dá)要具有柔性,對象物的表面不都是連續(xù)的,也有一些非連續(xù)性和不規(guī)律性,這些特性怎樣能夠進(jìn)行柔性處理。第三個是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個很好的結(jié)合方法。第四是在大量的計算當(dāng)中,包括變形和動畫中有很多編輯的工具,所以我們要求對現(xiàn)在的形狀表達(dá)有一些比較高的要求。
在計算機視覺里面有一個老大難就是識別,已有模型,但是眼前看到的是一部分三維數(shù)據(jù),怎么用這部分?jǐn)?shù)據(jù)和模型數(shù)據(jù)匹配來識別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個模型,從大量的數(shù)據(jù)中建立一個模型庫,并從中抽取很多特征,把這些特征進(jìn)行組織。這里面牽涉三個比較大的問題,第一個是形狀空間怎么構(gòu)造,沒有很好的特征表達(dá)或整理的形式,后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當(dāng)中搜索到最優(yōu)的匹配。
針對這些問題我們最近一兩年做了一些工作,最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點,能不能在三維形狀表示過程當(dāng)中,找到一些最關(guān)鍵的描述指令,并從中找到相互關(guān)系,把整體和局部結(jié)合起來。如果把之間的關(guān)系描述出來,就能把局部結(jié)構(gòu)性的信息用整體觀點加進(jìn)去,這兩件工作就是我們做這件事情的主要目的。
在形狀描述問題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結(jié)合到一起。今后幾年要用更多的模式識別的辦法,來解決面臨的圖形學(xué)或虛擬現(xiàn)實和計算機視覺當(dāng)中的很多問題。
生活中的計算機視覺
香港中文大學(xué)信息工程系終身教授
微軟亞洲研究院視覺計算組負(fù)責(zé)人 湯曉歐
精彩問答
微軟亞洲研究院視覺計算組在原創(chuàng)思想這一塊,引領(lǐng)下一個方向有沒有什么考慮,您談到很多對人們?nèi)粘I钣绊懞艽蟮膽?yīng)用,但是在背后的更深層的考慮,更新的創(chuàng)意在哪里呢?
我們的研究者都很年輕,我本人也才工作七年的時間,很多的算法已經(jīng)發(fā)展這么多年了,所以在開始的時候比較容易想出來的方法,現(xiàn)在已經(jīng)很難有那么多的原創(chuàng)內(nèi)容。我們的工作是去找一些非常原創(chuàng)的內(nèi)容,有的是理論上的,有的是新的發(fā)明,這可以有很大的影響。
圖像通過閃光燈的分割,前景和背景深度差會不會影響分割效果,距離會不會影響分割效果呢?
我們這個通過閃光燈對圖像進(jìn)行分割的技術(shù),會一定程度上受到光的強度和距離的影響。
我們主要的研究領(lǐng)域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應(yīng)用。
如何將圖片的前景和后景分離?我們現(xiàn)在照兩張圖片,一張打閃光燈,一張沒有打閃光燈,這樣拍出來的照片背景沒有變化,但前景變化很厲害。在開閃光燈的情況下拍的照片,前景和后景可以利用一些技術(shù)很容易地分開來。
把一個圖片的前景切割出來放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復(fù)剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區(qū)域,我們可以由一個算法,從其他的地方借過來,再貼上去,經(jīng)過這樣的處理后,圖像基本上和原來沒有太大的區(qū)別。
如此的修修補補又有什么用呢?比如說,你對這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來,然后利用一些技術(shù)將劃出來的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補上,而且讓別人看不出來。
現(xiàn)在大家的電腦上都會有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現(xiàn)在做的是可以隨機把照片放到桌面上,但是電腦會對每張照片上的重要信息進(jìn)行篩選,在放盡可能多的照片的同時,讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布,同時把所有背景都要蓋上。我們可以對圖像進(jìn)行各種處理,同時我們也可以利用一些技術(shù)知道別人有沒有處理圖像,對圖像有沒有做過手腳。
現(xiàn)在我們來說說視頻方面。比如說抖動很厲害的圖像,怎么把物體移到中間?一個辦法是把除移動圖像外的公共部分切出來,但是移動越大,公共部分就會越來越小,更好的辦法是用一些技術(shù)把空處填上。
現(xiàn)在MSN的功能已經(jīng)越來越豐富。比如說一段電影,你看到一件比較中意的衣服,只要你把鼠標(biāo)移動衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標(biāo)在那件衣服上輕點,電腦就會直接跳轉(zhuǎn)到這個衣服的相關(guān)網(wǎng)站。
你在視頻聊天的時候如果不想讓對方看到你所處的環(huán)境,你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心,我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡,換上一個性感的大嘴巴,這些都能輕而易舉地完成。
多媒體傳感器網(wǎng)絡(luò)
北京郵電大學(xué)教授、博士生導(dǎo)師
智能通信軟件與多媒體北京市重點實驗室主任 馬華東
傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網(wǎng)絡(luò)的基本概念。從早期的巨型機到今天的小型機,生物芯片尺寸越來越小,但是效率越來越高;網(wǎng)絡(luò)設(shè)備聯(lián)網(wǎng)和數(shù)據(jù)交換的需求越來越大,設(shè)備之間的傳輸量也越來越大;從信息處理的角度來看,內(nèi)容逐漸占據(jù)了主導(dǎo)地位,由數(shù)據(jù)為中心轉(zhuǎn)到以內(nèi)容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。
傳感器網(wǎng)絡(luò)是一組傳感器節(jié)點,由組織方式協(xié)作地感知采集和處理感知對象的信息,它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態(tài)變化。現(xiàn)在的需求是要求通信能力越來越強,計算能力應(yīng)付節(jié)點的處理的要求。
右圖是目前主流的傳感器節(jié)點的配置,從配置來講還是比較低的,現(xiàn)在信息處理側(cè)重壓力、溫度、光、震動等簡單的數(shù)據(jù)或者是標(biāo)量數(shù)據(jù)。人類獲取信息80%是視覺信息,10%左右是聽覺信息,也就是說90%左右的信息是多媒體信息。傳感器網(wǎng)絡(luò)就是對音頻、視頻信息獲取后提供給使用者,使其對環(huán)境信息有一個全方位的了解,對傳感器網(wǎng)絡(luò)的應(yīng)用是非常廣泛的。
從網(wǎng)絡(luò)的結(jié)構(gòu)來講,基本結(jié)構(gòu)和原來傳感器網(wǎng)絡(luò)差別不是很大,這里面強調(diào)增加音頻、視頻獲取處理,網(wǎng)絡(luò)傳輸整個過程的各個環(huán)節(jié),同時這里面最好可以交互。有了這個概念以后,深入分析一下主要特點,首先是網(wǎng)絡(luò)能力的增強,這樣一個傳感器網(wǎng)絡(luò)應(yīng)該集信息的采集、處理傳輸、轉(zhuǎn)發(fā)、能量供應(yīng)等方面,除了傳統(tǒng)的標(biāo)量數(shù)據(jù),音頻、視頻的圖像數(shù)據(jù),都可以進(jìn)行采集處理。
現(xiàn)在多媒體傳感器網(wǎng)絡(luò)目前有哪些問題呢?從需求來看,現(xiàn)在網(wǎng)絡(luò)是異構(gòu)的信息,媒體信息的格式,種類很多,并且差異非常大,數(shù)據(jù)量比較大,特別是音頻、視頻信息,格式比較復(fù)雜。這些信息傳輸過程中需要高速實時地傳輸,對網(wǎng)絡(luò)傳輸速率也提出了比較高的要求。媒體信息的安全問題,也是網(wǎng)絡(luò)需要考慮的,還有服務(wù)質(zhì)量的問題。針對這些需求,我們可以看到,通信資源和計算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問題所在。
最后談一下多媒體傳感器網(wǎng)絡(luò)研究的挑戰(zhàn),首先是節(jié)點的芯片設(shè)計,這是基礎(chǔ),這里面需要采用多種技術(shù),包括軟硬件協(xié)同設(shè)計的技術(shù),各種技術(shù)結(jié)合,降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題,方向性傳感模型是一個簡單的二維圖形,實際上是三維圖形監(jiān)測,這是一個三維場景方向的問題,研究這個就復(fù)雜多了。還有一個問題是服務(wù)質(zhì)量保證問題,在新的網(wǎng)絡(luò)當(dāng)中服務(wù)質(zhì)量體系是什么樣,也是研究的方向。再一個是信息處理,為了使網(wǎng)絡(luò)傳輸數(shù)據(jù)量比較快,能不能在節(jié)點做信息處理的計算。當(dāng)然信息的安全也比較重要,用這些節(jié)點獲取多媒體信息怎么保證安全的質(zhì)量,使應(yīng)該看到的人看到這些信息,不應(yīng)該看到的人看不到這些信息。
在多媒體傳感器網(wǎng)絡(luò)中,我們還是做了一些工作,和一些同行學(xué)者也有一些交流,這里面也有一些質(zhì)疑,說多媒體傳感網(wǎng)絡(luò)和原來傳感器網(wǎng)絡(luò)設(shè)計初衷是不是吻合的,原來沒有想讓它處理這么多信息,原來體積比較小,加上這些信息以后,無疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網(wǎng)絡(luò)研究有沒有必要性,如果有必要性可行不可行,這都是我們目前研究的問題。
關(guān)鍵詞: 人工智能 發(fā)展過程 研究熱點 應(yīng)用領(lǐng)域 未來發(fā)展
一、人工智能概述
人工智能(Artificial Intelligence,簡稱AI),也稱機器智能,它是計算機科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語言學(xué)等多種學(xué)科互相滲透而發(fā)展起來的一門綜合性學(xué)科。從計算機應(yīng)用系統(tǒng)角度來看,人工智能是研究如何制造出智能機器或智能系統(tǒng),實現(xiàn)模擬人類智能活動的能力,以延伸人們智能的科學(xué)。人工智能是一門交叉學(xué)科,是一門涉及心理學(xué)、認(rèn)知科學(xué)、思維科學(xué)、信息科學(xué)、系統(tǒng)科學(xué)和生物科學(xué)等多學(xué)科的綜合性技術(shù)學(xué)科,目前已在知識處理、模式識別、自然語言處理、博弈、自動定理證明、自動程序設(shè)計、專家系統(tǒng)、知識庫、智能機器人等多個領(lǐng)域取得舉世矚目的成果,并形成了多元化的發(fā)展方向。
二、人工智能的發(fā)展過程
人工智能經(jīng)歷了三次飛躍階段:第一次是實現(xiàn)問題求解,代替人完成部分邏輯推理工作,如機器定理證明和專家系統(tǒng);第二次是智能系統(tǒng)能夠和環(huán)境交互,從運行的環(huán)境中獲取信息,代替人完成包括不確定性在內(nèi)的部分思維工作,通過自身的動作,對環(huán)境施加影響,并適應(yīng)環(huán)境的變化,如智能機器人;第三次是智能系統(tǒng),具有類人的認(rèn)知和思維能力,能夠發(fā)現(xiàn)新的知識,去完成面臨的任務(wù),如基于數(shù)據(jù)挖掘的系統(tǒng)。
三、人工智能的研究熱點
AI研究出現(xiàn)了新的,這一方面是因為在人工智能理論方面有了新的進(jìn)展,另一方面是因為計算機硬件突飛猛進(jìn)地發(fā)展。隨著計算機速度的不斷提高、存儲容量的不斷擴大、價格的不斷降低,以及網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,許多原來無法完成的工作現(xiàn)在已經(jīng)能夠?qū)崿F(xiàn)。目前人工智能研究的三個熱點是:智能接口、數(shù)據(jù)挖掘、主體及多主體系統(tǒng)。
1.智能接口技術(shù)是研究如何使人們能夠方便自然地與計算機交流。為了實現(xiàn)這一目標(biāo),要求計算機能夠看懂文字、聽懂語言、說話表達(dá),甚至能夠進(jìn)行不同語言之間的翻譯,而這些功能的實現(xiàn)又依賴于知識表示方法的研究。因此,智能接口技術(shù)的研究既有巨大的應(yīng)用價值,又有基礎(chǔ)的理論意義。目前,智能接口技術(shù)已經(jīng)取得了顯著成果,文字識別、語音識別、語音合成、圖像識別、機器翻譯及自然語言理解等技術(shù)已經(jīng)開始實用化。
2.數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但是又潛在有用的信息和知識的過程。數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的研究目前已經(jīng)形成了三根強大的技術(shù)支柱:數(shù)據(jù)庫、人工智能和數(shù)理統(tǒng)計。主要研究內(nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉庫、可視化技術(shù)、定性定量互換模型、知識表示方法、發(fā)現(xiàn)知識的維護(hù)和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識發(fā)現(xiàn)及網(wǎng)上數(shù)據(jù)挖掘等。
3.主體系統(tǒng)是具有信念、愿望、意圖、能力、選擇、承諾等心智狀態(tài)的實體,比對象的粒度更大,智能性更高,而且具有一定的自主性。主體試圖自治、獨立地完成任務(wù),而且可以和環(huán)境交互,與其他主體通信,通過規(guī)劃達(dá)到目標(biāo)。多主體系統(tǒng)主要研究在邏輯上或物理上分離的多個主體之間進(jìn)行協(xié)調(diào)智能行為,最終實現(xiàn)問題求解。多主體系統(tǒng)試圖用主體來模擬人的理,主要應(yīng)用在對現(xiàn)實世界和社會的模擬、機器人及智能機械等領(lǐng)域。目前對主體和多主體系統(tǒng)的研究主要集中在主體和多主體理論、主體的體系結(jié)構(gòu)和組織、主體語言、主體之間的協(xié)作和協(xié)調(diào)、通信和交互技術(shù)、多主體學(xué)習(xí)及多主體系統(tǒng)應(yīng)用等方面。
四、人工智能的應(yīng)用領(lǐng)域
1.專家系統(tǒng)
專家系統(tǒng)是一個具有大量專門知識與經(jīng)驗的程序系統(tǒng),專家系統(tǒng)存儲著某個專門領(lǐng)域中經(jīng)過事先總結(jié)、分析并按某種模式表示的專家知識,以及擁有類似于領(lǐng)域?qū)<医鉀Q實際問題的推理機制。專家系統(tǒng)的開發(fā)和研究是人工智能中最活躍的一個應(yīng)用研究領(lǐng)域,涉及社會各個方面。
2.知識庫系統(tǒng)
知識庫系統(tǒng)也叫數(shù)據(jù)庫系統(tǒng),是儲存某學(xué)科大量事實的計算機軟件系統(tǒng),它可以回答用戶提出的有關(guān)該學(xué)科的各種問題。知識庫系統(tǒng)的設(shè)計是計算機科學(xué)的一個活躍的分支。為了有效地表示、儲存和檢索大量事實,已經(jīng)發(fā)展出了許多技術(shù)。但是在設(shè)計智能信息檢索系統(tǒng)時還是遇到很多問題,包括對自然語言的理解,根據(jù)儲存的事實演繹答案的問題、理解詢問和演繹答案所需要的知識都可能超出該學(xué)科領(lǐng)域數(shù)據(jù)庫所表示的知識。
3.物景分析
計算機視覺已從模式識別的一個研究領(lǐng)域發(fā)展為一門獨立的學(xué)科。視覺是感知問題之一。整個感知問題的要點是形成一個精練的表示,以表示難以處理的、極其龐大的未經(jīng)加工的輸入數(shù)據(jù)。最終表示的性質(zhì)和質(zhì)量取決于感知系統(tǒng)的目標(biāo)。機器視覺的前沿研究領(lǐng)域包括實時并行處理、主動式定性視覺、動態(tài)和時變視覺、三維景物的建模與識別、實時圖像壓縮傳送和復(fù)原、多光譜和彩色圖像的處理與解釋等。機器視覺已在機器人裝配、衛(wèi)星圖像處理、工業(yè)過程監(jiān)控、飛行器跟蹤和制導(dǎo)及電視實況轉(zhuǎn)播等領(lǐng)域獲得極為廣泛的應(yīng)用。
4.模式識別
模式識別就是識別出給定物體所模仿的標(biāo)本或標(biāo)識。計算機模式識別系統(tǒng)能夠彌補計算機對外部世界感知能力低下的缺陷,使計算機能夠通過感官接受外界信息,識別和理解周圍環(huán)境。模式識別在二維的文字、圖形和圖像的識別方面已取得許多成果,在三維景物、活動目標(biāo)的識別和分析方面是目前研究的熱點,同時它還是智能計算機和智能機器人研究的十分重要的基礎(chǔ)。此外,人工智能還在機器視覺、組合調(diào)度問題、自然語言理解、機器學(xué)習(xí)、博弈、定理證明等研究應(yīng)用領(lǐng)域發(fā)揮著重要作用??梢哉f人工智能已深入各行各業(yè),對人類社會作出了巨大的貢獻(xiàn)。
5.機器人
機器人學(xué)所研究的問題,從機器人手臂的最佳移動到實現(xiàn)機器人目標(biāo)的動作序列的規(guī)劃方法,無所不包。盡管已經(jīng)建立了一些比較復(fù)雜的機器人系統(tǒng),但是現(xiàn)在工業(yè)上運行的機器人都是一些按預(yù)先編好的程序執(zhí)行某些重復(fù)作業(yè)的簡單裝置,大多數(shù)工業(yè)機器人是“盲人”。機器人和機器人學(xué)的研究促進(jìn)了許多人工智能思想的發(fā)展。智能機器人的研究和應(yīng)用體現(xiàn)出廣泛的學(xué)科交叉,涉及眾多課題。機器人已在工業(yè)、農(nóng)業(yè)、商業(yè)、旅游業(yè)、空中和海洋及國防等多個領(lǐng)域獲得越來越普遍的應(yīng)用。
五、人工智能的未來發(fā)展
目前絕大多數(shù)人工智能系統(tǒng)都是建立在物理符號系統(tǒng)假設(shè)之上的。在尚未出現(xiàn)能與物理符號系統(tǒng)假設(shè)相抗衡的新的人工智能理論之前,無論從設(shè)計原理還是從已取得的實驗結(jié)果來看,Soar在探討智能行為的一般特征和人類認(rèn)知的具體特征的艱難征途上都取得了有特色的進(jìn)展或成就,處在人工智能研究的前沿。上世紀(jì)80年代,以NewellA為代表的研究學(xué)者總結(jié)了專家系統(tǒng)的成功經(jīng)驗,吸收了認(rèn)知科學(xué)研究的最新成果,提出了作為通用智能基礎(chǔ)的體系結(jié)構(gòu)Soar。目前的Soar已經(jīng)顯示出強大的問題求解能力。在Soar中已實現(xiàn)了30多種搜索方法,實現(xiàn)了若干知識密集型任務(wù)(專家系統(tǒng)),如RI等。對于人工智能未來的發(fā)展方向,專家們通過一些前瞻性研究可以看出未來人工智能可能會向以下幾個方面發(fā)展:模糊處理、并行化、神經(jīng)網(wǎng)絡(luò)及其情感。
目前,人工智能的推理功能已獲突破,學(xué)習(xí)及聯(lián)想功能正在研究之中,下一步就是模仿人類右腦的模糊處理功能和整個大腦的并行化處理功能。人工神經(jīng)網(wǎng)絡(luò)是未來人工智能應(yīng)用的新領(lǐng)域。未來智能計算機的構(gòu)成,可能就是作為主機的馮?諾依曼型機與作為智能的人工神經(jīng)網(wǎng)絡(luò)的結(jié)合。研究表明:情感是智能的一部分,而不是與智能相分離的,因此人工智能領(lǐng)域的下一個突破可能在于賦予計算機情感能力。情感能力對于計算機與人的自然交往至關(guān)重要。
根據(jù)這些前瞻性研究我們也可以通過想象模擬勾畫出人工智能未來發(fā)展的三個階段。
1.融合時期(2010―2020年)
(1)用語言操縱和控制的智能化設(shè)備十分普及,像遠(yuǎn)程醫(yī)療這樣的服務(wù)也更為完善。
(2)以計算機和互聯(lián)網(wǎng)為基礎(chǔ)的遠(yuǎn)程教育十分普及,在家就可以上大學(xué)。
(3)在身體里植入許多不同功能的芯片已不新奇。
(4)量子計算機和DNA計算機會有更大發(fā)展,新材料不斷問世。
(5)抗病毒程序可以防止各種非自然因素引發(fā)災(zāi)難。
2.自信時期(2020―2030年)
(1)智能化計算機和互聯(lián)網(wǎng)既能自我修復(fù),也能自行進(jìn)行研究、生產(chǎn)產(chǎn)品。
(2)一些新型材料的出現(xiàn),促使智能化向更高層次發(fā)展。
(3)有了高水準(zhǔn)智能化技術(shù)的協(xié)助,人們“定居火星夢”可能性大增。
3.非神秘時期(2030―2040年)
(1)新的全息模式世界將取代原有幾何模式的世界。
(2)人們對一些目前無法解釋的自然現(xiàn)象會有更完善的解釋。
(3)人工智能可以模仿人類的智能,因此會出現(xiàn)有關(guān)法律來規(guī)范這些行為。
愛爾蘭都柏林大學(xué)(UCD)教授孫大文(Da-Wen Sun)的經(jīng)歷無疑就是這句話的具體詮釋。
2010年5月,孫大文當(dāng)選愛爾蘭皇家科學(xué)院院士。成立于1785的愛爾蘭皇家科學(xué)院是愛爾蘭自然科學(xué)、人文和社會科學(xué)的最高學(xué)術(shù)機構(gòu)。
2010年6月,國際農(nóng)業(yè)工程委員會(CIGR)第十七屆世界大會上,來自全球40多個國家的近1000位專家學(xué)者代表與會。會上,孫大文當(dāng)選為國際農(nóng)業(yè)工程委員會候任主席,任期從2011年1月開始,并將于2013年起接任主席,為期2年。他成為國際農(nóng)業(yè)工程委員會自成立80年以來的首位華人主席。在這次大會上,孫大文還被授予國際農(nóng)業(yè)工程委員會會士榮譽稱號(CIGR Fellow Award),這是CIGR對國際農(nóng)業(yè)與生物系統(tǒng)工程領(lǐng)域獲得公認(rèn)卓越地位和作出杰出科學(xué)貢獻(xiàn)者的一項殊榮。
豐碩的成果是多年奮斗的收獲,從廣東潮安縣一路走來,孫大文對于事業(yè)、人生都有自己的體會。
我的大學(xué)
2010年秋,在一個都柏林典型的陰天、大風(fēng)、細(xì)雨交替的日子,我們來到都柏林大學(xué)采訪孫大文教授。盡管前一天晚上他才從國外出差回來,但早就訂好了會議室,并準(zhǔn)備了茶點。打開電腦,題為《談?wù)勎以诤M獾膴^斗經(jīng)歷和體會》的PPT文檔圖文并茂地為我們一一細(xì)說從前。
從當(dāng)年參加高考的準(zhǔn)考證、成績單,到出國留學(xué)的很多審批文件,再到后來獲得的多項獎勵……這些無不透著孫大文的嚴(yán)謹(jǐn)和認(rèn)真,以及對于自己人生經(jīng)歷的珍視。
盡管我們曾經(jīng)采訪過很多恢復(fù)高考后考上大學(xué)的留學(xué)人員,但真正看到一張1978年的高等學(xué)校準(zhǔn)考證、成績單,以及諸多的出國審批手續(xù)等批件,這還是第一次。
孫大文出生于廣東省潮安縣,讀書時他的學(xué)習(xí)成績一直名列全校前茅。1977年恢復(fù)高考時,還在上高一的孫大文就被學(xué)校破格推薦參加全國高考。1978年,孫大文以優(yōu)異成績被全國重點大學(xué)華南工學(xué)院(現(xiàn)華南理工大學(xué))錄取。
為了對比當(dāng)年高考的難度,孫大文特地選用一組數(shù)據(jù)說明:1978年全國參加高考人數(shù)為610萬人,錄取人數(shù)40.2萬,錄取率為7%。而2009年全國參加高考人數(shù)1020萬人,錄取人數(shù)629萬人,錄取率高達(dá)62%。
恢復(fù)高考后,幾乎所有進(jìn)入大學(xué)的學(xué)子都如饑似渴地汲取著知識的營養(yǎng),因為他們深深地懂得機會的來之不易,孫大文說:“我們的大學(xué)生活就是‘宿舍―飯?zhí)猫D課室’,‘三點一線’是對我們那時候生活的真實寫照?!?/p>
和很多同學(xué)一樣,孫大文也缺乏英語基礎(chǔ),英語成為他學(xué)習(xí)上的瓶頸之一,為了學(xué)好英語,他口袋里總是裝著單詞本,甚至連在飯?zhí)门抨牬蝻堃约巴盹埡笊⒉降臅r間都在用功地背英語,只是當(dāng)時的他并不知道英語將在今后為他打開一扇更大的門,讓他進(jìn)入一個更廣闊的世界。
回首往事,孫大文感慨道:“在我們那個年代,所有人都崇拜陳景潤,羨慕中國科技大學(xué)少年班的學(xué)生,家長也以此來激勵自家孩子讀書。那時候上大學(xué),就是用心學(xué)習(xí)知識,并且我們有一定要把知識學(xué)好的精神?!?/p>
在華南工學(xué)院本科畢業(yè)時,按照當(dāng)時的政策,所有大學(xué)生畢業(yè)后都要服從分配。一直在南方長大的孫大文沒想到自己竟然被分配到佳木斯,他當(dāng)時甚至不知道佳木斯在哪里,而研究生的入學(xué)通知書又讓他的命運軌跡有了改變。1982年,孫大文以專業(yè)第一名的成績考上華南工學(xué)院的碩士研究生,研究方向為高聚物流變工程原理。當(dāng)年全國在校碩士研究生為2.58萬人,博士生約550人,博士生人數(shù)與碩士生人數(shù)之比為1∶47.2。
今天說來,這成了孫大文在廣州求學(xué)的一件軼事!“連我們老師也笑我,要是我當(dāng)時沒有考研并且成功考上的話,我就要去遙遠(yuǎn)的佳木斯了?!?/p>
到了研究生學(xué)習(xí)階段,孫大文的刻苦鉆研有了更多收獲,獲得多項科研獎項。上個世紀(jì)80年代中期,國內(nèi)物價飛漲,腦體倒掛現(xiàn)象突出,“搞導(dǎo)彈的收入不如賣茶葉蛋的,拿手術(shù)刀的不如拿剃頭刀的”,這使得全國刮起下海經(jīng)商的風(fēng),很多人的價值取向由此也發(fā)生了巨大變化。1985年,碩士畢業(yè)的孫大文迎來了自己人生中的第一次選擇:工作還是繼續(xù)深造?幾經(jīng)考量,孫大文選擇了繼續(xù)在華南工學(xué)院攻讀博士研究生。那一年華南工學(xué)院總共招收5名博士生,孫大文是其中之一,他的研究方向轉(zhuǎn)為傳熱與節(jié)能。
在攻讀博士期間,他先后在《稀有金屬》等國際權(quán)威性雜志上發(fā)表了7篇論文并全部由科學(xué)引文索引(SCl)收錄,他的博士成果后來還相繼獲得廣州市和廣東省自然科學(xué)獎。這在當(dāng)時,對很多科研人員來說,也是有很大難度的。孫大文說:“我當(dāng)時看很多英文科研文章就想,這樣的文章我也可以寫,于是就將自己的科研成果寫成文章投稿,沒想到都發(fā)表了。”
跨出國門
1988年,孫大文博士畢業(yè),他又一次面臨著人生的重要選擇:是畢業(yè)留校?還是出國深造?
當(dāng)時出國要歷經(jīng)多項環(huán)節(jié),其過程是耐力、實力、心理的多項考驗:給國外寫信聯(lián)系導(dǎo)師,向?qū)W校申請留學(xué),經(jīng)過政審、國家教委審批,然后集訓(xùn),再辦理護(hù)照和簽證,換取外匯……
孫大文說:“去海外深造是當(dāng)時很多人的向往,我也希望去國外進(jìn)一步深造。我已經(jīng)拿到了德國和日本的邀請函。但是,去德國還是日本?這個問題讓我非常矛盾。鑒于當(dāng)時的國際形勢和意識形態(tài)差異,我還是選擇了去德國深造?!庇捎诋?dāng)時很多情況不斷變化,孫大文臨時變更了機票,當(dāng)時他甚至來不及確認(rèn)自己在國外的聯(lián)系人是否收到了早先發(fā)去的電傳。帶著僅有的50美元,1989年6月,孫大文前往德國斯圖加特大學(xué)繼續(xù)深造,從事儲氫材料研究工作。
“國外的一切對我來說都是那么新鮮。在德國,我第一次接觸到Macintosh計算機,第一次使用word軟件,第一次使用E-mail……”太多的第一次讓他甚至來不及適應(yīng)。在體驗著新鮮刺激的國外生活的同時,孫大文努力讓自己適應(yīng)新的環(huán)境,克服語言和文化上的障礙,潛心從事科研工作,在研究所,他是在那里學(xué)習(xí)的中國人中第一個的研究人員。
到德國工作1年后,由于需要在工作中用德語交流。孫大文想放棄學(xué)習(xí)了那么久的英語很可惜,考慮再三。1990年底,他在導(dǎo)師的指引下,前往英國貝爾法斯特女王大學(xué)擔(dān)任研究員。
此后幾年,孫大文先后于英國紐卡斯?fàn)柎髮W(xué)和謝菲爾德大學(xué)擔(dān)任研究員,也正是在紐卡斯?fàn)柎髮W(xué),孫大文的研究進(jìn)入了全新的領(lǐng)域。在那里,他還認(rèn)識了一位退休的中學(xué)校長,校長很想學(xué)中文,于是孫大文每周一個晚上到他家里教他中文,也向他學(xué)習(xí)英文口語,從不間斷,孫大文的英語口語水平有了很大的提高。孫大文說:“在紐克斯?fàn)柎髮W(xué)進(jìn)行的谷物干燥研究工作,為我日后在食品工程領(lǐng)域發(fā)展打下了堅實的基礎(chǔ)。我改造了那里現(xiàn)有的實驗設(shè)備并實現(xiàn)數(shù)據(jù)采集自動化,并發(fā)表了6篇SCI論文?!?/p>
在科研之余,孫大文特別喜歡到英國的鄉(xiāng)村種菜,租一塊地,種上自己喜歡的蔬菜,耕作打理,期待著農(nóng)耕收獲的喜悅。沒想到有一次來到自己的菜地,發(fā)現(xiàn)上次離開時已經(jīng)郁郁蔥蔥的菜地卻一片狼籍,孫大文心想難道是有人破壞?一次碰巧遇到一位在他旁邊種地的本地人,那位英國紳士慢條斯理地說:“你知道你的菜地出什么問題了么?是蛞蝓(slug)搞得鬼……”孫大文才知道這種蟲子專吃蔬菜,趕忙滅蟲。
事業(yè)在都柏林騰飛
孫大事情喜歡制定明確的目標(biāo)和詳細(xì)的計劃,通過計劃,合理安排時間和任務(wù),從而達(dá)到目標(biāo),同時也使自己明確每一個任務(wù)的目的。他經(jīng)常跟學(xué)生說做事情要通過制定計劃,腳踏實地、有步驟地去實現(xiàn)它。在學(xué)習(xí)、工作中不斷努力,不斷修正自己的行動,直到達(dá)成目標(biāo)。
在英國,孫大文給自己定下的目標(biāo)是45歲之前要做到教授,但在英國的教育機制下,這并不容易。孫大文開始留意別的機會,1995年秋,他在英國的《衛(wèi)報》上看到愛爾蘭都柏林大學(xué)正在招聘大學(xué)教師,當(dāng)時愛爾蘭處于發(fā)展期,經(jīng)濟環(huán)境不斷好轉(zhuǎn),高技術(shù)產(chǎn)業(yè),特別是信息技術(shù)和軟件業(yè)發(fā)展很快,急需大量科研人員。孫大文決定離開英國,他順利在愛爾蘭都柏林大學(xué)找到職位。
正應(yīng)了中國那句古話“萬事開頭難”,當(dāng)時,愛爾蘭的中國人很少,作為愛爾蘭都柏林大學(xué)第一位獲得教席的華人,諸多來自歐美等發(fā)達(dá)國家的學(xué)者、教授對孫大文的出現(xiàn)感到有些異樣。都柏林大學(xué)的同事甚至問孫大文:“你為什么跑到這里來教書?你上課學(xué)生能聽懂嗎?”孫大文知道自己必須盡快找到突破口并做出成績來,安頓下來的孫大文開始尋找研究方向和合作者,他一邊組建自己的科研團(tuán)隊,一邊申請課題和科研經(jīng)費。
孫大文決定在食品工程方面找突破口,考慮到自己初來乍到,必須要有合適的合作伙伴以及團(tuán)隊,他幾經(jīng)周折,拿著自己寫好的項目建議,到愛爾蘭國家食品中心找合作者。他說:“因為如果我單獨申請,成功率肯定比較低,但如果找到當(dāng)?shù)乇容^權(quán)威的專家,讓他做項目主持人,成功率會比較高?!?/p>
看到孫大文翔實的資料準(zhǔn)備以及項目建議,國家食品中心的專家同意合作,于是兩個人聯(lián)名申請的第一筆科研經(jīng)費順利通過審批,這奠定了孫大文隨后科研的基礎(chǔ)。孫大文說:“在國外搞研究,你必須有好的課題。缺少經(jīng)費的研究是非常艱難的,在申請到了經(jīng)費后,一切就走向正規(guī),順利運行起來了?!?/p>
此后十幾年間,孫大文一直奮戰(zhàn)在食品工程研究領(lǐng)域,在新興食品加工技術(shù),食品冷卻、冷凍、冷藏和保鮮技術(shù),食品快速檢測計算機視覺技術(shù),食品加工過程模擬、優(yōu)化和控制等多個領(lǐng)域走在全球食品工程研究領(lǐng)域的前沿。由于有著寬廣的學(xué)術(shù)積累,孫大文能從材料、加工、農(nóng)業(yè)工程等諸多領(lǐng)域進(jìn)行分析研究,并密切關(guān)注科研成果的社會轉(zhuǎn)化等,使得他可以從不同角度看待研究課題,從而找到最佳對接點。
孫大文在愛爾蘭這片陌生的土地上逐漸確立了自己的科研地位,他先后從歐盟、愛爾蘭政府的有關(guān)部門和企業(yè)界獲得了超過100萬歐元的科研經(jīng)費,組建了自己的科研隊伍,并成立了食品冷凍及計算機化食品技術(shù)研究所。該研究所目前擁有4個專業(yè)實驗室,配備有門類齊全的現(xiàn)代化科研設(shè)備與測試系統(tǒng),承擔(dān)著歐盟、愛爾蘭政府及企業(yè)的多項科研項目。
在歐洲,熟肉制品是以鮮畜禽肉為主要原料,經(jīng)選料、修整、腌制、調(diào)味、成型、熟化和包裝等工藝制成的肉類加工食品,為歐洲主要日常食品。歐洲食品安全條例極其嚴(yán)格,歐洲工業(yè)界為了減少浪費和提高效率,通常加工生產(chǎn)重約5~7公斤的超大產(chǎn)品。由于肉制品具有極低的導(dǎo)熱系數(shù),采用目前通用的風(fēng)冷或水冷的冷卻方法根本無法達(dá)到歐洲食品安全條例的要求。于是,孫大文首次采用冷卻機理完全不同的真空冷卻方法,以蒸發(fā)相變傳熱過程取代傳統(tǒng)方法中以熱傳導(dǎo)傳熱模式為主的傳熱過程。由于水分蒸發(fā)潛熱很大,他所開發(fā)的新型真空冷卻技術(shù)可以達(dá)到超快速冷卻效果,從根本上克服了傳統(tǒng)熱傳導(dǎo)傳熱模式所存在的低效率問題。近年來,由于即食食品具有方便和大眾化的優(yōu)點,適合現(xiàn)代人快節(jié)奏生活,即食食品產(chǎn)業(yè)在歐洲得到大規(guī)模發(fā)展,因此歐盟對其冷卻時間具有極為嚴(yán)格的規(guī)定,孫大文開發(fā)的真空冷卻技術(shù)對即食食品及其所含的眾多配料都具有極其明顯的超快速凍效果。
在計算機視覺領(lǐng)域,孫大文的研究也取得了世界領(lǐng)先的原創(chuàng)性成果。計算機視覺技術(shù)正越來越廣泛地用于食品工業(yè)產(chǎn)品質(zhì)量檢測和生產(chǎn)控制,它能有效地提高生產(chǎn)自動化程度,提高產(chǎn)品質(zhì)量和生產(chǎn)效率。比薩餅是歐洲最主要的方便食品之一,顧客對外觀品質(zhì)尤為重視。但目前通用的外觀品質(zhì)檢測手段仍然采用費時和客觀性差的肉眼觀察方法,從而導(dǎo)致產(chǎn)品質(zhì)量的波動。比薩餅表面飾料多種多樣且分布復(fù)雜,孫大文提出了一種基于區(qū)域的圖象分割算法,汲取了常見的門限化、邊界分割法和區(qū)域分割法的優(yōu)點,極大地改進(jìn)了傳統(tǒng)區(qū)域增長算法,研制出適用于比薩餅外觀品質(zhì)快速檢測計算機圖像處理識別系統(tǒng)。這一系統(tǒng)很適合像比薩餅表面復(fù)雜的圖像處理,在對表面飾料包括青椒、火腿、番茄醬等數(shù)十種比薩餅和糕點的圖像分析表明,該視覺系統(tǒng)對餅基表面各種飾料的識別準(zhǔn)確率達(dá)到95%以上。在此基礎(chǔ)上,孫大文還把計算機視覺技術(shù)成功地運用于干酪熔化特性量化測定和肉品品質(zhì)檢測與控制,以代替?zhèn)鹘y(tǒng)的儀器測量與感官評定手段。這一系列研究開創(chuàng)了對食品,特別是比薩餅生產(chǎn)質(zhì)量和屬性進(jìn)行自動檢測的應(yīng)用先例。英國著名的《新科學(xué)家》雜志等多家世界新聞媒體紛紛報道了這一最新成就。
為國效力
雖然在國外多年,但孫大文一直希望能有機會為祖國服務(wù)。近年來,孫大文經(jīng)常利用自己的休假時間,回國講學(xué),與國內(nèi)科研機構(gòu)建立了長期和密切的合作關(guān)系,他與華南理工大學(xué)共同建立研究基地,雙方聯(lián)手共同開拓食品冷凍方面的科研新課題。孫大文與哈爾濱工業(yè)大學(xué)簽訂了5年的合作合同,每年為哈工大招收培養(yǎng)博士生,期間以哈工大為第一作者單位聯(lián)合發(fā)表了8篇SCI論文,并多次推薦和邀請該校老師參加國際學(xué)術(shù)活動。
孫大文與江南大學(xué)聯(lián)合培養(yǎng)的一位博士生,攻讀博士學(xué)位期間共在國際知名期刊上發(fā)表6篇論文并全部由SCI收錄。他與江南大學(xué)聯(lián)合開發(fā)的基于豆類蛋白質(zhì)的無色無味透明的可食用膜用于水果和蔬菜保鮮可使產(chǎn)品的貨架期延長了好幾個星期。如對獼猴桃的實驗結(jié)果,顯示使用該涂膜保鮮可使獼猴桃貨架期從原先的2周延長至37天,這一成果再次引起了工業(yè)界的高度重視。英國著名的《新科學(xué)家》雜志對這一成果報道后,世界各地傳媒也相繼報道了這一技術(shù)。
關(guān)鍵詞:數(shù)據(jù)處理;數(shù)據(jù)挖掘;特征提??;聚類分析
中圖分類號:TP18 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)31-0164-04
Abstract:With the rapid development of computer technology and Internet technology, the amount of data accumulated in the human gradually increased dramatically. For the vast amounts of data into useful information for the user to provide decision support, clustering algorithm has been widely attention and applied to all types of data processing and data mining applications. The project based on the analysis of visual features on the image, through the effective integration of color, texture and shape features of the image information, the use of K-Means algorithm to cluster. The proposed method can be carried out experiments on the acquired image data set, and has a good clustering effect .
Key words: data processing; data mining;feature extraction;cluster analysis
F今,互聯(lián)網(wǎng)上的圖像信息數(shù)量如海洋般龐大,我們雖可以通過眼睛獲取十分豐富的信息,然而人類可以接受的范圍是有限的,如何從海量的數(shù)據(jù)之中準(zhǔn)確、快速地將圖像進(jìn)行聚類,最終為人類社會的發(fā)展服務(wù),是當(dāng)前圖像特征提取領(lǐng)域的一個研究焦點。
圖像聚類就是運用計算機對圖像庫中圖像進(jìn)行定量分析,再把圖像劃分到某一種特征類別中,以代替人類對圖像的視覺判別。圖像聚類的過程實質(zhì)上就是一個基于知識的圖像理解過程,同時也是人類對圖像的視覺判別的延續(xù)與發(fā)展。
基于視覺特征的圖像聚類研究是解決視覺圖像問題的一條重要途徑,也是一個聚集了計算機視覺、圖像處理、數(shù)據(jù)挖掘等多個研究領(lǐng)域的交叉研究方向?,F(xiàn)如今,基于視覺特征的圖像分類研究已越來越受到國內(nèi)外研究者的關(guān)注,在近幾年舉辦的與該領(lǐng)域研究相關(guān)的一些頂級國際會議,如計算機視覺與圖像處理國際會議CVPR、數(shù)據(jù)挖掘國際會議KDD、ICDM等等,都有相關(guān)文獻(xiàn)發(fā)表。
文獻(xiàn)[2]中,孫君頂?shù)热嗽谛螤钐卣魈崛≈刑岢鲆环N新的圖像分塊形狀特征的描述方法,對圖像采用固定塊的分割方法。文獻(xiàn)[4]中,劉麗等人介紹了關(guān)于紋理特征的所有研究方法。文獻(xiàn)[6]中,趙書蓮在應(yīng)用研究過程中使用Hu不變矩算法進(jìn)行形狀特征的提取。在博士論文[11]中,朱蓉論述了所有視覺特征的提取方法。
隨著研究者在聚類技術(shù)上的不斷改進(jìn)和創(chuàng)新,許多新奇且高效的聚類算法層出不窮,針對特定的問題和用戶,許多學(xué)者研究出了多種具有代表性的聚類算法,并且廣泛地應(yīng)用于模式識別、生物信息、圖像處理以及數(shù)據(jù)挖掘等領(lǐng)域。
文獻(xiàn)[7]中,臧少杰介紹了所有聚類算法,并且將這些算法進(jìn)行了比較。文獻(xiàn)[8]中,路晶等人針對非監(jiān)督學(xué)習(xí),在基于EM算法啟發(fā)式迭代優(yōu)化算法的框架下,提出了6種多例聚類算法。文獻(xiàn)[9]中,周俊祥對模糊C-均值聚類(FCM,全稱為Fuzzy C-Means Algorithm)算法進(jìn)行改進(jìn),有效地降低了孤立點對圖像數(shù)據(jù)聚類結(jié)果的影響。
1 特征提取
基于視覺特征的網(wǎng)絡(luò)圖像特征有三個,分別為顏色、紋理、形狀。特征提取是將某一模式的一組測量值進(jìn)行變換,用以表現(xiàn)這一模式具有代表性特征的方法。通過影像分析和變換,以提取所需特征的方法。
1.1 顏色特征的提取
顏色特征的提取主要有四種方法,為顏色直方圖、顏色矩與顏色熵的研究、顏色相關(guān)圖的研究、
顏色聚合向量的研究。在這四種方法中,顏色矩與顏色熵的研究方法的分辨能力比較低,所以通常也必須和其他圖像特征結(jié)合起來進(jìn)行檢索。顏色相關(guān)圖的研究計算量很大,近些年來對于顏色相關(guān)圖的研究才剛剛起步,主要是結(jié)合其他方法一起來研究,在文獻(xiàn)[3]中作者介紹了一種基于顏色相關(guān)圖和小波變換的算法。顏色聚合向量的研究當(dāng)前也主要集中于與其他方法結(jié)合來進(jìn)行效果的改進(jìn)上,比如該文中作者在顏色直方圖的基礎(chǔ)之上采用了一種基于顏色聚合向量的方法從而提高了檢索的精度。而顏色直方圖具有相似度計算,有特征提取簡潔和不隨圖像尺度、旋轉(zhuǎn)等變化而變化的特點。所以顏色直方圖相較于其他方法更適合于顏色特征的提取。具體方法如下:
1.2紋理特征的提取
紋理是指在圖像中重復(fù)出現(xiàn)的局部模式及其排列規(guī)則。紋理特征與顏色特征相似,同樣也是一個整體性的特征。近年來,對紋理分析方法的種種理論或者方法在紋理特征提取中的實踐已然基本成形,Tuceryan和Jain將紋理特征提取的方法歸納為五大類,即結(jié)構(gòu)統(tǒng)計、 模型、信號處理、幾何和結(jié)構(gòu)家族。這種分類方法被大多學(xué)者所采納。
模型家族的方法能兼顧紋理局部的隨機性與整體上的規(guī)律性,而且有很強大的靈活性;主要優(yōu)勢是提供了用來表示空間上相關(guān)的隨機變量之間的相互作用的模型。它的不足在于模型系數(shù)的求解有難度,需要相當(dāng)大的計算量,往往需要迭代了數(shù)百次才能達(dá)到收斂。信號處理家族對紋理進(jìn)行多分辨描述,可以在更精準(zhǔn)的尺度之上分析紋理。但有有效性不佳和計算量大的缺陷。
而本文推薦使用的統(tǒng)計家族方法簡便,容易實現(xiàn),特別是灰度共生矩陣(GLCM,全稱為Gray Level Co-occurrence Matrix)方法是世界公認(rèn)的有效方法,具有比較強的適應(yīng)性。
灰度共生矩陣是被廣泛使用的紋理提取的算法,也是分析圖像的基礎(chǔ),它運用統(tǒng)計學(xué)當(dāng)中的概率來反映圖像灰度的有關(guān)方向和間隔等整體信息。其算法描述如下:
是圖像中任意一點,是圖像中移動后的另一點,因此形成一個點對, 是該點對的灰度值,即m是點的灰度值, n是點的灰度值。然后固定和,通過點的改動,來明確相應(yīng)的值,所以相應(yīng)灰度值的組合為(灰度值的級數(shù)為L)。對于研究的圖像,計算出值出現(xiàn)的頻率,化其積分為1,它的概率為,則灰度共生矩陣(灰度聯(lián)合概率密度)為。
對于有區(qū)別的紋理周期分布,就有不一樣的離差分值,即不一樣的與值。在紋理比較細(xì)致的情況下,選?。?,0),(0,1),(1,1),(-1,1)等小的差分值是非常有效果的。若與取值比較小,則表明紋理圖像變化情況遲緩,那么在灰度聯(lián)合概率矩陣對角線上的數(shù)值就相對較大,適合于做對角線分布;若與取值比較大,那么說明紋理變化愈快,則在灰度聯(lián)合概率矩陣對角線上的數(shù)值就愈小,適合于做均勻分布。一系列的紋理特征的y計量能夠通過灰度共生矩陣而得到,其中常用的有以下8個紋理特征值。
(1)角二階矩
(2)對比度其中。
(3)灰度相關(guān)其中分別為與的標(biāo)準(zhǔn)差和準(zhǔn)值。
(4)熵
(5)逆差矩其中k為常數(shù)且。
(6)最大概率
(7)相異
(8)反差
1.3 形狀特征的提取
形狀特征提取表示方法有2種,一種是區(qū)域特性,它主要是針對于圖像的整個形狀區(qū)域;另一種是輪廓特性,它主要針對于物體的外邊界。前人關(guān)于形狀特征提取的典型方法有:邊界特征值法、幾何參數(shù)法、形狀不變矩法、傅里葉形狀描述法等。本文采用Hu不變矩算法來提取形狀特征。
Hu不變矩是由Hu在1962年提出來的。不變矩是一種經(jīng)過提取具有平移、旋轉(zhuǎn)與比例不變性的圖像特征,不變矩的中心思想是使用對變換不敏感的基于區(qū)域的幾個矩陣作為形狀特征,從而進(jìn)行圖像識別的方法。矩不變量因為具有不隨圖像的位置、大小與方向而變化的特點,對于提取圖像中的形狀特征而言,是一個很常用的工具。
2 聚類分析
聚類是依據(jù)事物的某些屬性特性,將事物劃分成為不同類的過程,其目的是使得類間的相似性盡可能小,類內(nèi)的相似性盡可能大。在許多應(yīng)用當(dāng)中,聚類分析是一種數(shù)據(jù)預(yù)處理的過程,同時也是進(jìn)一步分析和處理數(shù)據(jù)的基礎(chǔ)。經(jīng)過恰當(dāng)?shù)木垲愃惴?,對事物的特征?shù)據(jù)進(jìn)行預(yù)處理,從而事物才便于研究,事物的內(nèi)部規(guī)律才可能被人類所掌握。
聚類算法大致可以分為以下幾種:劃分、層次、基于密度、基于網(wǎng)格和基于模型的聚類。
基于層次的聚類是將既定數(shù)據(jù)對象集合進(jìn)行層次的分解,雖然適用于任意形狀和任意屬性的數(shù)據(jù)集,但算法執(zhí)行時間長,不能回溯處理;基于密度的聚類是基于發(fā)現(xiàn)所有形狀的聚類結(jié)果,能夠用來過濾“噪聲”孤立點數(shù)據(jù),發(fā)現(xiàn)所有形狀的不同簇,但處理時間與每維空間所劃分的單元數(shù)相關(guān),一定程度上降低了聚類的質(zhì)量和準(zhǔn)確性;基于網(wǎng)格的聚類能夠處理所有類型的數(shù)據(jù),但這是以降低聚類的質(zhì)量和準(zhǔn)確度為代價的;基于模型的方法對每個簇假設(shè)了一個固定的模型,繼而找到對給定模型最佳擬合的數(shù)據(jù)。基于模型的算法能夠經(jīng)過搭建反映數(shù)據(jù)點空間分布的密度函數(shù)來確定聚類。
基于劃分的算法首先構(gòu)建一個初始的劃分,確定需要構(gòu)建的劃分?jǐn)?shù)目k。之后使用一種迭代的重定位技術(shù),通過對象在劃分間變動來改進(jìn)劃分,使在相同的類中對象之間盡可能接近或相近,相反不同類中的對象盡可能闊別或有差別。為了能夠達(dá)到全局的最優(yōu),基于劃分的聚類會需要列舉所有可能的劃分。實際上,大部分應(yīng)用采用了K-均值算法(K-Means)和K-中心點算法這兩種較流行的啟發(fā)式算法。
這兩種啟發(fā)式聚類算法對在中小規(guī)模的數(shù)據(jù)庫中找到球狀簇非常適用。下面主要介紹本文所采用的K-均值算法。
2.1 K-均值算法
K-均值算法的過程:
1.隨機選取k個數(shù)據(jù)點作為初始的種子聚類中心。
2.計算每個數(shù)據(jù)點與各個中資聚類中心之間的距離,把每個數(shù)據(jù)點分配給距離它最近的聚類中心。聚類中心以及分配給它的數(shù)據(jù)點就代表一個聚類。
3.重復(fù)以上步驟,直至達(dá)到以下任一條件便會終止:
(1)沒有(或最小數(shù)目)數(shù)據(jù)點被重新分配給不同的聚類。
(2)沒有(或最小數(shù)目)聚類中心再發(fā)生變化。
3.2 特征提取實驗
紋理特征提?。簭膱D像庫中選取100幅花朵類圖像,用統(tǒng)計家族的灰度共生矩陣(GLCM)提取其8維紋理特征。
形狀特征提?。簭膱D像庫中選取100幅花朵類圖像,選擇Hu不變矩方法提取其形狀特征。
3.3 具體分析過程
第一步:從圖像庫中選取兩組不同圖像,使用灰度共生矩陣和Hu不變矩提取各自的紋理和形狀特征;
第二步:利用K均值算法將這兩組圖像分別基于紋理和形狀特征進(jìn)行聚類,再從中分別選取60幅得到聚類中心的范圍,求出平均值;
第三步:分別從花朵類和美食類圖像中選取40幅圖像,將每幅圖像的紋理和形狀特征數(shù)值與平均值進(jìn)行歐式距離計算,距離較小時可認(rèn)為屬于該類,而后計算兩組數(shù)據(jù)的準(zhǔn)確率。
1)紋理特征的聚類結(jié)果
測試集中40幅花朵類圖像的紋理特征數(shù)據(jù)與訓(xùn)練集中花朵類圖像紋理特征數(shù)據(jù)平均值的歐式距離全都小于和訓(xùn)練集中美食類圖像紋理特征數(shù)據(jù)平均值的歐式距離,故實驗準(zhǔn)確率達(dá)到100.0%;測試集中40幅美食類圖像的紋理特征數(shù)據(jù)與訓(xùn)練集中美食類圖像紋理特征數(shù)據(jù)平均值的歐式距離全都小于和訓(xùn)練集中花朵類圖像紋理特征數(shù)據(jù)平均值的歐式距離,故實驗準(zhǔn)確率達(dá)到100.0%。紋理特征的比較結(jié)果如表1所示:
2)形狀特征的聚類結(jié)果
測試集中40幅花朵類圖像的形狀特征數(shù)據(jù)與訓(xùn)練集中花朵類圖像形狀特征數(shù)據(jù)平均值的歐式距離有28幅圖像的數(shù)值小于和訓(xùn)練集中美食類圖像形狀特征數(shù)據(jù)平均值的歐式距離,故實驗準(zhǔn)確率達(dá)到70.0%。測試集中40幅美食類圖像的形狀特征數(shù)據(jù)與訓(xùn)練集中美食類圖像形狀特征數(shù)據(jù)平均值的歐式距離有30幅圖像的數(shù)值小于和訓(xùn)練集中花朵類圖像形狀特征數(shù)據(jù)平均值的歐式距離,故實驗準(zhǔn)確率達(dá)到75.0%。形狀特征的比較結(jié)果如表2所示:
綜上所述:
1)花朵類圖像和美食類圖像在紋理上的有很大的相似性,因為花朵類圖像的紋理較細(xì)致,其基元較小,因而空間頻率較高,而美食類圖像的紋理較粗糙,其基元較大,空間頻率較低。
2)花朵類圖像和美食類圖像在形狀上的^別比較小,由于某些花朵的形狀與某些美食的形狀有相似性,如帶有花邊圖案的盤子所盛的美食的圖像和擺盤呈花型的美食圖像與花朵類圖像有很大的相似度,如圖1中的(a)圖與圖2中的(c)圖,會有較低的準(zhǔn)確率。而圖2中(a)圖的美食呈長方形,則會與花朵類圖像有很大的區(qū)別。
4 總結(jié)
基于視覺特征的圖像聚類研究中,花朵類圖像和美食類圖像在紋理和形狀上的聚類都有一定的準(zhǔn)確率,特別是在紋理的聚類上本次研究有著100.0%的準(zhǔn)確率。同時也有不足之處,本次研究并未融入顏色特征,針對特定的圖像也還需要進(jìn)一步研究具有區(qū)分度的特征。本文所用的K-均值算法只能應(yīng)用于那些均值能夠被定義的數(shù)據(jù)上。因此,它很難應(yīng)用到范疇數(shù)據(jù)上,且對于異常值異常敏感。所以現(xiàn)在所用的聚類算法未來要繼續(xù)改進(jìn),比如聚類中心的計算能夠?qū)崿F(xiàn)自適應(yīng)等。
基于視覺特征的圖像聚類方法研究涉及圖像搜索引擎、數(shù)字照片的個性化管理、敏感圖像的識別與過濾、藝術(shù)圖像鑒別等等,具有十分重要的現(xiàn)實意義,相關(guān)研究領(lǐng)域的最新知識與研究成果都可以創(chuàng)新性地應(yīng)用到解決各方面的問題中,以促進(jìn)圖像聚類技術(shù)的快速發(fā)展。
參考文獻(xiàn):
[1] 高進(jìn)樂,康耀紅,伍小芹.基于顏色特征圖像檢索方法的研究[J] .信息技術(shù),2008(11):4-7.
[2] 孫君頂,趙珊.圖像底層特征提取與檢索技術(shù)[M].北京:電子工業(yè)出版社,2009:49-85.
[3] 張篤振.基于顏色特征與LBP的圖像檢索算法研究[J] .微計算機應(yīng)用,2009,30(6):35-38.
[4] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國圖象圖形學(xué)報,2009(4).
[5] 王志瑞,閆彩良.圖像特征提取方法的綜述[J].吉首大學(xué)學(xué)報:自然科學(xué)版,2011(6).
[6] 趙書蓮.形狀分類及其在圖像檢索系統(tǒng)中的應(yīng)用研究[D].山東:山東師范大學(xué),2006.
[7] 臧少杰.基于視覺的聚類算法研究及應(yīng)用[D].山東.山東師范大學(xué),2008:1-49.
[8] 路晶等.基于多例學(xué)習(xí)的WEB圖像聚類[J].計算機研究與發(fā)展,2009,46(9):1462-1470.
[9] 周俊祥.改進(jìn)FCM的圖像聚類方法[J].計算機系統(tǒng)應(yīng)用,2011,20(7).
[10] 劉康苗.基于視覺與語義融合特征的階段式圖像聚類[J].浙江大學(xué)學(xué)報:工學(xué)版,2008,42(12).
[11] 朱蓉.基于語義的WEB圖像分類研究[D].浙江大學(xué),2011.
[12] 張建萍,劉希玉.基于聚類分析的K-means算法研究及應(yīng)用[J].計算機應(yīng)用,2007(5).
[13] 張講社,徐宗本.基于視覺系統(tǒng)的聚類:原理與算法[J].工程數(shù)學(xué)學(xué)報,2000(5).
關(guān)鍵詞:人機大戰(zhàn);人工智能;發(fā)展前景
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A
0.引言
2016年3月15日,備受矚目的“人機大戰(zhàn)”終于落下帷幕,最終Google公司開發(fā)的“AlphaGo”以4∶1戰(zhàn)勝了韓國九段棋手李世h。毫無疑問,這是人工智能歷史上一個具有里程碑式的大事件。大家一致認(rèn)為,人工智能已經(jīng)上升到了一個新的高度。
這次勝利與1997年IBM公司的“深藍(lán)”戰(zhàn)勝國際象棋世界冠軍卡斯帕羅不同。主要表現(xiàn)在兩個方面:
(1)AlphaGo的勝利并非僅僅依賴強悍的計算能力和龐大的棋譜數(shù)據(jù)庫取勝,而是AlphaGo已經(jīng)擁有了深度學(xué)習(xí)的能力,能夠?qū)W習(xí)已經(jīng)對弈過的棋盤,并在練習(xí)和實戰(zhàn)中不斷學(xué)習(xí)和積累經(jīng)驗。
(2)圍棋比國際象棋更加復(fù)雜,圍棋棋盤有361個點,其分支因子無窮無盡,19×19格圍棋的合法棋局?jǐn)?shù)的所有可能性是冪為171的指數(shù),這樣的計算量相當(dāng)巨大。英國圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡單的規(guī)則加深了棋局的復(fù)雜性”。因此,進(jìn)入圍棋領(lǐng)域一直被認(rèn)為是目前人工智能的最大挑戰(zhàn)。
簡而言之,AlphaGo取得勝利的一個很重要的方面就是它擁有強大的“學(xué)習(xí)”能力。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,得益于大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)。本文就從人工智能的發(fā)展歷程與現(xiàn)狀入手,在此基礎(chǔ)上分析了人工智能的未來發(fā)展前景。
1.人工智能的發(fā)展歷程
AlphaGo的勝利表明,人工智能發(fā)展到今天,已經(jīng)取得了很多卓越的成果。但是,其發(fā)展不是一帆風(fēng)順的,人工智能是一個不斷進(jìn)步,并且至今仍在取得不斷突破的學(xué)科?;仡櫲斯ぶ悄艿陌l(fā)展歷程,可大致分為孕育、形成、暗淡、知識應(yīng)用和集成發(fā)展五大時期。
孕育期:1956年以前,數(shù)學(xué)、邏輯、計算機等理論和技術(shù)方面的研究為人工智能的出現(xiàn)奠定了基礎(chǔ)。德國數(shù)學(xué)家和哲學(xué)家萊布尼茨把形式邏輯符號化,奠定了數(shù)理邏輯的基礎(chǔ)。英國數(shù)學(xué)家圖靈在1936年創(chuàng)立了自動機理論(亦稱圖靈機),1950年在其著作《計算機與智能》中首次提出“機器也能思維”,被譽為“人工智能之父”??傊?,這些人為人工智能的孕育和產(chǎn)生做出了巨大的貢獻(xiàn)。
形成期:1956年夏季,在美國達(dá)特茅斯大學(xué)舉辦了長達(dá)2個多月的研討會,熱烈地討論用機器模擬人類智能的問題。該次會議首次使用了“人工智能”這一術(shù)語。這是人類歷史上第一次人工智能研討會,標(biāo)志著人工智能學(xué)科的誕生。其后的十幾年是人工智能的黃金時期。在接下來的幾年中,在眾多科學(xué)家的努力下,人工智能取得了矚目的突破,也在當(dāng)時形成了廣泛的樂觀思潮。
暗淡期:20世紀(jì)70年代初,即使最杰出的AI程序也只能解決問題中最簡單的部分,發(fā)展遇到瓶頸也就是說所有的AI程序都只是“玩具”,無法解決更為復(fù)雜的問題。隨著AI遭遇批評,對AI提供資助的機構(gòu)也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。
知識應(yīng)用期:在80年代,“專家系統(tǒng)”(Expect System)成為了人工智能中一個非常主流的分支?!皩<蚁到y(tǒng)”是一種程序,為計算機提供特定領(lǐng)域的專門知識和經(jīng)驗,計算機就能夠依據(jù)一組從專門知識中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問題。不同領(lǐng)域的專家系統(tǒng)基本都是由知識庫、數(shù)據(jù)庫、推理機、解釋機制、知識獲取等部分組成。
集成發(fā)展期:得益于互聯(lián)網(wǎng)的蓬勃發(fā)展、計算機性能的突飛猛進(jìn)、分布式系統(tǒng)的廣泛應(yīng)用以及人工智能多分支的協(xié)同發(fā)展,人工智能在這一階段飛速發(fā)展。尤其是隨著深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)研究的不斷深入,人工智能在近幾十年中取得了長足的進(jìn)步,取得了令人矚目的成就。
人工智能發(fā)展到今天,出現(xiàn)了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個里程碑。當(dāng)前人工智能的研究熱點主要集中在自然語言處理、機器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
2.人工智能l展現(xiàn)狀與前景
人工智能當(dāng)前有很多重要的研究領(lǐng)域和分支。目前,越來越多的AI項目依賴于分布式系統(tǒng),而當(dāng)前研究的普遍熱點則集中于自然語言處理、機器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
自然語言處理:自然語言處理(Natural Language Processing,簡稱NLP),是語言學(xué)與人工智能的交叉學(xué)科,其主要功能就是實現(xiàn)讓機器明白人類的語言,這需要將人類的自然語言轉(zhuǎn)化為計算機能夠處理的機器語言。
自然語言處理主要包括詞法分析、句法分析和語義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對自然語言中句子的結(jié)構(gòu)、語法進(jìn)行分析如辨別疑問句和感嘆句等。而語義分析則注重情感分析和整個段落的上下文分析,辨別一些字詞在不同的上下文定的語義和情感態(tài)度。
當(dāng)前自然語言的處理主要有兩大方向。一種是基于句法-語義規(guī)則的理性主義理論,該理論認(rèn)為需要為計算機制定一系列的規(guī)則,計算機在規(guī)則下進(jìn)行推理與判斷。因此其技術(shù)路線是一系列的人為的語料建設(shè)與規(guī)則制定。第二種是基于統(tǒng)計學(xué)習(xí)的經(jīng)驗主義理論,這種理論在最近受到普遍推崇。該理論讓計算機自己通過學(xué)習(xí)并進(jìn)行統(tǒng)計推斷的方式不停地從數(shù)據(jù)中“學(xué)習(xí)”語言,試圖刻畫真實世界的語言現(xiàn)象,從數(shù)據(jù)中統(tǒng)計語言的規(guī)律。
機器學(xué)習(xí):機器學(xué)習(xí)(Machine Learning)是近20年來興起的人工智能一大重要領(lǐng)域。其主要是指通過讓計算機在數(shù)據(jù)中自動分析獲得規(guī)律,從而獲取“自我學(xué)習(xí)”的能力,并利用規(guī)律對未知數(shù)據(jù)進(jìn)行判斷和預(yù)測的方法。
機器學(xué)致可以分為有監(jiān)督的學(xué)習(xí)和無監(jiān)督的學(xué)習(xí)。有監(jiān)督的學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中練出一個函數(shù)和目標(biāo),當(dāng)有新的數(shù)據(jù)到來時,可以由訓(xùn)練得到函數(shù)預(yù)測目標(biāo)。有監(jiān)督的學(xué)習(xí)要求訓(xùn)練集同時有輸入和輸出,也就是所謂的特征和目標(biāo)。而依據(jù)預(yù)測的結(jié)果是離散的還是連續(xù)的,將有監(jiān)督的學(xué)習(xí)分為兩大問題,即統(tǒng)計分類問題和回歸分析問題。統(tǒng)計分類的預(yù)測結(jié)果是離散的,如腫瘤是良性還是惡性等;而回歸分析問題目標(biāo)是連續(xù)的,如天氣、股價等的預(yù)測。
無監(jiān)督學(xué)習(xí)的訓(xùn)練集則沒有人為標(biāo)注的結(jié)果,這就需要計算機去發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系并用來分類等。一種常見的無監(jiān)督學(xué)習(xí)是聚類分析(Cluster Analysis),它是將相似的對象通過靜態(tài)分類的方法分成不同的組別或者是特定的子集,讓同一個子集中的數(shù)據(jù)對象都有一些相似的屬性,比較常用的聚類方法是簡潔并快速的“K-均值”聚類算法。它基于K個中心并對距離這些中心最近的數(shù)據(jù)對象進(jìn)行分類。
機器學(xué)習(xí)還包括如半監(jiān)督學(xué)習(xí)和增強學(xué)習(xí)等類別。總而言之,機器學(xué)習(xí)是研究如何使用機器來模擬人類學(xué)習(xí)活動的一門學(xué)科,而其應(yīng)用隨著人工智能研究領(lǐng)域的深入也變得越來越廣泛,如模式識別、計算機視覺、語音識別、推薦算法等領(lǐng)域越來越廣泛地應(yīng)用到了機器學(xué)習(xí)中。
人工神經(jīng)網(wǎng)絡(luò):在腦神經(jīng)科學(xué)領(lǐng)域,人們認(rèn)為人類的意識及智能行為,都是通過巨大的神經(jīng)網(wǎng)絡(luò)傳遞的,每個神經(jīng)細(xì)胞通過突出與其他神經(jīng)細(xì)胞連接,當(dāng)通過突觸的信號強度超過某個閾值時,神經(jīng)細(xì)胞便會進(jìn)入激活狀態(tài),向所連接的神經(jīng)細(xì)胞一層層傳遞信號。于1943年提出的基于生物神經(jīng)元的M-P模型的主要思想就是將神經(jīng)元抽象為一個多輸入單輸出的信息處理單元,并通過傳遞函數(shù)f對輸入x1,x2…,xn進(jìn)行處理并模擬神經(jīng)細(xì)胞的激活模式。主要的傳遞函數(shù)有階躍型、線性型和S型。
在此基礎(chǔ)上,對神經(jīng)網(wǎng)絡(luò)算法的研究又有諸多進(jìn)展。日本的福島教授于1983年基于視覺認(rèn)知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計算模型。通過學(xué)習(xí)訓(xùn)練獲取到卷積運算中所使用的卷積系數(shù),并通過不同層次與自由度的變化,可以得到較為優(yōu)化的計算結(jié)果。而AlphaGo也正是采用了這種深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型,提高了AlphaGo的視覺分類能力,也就是所謂的“棋感”,增強了其對全盤決策和把握的能力。
3.人工智能的發(fā)展前景
總體來看,人工智能的應(yīng)用經(jīng)歷了博弈、感知、決策和反饋這幾個里程碑。在以上4個領(lǐng)域中,既是縱向發(fā)展的過程,也是橫向不斷改進(jìn)的過程。
人工智能在博弈階段,主要是實現(xiàn)邏輯推理等功能,隨著計算機處理能力的進(jìn)步以及深度學(xué)習(xí)等算法的改進(jìn),機器擁有了越來越強的邏輯與對弈能力。在感知領(lǐng)域,隨著自然語言處理的進(jìn)步,機器已經(jīng)基本能對人類的語音與語言進(jìn)行感知,并且能夠已經(jīng)對現(xiàn)實世界進(jìn)行視覺上的感知?;诖髷?shù)據(jù)的處理和機器學(xué)習(xí)的發(fā)展,機器已經(jīng)能夠?qū)χ車沫h(huán)境進(jìn)行認(rèn)知,例如微軟的Kinect就能夠準(zhǔn)確的對人的肢體動作進(jìn)行判斷。該領(lǐng)域的主要實現(xiàn)還包括蘋果的Siri,谷歌大腦以及無人駕駛汽車中的各種傳感器等。在以上兩個階段的基礎(chǔ)上,機器擁有了一定的決策和反饋的能力。無人駕駛汽車的蓬勃發(fā)展就是這兩個里程碑很好的例證。Google的無人駕駛汽車通過各種傳感器對周圍的環(huán)境進(jìn)行感知并處理人類的語言等指令,利用所收集的信息進(jìn)行最后的決策,比如操作方向盤、剎車等。
人工智能已經(jīng)滲透到生活中的各個領(lǐng)域。機器已經(jīng)能識別語音、人臉以及視頻內(nèi)容等,從而實現(xiàn)各種人際交互的場景。在醫(yī)學(xué)領(lǐng)域,人工智能可以實現(xiàn)自動讀片和輔助診斷以及個性化t療和基因排序等功能。在教育領(lǐng)域,機器也承擔(dān)了越來越多的輔助教育,智能交互的功能。在交通領(lǐng)域,一方面無人車的發(fā)展表明無人駕駛是一個可以期待的未來,另一方面人工智能能夠帶來更加通暢和智能的交通。另外人工智能在安防、金融等領(lǐng)域也有非常廣闊的發(fā)展前景。總之,人工智能在一些具有重復(fù)性的和具備簡單決策的領(lǐng)域已經(jīng)是一種非常重要的工具,用來幫助人們解決問題,創(chuàng)造價值。
參考文獻(xiàn)
[1]阮曉東.從AlphaGo的勝利看人工智能的未來[J].新經(jīng)濟導(dǎo)刊,2016 (6):69-74.
關(guān)鍵詞:PCB;圖像處理;視覺檢測
中圖分類號:TP277文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2012)07-1648-06
當(dāng)今世界科技發(fā)展日新月異,電子產(chǎn)業(yè)的發(fā)展直接制約著國民經(jīng)濟的騰飛與否,而PCB電路板制作工藝的提高對促進(jìn)電子產(chǎn)業(yè)的發(fā)展至關(guān)重要,能否有效精確地檢測PCB電路板的缺陷一直都是電子行業(yè)的研究熱點。國外的印刷電路板自動檢測技術(shù)一直領(lǐng)先于國內(nèi),國內(nèi)的很多廠家不得不采用昂貴的外國技術(shù),雖然近年國內(nèi)的印刷電路板自動檢測技術(shù)發(fā)展迅速,但大都沒有取得令人非常滿意的結(jié)果。加入研究這一領(lǐng)域的熱潮,趕超外國的先進(jìn)技技水平,打斷外國壟斷技術(shù),對于發(fā)展國民經(jīng)濟具有十分重要的意義。
1 PCB檢測系統(tǒng)的硬件設(shè)計
1.1 PCB檢測系統(tǒng)的硬件組成框圖
雖然本文所做的工作主要是軟件方面,但對于硬件系統(tǒng)的設(shè)計也是至關(guān)重要的,它對于建立有效的計算機視覺識別檢測系統(tǒng),起著決定性作用。因此,必須在綜合考慮系統(tǒng)性價比和系統(tǒng)性能的基礎(chǔ)上,設(shè)計出合理的硬件系統(tǒng)[9]。PCB檢測系統(tǒng)的硬件組成框圖如圖1所示:圖1 PCB檢測系統(tǒng)硬件組成框圖
1.2系統(tǒng)的硬件組成
系統(tǒng)的硬件組成[10]主要包括:計算機主機、CCD攝像機、圖像采集卡、照明系統(tǒng)及相關(guān)的設(shè)備。
2 PCB電路板缺陷檢測識別
PCB電路板在電子工業(yè)中的應(yīng)用越來越廣泛,如何降低電路板的故障率、提高電路板的質(zhì)量直接影響到整個產(chǎn)業(yè)的發(fā)展。因此,對于PCB電路板缺陷的識別技術(shù)的發(fā)展至關(guān)重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過焊等等,由于實驗室設(shè)備限制和個人水平所限,本文主要研究的內(nèi)容是PCB電路板短路與斷路的檢測識別
近年來出現(xiàn)了很多圖像檢測算法,這些算法大致可分為三大類:有參考算法、無參考算法以及混合型算法。有參考算法分為兩大類:圖像對比法和模型對比法。無參考算法是一種不需要標(biāo)準(zhǔn)圖像的檢測算法,它是基于一定的設(shè)計規(guī)則來進(jìn)行檢測的?;旌闲头椒ㄊ菍⒂袇⒖妓惴ㄅc無參考算法混合使用,從而發(fā)揮出各自的優(yōu)點。比如,模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用,或者連接表方法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用等。本文中短路與斷路的檢測識別采取了圖像對比法,即將經(jīng)過一定處理后的圖像進(jìn)行相減,從而分析相應(yīng)的結(jié)果;而對焊點缺陷的識別主要采用模板匹配法與數(shù)學(xué)形態(tài)學(xué)方法結(jié)合使用。
2.1 PCB電路板缺陷檢測識別的主要流程圖
圖2為子程序流程圖;圖3為主程序流程圖。
2.2 PCB電路板短路與斷路的檢測識別
2.2.1邊緣檢測
在對圖像進(jìn)行基本的處理過后可以將圖像與背景分割開來。邊緣檢測是圖像處理和計算機視覺中的基本問題,邊緣檢測的目的是標(biāo)識數(shù)字圖像中亮度變化明顯的點。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。
這些包括:深度上的不連續(xù);表面方向不連續(xù);物質(zhì)屬性變化;場景照明變化。邊緣檢測是圖像處理和計算機視覺中,尤其是特征提取中的一個研究領(lǐng)域。
圖像邊緣檢測大幅度地減少了數(shù)據(jù)量,并且剔除了可以認(rèn)為不相關(guān)的信息,保留了圖像重要的結(jié)構(gòu)屬性。有許多方法用于邊緣檢測,它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類?;诓檎业姆椒ㄍㄟ^尋找圖像一階導(dǎo)數(shù)中的最大和最小值來檢測邊界,通常是將邊界定位在梯度最大的方向?;诹愦┰降姆椒ㄍㄟ^尋找圖像二階導(dǎo)數(shù)零穿越來尋找邊界,通常是Laplacian過零點或者非線性差分表示的過零點。
1)Roberts算子
邊緣,是指周圍像素灰度有階躍變化或屋頂?shù)茸兓哪切┫袼氐募稀D像的邊緣對應(yīng)著圖像灰度的不連續(xù)性。顯然圖像的邊緣很少是從一個灰度跳到另一個灰度這樣的理想狀況。真實圖像的邊緣通常都具有有限的寬度呈現(xiàn)出陡峭的斜坡狀。邊緣的銳利程度由圖像灰度的梯度決定。梯度是一個向量,?f指出灰度變化的最快的方向和數(shù)量,如式2-1所示。
?f=(決定的。
因此最簡單的邊緣檢測算子是用圖像的垂直和水平差分來逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)
因此當(dāng)我們想尋找邊緣的時候,最簡單的方法是對每一個像素計算出(2,4)的向量,然后求出他的絕對值,然后進(jìn)行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。
R(i,j)=
(式2-5)
它是一個兩個2×2模板作用的結(jié)果。
2)Sobel算子
該算法通過2個3*3的模板,對選定的二維圖像中同樣大小窗口進(jìn)行卷積,通常是一個模板對一個邊緣響應(yīng)大,另一個模板對水平邊緣響應(yīng)大,兩個卷積值對最大值作為該點對輸出。對于圖像上的任意點(i,j)進(jìn)行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。
用sobel算子檢測階躍邊緣得到的邊緣寬度至少為兩個寬度。3)Laplacian邊緣檢測算子
Laplacian算子定義由式2-9所示。
Δ2f(x,y)=
(式2-9)它的差分形式由式2-10所示。
Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}
=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)
Laplacian算子是一種各向同性算子,在只關(guān)心邊緣的位置而不考慮其周圍的灰度象素差值時時比較合適,Laplacian算子對孤立象素的響應(yīng)要比對邊緣或線的響應(yīng)更要強烈,因此只適用于無噪聲圖像。
原圖像與用三種邊緣檢測算子處理后的圖像如下所示:圖6 Sobel邊緣檢測圖7 Laplacian邊緣檢測
從上面四幅圖分析比較可得出結(jié)論:用Roberts邊緣檢測得出的圖像較之其他方法更為清晰,噪點更少,圖像更為連續(xù),所以本文中采用Roberts算子來進(jìn)行邊緣檢測。
2.2.2閾值分割
閾值分割法是一種基于區(qū)域的圖像分割技術(shù),其基本原理是:通過設(shè)定不同的特征閾值,把圖像象素點分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設(shè)原始圖像為f(x,y),按照一定的準(zhǔn)則f(x,y)中找到特征值T,將圖像分割為兩個部分,分割后的圖像為:
若?。篵0=0(黑),b1=1(白),即為我們通常所說的圖像二值化。
在數(shù)字化的圖像數(shù)據(jù)中,無用的背景數(shù)據(jù)和對象物的數(shù)據(jù)經(jīng)常放在一起,同時,圖像中還含有各種噪聲,因此可以根據(jù)圖像的統(tǒng)計性質(zhì),從概率的角度來選擇合適的閾值。
1)最大方差閾值法
把待處理圖像的直方圖在某一閾值處分割為兩組,當(dāng)被分割成的兩組間的方差最大時,便可以決定閾值了。
設(shè)灰度圖像f(x,y)的灰度級為0-L,灰度級I的像素為Ni,則圖中:
總象素數(shù)N=∑j=0 i=LNi(式2-11)灰度級i出現(xiàn)的概率Pi= 1-ω(K)(式2-16)則兩組間的數(shù)學(xué)期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)
ρ2(k)是K的函數(shù),計算k取從0,1,2…L時ρ2(k)的值,當(dāng)多的值為最大時,K即為閾值。
2)雙峰法
根據(jù)圖像的直方圖具有背景和對象物的兩個峰,分割兩個區(qū)域的閾值由兩個峰值之間的谷所對應(yīng)的灰度值決定。設(shè)灰度圖像f(x,y)的灰度級為0-L,灰度i的像素為Pi,分別計算
因為實際PCB電路板有著許多的劃痕、污點等,使用最大方差閾值法時,會在處理后的圖像上產(chǎn)生許多誤點,而影響實際結(jié)果的分析,而雙峰法能夠順利地濾除這些干擾,這個結(jié)論在分析對比以上圖像時也可得出。所以本文選用了雙峰法來進(jìn)行閾值分割。
2.2.3粒子分析與圖像對比
經(jīng)過邊緣檢測和閾值分割的圖像中會存在許多瑕點,這些點會影響到最后的圖像識別與分析,有可能會增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進(jìn)行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析
將標(biāo)準(zhǔn)PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。
將缺陷PCB圖片減去標(biāo)準(zhǔn)PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。
3結(jié)束語
利用LABVIEW來進(jìn)行PCB電路板缺陷的識別與檢測是一項非常好的課題,它在近些年已經(jīng)得到了一定的發(fā)展,并將得到更大的進(jìn)步。限于本人能力和時間,本文的研究還未涉及很深的領(lǐng)域,可以在以下方面加以改進(jìn):
1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設(shè)計可以再利用其他語言如VISUAL BASIC,C++等編程語言加以輔助設(shè)計,相信可以取得更加令人滿意的結(jié)果。
2)由于實驗設(shè)備等其他因素,本文中只重點研究了PCB電路板短路與斷路的檢測識別,PCB電路板的其他缺陷還有待于進(jìn)一步的分析研究、分類和總結(jié),并設(shè)計出更好的檢測方法,以真正滿足PCB電路板檢測的需求。
3)照明設(shè)備的限制在很大程度上影響到了圖像的檢測效果,為取得PCB缺陷檢測的進(jìn)一步進(jìn)展,在照明設(shè)備的選擇上必須重視,并且設(shè)計出更好的圖像采集系統(tǒng)。
4)在識別與檢測手段上,可以引入更新更好的方法,而不要局限于在傳統(tǒng)的方法中分析比較,例如基于BP神經(jīng)網(wǎng)絡(luò)的識別檢測,圖像的模糊決策等將有待于進(jìn)一步研究。
總之,基于LABVIEW的機器視覺檢測系統(tǒng)已經(jīng)取得了不錯的進(jìn)展,高速發(fā)展的PCB制造技術(shù)和計算機技術(shù)對于PCB缺陷的檢測提出了更高的要求,同時也大大地促進(jìn)了PCB缺陷檢測技術(shù)的發(fā)展。利用機器視覺檢測在未來的較長的一段時間內(nèi)將占據(jù)檢測行業(yè)的半壁江山,相信在未來會取得更大的發(fā)展。
參考文獻(xiàn):
[1]程學(xué)慶,房曉溪.LabVIEW圖形化編程與實例應(yīng)用[M].北京:中國鐵道出版社,2005.
[2]胡仲波.基于虛擬儀器技術(shù)的PCB視覺檢測系統(tǒng)[D].南京:南京理工大學(xué)碩士學(xué)位論文,2006.
[3]段峰,王耀南.機器視覺技術(shù)及其應(yīng)用綜述[J].自動化博覽,2002,19(3).
[4]周長發(fā).精通Visual C++圖像處理編程[M].北京:電子工業(yè)出版社,2004.
[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設(shè)計從入門到精通[M].北京:清華大學(xué)出版社,2007.
[6]鄭偉.圖像法檢測印刷電路板缺陷[M].西安:西安理工大學(xué),2002.
[7] National Instruments,IMAQ User Manual Concepts[Z].1999.
[8]李強.PCB板缺陷自動檢測技術(shù)的分析研究[D].合肥:合肥工業(yè)大學(xué),2002.
[9]傅茂名.基于形態(tài)邊緣檢測算法的一種改進(jìn)[J].電子科技大學(xué)學(xué)報,2005(2).
[10]王思華.計算機視覺新技術(shù)及其在IC標(biāo)記質(zhì)量檢驗系統(tǒng)設(shè)計中的應(yīng)用[J].電子技術(shù)應(yīng)用,2000(9).
[11]岳永哲.圖像處理技術(shù)在閱卷系統(tǒng)中的應(yīng)用[D].北京:北京工業(yè)大學(xué),2006.
[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.
[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.
[14]高育鵬,楊俊,何廣軍.基于圖像識別的自動閱卷系統(tǒng)研究[J].現(xiàn)代電子期刊,2006(22).
[15]楊青燕,彭延軍.基于灰度圖像的答題卡識別技術(shù)[J].山東科技大學(xué)學(xué)報:自然科學(xué)版,2009(3).
[16]周海濤,韓曉軍.基于數(shù)字圖像處理的答題卡識別方法研究[J].電腦知識與技術(shù),2008(28).
[17]周萬珍,鄭廣,王建霞,等.數(shù)字圖像處理技術(shù)在客觀題閱卷中的應(yīng)用[J].數(shù)學(xué)的實踐與認(rèn)識,2006(8).
[18]王勝春.基于SVM的信息卡識別系統(tǒng)[D].長沙:湖南師范大學(xué),2008.
[19]吳志明.SMT系統(tǒng)中焊點位置的檢測[D].哈爾濱:哈爾濱工業(yè)大學(xué),2006.
[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點信息的自動獲取[J].焊接學(xué)報,2005,39(6).