公務(wù)員期刊網(wǎng) 精選范文 計(jì)算機(jī)視覺的展望范文

計(jì)算機(jī)視覺的展望精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺的展望主題范文,僅供參考,歡迎閱讀并收藏。

計(jì)算機(jī)視覺的展望

第1篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:計(jì)算機(jī)圖形學(xué);計(jì)算機(jī)視覺;可視化技術(shù)

中圖分類號(hào):TM862 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2017)01-0054-02

計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)三者均是計(jì)算機(jī)領(lǐng)域重要組成部分,要做好計(jì)算機(jī)知識(shí),就要先學(xué)好計(jì)算機(jī)圖形學(xué),但計(jì)算機(jī)圖形學(xué)學(xué)習(xí)相對(duì)枯燥,尤其是算法教學(xué)難以理解,為解決這一問題,計(jì)算機(jī)視覺與可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)中。可見,三者之間存在一定的聯(lián)系,因此,有必要對(duì)計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)展開研究。

1 計(jì)算機(jī)圖形學(xué)概述

1.1 計(jì)算機(jī)圖形學(xué)目的

所謂的計(jì)算機(jī)圖形學(xué)實(shí)際上就是怎樣利用計(jì)算機(jī)表示圖形,并利用計(jì)算機(jī)完成圖形計(jì)算與處理,而這一過程的實(shí)現(xiàn)需要得到相關(guān)算法的支持。學(xué)習(xí)計(jì)算機(jī)圖形學(xué)的目的是利用計(jì)算機(jī)技術(shù)為人們呈現(xiàn)既帶有美感又不缺真實(shí)的圖形(如下圖1所示),為實(shí)現(xiàn)這一目標(biāo),就需要按照?qǐng)D形的要求創(chuàng)設(shè)合適的場(chǎng)景,并在一些光照模型的作用下,做好光照效果設(shè)計(jì),在這一過程中需要計(jì)算機(jī)圖形學(xué)能夠與其他計(jì)算機(jī)技術(shù)相配合。經(jīng)過計(jì)算機(jī)圖形學(xué)出來的圖像,多會(huì)以數(shù)字圖像的方式展示出來,總的來說,計(jì)算機(jī)圖形學(xué)與圖像處理之間存在著一定的聯(lián)系[1]。計(jì)算機(jī)圖形學(xué)的涉及范圍相對(duì)寬泛,不僅有圖形硬件設(shè)計(jì),還包括動(dòng)畫制作,虛擬現(xiàn)實(shí)等多個(gè)部分。此外,計(jì)算機(jī)圖形學(xué)在動(dòng)畫制作中的應(yīng)用頻率也很高,如45分鐘一集的動(dòng)畫影片中,85%的畫面都需要用算機(jī)圖形學(xué)來完成,由此可見,計(jì)算機(jī)圖形學(xué)的應(yīng)用頻率極高,并在動(dòng)畫制作中發(fā)揮著不可替代的作用。因此,應(yīng)重視計(jì)算機(jī)圖形學(xué)的應(yīng)用。

1.2 計(jì)算機(jī)圖形學(xué)應(yīng)用

隨著計(jì)算機(jī)圖形學(xué)的發(fā)展,它被應(yīng)用到各個(gè)領(lǐng)域中,并發(fā)揮著重要作用。首先,在計(jì)算機(jī)輔助設(shè)計(jì)與制造中的應(yīng)用,這是計(jì)算機(jī)圖形學(xué)應(yīng)用最多的領(lǐng)域,在計(jì)算機(jī)圖形學(xué)被應(yīng)用以后,不僅可以設(shè)計(jì)出更精準(zhǔn)的圖形,還能做好人機(jī)交互設(shè)計(jì),強(qiáng)化修改能力。計(jì)算機(jī)圖形學(xué)還被應(yīng)用到三維形體重建中,利用該技術(shù)可以將原理的二維信息轉(zhuǎn)化為三維信息,如在某次工程圖紙?jiān)O(shè)計(jì)中就應(yīng)用了計(jì)算機(jī)圖形學(xué),經(jīng)過一系列的處理以后,三維形體逐漸形成,最終實(shí)現(xiàn)了重建。其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用多以計(jì)算可視化的形式展示出來,如在腦部手術(shù)中,醫(yī)生為看清患處真實(shí)情況,經(jīng)常需要利用在可視化技術(shù)的作用下將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像,這時(shí)就體現(xiàn)了計(jì)算機(jī)圖形學(xué)在其中的應(yīng)用[2]。再者,在計(jì)算機(jī)動(dòng)畫中的應(yīng)用,人們看到的動(dòng)畫影片就是計(jì)算機(jī)圖形學(xué)作用的結(jié)果,以動(dòng)畫人物的行走為例,為保證動(dòng)畫人物的行走與自然人不存在過大差異,就需要應(yīng)用大量的計(jì)算機(jī)技術(shù),并在計(jì)算機(jī)圖形學(xué)的作用下完成設(shè)計(jì)。最后,在計(jì)算機(jī)藝術(shù)中的應(yīng)用。計(jì)算機(jī)圖形學(xué)在計(jì)算機(jī)藝術(shù)中也有廣泛應(yīng)用,它不僅可以用于藝術(shù)制作,很多場(chǎng)景都是通過計(jì)算機(jī)圖形學(xué)來完成的,現(xiàn)階段,一些人正在利用計(jì)算機(jī)圖形學(xué)創(chuàng)設(shè)人體模擬系統(tǒng),其目的是讓已故人士再次出現(xiàn)在熒屏上,這一目標(biāo)的實(shí)現(xiàn)就需要得到計(jì)算機(jī)圖形學(xué)的支持。

2 計(jì)算機(jī)視覺技術(shù)

2.1 計(jì)算機(jī)視覺技術(shù)含義

所謂的計(jì)算機(jī)視覺技術(shù),實(shí)際上就是用計(jì)算機(jī)取代人眼做識(shí)別、跟蹤以及測(cè)量等,同時(shí)也兼顧圖形處理,其目的是讓圖像在計(jì)算機(jī)被處理以后更適于識(shí)別。對(duì)于計(jì)算機(jī)視覺技術(shù)來說,意在實(shí)現(xiàn)人工智能,主要是從圖像與多維數(shù)據(jù)等方面實(shí)現(xiàn)人工智能系統(tǒng)設(shè)計(jì)[3]。計(jì)算機(jī)視覺是一種在相關(guān)理論與模型基礎(chǔ)上發(fā)展起來的視覺系統(tǒng),其主要構(gòu)成部分有以下幾種:

(1)程序控制,這一點(diǎn)主要體現(xiàn)在機(jī)器人設(shè)計(jì)上;(2)事件檢測(cè),多體現(xiàn)在圖像監(jiān)測(cè)上;(3)信息組織,主要體現(xiàn)在圖像數(shù)據(jù)庫等方面。計(jì)算機(jī)視覺三個(gè)階段如圖2所示,通過觀察圖1可以發(fā)現(xiàn),計(jì)算機(jī)視覺存在于圖像處理始終,從早期處理直到后期結(jié)束都存在,最終實(shí)現(xiàn)了3D描述,可見,計(jì)算機(jī)視覺具有十分重要的作用[4]。

2.2 計(jì)算機(jī)視覺技術(shù)的應(yīng)用

現(xiàn)階段,現(xiàn)代社會(huì)已經(jīng)進(jìn)入信息化時(shí)代,計(jì)算機(jī)技術(shù)也被應(yīng)用到各個(gè)領(lǐng)域,并發(fā)揮著重要作用。計(jì)算機(jī)視覺的應(yīng)用促使計(jì)算機(jī)實(shí)現(xiàn)了智能化,在該技術(shù)的支持下,計(jì)算機(jī)可以像人一樣透過視覺看待世界萬物,且具有良好的適應(yīng)能力,但這一目標(biāo)的實(shí)現(xiàn)還需要很長時(shí)間,需要一系列的努力才能實(shí)現(xiàn)。現(xiàn)階段,計(jì)算機(jī)視覺應(yīng)用最多的就是車輛視覺導(dǎo)航,然而,這種導(dǎo)航還沒有實(shí)現(xiàn)完全自主導(dǎo)航,這也是需要進(jìn)一步研究的地方。計(jì)算機(jī)視覺技術(shù)的適應(yīng)性較好,特別適合在工業(yè)領(lǐng)域應(yīng)用,即便是存在電子在干擾或溫度變化較大的地方都能很好的運(yùn)行,其整體效果也不會(huì)受到影響,再者,計(jì)算機(jī)視覺技術(shù)的嵌入性較好,成本相對(duì)較低,尤其適合在PC方案中使用,同時(shí),具有一定的非接觸能力,能夠獲取大量信息,且不受距離限制,總的來說,計(jì)算機(jī)視覺技術(shù)總體效果較好,適合利用在各種工業(yè)環(huán)境中應(yīng)用,因此,應(yīng)重視計(jì)算機(jī)視覺技術(shù)的應(yīng)用[5]。同時(shí)計(jì)算機(jī)視覺還被應(yīng)用到移動(dòng)機(jī)器人設(shè)計(jì)中,主要是利用小波模板展示人體形態(tài),然后做圖像掃描,這樣就可以順利完成小波變換,進(jìn)而了解到人的存在。同樣,將計(jì)算機(jī)視覺應(yīng)用到機(jī)器人設(shè)計(jì)上,可以自動(dòng)檢測(cè)出正在行動(dòng)的人或車輛,而無法檢測(cè)到靜止的人,之所以會(huì)出現(xiàn)這樣情況,主要是由于其中采用率步態(tài)分析法。

3 可視化技術(shù)

3.1 可視化技術(shù)含義

可視化技術(shù)是一種綜合了計(jì)算機(jī)圖形學(xué)與圖像處理于一體的技術(shù),它可以將復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為圖像并在屏幕上展示出來。在可視化技術(shù)中,融合了以上兩種技術(shù)的特點(diǎn),并在多個(gè)領(lǐng)域都有應(yīng)用,隨著可視化技術(shù)的應(yīng)用,不僅有效實(shí)現(xiàn)了數(shù)據(jù)表示,還強(qiáng)化了數(shù)據(jù)處理能力,更對(duì)數(shù)據(jù)決策分析有一定作用[6]。現(xiàn)階段,虛擬現(xiàn)實(shí)技術(shù)已經(jīng)成為可視化技術(shù)主要發(fā)展方向。

3.2 可視化技術(shù)的應(yīng)用

首先,在計(jì)算機(jī)圖形學(xué)教學(xué)中的應(yīng)用,計(jì)算機(jī)圖形學(xué)相對(duì)枯燥,相關(guān)知識(shí)也很抽象,不便于學(xué)生理解,在計(jì)算機(jī)圖形學(xué)中最重要的部分是曲線曲面,而這些曲線曲面多是與數(shù)學(xué)模型有關(guān),具有一定的抽象性,學(xué)生理解難度較大,以往教師只能通過一系列的公式演算幫助學(xué)生理解,盡管這樣依然難以讓學(xué)生掌握曲線變化情況,學(xué)生依舊無法正確理解。為減少這種情況的發(fā)生,可視化技術(shù)被應(yīng)用到計(jì)算機(jī)圖形學(xué)教學(xué)中,教師將抽象的知識(shí)用動(dòng)畫的形式展示出來,學(xué)生只要觀看動(dòng)畫,拖動(dòng)一定的控制點(diǎn)就可以了解到曲線變化情況,這樣一來不僅增加了教學(xué)趣味性,學(xué)生也可以隨意變動(dòng)曲線,讓復(fù)雜的知識(shí)變得簡單,深化學(xué)生對(duì)計(jì)算機(jī)圖形學(xué)知識(shí)的深度理解,同時(shí),利用可視化技術(shù)在一定條件下,還可以完成代碼編譯,如在Actoin ScriPt中做編譯,這樣也可以增強(qiáng)學(xué)生的理解能力[7]。

其次,在醫(yī)學(xué)領(lǐng)域中的應(yīng)用。醫(yī)學(xué)領(lǐng)域?qū)τ诳梢暬夹g(shù)的應(yīng)用主要體現(xiàn)在放射治療與矯正手術(shù)上。通過可視化技術(shù)可以屏幕上看到手術(shù)整個(gè)過程,并將原來細(xì)節(jié)部位放大,手術(shù)醫(yī)生觀察的更加細(xì)致,手術(shù)成功幾率也會(huì)大幅度提升,患者生命也能得到保證(如圖3所示)。如在對(duì)某名患者進(jìn)行身體檢查的過程中需要應(yīng)用到可視化技術(shù),由于通過檢查會(huì)獲得大量數(shù)據(jù),而這些數(shù)據(jù)又相對(duì)復(fù)雜,但在可視化技術(shù)下就可以通過圖表、曲線圖或立柱圖的方式展示出來,經(jīng)過可視化技術(shù)的作用,了解到患者的血糖為5.6mmol/L,醫(yī)生可以根這一數(shù)據(jù)做出診斷,而不必再分析這些數(shù)據(jù)。據(jù)不完全統(tǒng)計(jì),80%的醫(yī)療檢查工作都是需要利用可視化技術(shù)。

地質(zhì)勘探是我國最重要的工作之一,由于多數(shù)礦藏都深埋地下,即便使用探測(cè)儀受多種因素影響也無法了解到實(shí)際礦藏情況,這就需要應(yīng)用到可視化技術(shù),在可視化技術(shù)的作用下,相關(guān)工作人員可以了解到地下有無礦藏,如果存在礦藏,相關(guān)工作人員也可以了解到礦藏所在位置與實(shí)際儲(chǔ)備量,進(jìn)而為礦藏開采奠定基礎(chǔ)。如在地質(zhì)勘探中,相關(guān)工作人員利用可視化技術(shù)做地形圖整理,然后從中提取地形數(shù)據(jù),再用CATIA做導(dǎo)入,這樣就可以完成地形模型創(chuàng)建,這樣就完成了三維地質(zhì)模型創(chuàng)建工作,同時(shí)在相關(guān)工作臺(tái)的影響下,還可以完成地形數(shù)據(jù)導(dǎo)入,進(jìn)而生成一定的地形云點(diǎn),如果其中存在錯(cuò)誤,可視化技術(shù)也可以將其中的錯(cuò)誤內(nèi)容刪除,這些都是可視化技術(shù)所帶來的好處[8]。由此可見,可視化技術(shù)已經(jīng)成為地質(zhì)勘探中不缺少的技術(shù)。

最后,在氣象預(yù)報(bào)中的應(yīng)用(如圖4所示)。利用可視化技術(shù)能夠?qū)?shù)據(jù)轉(zhuǎn)化為圖像,通過觀察圖像就可以了解到云層變化情況,同時(shí)也能了解到實(shí)際風(fēng)力大小與風(fēng)走向等,氣象預(yù)報(bào)人員就可以根據(jù)圖像做出精準(zhǔn)分析,需要了解氣象變化的人也能了解到現(xiàn)實(shí)情況,如果氣象條件惡劣,相關(guān)工作人員也可以及時(shí)做出工作調(diào)整,減少危險(xiǎn)事件的發(fā)生。據(jù)不完全統(tǒng)計(jì),可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用頻率高達(dá)100%,由此挽回的經(jīng)濟(jì)損失高達(dá)13.2億元,可見,可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用十分有必要,因此,應(yīng)重視可視化技術(shù)在氣象預(yù)報(bào)中的應(yīng)用。

4 結(jié)語

通過以上研究得知,計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)三者各具特色,三者間也存在一定的關(guān)系,尤其是可視化技術(shù)綜合了前兩者的特點(diǎn),并融合了其他技術(shù),在很多領(lǐng)域中都有應(yīng)用。可視化技術(shù)是現(xiàn)階段應(yīng)用最多的一種技術(shù),在計(jì)算機(jī)圖形學(xué)教學(xué)中也有應(yīng)用,并發(fā)揮著不可替代的作用。本文分析了計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺以及可視化技術(shù)的含義與應(yīng)用,希望能為相關(guān)人士帶來有效參考,正確利用這些技術(shù)。

參考文獻(xiàn):

[1]陳敏雅,金旭東.淺談?dòng)?jì)算機(jī)圖形學(xué)與圖形圖像處理技術(shù)[J].長春理工大學(xué)學(xué)報(bào),2011(01):138-139+146.

[2]柳海蘭.淺談?dòng)?jì)算機(jī)圖形學(xué)的發(fā)展及應(yīng)用[J].電腦知識(shí)與技術(shù),2010(33):9551-9552.

[3]滑瑞朋.計(jì)算機(jī)圖形學(xué)的應(yīng)用及研究[J].山西科技,2012(05):37-38+45.

[4]劉濤,仲曉春,孫成明,郭文善,陳瑛瑛,孫娟.基于計(jì)算機(jī)視覺的水稻葉部病害識(shí)別研究[J].中國農(nóng)業(yè)科學(xué),2014(04):664-674.

[5]關(guān)然,徐向民,羅雅愉,苗捷,裘索.基于計(jì)算機(jī)視覺的手勢(shì)檢測(cè)識(shí)別技術(shù)[J].計(jì)算機(jī)應(yīng)用與軟件,2013(01):155-159+164.

[6]許志杰,王晶,劉穎,范九倫.計(jì)算機(jī)視覺核心技術(shù)現(xiàn)狀與展望[J].西安郵電學(xué)院學(xué)報(bào),2012(06):1-8.

第2篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:果品;無損檢測(cè);品質(zhì)

我國水果產(chǎn)量居世界第一,果品出口成為我國外貿(mào)的重要組成部分。但是我國大多數(shù)農(nóng)產(chǎn)品國際市場(chǎng)競爭力弱,出口價(jià)格低廉。其中品質(zhì)因素是重要原因之一,這是由于檢測(cè)技術(shù)、評(píng)判標(biāo)準(zhǔn)等限制,所以對(duì)果品進(jìn)行合適的品質(zhì)檢測(cè)對(duì)提高經(jīng)濟(jì)效益和市場(chǎng)競爭力具有重要意義。對(duì)農(nóng)產(chǎn)品品質(zhì)的無損檢測(cè),已引起國內(nèi)外廣泛關(guān)注。

所謂無損檢測(cè),又稱非破壞檢測(cè),是不破壞被檢對(duì)象卻能評(píng)價(jià)其品質(zhì)的方法。它利用自身力學(xué)、光學(xué)、電學(xué)及聲學(xué)等物理性質(zhì)對(duì)評(píng)價(jià)對(duì)象品質(zhì)進(jìn)行非破壞檢測(cè),并按照一定標(biāo)準(zhǔn)進(jìn)行分級(jí)分選的新興技術(shù),廣泛應(yīng)用于工業(yè)和農(nóng)業(yè)。農(nóng)業(yè)中的無損檢測(cè)技術(shù)是利用農(nóng)產(chǎn)品的物理性質(zhì)如光學(xué)性質(zhì)、聲學(xué)性質(zhì)、電磁學(xué)性質(zhì)和熱學(xué)性質(zhì)等的變化而實(shí)現(xiàn)。目前,無損檢測(cè)技術(shù)主要包括:近紅外技術(shù)、聲學(xué)檢測(cè)技術(shù)、軟X射線技術(shù)、計(jì)算機(jī)視覺技術(shù)、核磁共振檢測(cè)技術(shù)、力學(xué)特性檢測(cè)技術(shù)等。

1.果品無損檢測(cè)技術(shù)

1.1新型可見、近紅外光譜無損檢測(cè)技術(shù)

可見、近紅外光譜法是農(nóng)產(chǎn)品內(nèi)部成分無損檢測(cè)的有效方法,是利用農(nóng)產(chǎn)品吸收、散射、反射和透射光的特性,進(jìn)而確定內(nèi)部成分的方法。近紅外分析技術(shù)作為一種高新分析技術(shù),能改造我國傳統(tǒng)農(nóng)業(yè),提高農(nóng)產(chǎn)品質(zhì)量,尤其是農(nóng)產(chǎn)品加工的質(zhì)量控制,將產(chǎn)生巨大作用。為改造我國的傳統(tǒng)行業(yè),企業(yè)迫切需要對(duì)原料進(jìn)行質(zhì)量監(jiān)測(cè)、生產(chǎn)過程監(jiān)控的設(shè)備和技術(shù)。國際經(jīng)驗(yàn)來看,近紅外技術(shù)是首選。

韓東海等[1]利用柑橘正常及損傷部位在紫外光源下的差異發(fā)射性,可有效確定柑橘損傷果。Slaugther DC[2]鑒于近紅外和可見光的分光光度技術(shù),建立完好的桃及油桃內(nèi)部品質(zhì)的無損關(guān)系式,能夠預(yù)測(cè)完好無損的桃與油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通過研究近紅外光譜和可見光譜對(duì)紅玉蘋果質(zhì)量的無損測(cè)量,進(jìn)而得到雙叉光纖記錄的反射光譜與蘋果參數(shù)之間的關(guān)系。Ali Moghimi[4]等用近紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)建立獼猴桃SSC和pH的校正模型,比較多元散射校正、變量標(biāo)準(zhǔn)化、中值濾波和一階導(dǎo)數(shù)光譜預(yù)處理對(duì)所建獼猴桃SSC和pH校正模型的影響,表明變量標(biāo)準(zhǔn)化結(jié)合中值濾波和一階倒數(shù)預(yù)處理光譜后,用PCR-PLS法建立的SSC和pH的校正模型精度較高。

目前,分光檢測(cè)技術(shù)在果蔬品質(zhì)檢測(cè)中的應(yīng)用廣泛,因?yàn)檫@種方法具有適應(yīng)性強(qiáng)、高檢測(cè)靈敏度、人體無害性、靈活使用性、成本低廉和自動(dòng)化易實(shí)現(xiàn)性等優(yōu)勢(shì)。利用這種技術(shù)能自動(dòng)分級(jí)果品,而合理的分級(jí)標(biāo)準(zhǔn),便于果品深加工和遠(yuǎn)銷售。近紅外光譜的研究雖起步較晚,但是其應(yīng)用廣,特別是在農(nóng)產(chǎn)品的品質(zhì)檢測(cè)和分級(jí)領(lǐng)域取得較大的進(jìn)展,開發(fā)應(yīng)用前景廣闊。

1.2聲學(xué)無損檢測(cè)技術(shù)

聲學(xué)無損檢測(cè)技術(shù)是利用果品聲學(xué)特性與內(nèi)部組織變化的關(guān)系,例如結(jié)構(gòu)、成分、物理狀態(tài)等物化特性信息來檢測(cè)果品品質(zhì)。聲學(xué)特性是指在聲波作用下農(nóng)產(chǎn)品的反射、散射和吸收特性、衰減系數(shù)和傳播速度及其本身的聲阻抗與固有頻率等,它們均反映聲波與農(nóng)產(chǎn)品相互作用的規(guī)律,這些特性隨農(nóng)產(chǎn)品內(nèi)部組織變化而變化。一般使用低能超聲波來檢測(cè),因?yàn)榈湍艹暡ㄔ诒粰z測(cè)物中傳播不會(huì)引起物理或化學(xué)特性變化。超聲方法檢測(cè)果品品質(zhì)始于近年,國內(nèi)外研究集中針對(duì)水果成熟度、硬度和內(nèi)部質(zhì)量缺陷等無損檢測(cè)。

與光學(xué)、電學(xué)及其他無損檢測(cè)技術(shù)相比,聲學(xué)無損檢測(cè)技術(shù)具有適應(yīng)性強(qiáng)、投資較低、操作簡便快捷等有死,特別適用于在線檢測(cè),在農(nóng)產(chǎn)品檢測(cè)領(lǐng)域應(yīng)用前景良好[5]。

1.3軟X射線技術(shù)

適用性極強(qiáng)的X射線成像能夠與圖像識(shí)別、人工智能、現(xiàn)代通信技術(shù)等相聯(lián)系。若待檢測(cè)物體的密度和厚度不同,則不同的透射X射線量產(chǎn)生。鑒于分析穿透量,進(jìn)而判斷果品內(nèi)部品質(zhì)。軟X射線擁有巨大優(yōu)勢(shì),特別是在農(nóng)產(chǎn)品的內(nèi)部品質(zhì)檢測(cè)上,因軟X射線具有穿透物料的特性,所以檢測(cè)那種易損壞的農(nóng)產(chǎn)品,能無損檢測(cè)內(nèi)部的品質(zhì)。所需X射線強(qiáng)度方面,農(nóng)產(chǎn)品檢測(cè)弱于工業(yè),所以稱為低能X射線或軟X射線。這種X射線成像技術(shù)來檢測(cè)農(nóng)產(chǎn)品內(nèi)部品質(zhì)方法已經(jīng)受到研究者關(guān)注,例如基于X射線成像技術(shù)的檢測(cè)核桃果核與果肉厚度,基于X射線圖像的評(píng)價(jià)牛肉嫩度,以及評(píng)價(jià)紅毛丹內(nèi)部品質(zhì)等。韓東海[6]用X射線來檢測(cè)柑橘皺皮果,結(jié)果表明射線與激光分析法在果實(shí)品質(zhì)檢測(cè)中的可行性。然而目前國內(nèi)此方面的技術(shù)開發(fā)較落后,期待學(xué)者們進(jìn)一步的研究和探索。

1.4計(jì)算機(jī)視覺技術(shù)

伴隨專業(yè)化的圖像處理技術(shù)以及下降的計(jì)算機(jī)硬件成本和高速度特性,計(jì)算機(jī)視覺技術(shù)對(duì)農(nóng)產(chǎn)品品質(zhì)自動(dòng)識(shí)別和分級(jí)的應(yīng)用日益廣泛。計(jì)算機(jī)視覺技術(shù)即以各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,借助于計(jì)算機(jī)替代大腦完成處理和解釋。計(jì)算機(jī)視覺的最終研究目標(biāo)是使計(jì)算機(jī)可以像人一樣,通過視覺觀察來理解世界,具有自主適應(yīng)環(huán)境的能力。

基于機(jī)器視覺的果品無損檢測(cè)的技術(shù),一般是借助于CCD攝像頭獲取果品圖像,圖像信息輸入計(jì)算機(jī),進(jìn)而應(yīng)用檢測(cè)方法和算法得到果品在大小、缺陷、外部損傷、內(nèi)部品質(zhì)等方面的特質(zhì)值,從而來分級(jí)果品[7]。這種方法通常是由CCD攝像頭、配備圖像采集卡的計(jì)算機(jī)、光照系統(tǒng)和專用圖像處理軟件組成。在一定光源照射情況下,利用CCD攝像頭得到水果形狀、顏色、缺陷等視覺方面的圖像信息,憑借圖像采集卡轉(zhuǎn)換為數(shù)字信號(hào)傳輸?shù)诫娔X,分隔圖像、提取特征值,從而得到特征值參數(shù)和水果顏色、質(zhì)量狀況、破損程度等品質(zhì)指標(biāo)間模型關(guān)系,進(jìn)而確定內(nèi)外品質(zhì)等級(jí)。這種方法快速、準(zhǔn)確、無損,使用一次能同時(shí)檢測(cè)多項(xiàng)品質(zhì)指標(biāo),方便設(shè)計(jì)自動(dòng)分級(jí)流水線,自動(dòng)識(shí)別水果外在品質(zhì)(外形、缺陷、顏色、大小等)和內(nèi)在品質(zhì)(成熟度、堅(jiān)實(shí)度、含糖量、含水率等),因此具有廣闊的應(yīng)用前景[8]。

我國利用計(jì)算機(jī)視覺系統(tǒng),檢測(cè)農(nóng)產(chǎn)品品質(zhì)和分類農(nóng)產(chǎn)品的研究方法開展較晚,始于20世紀(jì)90年代,但逐漸受到重視。與國際先進(jìn)水平相比,在農(nóng)業(yè)領(lǐng)域的應(yīng)用我國計(jì)算機(jī)視覺技術(shù)研究具有一定程度的差距,我國目前處于實(shí)驗(yàn)研究以及理論探索階段,實(shí)用化和商品化的程度還未達(dá)到。這項(xiàng)項(xiàng)目基于數(shù)碼攝像技術(shù),通過電腦直接處理圖像信息,其研發(fā)促使使我國獲得最快速、最便利的視覺技術(shù)。

1.5核磁共振檢測(cè)技術(shù)

1946年,核磁共振現(xiàn)象由美國科學(xué)家F.Bloch和E.M.Purcell發(fā)現(xiàn),這一技術(shù)廣泛應(yīng)用于研究物質(zhì)結(jié)構(gòu)。核磁共振可以便利地生成果實(shí)內(nèi)部組織結(jié)構(gòu)的高清圖像。方便檢測(cè)果品壓傷、蟲害以及成熟度,因此在檢測(cè)蘋果、香蕉糖度等方面潛在價(jià)值極高。而那些因采收成熟度而影響品質(zhì)的品種,鑒于核磁共振技術(shù),能提高收獲和運(yùn)輸可靠性。現(xiàn)階段,這種技術(shù)要想真正應(yīng)用于果品檢測(cè)和評(píng)價(jià)果品質(zhì)量,還存在諸多問題,然而其優(yōu)勢(shì)明顯,這種技術(shù)無疑是一種良好的果品無損檢測(cè)方法[9]。

1.6力學(xué)特性檢測(cè)技術(shù)

基于動(dòng)力學(xué)原理測(cè)度農(nóng)產(chǎn)品硬度的檢測(cè)方法是力學(xué)特性檢測(cè)技術(shù)。采用振動(dòng)頻率分析法以及沖擊力檢測(cè)法,檢測(cè)果品堅(jiān)實(shí)度來判斷果實(shí)成熟度。力學(xué)特性檢測(cè)技術(shù)方便判斷果品的采收期,依照成熟度分級(jí)、貯藏果品,確定果品的保鮮期和貯存期。盡管這種技術(shù)具有較為堅(jiān)實(shí)的實(shí)踐應(yīng)用基礎(chǔ)及歷史,但介于果品品質(zhì)和物理參數(shù)間的復(fù)雜關(guān)系,實(shí)際應(yīng)用是一個(gè)漫長的研究過程[10]。

第3篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:深度學(xué)習(xí);行為識(shí)別;神經(jīng)網(wǎng)絡(luò)

1 概述

動(dòng)作行為識(shí)別是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)研究熱點(diǎn),已經(jīng)廣泛應(yīng)用于智能監(jiān)控、人機(jī)交互、視頻檢索等領(lǐng)域中[1]。動(dòng)作行為識(shí)別技術(shù)是通過對(duì)視頻或者圖像中人體動(dòng)作行為做出有意義的判斷。有效表達(dá)圖像(視頻)中的實(shí)際目標(biāo)和場(chǎng)景內(nèi)容是最基本,最核心的問題。因此,對(duì)于特征的構(gòu)建和選擇得到廣泛關(guān)注,例如STIP、SIFT、MSER等。但是,能通過無監(jiān)督方式讓機(jī)器自動(dòng)從樣本中學(xué)習(xí)到表征樣本的特征,會(huì)讓人們更好地利用計(jì)算機(jī)來實(shí)現(xiàn)人的視覺功能。而深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的延伸和發(fā)展,是通過逐層構(gòu)建一個(gè)多層網(wǎng)絡(luò)來使得機(jī)器自動(dòng)學(xué)習(xí)到隱含在數(shù)據(jù)內(nèi)部的關(guān)系,從而讓學(xué)習(xí)到的特征更加準(zhǔn)確性。

文章旨在探討深度學(xué)習(xí)與機(jī)器學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))之間的關(guān)系,并且介紹深度學(xué)習(xí)的由來、概念和原理;同時(shí)介紹目前深度學(xué)習(xí)在計(jì)算機(jī)視覺中的應(yīng)用。最后提出深度學(xué)習(xí)目前發(fā)展所面臨的問題,以及對(duì)未來的展望。

2 深度學(xué)習(xí)

2.1 深度學(xué)習(xí)概述

深度學(xué)習(xí)源于人工神經(jīng)網(wǎng)絡(luò)的研究,是機(jī)器學(xué)習(xí)的拓展。深度學(xué)習(xí)是經(jīng)過組合低層特征來形成更加抽象的屬性類別和特征,從中發(fā)現(xiàn)原始數(shù)據(jù)的特征表征[2]?,F(xiàn)在用于動(dòng)作行為識(shí)別的技術(shù)是通過“動(dòng)作表征”+“動(dòng)作分類器”的框架來進(jìn)行行為識(shí)別的。其中“動(dòng)作表征”是人們手動(dòng)設(shè)計(jì)特征獲取到的,也就是在目前識(shí)別框架內(nèi)存在一個(gè)對(duì)動(dòng)作圖像(視頻)的預(yù)處理過程。

深度學(xué)習(xí)和淺層學(xué)習(xí)相對(duì)。目前許多學(xué)習(xí)算法是淺層網(wǎng)絡(luò)學(xué)習(xí)方法,具有一定的局限性,例如在樣本有限的狀況下,表示復(fù)雜函數(shù)的能力有限制,且對(duì)復(fù)雜分類問題的泛化能力也會(huì)受到一定約束[3]。而深度學(xué)習(xí)通過學(xué)習(xí)深層非線性網(wǎng)絡(luò)結(jié)構(gòu),達(dá)到復(fù)雜函數(shù)逼近,又能在樣本少的情況下學(xué)習(xí)原始數(shù)據(jù)的特征。BP算法作為傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的典型算法,雖然訓(xùn)練多層網(wǎng)絡(luò),但僅含幾層網(wǎng)絡(luò),訓(xùn)練方法很不理想[3]。因?yàn)槠漭斎牒洼敵鲩g非線性映射讓網(wǎng)絡(luò)誤差函數(shù)形成含多個(gè)極小點(diǎn)的非線性空間,因而經(jīng)常收斂到局部最小,且隨著網(wǎng)絡(luò)層數(shù)的增加,容易過擬合。而深度學(xué)習(xí)可以獲得分布式表示,通過逐層學(xué)習(xí)算法來得到原始輸入數(shù)據(jù)的主要變量。通過深度學(xué)習(xí)的非監(jiān)督訓(xùn)練完成,同時(shí)利用生成性訓(xùn)練避免因函數(shù)表達(dá)能力過強(qiáng)而出現(xiàn)過擬合情況。

2.2 深度學(xué)習(xí)原理

傳統(tǒng)機(jī)器學(xué)習(xí)僅含單層非線性變換的淺層網(wǎng)絡(luò)結(jié)構(gòu),而且淺層模型單一。這對(duì)于深度網(wǎng)絡(luò)來說易造成陷入最優(yōu)或產(chǎn)生梯度分散等問題。因此,Hinton等人在基于深度置信網(wǎng)(DBNs)的情況下提出非監(jiān)督貪婪逐層訓(xùn)練算法,隨后提出了多層次自動(dòng)編碼器深層結(jié)構(gòu),這給解決深層網(wǎng)絡(luò)結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來了希望。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個(gè)多層次結(jié)構(gòu)的學(xué)習(xí)算法。同時(shí)深度學(xué)習(xí)還出現(xiàn)了許多結(jié)構(gòu):多層感知機(jī)、去噪自動(dòng)編碼器、稀疏編碼等。

卷積神經(jīng)網(wǎng)絡(luò)是第一個(gè)真正采用多層次網(wǎng)絡(luò)結(jié)構(gòu),具有魯棒性的深度學(xué)習(xí)算法,通過探究數(shù)據(jù)在空間上的相關(guān)性,減少訓(xùn)練參數(shù)的數(shù)量。而且卷積神經(jīng)網(wǎng)絡(luò)(CNN)適應(yīng)性強(qiáng),善于發(fā)現(xiàn)數(shù)據(jù)的局部特征。它的權(quán)重共享結(jié)構(gòu)降低了網(wǎng)絡(luò)模型的復(fù)雜度,減少了權(quán)值的數(shù)量,使得卷積神經(jīng)網(wǎng)絡(luò)在模式識(shí)別中取得了很好的結(jié)果。

自動(dòng)編碼器的核心關(guān)鍵是將原始圖像(視頻)輸入信號(hào)進(jìn)行編碼,使用編碼后的信號(hào)來重建原始信號(hào),使得兩者之間的重建誤差最小。通過將原始信號(hào)編碼成另一形式,能夠有效地提取信號(hào)中的主要信息,能夠簡潔地表達(dá)原始圖像(視頻)的特征。

3 深度學(xué)習(xí)的應(yīng)用

3.1 語音識(shí)別

從2009年開始,微軟研究院語音識(shí)別專家通過與Hinton合作,首先將RBM和DBN引入到語音識(shí)別聲學(xué)模型訓(xùn)練中,使得語音識(shí)別的錯(cuò)誤率相對(duì)減低30%,這徹底改變了語音識(shí)別原有的技術(shù)框架。在國際上,IBM、google等公司都快速進(jìn)行了DNN語音識(shí)別的研究,并且速度飛快。國內(nèi)方面,阿里巴巴,科大訊飛、百度、中科院自動(dòng)化所等公司或研究單位,也在進(jìn)行深度學(xué)習(xí)在語音識(shí)別上的研究。

3.2 視頻中的動(dòng)作行為識(shí)別

準(zhǔn)確迅速識(shí)別視頻中人的動(dòng)作行為對(duì)于視頻搜索和視頻監(jiān)控具有劃時(shí)代的意義。最近幾年,深度學(xué)習(xí)技術(shù)被應(yīng)用于視頻動(dòng)作行為識(shí)別中。如Ji等人[4]提出多層網(wǎng)絡(luò)的3D卷積神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)視頻中的時(shí)空特征,并通過卷積來實(shí)現(xiàn)對(duì)整個(gè)視頻特征的學(xué)習(xí),從而代替之前的時(shí)空興趣點(diǎn)檢測(cè)和特征描述提取。在TRECVID數(shù)據(jù)庫上進(jìn)行的實(shí)驗(yàn)取得了不錯(cuò)效果。

4 結(jié)束語

文章對(duì)深度學(xué)習(xí)的主要概念進(jìn)行了全面闡述,包括其由來、原理、研究進(jìn)展和相應(yīng)的應(yīng)用等。在很多領(lǐng)域中,深度學(xué)習(xí)都表現(xiàn)了潛在的巨大價(jià)值,但深度學(xué)習(xí)作為淺層學(xué)習(xí)的延伸,仍處于發(fā)展階段,還有很多問題值得我們深入探討:

(1)我們需要了解深度學(xué)習(xí)的樣本復(fù)雜度,需要多少訓(xùn)練樣本才能學(xué)習(xí)到足夠的深度模型。

(2)在推進(jìn)深度學(xué)習(xí)的學(xué)習(xí)理論和計(jì)算理論的同時(shí),我們是否可以建立一個(gè)通用的深度學(xué)習(xí)網(wǎng)絡(luò)模型,作為統(tǒng)一的框架來處理語音、圖像和語言。

(3)神經(jīng)網(wǎng)絡(luò)具有前饋性連接和反饋性連接,可是我們研究的深度網(wǎng)絡(luò)中還沒有加入反饋連接,這些都給深度學(xué)習(xí)的研究帶來了嚴(yán)峻的挑戰(zhàn)。

參考文獻(xiàn)

[1]王亮,胡衛(wèi)明,譚鐵牛.人運(yùn)動(dòng)的視覺分析綜述[J].計(jì)算機(jī)學(xué)報(bào),2002,25(3):225-237.

[2]余凱,賈磊,陳雨強(qiáng).深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,50(9):1799-1804.

第4篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:立體視覺;圖像分割;陰影抑制;三維重建

1 概述

立體視覺的交通場(chǎng)景理解系統(tǒng)關(guān)鍵技術(shù)主要解決交通對(duì)象(行人、汽車、摩托車、自行車等)的三維信息模型化;低層處理,即先把圖像數(shù)字符號(hào)化和特征c的提取過程,主要包括圖像的分割和描述;運(yùn)動(dòng)檢測(cè)與運(yùn)動(dòng)匹配,主要技術(shù)有基于時(shí)空梯度的方法、基于相關(guān)的方法、頻率域法等;模型匹配與識(shí)別;交通對(duì)象的陰影檢測(cè);系統(tǒng)實(shí)時(shí)性,由于三維重構(gòu)計(jì)算量較大,提高系統(tǒng)實(shí)時(shí)性等六大問題。其中對(duì)三維重建、運(yùn)動(dòng)檢測(cè)與運(yùn)動(dòng)匹配和模型匹配與識(shí)別是立體視覺的交通場(chǎng)景理解系統(tǒng)關(guān)鍵技術(shù)主要研究方向。

從計(jì)算機(jī)視覺的角度進(jìn)行分類,基于模型交通流量檢測(cè)技術(shù)的方法可以分類為:基于區(qū)域跟蹤的方法;基于動(dòng)態(tài)輪廓的目標(biāo)跟蹤方法;基于特征的跟蹤方法;基于3D模型(立體視覺)的車輛跟蹤識(shí)別方法。

2 立體視覺的三維重建研究方法

基于立體視覺的三維重建是指通過對(duì)二維圖像的處理,利用立體視覺的原理獲取場(chǎng)景中目標(biāo)的三維信息。雙目立體視覺是直接模擬人類雙眼來處理景物的一種新型研究方法,由于其靈活性較高,可以測(cè)量多種條件下景物的三維信息。

2.1 圖像自適應(yīng)閾值分割法

圖像自適應(yīng)閾值分割法無論參數(shù)的選取為何種特征值,都能準(zhǔn)確快速的捕捉待處理的運(yùn)動(dòng)目標(biāo)。采用自適應(yīng)閾值分割方法對(duì)獲得的交通對(duì)象的視頻圖像進(jìn)行處理,把交通目標(biāo)特征層經(jīng)行分類處理,提高了類判別能力。同時(shí),閾值來源較為廣泛和準(zhǔn)確,因此,不僅具有較好的識(shí)別率還具有較強(qiáng)的實(shí)時(shí)性。在背景存在微小運(yùn)動(dòng)和環(huán)境亮度突變的情形下也具有很好的魯棒性。徐文聰?shù)热酥饕獜淖赃m應(yīng)閾值分割的方法對(duì)運(yùn)動(dòng)車輛進(jìn)行檢測(cè)和流量統(tǒng)計(jì)。

在徐文聰研究中,閾值的取值為圖像的形態(tài)值,結(jié)合車道線和標(biāo)定的攝像機(jī)內(nèi)外參數(shù),利用Dtsu算法提取候選車燈連通域信息。張虹波、孫明玉研究中,閾值的取值為圖像的灰度值。張虹波利用圖像差分方法獲得運(yùn)動(dòng)目標(biāo)。提取虛擬檢測(cè)區(qū)域內(nèi)的車輛圖像,進(jìn)行圖像的數(shù)字化和濾除噪聲等預(yù)處理,對(duì)視頻圖像提取背景模型,得到車流量信息。孫明玉提出基于新型自適應(yīng)閾值的運(yùn)動(dòng)目標(biāo)提取算法。孫明玉[4]提出基于新型自適應(yīng)閾值的運(yùn)動(dòng)目標(biāo)提取算法。首先,根據(jù)運(yùn)動(dòng)屬性,分成兩個(gè)聚類,一是運(yùn)動(dòng)目標(biāo),二是背景。對(duì)提取的圖像按像素灰度進(jìn)行分類,以聚類間的方根-算術(shù)均值距離最大值作為分割閾選擇的準(zhǔn)則,實(shí)時(shí)更新提取的運(yùn)動(dòng)目標(biāo)的二值化閾值,從而實(shí)現(xiàn)對(duì)運(yùn)動(dòng)目標(biāo)的準(zhǔn)確完整提取。

2.2 基于側(cè)影輪廓的三維重建方法

基于側(cè)影輪廓的三維建模是一種新的建模方法,也稱為可見外殼 (Visual Hull)生成方法。側(cè)影輪廓法是利用攝像機(jī)拍攝的不同角度的圖像進(jìn)行立體重建,具有良好的幾何和拓?fù)浣Y(jié)構(gòu)的一致性,同時(shí)提取的特征點(diǎn)較少,易于計(jì)算,有較好的魯棒性。

阮孟貴、章毓晉利用攝像機(jī)在各個(gè)相異的角度獲取的多幅圖像完成三維重建。主要利用反射投影的交叉輪廓進(jìn)行匹配,重建物體表面。伍燕萍用Marching Cubes算法,把獲取的多幅圖像進(jìn)行側(cè)影輪廓重建,生成物體的可見外殼。曹煜利用平面鏡反射原理,對(duì)圖像輪廓線之間極的線幾何關(guān)系進(jìn)行分析,獲得相應(yīng)的相機(jī)內(nèi)外參數(shù),實(shí)現(xiàn)目標(biāo)物體的三維重建。

2.3 基于序列圖像的三維重建方法

序列圖像法主要是利用數(shù)字圖像處理的方法對(duì)圖像二值化,便于計(jì)算機(jī)處理。通過對(duì)提取的特征點(diǎn)之間進(jìn)行相似度的匹配,利用矩陣分析進(jìn)行三維重建。此類方法關(guān)鍵在于正確三維數(shù)據(jù)的獲取,利用計(jì)算機(jī)相關(guān)軟件進(jìn)行圖像掃描、圖像預(yù)處理、建立數(shù)據(jù)模型,怎樣辨別噪聲是此方法的難點(diǎn)。雖然序列圖像法存在一定的噪聲污染,但由于其設(shè)備簡單,在交通場(chǎng)景中運(yùn)用面較廣。

劉同敏利用提取的圖像序列作為測(cè)量矩陣的參數(shù),提出了一種基于匹配相似度的最小二乘法三維重建方法。譚論正提出了基于PCA的交通場(chǎng)景點(diǎn)的重建方法。利用最小二乘法求場(chǎng)景點(diǎn)的三維軌跡,根據(jù)獲得的數(shù)據(jù)實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)和背景模型的三維重建。孫麗娟通過透視投影重建算法中引入了迭代算法。利用矩陣擾動(dòng)理論,分析圖像噪聲對(duì)不同特征點(diǎn)重構(gòu)的影響,得出圖像數(shù)量越多重建精度越高的結(jié)論。彭科舉提出了尺度不變特征變換特征和角點(diǎn)特征相結(jié)合的三維重建算法。

2.4 混合高斯模型進(jìn)行背景建模

隨著信息技術(shù)、計(jì)算機(jī)技術(shù)、數(shù)據(jù)通信技術(shù)、傳感器技術(shù)、電子控制技術(shù)快速發(fā)展,基于視頻的智能交通控制系統(tǒng)在交通控制中占主要作用。在交通對(duì)象的監(jiān)測(cè)中,高斯背景模型在建立對(duì)運(yùn)動(dòng)目標(biāo)的提取有著至關(guān)重要的作用。研究發(fā)現(xiàn),視頻圖像提取的特征值背景顏色和像素的灰度值符合高斯分布。由于像素在時(shí)間域上的分布信息符合高斯分布,利用其構(gòu)造其背景模型能解決光線突變等問題帶來的影響,能夠適應(yīng)于戶外復(fù)雜光線的環(huán)境。此方法建模后模型的魯棒性強(qiáng),準(zhǔn)確率高。目前,高斯背景建模在交通智能控制系統(tǒng)中發(fā)揮著越來越重要的作用。

劉亞利等人提出了基于邊緣特征的混合高斯背景建模方法。此方法加快了高斯模型的收斂速度,有較強(qiáng)的光變性。同時(shí)利用像素在時(shí)間域及空間域上的分布信信息,王永忠等人提出了一種基于自適應(yīng)混合高斯模型的時(shí)空背景建模方法。監(jiān)控系統(tǒng)采集的數(shù)庫不僅僅有時(shí)間上的信息,還有空間位移信息。王永忠提出的時(shí)空背景建模方法利用時(shí)間和空間上的像素分布信息,不僅提高了建模精度還解決了傳統(tǒng)的混合高斯背景建模方法對(duì)不平穩(wěn)場(chǎng)景建模失效的這一缺點(diǎn)。

3 結(jié)束語

基于立體視覺的三維建模技術(shù)研究是一個(gè)非常有意義的研究課題,在交通參數(shù)檢測(cè)技術(shù)的研究中,我們要結(jié)合相關(guān)的計(jì)算機(jī)圖像采集和處理技術(shù),充分利用道路已有的資源,并將其采集的資源圖形化、數(shù)字化。雙目立體視覺技術(shù)對(duì)目前的單視點(diǎn)平面監(jiān)控系統(tǒng)缺點(diǎn)進(jìn)行很好的彌補(bǔ)。利用雙目立體視覺對(duì)交通對(duì)象進(jìn)行檢測(cè)和監(jiān)控,對(duì)獲得圖像數(shù)據(jù)分析,完成運(yùn)動(dòng)目標(biāo)的三維空間定位和追蹤。結(jié)合現(xiàn)有的計(jì)算機(jī)、電子信息技術(shù),互聯(lián)網(wǎng)技術(shù),對(duì)交通加強(qiáng)智能化建設(shè),逐步實(shí)現(xiàn)增強(qiáng)道路交通監(jiān)控的信息化和自動(dòng)化。

參考文獻(xiàn)

[1]周冬梅,張明星,代永霞,等.基于紋理的車輛陰影消除新算法[J].自動(dòng)化與儀表,2014(1):133-138.

[2]徐文聰,劉海.夜間環(huán)境交通數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].測(cè)控技術(shù),2012,31(6):60-66.

第5篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:焊接自動(dòng)化;圖像處理;應(yīng)用;發(fā)展趨勢(shì)

中圖分類號(hào):C37 文獻(xiàn)標(biāo)識(shí)碼:A

一、概述

隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,近年來利用機(jī)器視覺直接觀察焊接熔池,對(duì)焊

接質(zhì)量進(jìn)行閉環(huán)控制是通過圖像處理獲取熔池的幾何形狀信息,已是當(dāng)前研究的主要方向。

和傳統(tǒng)的手工焊和半自動(dòng)焊接過程相比,使用機(jī)器視覺進(jìn)行直接觀測(cè)焊接熔池有著很明顯的優(yōu)點(diǎn),采集的數(shù)字圖像信息豐富,表象直觀,且數(shù)字化的圖像數(shù)據(jù)可以實(shí)時(shí)傳輸?shù)接?jì)算機(jī)高速緩存內(nèi),提取特征信息, 進(jìn)行實(shí)時(shí)處理,同時(shí)作出在線判決,可以實(shí)現(xiàn)焊接過程質(zhì)量實(shí)時(shí)控制和傳感。

在傳統(tǒng)的手工焊接和半自動(dòng)焊接過程當(dāng)中,對(duì)于一個(gè)有經(jīng)驗(yàn)的焊工,通過直接觀察熔池的行為、接頭的位置、焊道外形及電弧形狀,能夠感知焊接的狀態(tài)。若是感覺到實(shí)際焊接過程中同最佳狀態(tài)不一致,為了達(dá)到最佳狀態(tài)可以通過調(diào)節(jié)各參數(shù),以獲得高質(zhì)量的焊縫??梢园堰@個(gè)過程劃分為眼-腦-手的控制過程。圖像處理在焊接過程中的重要意義就等同于手工焊接過程中人的眼睛,可以實(shí)現(xiàn)采集和處理焊接位置的傳感、焊接時(shí)熔池、焊道對(duì)中、熔寬和熔深的信息,然后利用計(jì)算機(jī)發(fā)出指令,實(shí)現(xiàn)焊接過程的各種工藝參數(shù)如電流、電壓、焊接速度的調(diào)節(jié)和電弧或焊絲的對(duì)中。

二、圖像處理的概念

圖像處理(image processing),用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù)。又稱影像處理。一般圖像處理就指的是對(duì)數(shù)字圖像處理。數(shù)字圖像是指用數(shù)字?jǐn)z像機(jī)、掃描儀等設(shè)備經(jīng)過采樣和數(shù)字化得到的一個(gè)大的二維數(shù)組,該數(shù)組的元素稱為像素,其值為一整數(shù),稱為灰度值。圖像處理技術(shù)的主要內(nèi)容包括圖像壓縮,匹配、描述和識(shí)別以及增強(qiáng)和復(fù)原這3個(gè)部分。常見的處理包括有圖像復(fù)原、圖像數(shù)字化、圖像增強(qiáng)、圖像編碼、圖像分析和圖像分割等

三、焊接圖像攝取方法

圖像的處理一般包括量化、圖像識(shí)別和圖像預(yù)處理等幾個(gè)步驟。圖像預(yù)處理包括圖像增強(qiáng)、圖像變換和圖像恢復(fù),盡量把因?yàn)殡S機(jī)因素的干擾和攝像中各種條件的限制而產(chǎn)生的不足和噪聲減小,繼而可以獲取焊縫位置的精確信息;量化由圖像卡完成;圖像識(shí)別包括邊緣提取和圖像分割等,可借助小波變換、快速傅立葉變換、概率統(tǒng)計(jì)等數(shù)學(xué)工具對(duì)圖像進(jìn)行理解、分析、模式識(shí)別和特征提取。

從國內(nèi)外大量文獻(xiàn)來看,利用機(jī)器視覺采集焊接熔池圖像的方法主要分為被動(dòng)式直接視覺傳感和主動(dòng)式直接視覺傳感兩大類,視覺傳感器常采用CCD攝取原始圖像。CCD是英文(Charge-Coupled Devices)的縮寫,意即“電荷耦合器件”。具有體積小、耐震動(dòng)、重量輕、穩(wěn)定性好、壽命長、速度高,幾何失真小及耐高壓等一系列優(yōu)點(diǎn)。CCD是固態(tài)圖像傳感器的一種,固態(tài)圖像傳感器是指把布設(shè)在半導(dǎo)體襯底上的許多感光小單元的光-電信號(hào),用所控制的時(shí)鐘脈沖讀取出來的一類功能器件。

動(dòng)式直接視覺傳感利用窄帶復(fù)合濾光系統(tǒng)濾除非連續(xù)光譜的電弧強(qiáng)光,并采用高強(qiáng)脈沖激光或具有圖像增強(qiáng)器的高頻閃光燈作為輔助光源,可有效地抑制弧光獲得清晰圖像。被動(dòng)式直接視覺傳感是利用焊接過程中的結(jié)構(gòu)光進(jìn)行成像。主被動(dòng)式直接視覺傳感存在強(qiáng)光干擾的問題,激光焊接中,通常采用中性減光的辦法解決強(qiáng)光干擾的問題;在電弧焊中,對(duì)于短路電弧焊和脈沖電弧焊.可在短路期間或基值電流期間獲取圖像數(shù)據(jù),或者在攝像機(jī)前通入部分保護(hù)氣,減少煙霧和飛濺的影響;TIG/MIG/MAG焊時(shí)弧光在600~700nm波段內(nèi)相對(duì)光強(qiáng)最弱最穩(wěn)定,選用這一波段內(nèi)的干涉濾光片和防熱玻璃可有效地排除弧光及紅外干擾。

四、圖像處理在焊接中的應(yīng)用

現(xiàn)如今,對(duì)于圖像處理主要集中應(yīng)用在脈沖機(jī)器人焊接、TIG焊、激光焊和焊縫質(zhì)量的檢測(cè)等領(lǐng)域。圖像技術(shù)在機(jī)器人焊接領(lǐng)域應(yīng)用較廣。由于機(jī)器人需要有很強(qiáng)的適應(yīng)能力,借助三維視覺傳感系統(tǒng)和計(jì)算機(jī)圖像處理技術(shù),焊接機(jī)器人可對(duì)焊接環(huán)境進(jìn)行實(shí)時(shí)控制。通過圖像的采集,可幫助機(jī)器人進(jìn)行焊縫的對(duì)中,為機(jī)器人焊接提供實(shí)時(shí)特征信息,如熔深、熔寬和熔池的形狀等,從而實(shí)現(xiàn)焊接過程的智能控制。目前國內(nèi)哈工大的吳林教授在這方面作了較深入的研究,從焊縫位置的傳感到熔滴的過渡,從過程實(shí)時(shí)控制到最后焊接質(zhì)量的檢測(cè)都進(jìn)行了較為系統(tǒng)的研究。

哈工大的何景山博士在脈沖TIG焊熔深及熔透的彩色圖形法傳感方面進(jìn)行了較深入的研究。圖像處理目前用得最廣的領(lǐng)域是在脈沖TIG焊中,國內(nèi)外許多學(xué)者都對(duì)該領(lǐng)域進(jìn)行了積極的探索。首先創(chuàng)建了一套適用于脈沖TIG焊的彩色圖像法熔深和熔透的傳感系統(tǒng),通過對(duì)脈沖峰值和脈寬的控制實(shí)現(xiàn)對(duì)熔深和熔透的控制,其控制信息來源于基值期間,進(jìn)行圖像信息的采集。

此外,圖像處理還在焊接的其它領(lǐng)域中有一定的應(yīng)用。有的將圖像處理用于焊接缺陷的自動(dòng)監(jiān)測(cè)與缺陷尺寸的保真,也都收到了良好的效果。有些科技工作者還將圖像處理用于水下濕法焊接,通過復(fù)合濾光技術(shù)和水下CCD攝像系統(tǒng),采集出了藥芯焊絲水下濕法焊接電弧區(qū)域的圖像,用中值濾波和梯度算子的電弧區(qū)域圖像邊緣檢測(cè)方法,有效地區(qū)分了電弧燃燒區(qū)域和電弧氣泡區(qū)域。哈爾濱工業(yè)大學(xué)的何景山、楊春利等人結(jié)合采用埋弧焊進(jìn)行容器類焊接結(jié)構(gòu)制造過程中的工藝特點(diǎn)及實(shí)際工況,設(shè)計(jì)了一種將微型攝像機(jī)、微型半導(dǎo)體激光發(fā)生器及具有濾光功能的光學(xué)系統(tǒng)三者集成一體的焊縫視覺傳感器。

焊接控制過程中的一個(gè)重要環(huán)節(jié)就是焊接縫隙檢測(cè),圖像處理在這方面的應(yīng)用也有許多學(xué)者研究。為了實(shí)現(xiàn)電弧焊過程的自動(dòng)對(duì)中和焊縫質(zhì)量控制,必須對(duì)焊接縫隙的相對(duì)位置和坡口幾何參數(shù)進(jìn)行檢測(cè)。西安交大的梁晉、賈昌申等在《圖像法焊接縫隙檢測(cè)的研究》一文介紹了一套自行設(shè)計(jì)的計(jì)算機(jī)焊接縫隙檢測(cè)系統(tǒng),包括圖像采集卡、計(jì)算機(jī)接口、光學(xué)傳感器、圖像處理軟件,分析了它們的基本結(jié)構(gòu)和工作原理,討論了提高光學(xué)傳感器、圖像處理軟硬件等抗干擾能力的措施。該系統(tǒng)工作原理是:由光源和CCD攝像機(jī)組成的光學(xué)傳感器攝取圖象,CCD攝像機(jī)把圖象轉(zhuǎn)換為電信號(hào),再經(jīng)圖象采集卡把模擬信號(hào)變?yōu)閿?shù)字信號(hào)存儲(chǔ)于計(jì)算機(jī)內(nèi),計(jì)算機(jī)對(duì)此信號(hào)進(jìn)行必要的處理,即可得到縫隙位置和坡口幾何參數(shù)信息,在監(jiān)視器屏幕上顯示出來,或經(jīng)過D/A電路給執(zhí)行機(jī)構(gòu),修正焊槍位置,實(shí)現(xiàn)閉環(huán)對(duì)中控制。有的將圖像分割和小波分析應(yīng)用于焊接領(lǐng)域,小波分析在焊縫視覺跟蹤過程中檢測(cè)焊縫,采用多次小波變換可獲得清晰的焊縫邊緣,大大簡化了硬件設(shè)備;圖像分割法可減小焊縫識(shí)別的圖像處理的復(fù)雜性,使得焊接過程的實(shí)時(shí)性增強(qiáng)。

五、圖像處理在焊接中應(yīng)用的展望

為焊接現(xiàn)象的描述及內(nèi)在規(guī)律的解釋提供了極佳的條件和直接的證據(jù),推動(dòng)焊接理論和實(shí)踐的發(fā)展就是通過圖像傳感的這種方法。同時(shí)也使得研究者能夠觀察到其它傳感方法所不能觀察到的被強(qiáng)光所淹沒的豐富直觀的信息。

把圖像處理技術(shù)應(yīng)用到現(xiàn)代焊接技術(shù)中,將會(huì)推動(dòng)焊接過程質(zhì)量實(shí)時(shí)傳感與控制的發(fā)展和成熟,使得焊接過程通過閉環(huán)反饋控制而實(shí)現(xiàn)完全自動(dòng)化,保證焊接質(zhì)量,提高焊接生產(chǎn)效率。

總之,作為智能控制中關(guān)鍵技術(shù)―數(shù)字圖像技術(shù),在焊接過程中發(fā)揮的作用將會(huì)越來越大,將為焊接智能化生產(chǎn)作出貢獻(xiàn)。現(xiàn)代工業(yè)正朝著信息化和智能化方向發(fā)展,現(xiàn)代焊接技術(shù)也必然要實(shí)現(xiàn)智能化。

參考文獻(xiàn):

[1]段佳佳,楊迎春.圖像處理在自動(dòng)焊接中的應(yīng)用[J].電子測(cè)試,2012,02:12-15.

[2]陳彥賓,李俐群,陳鳳東,陳杰.圖像處理在自動(dòng)焊接中的應(yīng)用和展望[J].材料科學(xué)與工藝,2003,01:106-112.

作者簡介:

第6篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:數(shù)字圖像;處理技術(shù);電子信息

中圖分類號(hào):TN911.7 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1000-8136(2012)09-0153-02

不論在哪種通訊手段中,人們都更愿意選擇直觀的圖像表達(dá),因此,未來社會(huì)對(duì)圖像傳遞信息的要求越來越高,及時(shí)性、直觀性、客觀性等發(fā)展條件都對(duì)現(xiàn)有的數(shù)字圖像處理技術(shù)提出了挑戰(zhàn)。

1數(shù)字圖像處理技術(shù)概述

數(shù)字圖像處理又稱為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過程。這一過程包括對(duì)圖像進(jìn)行增強(qiáng)、除噪、分割、復(fù)原、編碼、壓縮、提取特征等內(nèi)容,圖像處理技術(shù)的產(chǎn)生離不開計(jì)算機(jī)的發(fā)展、數(shù)學(xué)的發(fā)展以及各個(gè)行業(yè)的應(yīng)用需求的增長。20世紀(jì)60年代,圖像處理的技術(shù)開始得到較為科學(xué)的應(yīng)用,人們用這種技術(shù)進(jìn)行輸出圖像的理想化處理。

經(jīng)過多年的發(fā)展,現(xiàn)在的電子圖像處理技術(shù)已具有了以下特點(diǎn):更好的再現(xiàn)性:數(shù)字圖像處理與傳統(tǒng)的模擬圖像處理相比,不會(huì)因?yàn)閳D像處理過程中的存儲(chǔ)、復(fù)制或傳輸?shù)拳h(huán)節(jié)引起圖像質(zhì)量的改變;占用的頻帶更寬:這一點(diǎn)是相對(duì)于語言信息而言的,圖像信息比語言信息所占頻帶要大好幾個(gè)數(shù)量級(jí),因此圖像信息在實(shí)現(xiàn)操作的過程中難度更大;適用面寬:可以從各個(gè)途徑獲得數(shù)據(jù)源,從顯微鏡到天文望遠(yuǎn)鏡的圖像都可以進(jìn)行數(shù)字處理;具有較高的靈活性:只要可以用數(shù)學(xué)公式和數(shù)理邏輯表達(dá)的內(nèi)容,幾乎都可以用電子圖像來進(jìn)行表現(xiàn)處理.

2數(shù)字圖像處理技術(shù)的發(fā)展

自從美國在1964年開始通過衛(wèi)星獲得大量月球圖片并運(yùn)用數(shù)字技術(shù)對(duì)之進(jìn)行處理之后,越來越多的相應(yīng)技術(shù)開始被運(yùn)用到圖像處理方面,數(shù)字圖像處理也作為一門科學(xué)占據(jù)了一個(gè)獨(dú)立的學(xué)科地位,開始被各個(gè)領(lǐng)域的科學(xué)研究運(yùn)用。圖像技術(shù)再一次的飛躍式發(fā)展出現(xiàn)在1972年,標(biāo)志是CT醫(yī)學(xué)技術(shù)的誕生,在這種技術(shù)指導(dǎo)下,運(yùn)用X射線計(jì)算機(jī)斷層攝影裝置,根據(jù)人的頭部截面的投影,計(jì)算機(jī)對(duì)數(shù)據(jù)處理后重建截面圖像,這種圖像重建技術(shù)后來被推廣到全身CT的裝置中,為人類發(fā)展做出了跨時(shí)代的貢獻(xiàn),隨后,數(shù)字圖像處理技術(shù)在更多的領(lǐng)域里被運(yùn)用,發(fā)展成為一門具有無限前景的新型學(xué)科。之后十年數(shù)字圖像處理技術(shù)也朝著更高深的方向發(fā)展,人們開始通過計(jì)算機(jī)構(gòu)建出數(shù)字化的人類視覺系統(tǒng),這項(xiàng)技術(shù)被稱為圖像理解或計(jì)算機(jī)視覺。很多國家已在這方面投入了很多的研究精力,并取得了高深的研究成果,其中,20世紀(jì)70年代末提出的視覺計(jì)算理論為后來計(jì)算機(jī)數(shù)字圖像技術(shù)的理論發(fā)展提供了主導(dǎo)思想,但理論上如此,在實(shí)際操作中還存在著很多的困難。

我國在建國之初就展開了計(jì)算機(jī)技術(shù)的研究,而改革開放以來,我國在計(jì)算機(jī)數(shù)字圖像處理技術(shù)上的發(fā)展進(jìn)步也是非常大的,甚至在某些理論研究方面已趕上了世界先進(jìn)水平,首先,對(duì)于成像數(shù)據(jù)的收集能力方面,我國通過成功研發(fā)的一系列傳感器以及發(fā)射的對(duì)地觀測(cè)衛(wèi)星,能夠及時(shí)有效地獲得風(fēng)云、海洋、資源和環(huán)境減災(zāi)等方面的相關(guān)數(shù)據(jù),并取得了有效的數(shù)據(jù)結(jié)果和數(shù)據(jù)成像效果。另外,數(shù)字圖像處理技術(shù)應(yīng)用較為廣泛的領(lǐng)域代表分別是建筑、通行工程和生物醫(yī)學(xué)工程方面,這些方面對(duì)數(shù)字圖像處理技術(shù)的應(yīng)用,最能直接體現(xiàn)該技術(shù)的發(fā)展現(xiàn)狀。在建筑行業(yè)中,數(shù)字圖像處理技術(shù)可以將擬建造的建筑或建筑群的高度、密度以及其他可能影響建筑質(zhì)量、建筑環(huán)境的信息轉(zhuǎn)換成圖像,從而使設(shè)計(jì)者更為合理地進(jìn)行規(guī)劃;在通信工程領(lǐng)域,數(shù)字圖像技術(shù)和語音、文字等因素構(gòu)成了現(xiàn)代多媒體的基本內(nèi)容,在傳遞圖像的過程中,采用編碼技術(shù)來壓縮信息的比特量,這種技術(shù)現(xiàn)在的發(fā)展內(nèi)容包括變換編碼等,未來可能發(fā)揮作用的還有小波變換圖像壓縮編碼、分行編碼等。在生物醫(yī)學(xué)工程中,書籍圖像技術(shù)能將人體活動(dòng)的機(jī)理以圖像的形式客觀地呈現(xiàn)在研究者面前,對(duì)醫(yī)學(xué)未來的發(fā)展具有不可替代的作用。

3數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)

計(jì)算機(jī)數(shù)字圖像處理技術(shù)在未來信息技術(shù)方面將會(huì)發(fā)揮的重要作用早已被人們看到,對(duì)于計(jì)算機(jī)圖像技術(shù)的發(fā)展道路,大致可以歸結(jié)出3個(gè)原則性內(nèi)容:①未來數(shù)據(jù)圖像技術(shù)強(qiáng)調(diào)高清晰度、高速傳輸、實(shí)時(shí)圖像處理、三維成像或多維成像、智能化、自動(dòng)化等方向發(fā)展。②未來數(shù)字圖像處理技術(shù)強(qiáng)調(diào)操作、運(yùn)用的方便性,圖像處理功能的集中化趨勢(shì)是必然會(huì)存在的。③更新的理論研究與更快的算法研究。理論走在實(shí)踐的前面,已經(jīng)是現(xiàn)代科學(xué)的特點(diǎn),未來數(shù)字圖像處理技術(shù)的實(shí)際運(yùn)用要取得更多的發(fā)展,必然離不開理論和研究方法的更新,新理論中包括小波分析、分形幾何、形態(tài)學(xué)、遺傳算法等都將得到更深層次的發(fā)展。

4結(jié)束語

數(shù)字圖像處理技術(shù)的有效應(yīng)用在人們?nèi)粘I钪芯湍芮猩淼馗惺艿剑还苁强措娨?、看電影、上網(wǎng)還是移動(dòng)通信,每個(gè)人都與這種技術(shù)發(fā)生著最緊密的聯(lián)系。數(shù)字圖像處理技術(shù)的發(fā)展關(guān)系到每個(gè)人對(duì)優(yōu)越的社會(huì)生活、現(xiàn)代物質(zhì)享受的程度的深淺,所以,對(duì)之進(jìn)行及時(shí)的研究和關(guān)注在電子通信行業(yè)中是非常重要的。

第7篇:計(jì)算機(jī)視覺的展望范文

【關(guān)鍵詞】單目視覺 風(fēng)洞 飛機(jī)模型 位姿判別 傳感系統(tǒng)

【Abstract】In order to provide a reference for later flight control computers, the study has studied and written a software system which could discriminate the position and orientation of wind tunnels model based on monocular vision. An aircraft model with driving force is able to fly stably and autonomously in the wind tunnel. By control-law, the aircraft model stays static relative to the ground, unlocking all six degrees of freedom. Multiple LED marked points are placed on the aircraft model. The CCD industrial camera model at the top of the model continuously captures the image and returns real-time image data to an upper computer with a dynamic link library. The free-flight trials system can get the spatial position and altitude information of the aircraft model through the use of upper computer software with C/C++ language, achieving identification algorithms, as well as position and orientation solver algorithms.

【Keywords】Monocular vision wind tunnel aircraft model attitude determination sensing systems

1 引言

近年來,隨著計(jì)算機(jī)技術(shù)和圖像處理技術(shù)以及數(shù)字視頻器件的發(fā)展,計(jì)算機(jī)機(jī)器視覺與視覺檢測(cè)在許多領(lǐng)域得到了廣泛應(yīng)用[1]:如機(jī)翼表面油流試驗(yàn)、壓敏漆表面壓力測(cè)量、模型變形測(cè)量、投放試驗(yàn)、非接觸位移測(cè)量等.另外在工業(yè)檢測(cè)[2]中應(yīng)用更加廣泛,如流水線工件自動(dòng)檢測(cè)、大型復(fù)雜曲面的三維檢測(cè)、大型工件平行度和垂直度測(cè)量、字符識(shí)別、醫(yī)學(xué)圖像分析、未來外星車導(dǎo)航[3]等等。在現(xiàn)代自動(dòng)化生產(chǎn)過程[4]中,機(jī)器視覺系統(tǒng)廣泛地應(yīng)用于工況監(jiān)視、成品檢驗(yàn)和質(zhì)量控制等領(lǐng)域。同時(shí),機(jī)器視覺與視覺檢測(cè)技術(shù)逐步發(fā)展為使用視頻測(cè)量技術(shù)(Videogram-metric Technique)[5],該技術(shù)在風(fēng)洞測(cè)量[6][7]這種要求非侵入式測(cè)量中具有無可比擬的優(yōu)勢(shì),因此在風(fēng)洞測(cè)量中得到了大量應(yīng)用。目前雖然我國利用CCD圖像傳感器設(shè)計(jì)出車牌識(shí)別[8][9]等系統(tǒng),逐步開始了工業(yè)現(xiàn)場(chǎng)的應(yīng)用[10],但是我國該技術(shù)起步較晚,應(yīng)用領(lǐng)域真正高端的不多。本文,將機(jī)器視覺技術(shù)應(yīng)用于基于單目視覺的風(fēng)洞模型位姿傳感系統(tǒng),提供了另一種獲取飛機(jī)空間位置信息研究飛機(jī)位姿的方法。擴(kuò)展了該技術(shù)的應(yīng)用領(lǐng)域,填補(bǔ)了國內(nèi)機(jī)器視覺技術(shù)發(fā)展的空白,順應(yīng)了時(shí)展的潮流。

2 風(fēng)洞模型及其工作原理

常規(guī)風(fēng)洞試驗(yàn)一般將模型固定在支架上,支架上裝有天平測(cè)力系統(tǒng),可以帶動(dòng)模型在一定自由度內(nèi)運(yùn)動(dòng)。但其顯著缺點(diǎn)是支架對(duì)模型周圍的流場(chǎng)存在干擾,同時(shí)模型自由度受到約束。常規(guī)風(fēng)洞試驗(yàn)如圖2.1:

而風(fēng)洞模型自由飛技術(shù)不限制模型自由度,沒有支架干擾,可以最大程度的模擬飛機(jī)在大氣中飛行的環(huán)境。本系統(tǒng)中引入機(jī)器視覺技術(shù),通過設(shè)計(jì)控制律,使模型相對(duì)于地面靜止,在模型上放置多個(gè)LED標(biāo)志物,通過CCD攝像機(jī)識(shí)別,推算模型的姿態(tài)或空間位置。如圖2.2:

3 相機(jī)接口實(shí)現(xiàn)

飛行器位姿識(shí)別屬于典型的機(jī)器視覺技術(shù)范疇,機(jī)器視覺技術(shù)是依靠圖像攝取裝置將攝取目標(biāo)轉(zhuǎn)換為圖像信號(hào),并將該信號(hào)傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號(hào);圖像系統(tǒng)對(duì)這些信號(hào)進(jìn)行各種運(yùn)算來抽取目標(biāo)的特征,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場(chǎng)的設(shè)備動(dòng)作的先進(jìn)技術(shù)。

圖像采集是機(jī)器視覺技術(shù)的兩大技術(shù)核心之一,由于既需要優(yōu)質(zhì)的圖像質(zhì)量,又需要高效的圖像采集速率,當(dāng)下普遍使用CCD相機(jī)(Charge-coupled Device)對(duì)攝取目標(biāo)進(jìn)行圖像采集。

CCD相機(jī)本質(zhì)上是一種半導(dǎo)體器件,能夠?qū)⑵胀ǖ墓鈱W(xué)影像轉(zhuǎn)化為特殊的數(shù)字信號(hào), CCD上植入的微小光敏物質(zhì)稱作像素(Pixel)。一塊CCD上包含的像素?cái)?shù)越多,其提供的畫面分辨率也就越高。一般而言CCD相機(jī)獲取的圖像為RGB圖像,也就是說每一個(gè)像素都由紅(R)綠(G)籃(B)三個(gè)成分組成,來表示RGB色彩空間中的一個(gè)點(diǎn)。CCD的作用就像膠片一樣,但它是把圖像像素轉(zhuǎn)換成數(shù)字信號(hào)。CCD上有許多排列整齊的電容,能感應(yīng)光線,并將影像轉(zhuǎn)變成數(shù)字信號(hào)。經(jīng)由外部電路的控制,每個(gè)小電容能將其所帶的電荷轉(zhuǎn)給它相鄰的電容。

相機(jī)攝取的光學(xué)影像轉(zhuǎn)換成的數(shù)字信號(hào),通過相機(jī)的驅(qū)動(dòng)程序可儲(chǔ)存到計(jì)算機(jī)的存儲(chǔ)器當(dāng)中。利用相機(jī)提供的接口配置好計(jì)算機(jī)的工程環(huán)境可以通過編寫開程序代碼對(duì)相機(jī)進(jìn)行操作控制,接口一般分為兩大類,一是主功能接口,具體功能包含攝像機(jī)開啟關(guān)閉、采集圖像、控制攝像機(jī)等具體操作,包含文件 GxIAPI.h,動(dòng)態(tài)鏈接庫 GxIAPI.dll,靜態(tài)鏈接庫 GxIAPI.lib二是圖像處理接口,包含數(shù)據(jù)轉(zhuǎn)換等功能操作。利用這些接口便可編寫相應(yīng)的代碼實(shí)現(xiàn)之后的位姿識(shí)別算法,包含文件 DxImageProc.h,動(dòng)態(tài)鏈接庫 DxImageProc.dll,靜態(tài)鏈接庫 DxImageProc.lib。

上述應(yīng)用接口庫支持32位編程開發(fā)工具M(jìn)icrosoft Visual C/C++。使用C/C++編程工具,用戶 應(yīng)在程序中調(diào)用相關(guān)的包含文件(.h),并將靜態(tài)鏈接庫(.lib)文件加入到工程文件中,供編譯程序在鏈接(Link)時(shí)使用。

完成上述準(zhǔn)備工作之后,便可采集圖像并根據(jù)編寫的程序?qū)D像進(jìn)行進(jìn)一步處理,其具體采集流程如圖3.1:

4 識(shí)別算法及其原理

通過CCD相機(jī)讀取到的圖像以類似矩陣的數(shù)據(jù)類型存儲(chǔ)在計(jì)算機(jī)中,其中黑暗環(huán)境的亮度值較低,其數(shù)據(jù)結(jié)構(gòu)中的標(biāo)記位會(huì)被標(biāo)記為0,而發(fā)光光源部分亮度值較高,其數(shù)據(jù)結(jié)構(gòu)中的標(biāo)記位會(huì)被標(biāo)記為1。其模型類似圖4.1,其中每一格代表一個(gè)像素點(diǎn):

1代表亮點(diǎn)

該算法從矩陣首行首列開始,由左至右,由上至下開始進(jìn)行遍歷搜索,每當(dāng)搜索到亮點(diǎn)(標(biāo)記位為1的像素點(diǎn)),就對(duì)該點(diǎn)進(jìn)行以該點(diǎn)為中心,依次按照上,右上,右,右下,下,左下,左,左上的優(yōu)先順序進(jìn)行搜索判斷,若相鄰點(diǎn)也為1,則對(duì)該相鄰點(diǎn)繼續(xù)擴(kuò)展搜索,直至將所有相鄰的亮度點(diǎn)全部搜索完畢,之后將所有被搜索到的點(diǎn)標(biāo)記為ACCESS,防止下次搜索重復(fù)計(jì)算,若此次擴(kuò)展搜索獲得的亮點(diǎn)總數(shù)超過設(shè)定值(本程序默認(rèn)設(shè)置為200,可修改)則判定此處為亮點(diǎn)。按照上述方法將全圖遍歷完成后,便可求得全圖所有亮度點(diǎn)。搜素偽代碼如下:

//********************************************

// 尋找亮點(diǎn)區(qū)域,記錄相關(guān)值,并標(biāo)記已訪問

// sumi 橫坐標(biāo)之和;sumj 縱坐標(biāo)之和;

// points 點(diǎn)區(qū)內(nèi)像素點(diǎn)的數(shù)目

//********************************************

findthearea(i,j)//標(biāo)記一個(gè)片區(qū)

5 位姿判別算法

參考六自由度頭部跟蹤算法[11][12],以四個(gè)LED燈所標(biāo)記的點(diǎn)所在平面為,即飛機(jī)為輻射坐標(biāo)系() ,令CCD攝像機(jī)攝像坐標(biāo)系代表風(fēng)洞的坐標(biāo)系(),CCD的成像面當(dāng)成圖像坐標(biāo)系(,)。因此,判斷飛機(jī)模型的姿態(tài)可以轉(zhuǎn)化為分析輻射坐標(biāo)系對(duì)于風(fēng)洞坐標(biāo)系的位置關(guān)系。由此可求得位姿信息,方位角α,滾轉(zhuǎn)角β,偏航角。

輻射坐標(biāo)系和攝像坐標(biāo)系的變換關(guān)系為

而矩陣H的表達(dá)式

采用小孔成像模型,像點(diǎn)坐標(biāo)(,)為:

其中i=A,B,C,D,代表所獲取飛機(jī)模型上的4個(gè)LED燈的信息。

綜合上述公式,進(jìn)行等量代換

假設(shè)4個(gè)LED燈構(gòu)成的正方形對(duì)角線長度為2L,則4個(gè)LED燈在輻射坐標(biāo)系下的坐標(biāo)為A(0,L,0),B(L,0,0) ,C(0,-L,0),D(-L,0,0)帶入前式,可知每個(gè)LED對(duì)應(yīng)2個(gè)方程:

設(shè):

根據(jù)以上兩式轉(zhuǎn)化這6個(gè)中間變量,然后聯(lián)系轉(zhuǎn)換矩陣H,便可求得位姿角:

6 Labview接口設(shè)計(jì)

飛控計(jì)算機(jī)的系統(tǒng)狀態(tài)實(shí)時(shí)顯示程序采用LabView開發(fā),便于模型狀態(tài)數(shù)據(jù)的記錄,飛控參數(shù)的調(diào)整。位姿信息最終作為輸入數(shù)據(jù)傳送到系統(tǒng)狀態(tài)實(shí)時(shí)顯示程序,程序?qū)斎氲奈蛔诵畔⒆鲞M(jìn)一步處理。

不同的位姿信息傳送方法對(duì)實(shí)時(shí)性的影響相差較大,因此,選擇高效的數(shù)據(jù)傳送方法至關(guān)重要。本項(xiàng)目擬采用LabView調(diào)用動(dòng)態(tài)鏈接庫的方法來實(shí)現(xiàn)數(shù)據(jù)傳送。

將獲取位姿信息源代碼編譯生成動(dòng)態(tài)鏈接庫文件,然后將文件加載至LabView項(xiàng)目中,通過調(diào)用動(dòng)態(tài)鏈接庫的接口函數(shù)來獲取位姿信息數(shù)據(jù),達(dá)到快速通訊的目的。

7 結(jié)語

風(fēng)洞模型自由飛技術(shù)是空氣動(dòng)力學(xué)領(lǐng)域一項(xiàng)先進(jìn)的測(cè)試技術(shù),可以模擬飛機(jī)復(fù)雜的飛行動(dòng)作,這項(xiàng)技術(shù)實(shí)現(xiàn)的關(guān)鍵之一是姿態(tài)測(cè)量。

本文針對(duì)通過飛機(jī)模型有限個(gè)標(biāo)志亮點(diǎn)來獲取模型位姿信息并傳送至上級(jí)處理系統(tǒng)的方法進(jìn)行了詳細(xì)的討論。通過對(duì)飛機(jī)模型姿態(tài)與模型上有限個(gè)亮點(diǎn)的位置信息的關(guān)系進(jìn)行分析,給出了實(shí)時(shí)位姿信息獲取系統(tǒng)的構(gòu)造思想。該系統(tǒng)提供實(shí)時(shí)的飛機(jī)模型位姿信息,為飛控計(jì)算機(jī)對(duì)模型的控制提供參考依據(jù)。

參考文獻(xiàn):

[1]賈云得.機(jī)器視覺[M].北京:科學(xué)出版社,2000.

[2]段峰,王耀南,雷曉峰,吳立釗,譚文.機(jī)器視覺技術(shù)及其應(yīng)用綜述[J].自動(dòng)化博覽,2002年03期.

[3]唐向陽,張勇,李江有,黃崗,楊松,關(guān)宏;機(jī)器視覺關(guān)鍵技術(shù)的現(xiàn)狀及應(yīng)用展望[J].昆明理工大學(xué)學(xué)報(bào)(理工版),2004年02期.

[4]關(guān)勝曉.機(jī)器視覺及其應(yīng)用發(fā)展[J].自動(dòng)化博覽,2005年03期.

[5]R.Shorts,W:L.Snow.Video-metric tracking of wind tunnel aerospace models at NASA

Langley research center[C].The Thompson Symposium held at the University of York

on 20th April 1 996:673~689.

[6]Hassan Mostafavi. Wind tunnel model aircraft attitude and motion analysis[J].PRO.SPIE.Signal and image processing systems performance evaluation simulmion and modeling.199I(1483):104~111.

[7]ohn V Foster,Kevin Cunningharn.Charles M.Fremaux.Dynamics modding and simulation of large transport airplanes in upset conditions[J].Navigation and control conference and exhibit,2005:l5~l 8.

[8]鄭南寧.計(jì)算機(jī)視覺與模式識(shí)別[M].北京:國防工業(yè)出版社,1998.

[9]劉煥軍,王耀南,段峰.機(jī)器視覺中的圖像采集技術(shù)[J].電腦與信息技術(shù),2003年01期

[10]王慶友,孫學(xué)株.CCD應(yīng)用技術(shù)[M].天津:天津大學(xué)出版社,1993

第8篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:鐵路貨車;輪對(duì)參數(shù);鐵路運(yùn)輸;安全系數(shù);自動(dòng)檢測(cè)系統(tǒng)

中圖分類號(hào):U270 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-2374(2014)33-0025-02

輪對(duì)是鐵路貨車行走過程中重要的構(gòu)件,安全高效的輪對(duì)是保證鐵路能夠快速、安全運(yùn)輸?shù)年P(guān)鍵因素,輪對(duì)故障導(dǎo)致的安全事故屢見不鮮,給鐵路運(yùn)輸造成了嚴(yán)重的損失。另外,輪對(duì)故障也會(huì)給車輛本身以及鐵路固定設(shè)施帶來一定程度的損害。目前,我國仍然依靠傳統(tǒng)的人工手動(dòng)測(cè)量來對(duì)其進(jìn)行故障的檢測(cè)診斷,不但效率低下,檢測(cè)精度以及可檢測(cè)項(xiàng)目也不盡如人意,為鐵路正常運(yùn)行帶來了隱患。因此,發(fā)展一種新型的自動(dòng)貨車輪對(duì)檢測(cè)技術(shù)對(duì)于提高我國檢測(cè)水平、提高鐵路運(yùn)輸安全系數(shù)有著重要的意義。

1 輪對(duì)自動(dòng)檢測(cè)技術(shù)的原理及現(xiàn)狀

目前來說,國內(nèi)外主要應(yīng)用的輪對(duì)自動(dòng)檢測(cè)技術(shù)按照原理分類,可分為以下三類:光截圖像原理技術(shù)、視覺自動(dòng)測(cè)量技術(shù)以及激光位移測(cè)距技術(shù),主要應(yīng)用于貨車的入庫檢查以及地鐵在線監(jiān)查上。下面分別簡述一下這三類原理:

1.1 光截圖像原理技術(shù)

這種技術(shù)主要原理為利用三角激光測(cè)量技術(shù)來實(shí)現(xiàn)測(cè)量物體二維尺寸的目的。采用的投射光源為點(diǎn)狀高強(qiáng)度激光,高速的CCD相機(jī)作為圖像采集設(shè)備。當(dāng)測(cè)試完畢后會(huì)得到一系列的曲線,將其和標(biāo)準(zhǔn)的校正曲線進(jìn)行比對(duì)矯點(diǎn),從而實(shí)現(xiàn)目標(biāo)參數(shù)的自動(dòng)檢測(cè)。這種技術(shù)在低速以及靜態(tài)測(cè)量中的精度比較高,但是對(duì)于高速測(cè)量的精度尚不能令人滿意,這是由于CCD相機(jī)的采集速度有限而造成的。但是這種原理制備的設(shè)備價(jià)格低廉、操作簡單,得到了廣泛的應(yīng)用,如丹麥的EDOC公司、美國的BEENA公司以及國內(nèi)的哈爾濱威克公司等都有相應(yīng)的產(chǎn)品。

1.2 視覺自動(dòng)測(cè)量技術(shù)

視覺自動(dòng)測(cè)量技術(shù)是一種基于視覺測(cè)量系統(tǒng),建立在計(jì)算機(jī)視覺研究基礎(chǔ)上的新興技術(shù),其優(yōu)點(diǎn)為抗干擾能力強(qiáng)、高效易行,非常適合一些在現(xiàn)場(chǎng)生產(chǎn)中的在線非接觸性監(jiān)控及監(jiān)測(cè)。在實(shí)際生產(chǎn)過程中,該技術(shù)基于視頻成像原理及先進(jìn)的圖像識(shí)別功能工作,通過高速攝像機(jī)現(xiàn)場(chǎng)拍攝車輛輪對(duì)運(yùn)行狀況,采用逐幀截屏得到清晰圖片,再對(duì)圖片進(jìn)行識(shí)別辨認(rèn)的方法來實(shí)現(xiàn)對(duì)車輛輪對(duì)的監(jiān)控監(jiān)測(cè)。

1.3 激光位移測(cè)距技術(shù)

激光位移技術(shù)是一種高精度、高精密的非接觸行測(cè)量技術(shù),主要用于測(cè)量對(duì)象物體的位置以及位移的變化,可以準(zhǔn)確監(jiān)測(cè)出物體的位移、體積尺寸、振動(dòng)頻率等物理幾何量的測(cè)量。按照原理,激光位移技術(shù)可分為激光回波法和激光三角測(cè)量法兩種,而在鐵輪貨車輪對(duì)檢測(cè)中主要用的是激光三角測(cè)量法,這種檢測(cè)方法精度高,但監(jiān)測(cè)的距離較短。在實(shí)際應(yīng)用中,左右兩路光電流從激光位移傳感器發(fā)出,通過干涉成像,就可以反推算出物體激光點(diǎn)和成像透鏡前面的距離,從而達(dá)到監(jiān)測(cè)的目的。目前這種技術(shù)已經(jīng)被應(yīng)用于我國部分鐵路

路段。

2 輪對(duì)自動(dòng)檢測(cè)系統(tǒng)的研制及簡單介紹

2.1 系統(tǒng)結(jié)構(gòu)整體設(shè)計(jì)

根據(jù)輪對(duì)檢測(cè)工藝要求以及車間的實(shí)際工作狀況,我們?cè)O(shè)計(jì)了一種以龍門通過式機(jī)械結(jié)構(gòu)為基礎(chǔ)的輪對(duì)自動(dòng)檢測(cè)系統(tǒng),其簡單組成主要包括進(jìn)給總成、升降總成、帶轉(zhuǎn)總成、測(cè)量裝置以及傳感器等。待貨車輪對(duì)沿著特定軌道進(jìn)入測(cè)量裝置后,通過各個(gè)部件的協(xié)同作用以及協(xié)調(diào)工作,自動(dòng)完成對(duì)輪對(duì)各參數(shù)的測(cè)量。本裝置可以檢測(cè)的輪對(duì)參數(shù)主要包括輪緣厚度、輪座直徑、車輪直徑、車軸中央直徑等。

待測(cè)的輪對(duì)在自動(dòng)計(jì)算機(jī)控制系統(tǒng)的作用下,通過導(dǎo)向裝置機(jī)構(gòu)使得輪對(duì)到達(dá)指定的測(cè)量位置,具體如下:當(dāng)輪對(duì)滾動(dòng)到待測(cè)位置時(shí),擋輪裝置將其擋住,位于裝置下方的輪對(duì)提升結(jié)構(gòu)將輪對(duì)升起后由轉(zhuǎn)動(dòng)裝置驅(qū)使輪對(duì)轉(zhuǎn)動(dòng)。

與此同時(shí),測(cè)量裝置在直線電機(jī)的驅(qū)動(dòng)下,通過絲杠的帶動(dòng)使其沿直線運(yùn)動(dòng)單元迅速下降到測(cè)量位置停止。當(dāng)測(cè)量傳感器做橫向運(yùn)動(dòng)時(shí),可以測(cè)量輪對(duì)的中央直徑,左右輪緣寬度等參數(shù);和其相連的旋轉(zhuǎn)電機(jī)可以控制測(cè)量傳感器做順時(shí)針以及逆時(shí)針的旋轉(zhuǎn),可以測(cè)量左右輪座直徑以及輪輞厚等參數(shù)。在自動(dòng)控制系統(tǒng)的作用下,激光傳感器按照一定的路徑做直線往復(fù)運(yùn)動(dòng),可以自動(dòng)采集被測(cè)輪對(duì)中各測(cè)量點(diǎn)的數(shù)據(jù),通過安裝的攝像裝置可以將裝置板上的圖像反映到計(jì)算機(jī)的顯示屏上,經(jīng)過計(jì)算機(jī)運(yùn)算處理后得到測(cè)量結(jié)果保存到相應(yīng)數(shù)據(jù)庫中并自動(dòng)打印。當(dāng)采集數(shù)據(jù)完成后,左右的測(cè)量裝置以及激光傳感器自動(dòng)上升到初始位置,測(cè)試的輪對(duì)停止轉(zhuǎn)動(dòng)并自動(dòng)下降,最后由輪推裝置推出測(cè)量位置,完成整個(gè)的工作循環(huán)。

2.2 測(cè)控系統(tǒng)設(shè)計(jì)

本自動(dòng)檢測(cè)系統(tǒng)的測(cè)控系統(tǒng)主要有工業(yè)控制高精密計(jì)算機(jī)、運(yùn)動(dòng)控制部分、數(shù)據(jù)自動(dòng)采集處理部分以及測(cè)控軟件等部分組成。

2.2.1 工業(yè)控制高精密計(jì)算機(jī)。該部分作為整體系統(tǒng)的關(guān)鍵組成之一,擔(dān)負(fù)著處理數(shù)據(jù),采集打印圖像以及對(duì)運(yùn)動(dòng)的部件進(jìn)行高精度高準(zhǔn)確度控制的作用。設(shè)計(jì)中我們采用的是方正的主機(jī),CPU為AMD 速龍II X4 740,內(nèi)存為4GB的DDR內(nèi)存,配備Dell打印機(jī),利用Windows自帶的Microsoft Visual C++ 7.0編程系統(tǒng)進(jìn)行編程。我們采用的計(jì)算機(jī)配置較高,編程系統(tǒng)較為先進(jìn),為整個(gè)檢測(cè)系統(tǒng)的優(yōu)良性能奠定了良好的基礎(chǔ)。

2.2.2 運(yùn)動(dòng)控制部分。運(yùn)動(dòng)控制部分主要由步進(jìn)電機(jī)、氣動(dòng)控制裝置以及異步電機(jī)三部分組成。實(shí)際運(yùn)行條件下,要求本系統(tǒng)的定位精度高,整體系統(tǒng)動(dòng)作平穩(wěn),沖擊力小。因?yàn)樾D(zhuǎn)特性不同,結(jié)合實(shí)際現(xiàn)場(chǎng)運(yùn)行的需要,選擇合適的電機(jī)是非常重要的。在輪對(duì)旋轉(zhuǎn)中,由于對(duì)電機(jī)的要求較低,因此采用的是步進(jìn)電機(jī),最佳細(xì)分圈數(shù)為6400步/圈。在滑臺(tái)極限位置兩側(cè)安裝有光電開發(fā),實(shí)現(xiàn)對(duì)運(yùn)動(dòng)極限位置的控制,保護(hù)與之相連的傳感器。設(shè)計(jì)中旋轉(zhuǎn)運(yùn)動(dòng)機(jī)構(gòu)和橫向運(yùn)動(dòng)機(jī)構(gòu)對(duì)電機(jī)要求較高,因此我們使用了帶有64位高性能RISC中央處理器的交流伺服電機(jī),提高了機(jī)器的響應(yīng)性。

2.2.3 數(shù)據(jù)自動(dòng)采集處理部分。數(shù)據(jù)采集部分主要由激光傳感器,電渦流傳感器以及A/D采集卡三部分組成,這部分也是系統(tǒng)設(shè)計(jì)最重要的部分,其采集數(shù)據(jù)的準(zhǔn)確度決定著系統(tǒng)的檢測(cè)精度,是設(shè)計(jì)中的重點(diǎn)。其基本工作原理是激光傳感器輸出的電信號(hào)經(jīng)由電渦流傳感器的放大、濾波、抑躁處理后送入A/D采集卡進(jìn)行模數(shù)轉(zhuǎn)換。

設(shè)計(jì)中利用電渦流傳感器對(duì)輪對(duì)的踏面進(jìn)行高速的數(shù)據(jù)采集,計(jì)算機(jī)處理后可得踏面特征;對(duì)于車輪直徑以及車軸中央直徑等則采用激光傳感器。為排除實(shí)際操作條件下的干擾,我們自行設(shè)計(jì)了一種A/D采集卡,帶有32bit分辨率的A/D轉(zhuǎn)換器以及模擬輸入通道,保證最佳轉(zhuǎn)換精度,最大限度地保證了數(shù)據(jù)的可靠性。

2.2.4 測(cè)控軟件。本系統(tǒng)采用先進(jìn)的VC++7.0進(jìn)行軟件的設(shè)計(jì),采用先進(jìn)的多線程編程技術(shù),利用模塊化設(shè)計(jì)方法,軟件程序結(jié)構(gòu)清晰,使用界面具有自動(dòng)填入、人工修改編輯的功能,上手快,使用方便。數(shù)據(jù)庫方面,我們采用的是ODBC法來訪問Access數(shù)據(jù)庫。

3 貨車輪對(duì)自動(dòng)檢測(cè)技術(shù)展望

國內(nèi)外的研究結(jié)果表明,現(xiàn)有的輪對(duì)自動(dòng)檢測(cè)技術(shù)基本上已經(jīng)具備實(shí)際應(yīng)用的條件,但是目前我國的檢測(cè)系統(tǒng)大部分安裝于列車通過速度較低的路段,并且受氣候條件影響較小;而鐵路重載貨車具有速度高、環(huán)境惡劣等特點(diǎn),還需對(duì)現(xiàn)有自動(dòng)檢測(cè)系統(tǒng)技術(shù)作進(jìn)一步的深入研究,從而實(shí)現(xiàn)其廣泛應(yīng)用,消除安全隱患,杜絕由輪對(duì)故障導(dǎo)致的嚴(yán)重安全事故。

參考文獻(xiàn)

[1] 黃曙光,黃海,吳乃優(yōu),敖銀輝,高向東.鐵路貨車輪對(duì)自動(dòng)檢測(cè)系統(tǒng)的研制[J].機(jī)電工程技術(shù),2002,(2).

第9篇:計(jì)算機(jī)視覺的展望范文

關(guān)鍵詞:雙目立體視覺; 攝像機(jī)標(biāo)定;立體匹配;三維重建

中圖分類號(hào):TP37 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)09-2145-03

The Analysis of the Technology and the Future Application of the Binocular Stereo Vision System

CHENG Huang-jin

(Huainan Union University, Huainan 232038, China)

Abstract: This article makes an analysis of the implementation process of the binocular stereo vision technology,presents implementation methods and drawbacks of camera calibration, feature extraction, stereo matching, especially gives a practical and effective 3D reconstruction method ,the article also analyses and prospects the future application and development of this technology.

Key words: binocular stereo vision; camera calibration; stereo matching; 3D reconstruction

雙目立體視覺(Binocular Stereo Vision)是計(jì)算機(jī)視覺的一種重要形式,它是基于視差原理,由不同位置的A、B兩臺(tái)或者同一位置的一臺(tái)攝像機(jī)(CCD)經(jīng)過位置移動(dòng)或者旋轉(zhuǎn)來拍攝同一幅場(chǎng)景,通過計(jì)算對(duì)應(yīng)點(diǎn)在兩幅圖像間的位置偏差,來獲取物體三維幾何信息的方法。和其他類的體視方法相比,如投影式、透鏡板式、全息照相式等三維成像技術(shù),雙目立體視覺測(cè)量方法具有低成本、高效率、結(jié)構(gòu)簡單、精度合適等優(yōu)點(diǎn)。自上世紀(jì)80年代創(chuàng)立以來,經(jīng)過近幾十年的發(fā)展,雙目立體視覺已經(jīng)成為計(jì)算機(jī)被動(dòng)測(cè)距方法中最重要的距離感知技術(shù),已在工業(yè)檢測(cè)、機(jī)器人導(dǎo)航、醫(yī)學(xué)機(jī)器成像、控制與檢測(cè)位姿、以及在軍事和航空測(cè)繪上等眾多領(lǐng)域中得到了越來越廣泛的應(yīng)用。

1 雙目體視系統(tǒng)的實(shí)現(xiàn)

雙目立體視覺技術(shù)的實(shí)現(xiàn)一般可分為:圖像獲取、攝像機(jī)標(biāo)定、特征提取、圖像匹配和三維重建幾個(gè)步驟,以下是各個(gè)過程的具體實(shí)現(xiàn)方法和特點(diǎn)。

1.1 圖像獲取

圖像獲取指的是先通過多個(gè)或單個(gè)攝像機(jī)從不同位置拍攝某物體,得到至少兩幅的二維圖像,再利用立體視覺方法對(duì)此圖像進(jìn)行處理,最終獲取同一場(chǎng)景的三維幾何信息的過程。立體視覺可在多種條件下靈活地測(cè)量景物的三維立體信息,在計(jì)算機(jī)被動(dòng)測(cè)距方法中,它是一種最重要的距離感知技術(shù),在非接觸測(cè)量中占有越來越重要的位置。

雙目體視系統(tǒng)的圖像獲取對(duì)應(yīng)的針孔模型如圖1所示。在理想狀態(tài)下,攝像機(jī)C1與C2的光軸互相平行,內(nèi)部參數(shù)和角距也都相等,并且圖中的二維成像平面x1o1y1和x2o2y2重合,其中P1與P2分別是空間點(diǎn)P在C1與C2上的成像點(diǎn)。但在實(shí)際應(yīng)用中,需要考慮兩臺(tái)攝像機(jī)的內(nèi)部參數(shù)不完全相同帶來的影響,要精確分析雙目體視系統(tǒng)的結(jié)構(gòu)參數(shù)與測(cè)量精度之間的關(guān)系,并對(duì)某一特定點(diǎn)進(jìn)行三角測(cè)量試驗(yàn),進(jìn)而得到兩臺(tái)攝像機(jī)光軸夾角與該點(diǎn)測(cè)量誤差之間的函數(shù)關(guān)系。通常在兩攝像頭光軸夾角一定的情況下,測(cè)量誤差將隨著被測(cè)坐標(biāo)系與攝像頭坐標(biāo)系之間距離的增大而增大,在滿足測(cè)量范圍的前提下,一般選擇兩CCD之間的正向夾角為銳角,且大于45度。

1.2 攝像機(jī)標(biāo)定[2,4-5]

對(duì)雙目體視而言,攝像機(jī)或數(shù)碼相機(jī)是利用計(jì)算機(jī)技術(shù)對(duì)物理世界進(jìn)行重建前的基本測(cè)量工具,由于攝像機(jī)參數(shù)會(huì)因?yàn)榻M合過程、環(huán)境溫度、零件更換等發(fā)生變化,為了準(zhǔn)確定位,攝像機(jī)必須標(biāo)定。攝像機(jī)標(biāo)定是實(shí)現(xiàn)立體視覺技術(shù)的關(guān)鍵步驟之一,標(biāo)定的參數(shù)有關(guān)于光學(xué)與幾何性質(zhì)的內(nèi)部參數(shù)和涉及坐標(biāo)系三維位置與方向的外部參數(shù),為了得到兩個(gè)攝像機(jī)的內(nèi)、外參數(shù),通常先采用單攝像機(jī)的標(biāo)定方法,再通過同一世界坐標(biāo)中的一組定標(biāo)點(diǎn)來建立兩個(gè)攝像機(jī)之間的位置關(guān)系。

標(biāo)定方法分精度低但簡單快速的線性標(biāo)定法和考慮畸變參數(shù)但復(fù)雜繁瑣的非線性標(biāo)定法。在單攝像機(jī)標(biāo)定方法中,目前常用的主要有:直接線性變換法、傳統(tǒng)設(shè)備標(biāo)定法、透視變換矩陣法和線性與非線性結(jié)合法等。在雙攝像機(jī)標(biāo)定中,是否有精確的外部參數(shù)決定著最終的標(biāo)定結(jié)果,受結(jié)構(gòu)配置的準(zhǔn)確性和攝像機(jī)距離與視角的影響,一般都需要確定8個(gè)以上的已知世界坐標(biāo)點(diǎn),才能得到比較滿意的參數(shù)矩陣。此外,雙攝像機(jī)標(biāo)定中除了考慮焦距、主點(diǎn)坐標(biāo)、線性誤差等以外,還需考慮徑向、切向和離心畸變,以及鏡頭校正、測(cè)量范圍等問題,應(yīng)用范圍受到了很大的限制。目前,通用性較好的有基于神經(jīng)網(wǎng)絡(luò)的雙目立體視覺攝像機(jī)標(biāo)定法,有采用線性與非線性變換結(jié)合標(biāo)定法等,前者的基本思想是先對(duì)攝像機(jī)進(jìn)行線性標(biāo)定,然后通過網(wǎng)絡(luò)訓(xùn)練建立起三維空間點(diǎn)位置補(bǔ)償?shù)亩鄬忧梆伾窠?jīng)網(wǎng)絡(luò)模型。后者是先利用直接線性轉(zhuǎn)換模型(DLT)得到投影矩陣,通過約束條件分解參數(shù)矩陣,分別求出攝像機(jī)內(nèi)部參數(shù);然后將得到的標(biāo)定參數(shù)作為初值,代入非線性方程進(jìn)行優(yōu)化,得到精確的標(biāo)定參數(shù)。

1.3 特征點(diǎn)提取[1-3]

測(cè)量中,測(cè)量精度將直接受到特征點(diǎn)的二維圖像坐標(biāo)能否準(zhǔn)確提取的影響,需要提取的特征點(diǎn)應(yīng)當(dāng)與傳感器類型及抽取特征所用技術(shù)等相適應(yīng),并且要具有足夠的魯棒性和一致性。因?yàn)樵趫D像獲取過程中,存在一系列的噪聲源,為了顯著的改進(jìn)圖像質(zhì)量,使圖像征點(diǎn)更加突出,通常在進(jìn)行特征點(diǎn)像的坐標(biāo)提取前,要對(duì)獲取的圖像進(jìn)行預(yù)處理。

目前,常見的特征點(diǎn)提取方法有邊緣提取法、興趣算子法、最小灰度差法等。其中邊緣提取法和興趣算子法對(duì)光照條件比較敏感,當(dāng)物體相鄰面的灰度近似時(shí),這些方法能夠在較低的精度要求下,概括且有效地提取特征點(diǎn),然而當(dāng)某一像素存在于局部灰度出現(xiàn)差異的區(qū)域,或者存在于具有不同灰度值的幾個(gè)相鄰區(qū)域之間時(shí),這些方法也往往會(huì)將其作為邊緣特征點(diǎn)提取出來。而最小灰度差法是對(duì)數(shù)字圖像的每一個(gè)原像素,分別考察與其同行、同列或?qū)窍噜彽娜舾蓚€(gè)像素的灰度變化,再選取這些像素與原像素間灰度差的最小值來作為特征點(diǎn)算子值的一種方法。它可以最大程度的消除物體相鄰面及物體與背景間存在的灰度差異而造成的影響,對(duì)外界光照條件具有較強(qiáng)的適應(yīng)性,但一致性較差。

1.4 立體匹配[1-2,6]

立體匹配是雙目體視技術(shù)中最重要,也是最復(fù)雜的一步。當(dāng)二維圖像特征點(diǎn)提取后,關(guān)鍵任務(wù)是匹配,也就是尋求左(右)圖像中的每個(gè)特征點(diǎn)在右(左)圖像中的對(duì)應(yīng)點(diǎn)。由于將空間三維場(chǎng)景投影為平面二維圖像時(shí),同一景物在不同視點(diǎn)下的圖像中存在著明顯差異,并且場(chǎng)景中的噪聲干擾、光照條件、景物的物理特性與幾何形狀、攝像機(jī)特性等諸多變化因素都將被綜合到單一的圖像灰度值中,因此僅由灰度值來定性以上這些因素和特征是十分困難的。為了求解對(duì)應(yīng)和減少錯(cuò)誤匹配,人們建立了諸如唯一性約束、連續(xù)性約束、外極線約束、一致性約束等許多約束,然而隨著約束條件的增加,匹配難度相應(yīng)增大,匹配的選擇性空間相應(yīng)縮小。根據(jù)匹配基元的不同,立體匹配的算法可分為區(qū)域匹配、特征匹配和相位匹配三大類。

區(qū)域匹配算法是利用局部窗口之間灰度信息的相關(guān)程度,通過區(qū)域匹配建立特征點(diǎn)與對(duì)應(yīng)點(diǎn)之間的相互關(guān)系的一種方法,它在變化平緩且細(xì)節(jié)豐富的地方可以達(dá)到較高的精度,但該算法的計(jì)算量大、速度慢,并且存在著匹配窗大小難以選擇的缺點(diǎn)。與區(qū)域匹配相比,特征匹配則不直接依賴于灰度,利用對(duì)高頻噪聲不敏感的模型來提取和定位特征,因此具有較強(qiáng)的抗干擾性,算法簡便且高效,但匹配結(jié)果的精確度受到特征提取和定位過程的直接影響,特征在圖像中的稀疏性決定著特征匹配只能得到稀疏的視差場(chǎng)。相位匹配是近二十年才發(fā)展起來的一類匹配算法,它將相位作為匹配基元,很好的抑制了圖像的高頻噪聲,適于并行處理,能獲得亞像素級(jí)精度的致密視差,但也存在著相位奇點(diǎn)和相位卷繞的問題。

1.5 三維重建[1,6]

在完成了圖像獲取、攝像機(jī)標(biāo)定、特征點(diǎn)提取和立體匹配之后,就得到了任一被測(cè)點(diǎn)在兩個(gè)圖像中的對(duì)應(yīng)齊次坐標(biāo)和兩攝像機(jī)的參數(shù)矩陣,接下來就是對(duì)空間點(diǎn)進(jìn)行三維重建。

結(jié)合上述圖1,用兩個(gè)參數(shù)標(biāo)定過的攝像機(jī)同時(shí)觀察空間物體表面上任意一點(diǎn)P,在確定了攝像機(jī)圖像上的共軛對(duì)應(yīng)點(diǎn)P1和P2是同一空間點(diǎn)P的圖像點(diǎn)后,P點(diǎn)的空間位置就可以由兩直線O1P1與O2P2的交點(diǎn)來唯一確定,其中O1,O2分別為兩攝像機(jī)的光心。

設(shè)攝像機(jī)的投影矩陣為:

代入下式:

其中(x1,y1,1)與(x2,y2,1)分別為P1與P2在各自圖像中的齊次坐標(biāo);(X,Y,Z,1)為P點(diǎn)在世界坐標(biāo)系下的齊次坐標(biāo);ωi(i=1,2)為非零參數(shù),αimn(m=1,2,3;n=1,2,3,4)為投影矩陣Ai(i=1,2)中的元素,它們與攝像機(jī)的位置及成像系統(tǒng)參數(shù)有關(guān),可通過攝像機(jī)標(biāo)定來確定。

攝像機(jī)標(biāo)定后,根據(jù)式(1)和被測(cè)點(diǎn)P在攝像機(jī)像面上的像點(diǎn)坐標(biāo)(x1,y1)與(x2,y2),可將上式變形為:

(2)

即:

(3)

這樣就可以求出未知點(diǎn)P的三維空間坐標(biāo)(X,Y,Z)。

在測(cè)量過程中,當(dāng)標(biāo)定參照物與被測(cè)物體的相對(duì)位置始終保持不變的情況下,也可以只用一個(gè)攝像機(jī),采用多個(gè)不同位置分別拍攝的方法,得到同一物體的多幅二維圖像。

2 雙目體視系統(tǒng)的發(fā)展[1,6]

正如本文引言所述,雙目立體視覺系統(tǒng)發(fā)展到現(xiàn)在,已經(jīng)在很多領(lǐng)域得到了廣泛應(yīng)用。例如日本大阪大學(xué)自適應(yīng)機(jī)械系統(tǒng)研究院研制了一種自適應(yīng)雙目視覺伺服系統(tǒng);東京大學(xué)將實(shí)時(shí)雙目立體視覺和機(jī)器人整體姿態(tài)信息集成,開發(fā)了仿真機(jī)器人動(dòng)態(tài)行走導(dǎo)航系統(tǒng);華盛頓大學(xué)與微軟公司合作為火星衛(wèi)星“探測(cè)者”號(hào)研制了寬基線立體視覺系統(tǒng),使“探測(cè)者”號(hào)能夠在火星上對(duì)其即將跨越的幾千米內(nèi)的地形進(jìn)行精確的定位和導(dǎo)航;浙江大學(xué)機(jī)械系完全利用透視成像原理,采用雙目體視方法實(shí)現(xiàn)了對(duì)多自由度機(jī)械裝置的動(dòng)態(tài)、精確位姿檢測(cè);哈工大采用異構(gòu)雙目活動(dòng)視覺系統(tǒng)實(shí)現(xiàn)了全自主足球機(jī)器人導(dǎo)航等等。

但就雙目立體視覺技術(shù)的發(fā)展現(xiàn)狀而言,要構(gòu)造出類似于人眼的通用雙目立體視覺系統(tǒng),還有很長的路要走,未來的發(fā)展趨勢(shì)可總結(jié)如下:

1)如何建立更有效的雙目體視模型,能更充分地反映立體視覺不確定性的本質(zhì)屬性,為匹配提供更多的約束信息,降低立體匹配的難度;

2)探索新的適用于全面立體視覺的計(jì)算理論和匹配策略,選擇有效的匹配準(zhǔn)則和算法結(jié)構(gòu),以解決存在灰度失真、幾何畸變(透視、旋轉(zhuǎn)、縮放等)、噪聲干擾、特殊結(jié)構(gòu)(平坦區(qū)域、重復(fù)相似結(jié)構(gòu)等)及遮掩景物的匹配問題;

3)算法向并行化發(fā)展,提高速度,減少運(yùn)算量,增強(qiáng)系統(tǒng)的實(shí)用性;

4)強(qiáng)調(diào)場(chǎng)景與任務(wù)的約束,針對(duì)不同的應(yīng)用目的,建立有目的的和面向任務(wù)的體視系統(tǒng)。

參考文獻(xiàn):

[1] 管業(yè)鵬,童林夙.雙目立體視覺測(cè)量方法研究[J].儀器儀表學(xué)報(bào),2003,24(6):581-584.

[2] 隋婧,金偉其.雙目立體視覺技術(shù)的實(shí)現(xiàn)及其進(jìn)展[J].電子技術(shù)應(yīng)用,2004(10):4-6.

[3] Barnard S T, Thompson W B.Disparity Analysis of Images IEEE Trans,1980,PAM I-2(4):333-340.

[4] Golub G, Loan C van, Matrix Computations[M].Balti-more,Maryland:The John Hopkins University Press,1996.