网站首页
教育杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
医学杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
经济杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
金融杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
管理杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
科技杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
工业杂志
CSSCI期刊 北大期刊 CSCD期刊 统计源期刊 知网收录期刊 维普收录期刊 万方收录期刊 SCI期刊(美)
SCI杂志
中科院1区 中科院2区 中科院3区 中科院4区
全部期刊
公務(wù)員期刊網(wǎng) 精選范文 計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

計(jì)算機(jī)視覺的優(yōu)點(diǎn)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺的優(yōu)點(diǎn)主題范文,僅供參考,歡迎閱讀并收藏。

計(jì)算機(jī)視覺的優(yōu)點(diǎn)

第1篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

關(guān)鍵詞:計(jì)算機(jī)視覺技術(shù);食品工業(yè);分級(jí);圖像處理

中圖分類號(hào): TS207 文獻(xiàn)標(biāo)識(shí)碼:A

隨著微型個(gè)人計(jì)算機(jī)應(yīng)用的越來越廣泛,以及計(jì)算機(jī)在綜合學(xué)科中應(yīng)用的深入研究,現(xiàn)如今在工農(nóng)業(yè)、軍事國防、醫(yī)學(xué)衛(wèi)生等眾多領(lǐng)域的使用和研究方面計(jì)算機(jī)視覺技術(shù)都起到了至關(guān)重要的作用,為了節(jié)省人力、降低成本、減少誤差,該項(xiàng)技術(shù)在食品企業(yè)、科研院所、檢測(cè)機(jī)構(gòu)中的應(yīng)用更加普遍。如今,在農(nóng)產(chǎn)品藥物殘留檢測(cè)、水果重量分級(jí)、等級(jí)篩選、質(zhì)量監(jiān)管等方面計(jì)算機(jī)視覺技術(shù)有眾多應(yīng)用。

1 計(jì)算機(jī)視覺技術(shù)概述

計(jì)算機(jī)視覺技術(shù)是利用計(jì)算機(jī)、攝像機(jī)、圖像卡以及相關(guān)處理技術(shù)來模擬人的視覺,用以識(shí)別、感知和認(rèn)識(shí)我們生活的世界[1]。該技術(shù)是模擬識(shí)別人工智能、心理物理學(xué)、圖像處理、計(jì)算機(jī)科學(xué)及神經(jīng)生物學(xué)等多領(lǐng)域的綜合學(xué)科。計(jì)算機(jī)視覺技術(shù)用攝像機(jī)模擬人眼,用計(jì)算機(jī)模擬大腦,用計(jì)算機(jī)程序和算法來模擬人對(duì)事物的認(rèn)識(shí)和思考,替代人類完成程序?yàn)槠湓O(shè)定的工作。該技術(shù)由多個(gè)相關(guān)的圖像處理系統(tǒng)組成,主要包括光源提供系統(tǒng)、圖像提取系統(tǒng)、計(jì)算機(jī)數(shù)據(jù)運(yùn)算系統(tǒng)等。原理是:首先通過攝像機(jī)獲得所需要的圖像信息,然后利用信號(hào)轉(zhuǎn)換將獲得的圖像信息轉(zhuǎn)變?yōu)閿?shù)字圖像以便計(jì)算機(jī)正確識(shí)別[2]。隨著科學(xué)技術(shù)的發(fā)展,計(jì)算機(jī)技術(shù)在各個(gè)領(lǐng)域得到廣泛應(yīng)用,計(jì)算機(jī)視覺技術(shù)不僅在代替人類視覺上取得了重大成就,而且在很多具體工作方便超越了人的視覺功能。計(jì)算機(jī)視覺計(jì)算有如此快速的發(fā)展,是因?yàn)榕c人類的視覺相比該技術(shù)具有以下顯著優(yōu)勢(shì)[3]。

1.1 自動(dòng)化程度高

計(jì)算機(jī)視覺可以實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品的多個(gè)外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時(shí)檢測(cè)分析,可以進(jìn)行整體識(shí)別、增強(qiáng)對(duì)目標(biāo)識(shí)別的準(zhǔn)確性。

1.2 實(shí)現(xiàn)無損檢測(cè)

由于計(jì)算機(jī)視覺技術(shù)對(duì)農(nóng)產(chǎn)品的識(shí)別是通過掃描、攝像,而不需要直接接觸,可以減少對(duì)所檢測(cè)食品的傷害。

1.3 穩(wěn)定的檢測(cè)精度

設(shè)計(jì)的運(yùn)行程序確定后,計(jì)算機(jī)視覺技術(shù)的識(shí)別功能就會(huì)具有統(tǒng)一的識(shí)別標(biāo)準(zhǔn),具有穩(wěn)定的檢測(cè)精度,避免了人工識(shí)別和檢測(cè)時(shí)主觀因素所造成的差異。

2 計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用

20世紀(jì)70年代初,學(xué)者開始研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計(jì)算機(jī)視覺技術(shù)也越來越成熟。國內(nèi)外學(xué)者在研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對(duì)果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識(shí)別、內(nèi)部無損檢測(cè)等方面。國內(nèi)有關(guān)計(jì)算機(jī)視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國外發(fā)達(dá)國家晚多達(dá)20a,但是發(fā)展很快。

2.1 計(jì)算機(jī)視覺技術(shù)在果蔬分級(jí)中的應(yīng)用研究

計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測(cè)到內(nèi)部腐爛程度的檢測(cè)都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計(jì)算機(jī)算法計(jì)算水果的半徑,進(jìn)而得出果蔬的最大直徑。研究表明,該算法不僅降低了計(jì)算量而且提高了計(jì)算精度,此方法用于水果分級(jí)的誤差不超過2mm,高于國際水果分級(jí)標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計(jì)算機(jī)視覺技術(shù)在蘋果檢測(cè)與分級(jí)中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識(shí)利用計(jì)算機(jī)視覺技術(shù)來檢測(cè)蘋果缺陷域,檢測(cè)不僅快速而且結(jié)果精確。劉禾等[7]通過研究認(rèn)為蘋果的表面缺陷可以利用計(jì)算機(jī)視覺技術(shù)進(jìn)行檢測(cè),計(jì)算機(jī)視覺技術(shù)還可以將蘋果按照檢測(cè)結(jié)果進(jìn)行分級(jí),把檢測(cè)過的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級(jí)的重要特征之一,應(yīng)義斌等[8]通過計(jì)算機(jī)視覺技術(shù)、圖像處理技術(shù)、傅立葉描述子的方法來描述和識(shí)別果形以及有無果柄,其識(shí)別率達(dá)到90%。楊秀坤等[9]綜合運(yùn)用計(jì)算機(jī)視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)了具有精確度高、靈活性強(qiáng)和速度快等優(yōu)點(diǎn)的蘋果成熟度自動(dòng)判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計(jì)算機(jī)視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測(cè)蘋果表面的機(jī)械損傷和果實(shí)內(nèi)部的腐爛情況,初步驗(yàn)證了計(jì)算機(jī)視覺技術(shù)檢測(cè)蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過計(jì)算機(jī)視覺技術(shù)對(duì)水果圖像的邊緣進(jìn)行檢測(cè),然后確定水果的大小用以水果分級(jí)。試驗(yàn)表明,該方法比傳統(tǒng)的檢測(cè)方法速度快、準(zhǔn)確率高,適用于計(jì)算機(jī)視覺的實(shí)時(shí)檢測(cè)。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對(duì)西紅柿的缺陷進(jìn)行分割,結(jié)果顯示準(zhǔn)確率高達(dá)96%。曹樂平等[13]人研究了溫州蜜柑的果皮顏色與果實(shí)可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測(cè)的正確識(shí)別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個(gè)方向獲取蘋果的圖像,并通過計(jì)算機(jī)自動(dòng)分析圖像數(shù)據(jù),對(duì)蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測(cè)相比,計(jì)算機(jī)視覺技術(shù)具有檢測(cè)效率高,檢測(cè)標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點(diǎn)。Blasco. J [15]通過計(jì)算機(jī)視覺技術(shù)分析柑橘果皮的缺陷,進(jìn)而對(duì)其在線分級(jí),正確率約為95%。趙廣華等[16]人綜合計(jì)算機(jī)視覺識(shí)別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實(shí)時(shí)監(jiān)測(cè)、品質(zhì)動(dòng)態(tài)的智能分級(jí)系統(tǒng),能夠很好地實(shí)現(xiàn)蘋果分級(jí)。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計(jì)算機(jī)視覺技術(shù)檢測(cè)桂香芒果和紫花芒果的重量和果面損傷,按重量分級(jí)其準(zhǔn)確率均為92%,按果面損傷分級(jí)的準(zhǔn)確率分別為76%和80%。

2.2 計(jì)算機(jī)視覺技術(shù)在禽蛋檢測(cè)中的應(yīng)用研究

禽蛋企業(yè)在生產(chǎn)過程中,產(chǎn)品的分級(jí)、品質(zhì)檢測(cè)主要采用人工方法,不僅需要大量的物力人力,而且存在勞動(dòng)強(qiáng)度大、人為誤差大、工作效率低等缺點(diǎn),計(jì)算機(jī)視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽靜怡等[18]利用計(jì)算機(jī)視覺技術(shù)來檢測(cè)雞蛋蛋殼裂紋,利用攝像機(jī)獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗(yàn)結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋蛋殼裂紋的檢測(cè)準(zhǔn)確率高達(dá)98%。汪俊德等[19]以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ),設(shè)計(jì)出一套雙黃雞蛋檢測(cè)系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計(jì)的數(shù)學(xué)模型對(duì)比來實(shí)現(xiàn)雙黃雞蛋的檢測(cè)和識(shí)別,檢測(cè)準(zhǔn)確率高達(dá)95%。鄭麗敏等[20]人通過高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來預(yù)測(cè)雞蛋的新鮮度和貯藏期,結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測(cè)的結(jié)果準(zhǔn)確率為94%。潘磊慶等[21]通過計(jì)算機(jī)視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測(cè)裂紋雞蛋,其檢測(cè)準(zhǔn)確率達(dá)到98%。Mertens K等[22]人基于計(jì)算機(jī)視覺技術(shù)研發(fā)了雞蛋的分級(jí)檢測(cè)系統(tǒng),該系統(tǒng)識(shí)別帶污漬雞蛋的正確率高達(dá)99%。

2.3 計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品中微生物含量中的應(yīng)用研究

計(jì)算機(jī)技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測(cè)中的應(yīng)用也越來越多,主要是針對(duì)微生物微菌落的處理。食品工業(yè)中計(jì)算機(jī)視覺技術(shù)在微生物檢測(cè)方面的研究和應(yīng)用以研究單個(gè)細(xì)胞為主,并在個(gè)體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計(jì)了一套應(yīng)用計(jì)算機(jī)視覺技術(shù)快速定量檢測(cè)食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測(cè)結(jié)果與傳統(tǒng)方法的檢測(cè)結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時(shí)間,檢測(cè)時(shí)間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時(shí)間段測(cè)定培養(yǎng)基上的細(xì)胞密度,然后通過計(jì)算機(jī)技術(shù)建立時(shí)間和細(xì)胞密度之間的動(dòng)態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測(cè)和自動(dòng)檢測(cè)微生物的生長情況,如通過計(jì)算機(jī)控制自動(dòng)定量采集檢測(cè)對(duì)象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計(jì)算機(jī)可以顯示被檢測(cè)菌落的具置,并且根據(jù)動(dòng)態(tài)關(guān)聯(lián)計(jì)算機(jī)視覺系統(tǒng)可以同時(shí)處理多個(gè)不同的樣品。郭培源等[25]人對(duì)計(jì)算機(jī)視覺技術(shù)用于豬肉的分級(jí)進(jìn)行了研究,結(jié)果顯示計(jì)算機(jī)視覺技術(shù)在識(shí)別豬肉表面微生物數(shù)量上與國標(biāo)方法檢測(cè)的結(jié)果顯著相關(guān),該技術(shù)可以有效地計(jì)算微生物的數(shù)量。Bayraktar. B等[26]人采用計(jì)算機(jī)視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識(shí)別技術(shù)相結(jié)合的方法來快速檢測(cè)李斯特菌,在獲取該菌菌落中的形態(tài)特征有對(duì)圖像進(jìn)行分析處理達(dá)到對(duì)該菌的分類識(shí)別。殷涌光等[27]人綜合利用計(jì)算機(jī)視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬像素的數(shù)字?jǐn)z像機(jī)拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對(duì)細(xì)菌形態(tài)學(xué)的8個(gè)特征參數(shù)進(jìn)行檢測(cè),檢測(cè)結(jié)果與傳統(tǒng)檢測(cè)結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測(cè)方法相比該方法具有操作簡單、快速、結(jié)果準(zhǔn)確、適合現(xiàn)場(chǎng)快速檢測(cè)等特點(diǎn)。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征,識(shí)別出微生物數(shù)量,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對(duì)產(chǎn)品進(jìn)行分級(jí)。

2.4計(jì)算機(jī)視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究

里紅杰等[30]通過提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對(duì)照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計(jì)算機(jī)識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)貝類和蝦類等海產(chǎn)品的無損檢測(cè)和自動(dòng)化分類、分級(jí)和質(zhì)量評(píng)估,并通過實(shí)例詳細(xì)闡述了該技術(shù)的實(shí)現(xiàn)方法,證實(shí)了此項(xiàng)技術(shù)的有效性。計(jì)算機(jī)視覺技術(shù)還可以檢驗(yàn)玉米粒形和玉米種子質(zhì)量、識(shí)別玉米品種和玉米田間雜草[31]。晁德起等[32]通過x射線照射獲取毛葉棗的透視圖像后,運(yùn)用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析評(píng)估,毛葉棗可食率的評(píng)估結(jié)果與運(yùn)用物理方法測(cè)得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計(jì)算機(jī)視覺技術(shù)可以應(yīng)用于毛葉棗的自動(dòng)分級(jí)。Gokmen,V等通用對(duì)薯片制作過程中圖像像素的變化來研究薯片的褐變率,通過分析特色參數(shù)來研究薯片中丙烯酰胺的含量和褐變率也關(guān)系,結(jié)果顯示兩項(xiàng)參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計(jì)算機(jī)視覺技術(shù)來預(yù)測(cè)加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等人拍攝和掃描11類花生籽粒,每類100顆不同等級(jí)的花生籽粒的正反面圖像,利用計(jì)算機(jī)視覺技術(shù)對(duì)花生內(nèi)部和外部采集圖像,并通過圖像對(duì)其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對(duì)待檢樣品進(jìn)行分級(jí)檢測(cè)時(shí)的正確率高達(dá)92%。另外,郭培源等人以國家標(biāo)準(zhǔn)為依據(jù),通過數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來實(shí)現(xiàn)豬肉新鮮程度的分級(jí)辨認(rèn)。

3 展望

新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開始,就遇到了很多問題。計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問題。

3.1 檢測(cè)指標(biāo)有限

計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品單一指標(biāo)或者以一個(gè)指標(biāo)作為分級(jí)標(biāo)準(zhǔn)進(jìn)行分級(jí)時(shí)具有理想效果,但以同一食品的多個(gè)指標(biāo)共同作為分級(jí)標(biāo)準(zhǔn)進(jìn)行檢測(cè)分級(jí),則分級(jí)結(jié)果誤差較大。例如,Davenel等通過計(jì)算機(jī)視覺對(duì)蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會(huì)把花粵和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級(jí)誤差很大,分級(jí)正確率只有69%。Nozer等以計(jì)算機(jī)視覺為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過分析圖像來確定水果的形狀、大小、顏色和重量,并進(jìn)行分級(jí),其正確率僅為85.1%。

3.2 兼容性差

計(jì)算機(jī)視覺技術(shù)針對(duì)單一種類的果蔬分級(jí)檢測(cè)效果顯著,但是同一套系統(tǒng)和設(shè)備很難用于其他種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計(jì)算機(jī)視覺設(shè)備。Reyerzwiggelaar等利用計(jì)算機(jī)視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測(cè)桃子的準(zhǔn)確率顯著高于杏的。Majumdar.S等利用計(jì)算機(jī)視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識(shí)別正確率有明顯差異。

3.3 檢測(cè)性能受環(huán)境制約

現(xiàn)階段的計(jì)算機(jī)視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡單的環(huán)境,在復(fù)雜環(huán)境下工作時(shí)會(huì)產(chǎn)生較大的誤差。Plebe等利用計(jì)算機(jī)視覺技術(shù)對(duì)果樹上的水果進(jìn)行識(shí)別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識(shí)別和定位精度不高,不能滿足實(shí)際生產(chǎn)的需要。

綜上所述,可看出國內(nèi)外學(xué)者對(duì)計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個(gè)學(xué)科,在研究和應(yīng)用的過程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問題,在新的形勢(shì)下,計(jì)算機(jī)視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計(jì)量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個(gè)領(lǐng)域?qū)W者的研究熱點(diǎn),以計(jì)算機(jī)視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。

參考文獻(xiàn)

[1] 寧紀(jì)鋒,龍滿生,何東健.農(nóng)業(yè)領(lǐng)域中的計(jì)算機(jī)視覺研究[J].計(jì)算機(jī)與農(nóng)業(yè),2001(01):1-3.

[2] 李崢.基于計(jì)算機(jī)視覺的蔬菜顏色檢測(cè)系統(tǒng)研究[D].吉林:吉林大學(xué),2004.

[3] 曾愛群.基于計(jì)算機(jī)視覺與神經(jīng)網(wǎng)絡(luò)的芒果等級(jí)分類研究[D].桂林:桂林工學(xué)院,2008.

[4] 韓偉,曾慶山.基于計(jì)算機(jī)視覺的水果直徑檢測(cè)方法的研究[J].中國農(nóng)機(jī)化,2011(05):25-29.

[5] 李慶中.蘋果自動(dòng)分級(jí)中計(jì)算機(jī)視覺信息快速獲取與處理技術(shù)的研究[D].北京:中國農(nóng)業(yè)大學(xué),2000.

[6] 孫洪勝,李宇鵬,王成,等.基于計(jì)算機(jī)視覺的蘋果在線高效檢測(cè)與分級(jí)系統(tǒng)[J].儀表技術(shù)與傳感器,2011(06):62-65.

[7] 劉禾,汀慰華.水果果形判別人工神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的研究[J].農(nóng)業(yè)工程學(xué)報(bào),1996,12(0l):171-176.

[8] 應(yīng)義斌,景寒松,馬俊福.用計(jì)算機(jī)視覺進(jìn)行黃花梨果梗識(shí)別的新方法[J].農(nóng)業(yè)工程學(xué)報(bào),1998,14(02):221-225.

[9] 楊秀坤,陳曉光,馬成林,等.用遺傳神經(jīng)網(wǎng)絡(luò)方法進(jìn)行蘋果顏色白動(dòng)檢測(cè)的研究[J].農(nóng)業(yè)工程學(xué)報(bào),1997,13(02):193-176.

[10] 陳育彥,屠康,柴麗月,等.基于激光圖像分析的蘋果表面損傷和內(nèi)部腐爛檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(07):133-137.

[11] 馮斌,汪憋華.基于計(jì)算機(jī)視覺的水果大小檢測(cè)方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2003,34(01):73-75.

[12] 朱偉,曹其新.基于模糊彩色聚類方法的西紅柿缺陷分割[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(03):133-136.

[13] 曹樂平,溫芝元,沈陸明.基于色調(diào)分形維數(shù)的柑橘糖度和有效酸度檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,41(03):143-148.

[14] 劉剛,王立香,柳兆君.基于計(jì)算機(jī)視覺的蘋果質(zhì)量檢測(cè)[J].安徽農(nóng)業(yè)科學(xué),2012,40(08):5014-5016.

[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.

[16] 趙廣華,飛,陸奎榮,等.智能化蘋果品質(zhì)實(shí)時(shí)分選系統(tǒng)[J].中國科技信息.

[17] 王江楓,羅錫文,洪添勝,等.計(jì)算機(jī)視覺技術(shù)在芒果重量及果面壞損檢測(cè)中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),1998(12):186-189.

[18] 歐陽靜怡,劉木華.基于計(jì)算機(jī)視覺的雞蛋裂紋檢測(cè)方法研究[J].農(nóng)機(jī)化研究,2012(03):91-93.

[19] 汪俊德,鄭麗敏,徐桂云,等.基于計(jì)算機(jī)視覺技術(shù)的雙黃雞蛋檢測(cè)系統(tǒng)研究[J].農(nóng)機(jī)化研究,2012(09):195-199.

[20] 鄭麗敏,楊旭,徐桂云,等.基于計(jì)算機(jī)視覺的雞蛋新鮮度無損檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(03):335-339.

[21] 潘磊慶,屠康,詹歌,等.基于計(jì)算機(jī)視覺和聲學(xué)響應(yīng)信息融合的雞蛋裂紋檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(11):332-337.

[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.

[23] 殷涌光,丁筠.基于計(jì)算機(jī)視覺的食品中大腸桿菌快速定量檢測(cè)[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2009,39(02):344-348.

[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.

[25] 郭培源,畢松,袁芳.豬肉新鮮度智能檢測(cè)分級(jí)系統(tǒng)研究[J].食品科學(xué),2010,31(15):68-72.

[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.

[27] 殷涌光,丁筠.基于計(jì)算機(jī)視覺的蔬菜中活菌總數(shù)的快速檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(07):249-254.

[28] 魯靜.乳品微生物自動(dòng)檢測(cè)系統(tǒng)的設(shè)計(jì)[J].湖北第二師范學(xué)院學(xué)報(bào),2010,27(08):115-117.

[29] 劉侃.鮮奶含菌量快速檢測(cè)系統(tǒng)[D].華中科技大學(xué),2008.

[30] 里紅杰,陶學(xué)恒,于曉強(qiáng).計(jì)算機(jī)視覺技術(shù)在海產(chǎn)品質(zhì)量評(píng)估中的應(yīng)用[J].食品與機(jī)械,2012,28(04):154-156.

第2篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

關(guān)鍵詞 智能交通系統(tǒng);計(jì)算機(jī)視覺;汽車流量

中圖分類號(hào):TN948 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)14-0048-01

基于視覺的圖像處理器測(cè)量精度高,抗干擾能力強(qiáng),許多自然及人為的干擾都可以被消除,運(yùn)用預(yù)測(cè)技術(shù)可以再捕獲瞬間丟失的目標(biāo),并且能實(shí)現(xiàn)對(duì)記憶的跟蹤。它通常安裝在路邊或架空安裝,不會(huì)重新鋪設(shè)路面,也不會(huì)影響埋在地下的水和天然氣管道,更不會(huì)干擾交通。 基于視覺的圖像處理有其突出的優(yōu)點(diǎn),表現(xiàn)在:可以獲得的目標(biāo)信息非常巨大,獲取信息的方法也非常方便。

1 研究的實(shí)用意義

車輛檢測(cè)系統(tǒng)在智能交通系統(tǒng)中具有很重要的地位。機(jī)動(dòng)車輛流量計(jì)數(shù)與監(jiān)控為智能控制提供了相當(dāng)重要的數(shù)據(jù)來源,通過計(jì)算機(jī)視覺的機(jī)動(dòng)車流量統(tǒng)計(jì)系統(tǒng)可以檢測(cè)很多交通參數(shù),便于我們檢測(cè)和監(jiān)控,這些參數(shù)中的一個(gè)重要參數(shù)就是汽車

流量。

基于視頻的檢測(cè)法作為最有前途的方法之一,有以下優(yōu)點(diǎn)。

1)能高效、準(zhǔn)確、安全可靠地的監(jiān)視和控制道路交通,能夠提供高質(zhì)量高分辨率的圖像信息。

2)用于交通監(jiān)視和控制的主要設(shè)備就是安裝視頻攝像機(jī),現(xiàn)在我國所有城市基本都已經(jīng)安裝了視頻攝像機(jī),甚至高清視頻攝像機(jī)。因?yàn)榘惭b視頻攝像機(jī)破壞性非常低、很方便、也很經(jīng)濟(jì)。

3)由計(jì)算機(jī)視覺得到的交通信息可以通過聯(lián)網(wǎng)工作,非常有利于對(duì)道路交通網(wǎng)的監(jiān)視以及控制。

4)由于目前對(duì)智能交通系統(tǒng)的安全性、實(shí)時(shí)性和可靠性的要求都非常高,計(jì)算機(jī)技術(shù)和圖像處理技術(shù)的發(fā)展顯得極其

重要。

2 研究內(nèi)容

本研究主要包含兩大部份:一部分就是采用分類和分割方法把采集到的視頻圖像的目標(biāo)進(jìn)行識(shí)別;另一部分就是通過定位方法來實(shí)現(xiàn)目標(biāo)的跟蹤。這兩部份是缺一不可,緊密聯(lián)系在一起的。

首先先介紹視頻圖像的目標(biāo)識(shí)別,視頻圖像目標(biāo)的識(shí)別方法有很多,但總體上主要有兩種方法:一是大家熟悉的相關(guān)匹配法,二是特征匹配法。相關(guān)匹配法是通過找到最大相關(guān)值(最大相關(guān)值指的就是當(dāng)前圖像與參考圖像間的相關(guān)系數(shù)的大?。┧诘奈恢脕泶_定當(dāng)前輸入圖像中的目標(biāo)位置。相關(guān)匹配法優(yōu)點(diǎn)是可以在信噪比很小的條件下工作,對(duì)噪聲抑制能力非常強(qiáng),在計(jì)算形式上比較簡單,很容易實(shí)現(xiàn)。但它的缺點(diǎn)也很明顯,由于相關(guān)匹配法對(duì)幾何和灰度畸變十分敏感,反而計(jì)算量偏大,造成的直接后果就是非常容易產(chǎn)生累積誤差,而且最關(guān)鍵的就是不能充分利用視頻圖像目標(biāo)的幾何特性,就不能保證對(duì)識(shí)別目標(biāo)的跟蹤精度。相關(guān)匹配法比較適合于對(duì)目標(biāo)的尺寸變化不大并且場(chǎng)景各部分的相關(guān)性不強(qiáng),當(dāng)前輸入圖像和參考圖像的產(chǎn)生條件較為一致的場(chǎng)合。特征匹配方法是目前研究較多的一類圖像匹配方法,它是通過目標(biāo)的特征與輸入圖像中目標(biāo)的特征來比較辨識(shí)目標(biāo)。它首先提取輸入圖像和參考圖像的相關(guān)特征信息,比如邊緣、角點(diǎn)等。然后通過測(cè)量距離來比較輸入圖像與參考圖像的特征集合,如果輸入圖像的特征集與參考圖像的特征集距離是最小的(在滿足給定約束條件下),則判定該目標(biāo)被識(shí)別。它對(duì)目標(biāo)的幾何特征、灰度畸變一點(diǎn)都不敏感,但它充分利用了目標(biāo)圖像的特征信息,因而可以保證較高的跟蹤精度。

上面介紹了視頻圖像目標(biāo)的識(shí)別,現(xiàn)在介紹本研究第二部分:通過定位方法來實(shí)現(xiàn)目標(biāo)的跟蹤。對(duì)于圖像目標(biāo)的跟蹤方法通常有下面幾個(gè)方法。

亮度中心法,其實(shí)這種方法計(jì)算很簡單,只要確定了一個(gè)點(diǎn),就能完成定位。這個(gè)點(diǎn)就是一個(gè)跟蹤點(diǎn),它就是具有最高灰度的像素點(diǎn)(來自獲得的視頻目標(biāo)圖像)或這個(gè)點(diǎn)上的一個(gè)鄰域。這種方法、性能很穩(wěn)定、容易實(shí)現(xiàn),工程上運(yùn)用的很多。但這種跟蹤非常容易受干擾,因?yàn)樗饕m用于紅外和其他放射性目標(biāo)的跟蹤。

最佳空間濾波法是常用跟蹤方法之一,它完全是在亮度中心法的基礎(chǔ)上建立起來的,為了提高跟蹤性能,就要把目標(biāo)的大小、形狀、運(yùn)動(dòng)特性等特征都完全利用起來。但目前這類方法也有明顯缺點(diǎn),在實(shí)用性、定位精度上和計(jì)算量方面都有較大的限制。

投影、形心法是通過目標(biāo)的投影或形心來確定目標(biāo)的實(shí)際位置和運(yùn)動(dòng)姿態(tài)。對(duì)比前面兩種跟蹤方法,投影、形心法的優(yōu)點(diǎn)是計(jì)算量非常小,容易通過硬件方式來實(shí)現(xiàn)。缺點(diǎn)是它的抗干擾性能力比較差,主要用于均勻背景下跟蹤孤立目標(biāo)。

從以上對(duì)研究內(nèi)容的介紹,現(xiàn)有的各類識(shí)別和定位方法都各有優(yōu)缺點(diǎn),要想找到一個(gè)合適的方法,都達(dá)不到滿意的效果。要想取得較好的性能,都只能在目標(biāo)尺寸相對(duì)對(duì)比度變化都不大、對(duì)噪聲的干擾又比較小、圖像灰度的空間變化并不明顯的理論環(huán)境中。然而實(shí)際的環(huán)境通常是變化無常的,通過一種方法來實(shí)現(xiàn)目標(biāo)的識(shí)別與跟蹤很難有合適的效果。最近幾年,結(jié)合這些方法的優(yōu)點(diǎn)和缺點(diǎn),混合定位識(shí)別的方法確能將上述各類基本的識(shí)別方法進(jìn)行混合定位,使它們能夠合二為一,相互補(bǔ)充。這代表著目標(biāo)識(shí)別方法非常具有理論研究和應(yīng)用價(jià)值,是一個(gè)重要發(fā)展方向。

3 技術(shù)路線

研究的技術(shù)路線(如圖1):首先提取出攝像機(jī)采集到的視頻,該視頻是以幀為單位的圖片文件形式。然后對(duì)圖像數(shù)據(jù)進(jìn)行數(shù)學(xué)上的處理,比如二值化、提取邊緣等。這樣就可以識(shí)別汽車的位置進(jìn)行定位,最后對(duì)識(shí)別出來的汽車數(shù)量通過計(jì)數(shù)器計(jì)數(shù)。

4 研究實(shí)現(xiàn)

通過基于計(jì)算機(jī)視覺的研究,我們?cè)O(shè)計(jì)出了能夠?qū)崿F(xiàn)機(jī)動(dòng)車流量的檢測(cè)和計(jì)數(shù)的系統(tǒng)。并且該系統(tǒng)能夠?qū)\(yùn)動(dòng)目標(biāo)進(jìn)行識(shí)別與跟蹤定位,對(duì)出現(xiàn)多目標(biāo)遮擋和丟失目標(biāo),還可以重新匹配。

5 結(jié)束語

本文創(chuàng)新之處就是將上述各類基本的識(shí)別方法進(jìn)行混合定位,使它們能夠相互補(bǔ)充。這代表著目標(biāo)識(shí)別方法非常具有理論研究和應(yīng)用價(jià)值,是一個(gè)重要發(fā)展方向。

參考文獻(xiàn)

[1]章毓晉.圖像工程(第2版)[M].清華大學(xué)出版社,2007.

[2]夏文龍.基于計(jì)算機(jī)視覺的汽車流量檢測(cè)研究[D].四川大學(xué),2003.

[3]葛群輝,淺談基于視覺的高速公路車流檢測(cè)技術(shù)[J].科技資訊,2010(2).

[4]劉萌萌,基于無標(biāo)度攝像機(jī)的車流跟蹤與速度估計(jì)算法研究[D].西南交通大學(xué),2005.

第3篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

計(jì)算機(jī)視覺的第一步是特征提取,即檢測(cè)圖像中的關(guān)鍵點(diǎn)并獲取有關(guān)這些關(guān)鍵點(diǎn)的有意義信息。特征提取過程本身包含4個(gè)基本階段:圖像準(zhǔn)備、關(guān)鍵點(diǎn)檢測(cè)、描述符生成和分類。實(shí)際上,這個(gè)過程會(huì)檢查每個(gè)像素,以查看是否有特征存在干該像素中。

特征提取算法將圖像描述為指向圖像中的關(guān)鍵元素的一組特征向量。本文將回顧一系列的特征檢測(cè)算法,在這個(gè)過程中,看看一般目標(biāo)識(shí)別和具體特征識(shí)別在這些年經(jīng)歷了怎樣的發(fā)展。

早期特征檢測(cè)器

Scale Invariant Feature Transform(SIFT)及Good Features To Track(GFTT)是特征提取技術(shù)的早期實(shí)現(xiàn)。但這些屬于計(jì)算密集型算法,涉及到大量的浮點(diǎn)運(yùn)算,所以它們不適合實(shí)時(shí)嵌入式平臺(tái)。

以SIFT為例,這種高精度的算法,在許多情況下都能產(chǎn)生不錯(cuò)的結(jié)果。它會(huì)查找具有子像素精度的特征,但只保留類似于角落的特征。而且,盡管SIFT非常準(zhǔn)確,但要實(shí)時(shí)實(shí)現(xiàn)也很復(fù)雜,并且通常使用較低的輸入圖像分辨率。

因此,SIFT在目前并不常用,它主要是用作一個(gè)參考基準(zhǔn)來衡量新算法的質(zhì)量。因?yàn)樾枰档陀?jì)算復(fù)雜度,所以最終導(dǎo)致要開發(fā)一套更容易實(shí)現(xiàn)的新型特征提取算法。

二代算法

Speeded Up Robust Features(SURF)是最早考慮實(shí)現(xiàn)效率的特征檢測(cè)器之一。它使用不同矩形尺寸中的一系列加法和減法取代了SIFT中浩繁的運(yùn)算。而且,這些運(yùn)算容易矢量化,需要的內(nèi)存較少。

接下來,HOG(Histograms ofOriented Gradients)這種在汽車行業(yè)中常用的熱門行人檢測(cè)算法可以變動(dòng),采用不同的尺度來檢測(cè)不同大小的對(duì)象,并使用塊之間的重疊量來提高檢測(cè)質(zhì)量,而不增加計(jì)算量。它可以利用并行存儲(chǔ)器訪問,而不像傳統(tǒng)存儲(chǔ)系統(tǒng)那樣每次只處理一個(gè)查找表,因此根據(jù)內(nèi)存的并行程度加快了查找速度。

然后,ORB(Oriented FASTand Rotated BRIEF)這種用來替代SIFT的高效算法將使用二進(jìn)制描述符來提取特征。ORB將方向的增加與FAST角點(diǎn)檢測(cè)器相結(jié)合,并旋轉(zhuǎn)BRIEF描述符,使其與角方向?qū)R。二進(jìn)制描述符與FAST和HarrisCorner等輕量級(jí)函數(shù)相結(jié)合產(chǎn)生了一個(gè)計(jì)算效率非常高而且相當(dāng)準(zhǔn)確的描述圖。

CNN:嵌入式平臺(tái)目標(biāo)識(shí)別的下一個(gè)前沿領(lǐng)域

配有攝像頭的智能手機(jī)、平板電腦、可穿戴設(shè)備、監(jiān)控系統(tǒng)和汽車系統(tǒng)采用智能視覺功能將這個(gè)行業(yè)帶到了一個(gè)十字路口,需要更先進(jìn)的算法來實(shí)現(xiàn)計(jì)算密集型應(yīng)用,從而提供更能根據(jù)周邊環(huán)境智能調(diào)整的用戶體驗(yàn)。因此,需要再一次降低計(jì)算復(fù)雜度來適應(yīng)這些移動(dòng)和嵌入式設(shè)備中使用的強(qiáng)大算法的嚴(yán)苛要求。

不可避免地,對(duì)更高精度和更靈活算法的需求會(huì)催生出矢量加速深度學(xué)習(xí)算法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN),用于分類、定位和檢測(cè)圖像中的目標(biāo)。例如,在使用交通標(biāo)志識(shí)別的情況下,基于CNN的算法在識(shí)別準(zhǔn)確度上勝過目前所有的目標(biāo)檢測(cè)算法。除了質(zhì)量高之外,CNN與傳統(tǒng)目標(biāo)檢測(cè)算法相比的主要優(yōu)點(diǎn)是,CNN的自適應(yīng)能力非常強(qiáng)。它可以在不改變算法代碼的情況下快速地被重新“訓(xùn)練(tuning)”以適應(yīng)新的目標(biāo)。因此,CNN和其他深度學(xué)習(xí)算法在不久的將來就會(huì)成為主流目標(biāo)檢測(cè)方法。

CNN對(duì)移動(dòng)和嵌入式設(shè)備有非??量痰挠?jì)算要求。卷積是CNN計(jì)算的主要部分。CNN的二維卷積層允許用戶利用重疊卷積,通過對(duì)同一輸入同時(shí)執(zhí)行一個(gè)或多個(gè)過濾器來提高處理效率。所以,對(duì)于嵌入式平臺(tái),設(shè)計(jì)師應(yīng)該能夠非常高效地執(zhí)行卷積,以充分利用CNN流。

事實(shí)上,CNN嚴(yán)格來說并不是一種算法,而是一種實(shí)現(xiàn)框架。它允許用戶優(yōu)化基本構(gòu)件塊,并建立一個(gè)高效的神經(jīng)網(wǎng)絡(luò)檢測(cè)應(yīng)用,因?yàn)镃NN框架是對(duì)每個(gè)像素逐一計(jì)算,而且逐像素計(jì)算是一種要求非常苛刻的運(yùn)算,所以它需要更多的計(jì)算量。

不懈改進(jìn)視覺處理器

第4篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

關(guān)鍵詞:ARM OPENCV AdaBoost

近年來,功能各異的視頻監(jiān)控設(shè)備越來越多,但是,大多只能簡單記錄視頻畫面,將監(jiān)控到的視頻信息存儲(chǔ)起來,而不能對(duì)所監(jiān)控到的視頻做一定的處理分析和預(yù)測(cè)?;贏RM的人臉檢測(cè)系統(tǒng),為我們的視頻監(jiān)控設(shè)備提供了一個(gè)視頻處理的參考解決方案,在一定基礎(chǔ)上加以擴(kuò)充,可以完成人物識(shí)別,危險(xiǎn)行為檢測(cè)與報(bào)警等,使視頻監(jiān)控設(shè)備更加智能化。

1、視頻監(jiān)控的幾項(xiàng)關(guān)鍵技術(shù)及發(fā)展方向

視頻監(jiān)控的關(guān)鍵技術(shù)主要有視頻采集壓縮算法、視頻信號(hào)可靠地傳輸、信息存儲(chǔ)調(diào)用的智能化與系統(tǒng)的集中管理等。視頻監(jiān)控技術(shù)發(fā)展方向?yàn)榉植疾杉泄芾?、高品質(zhì)圖象壓縮處理、開放標(biāo)準(zhǔn)統(tǒng)一接口、統(tǒng)一認(rèn)證以確保安全、操作人性化以及功能集成化、結(jié)構(gòu)模塊化和傳輸多樣化。隨著不斷發(fā)展的網(wǎng)絡(luò)技術(shù),基于嵌入式技術(shù)的網(wǎng)絡(luò)數(shù)字監(jiān)控系統(tǒng)不再是處理模擬視頻信號(hào),而是把攝像機(jī)輸出的模擬視頻信號(hào)通過視頻編碼器直接轉(zhuǎn)換為IP數(shù)字信號(hào)。

2、平臺(tái)的搭建

ARM之所以應(yīng)用廣泛,是因?yàn)橛休^快得運(yùn)算速度,較低的價(jià)格,開發(fā)人員也比較容易接觸,程序較易移植過來等特點(diǎn)。EmbeddedLinux也是Linux家族的成員,支持廣泛的硬件平臺(tái),如PPC、ARM、MIPS等,也繼承了Linux的優(yōu)點(diǎn)——開源、免費(fèi),同時(shí)也有廣泛的應(yīng)用軟件支持,能夠比較方便的移植操作系統(tǒng)與應(yīng)用軟件。

3、OPENCV簡介

OpenCV是一個(gè)開源的計(jì)算機(jī)視覺庫,采用C/C++語言進(jìn)行編寫,可以運(yùn)行在Linux/Windows/Mac等操作系統(tǒng)上,同時(shí)還提供了Python、Ruby以及其他語言的接口。其設(shè)計(jì)目標(biāo)就是執(zhí)行速度盡量快,它采用優(yōu)化的C語言編寫,能夠充分利用多核處理器的優(yōu)勢(shì)。除此之外,另外一個(gè)目標(biāo)就是構(gòu)建一個(gè)簡單易用的計(jì)算機(jī)視覺框架,開發(fā)人員可以利用它更便捷地設(shè)計(jì)復(fù)雜的計(jì)算機(jī)視覺相關(guān)應(yīng)用程序。其中包含的函數(shù)有500多個(gè),覆蓋了計(jì)算機(jī)視覺的許多應(yīng)用領(lǐng)域,如工廠產(chǎn)品檢測(cè)、醫(yī)學(xué)成像、信息安全、攝像機(jī)標(biāo)定、立體視覺和機(jī)器人等。

4、人臉檢測(cè)的原理

人臉檢測(cè)技術(shù)的研究要追溯到20世紀(jì)70年代,早期的研究主要致力于模板匹配、子空間方法、變形模板匹配等,近幾年,集中研究基于數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方法,如統(tǒng)計(jì)模型方法,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,統(tǒng)計(jì)知識(shí)理論和支持向量計(jì)算方法,基于馬爾可夫[1]隨機(jī)域的方法,以及基于膚色的人臉檢測(cè)等。目前在實(shí)際中應(yīng)用的人臉檢測(cè)方法多為基于Adaboost[2]學(xué)習(xí)算法的方法。

Viola是AdaBoost算法的一種,主要基于積分圖和級(jí)聯(lián)檢測(cè)器,其方法框架可大至分為以下三大部分:第一部分,使用Harr-like特征來表示人臉,并且使用“積分圖”實(shí)現(xiàn)特征數(shù)值的快速計(jì)算;第二部分,使用Adaboost算法挑選出一些最能代表人臉的矩形特征,用弱分類器按照加權(quán)投票的方式,構(gòu)造為一個(gè)強(qiáng)分類器;第三部分,為有效的提高檢測(cè)速度,將訓(xùn)練得到的若干強(qiáng)分類器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類器。

人臉檢測(cè)的目的就是從圖片之中找出所有包含人臉的子窗口,對(duì)人臉的子窗口與非人臉的子窗口進(jìn)行區(qū)分。第一步,在一個(gè)20*20的圖片中提取出一些簡單的特征(Harr特征),將白色區(qū)域內(nèi)的像素減去黑色區(qū)域,因此在人臉與非人臉圖片的相同位置上,有著大小不一樣的數(shù)值,這些特征就是區(qū)分人臉和非人臉的依據(jù)。第二步,使用上萬張切割好的人臉圖片和上萬張背景圖片作為訓(xùn)練樣本。訓(xùn)練圖片一般都調(diào)到到20*20的大小。在這樣大小的圖片中,可供haar使用的特征數(shù)大概有1萬個(gè)左右,然后通過機(jī)器學(xué)習(xí)算法也就是Adaboost算法挑選數(shù)千個(gè)有效的haar特征,用來組成人臉檢測(cè)器。第三步,學(xué)習(xí)算法訓(xùn)練出一個(gè)人臉檢測(cè)器后,便可以在各種各樣的場(chǎng)合使用了。使用時(shí),依次縮放圖像比例,最后在縮放后的圖片20*20的子窗口中依次判別是否是人臉。

人臉檢測(cè)技術(shù)在門禁系統(tǒng)、智能監(jiān)控系統(tǒng)中已經(jīng)得到了很好的應(yīng)用。另外,目前的筆記本電腦登錄時(shí),也陸續(xù)使用人臉識(shí)別技術(shù)作為憑證。同時(shí),人臉檢測(cè)算法也在數(shù)碼相機(jī)和手機(jī)中起作用,作為一個(gè)新新的功能提供用戶使用。

5、結(jié)語

ARM上進(jìn)行圖像處理以及人臉檢測(cè)與識(shí)別等是可行的方案,可以減少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一個(gè)方案合理、技術(shù)成熟、成本低廉、應(yīng)用廣泛的人臉檢測(cè)與圖像處理的解決方案。

參考文獻(xiàn)

第5篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

關(guān)鍵詞:數(shù)字圖像技術(shù);應(yīng)用;發(fā)展趨勢(shì)

中圖分類號(hào):TP391.41

計(jì)算機(jī)的特點(diǎn)在于能夠處理各種數(shù)據(jù),數(shù)字圖像能夠經(jīng)過增強(qiáng)、復(fù)原、分割等處理,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和進(jìn)步,現(xiàn)在的數(shù)字圖像技術(shù)具有圖像處理多樣性、精度高、圖像的再現(xiàn)性好、處理量大的優(yōu)點(diǎn),本文主要研究數(shù)字圖像處理技術(shù)的發(fā)展現(xiàn)狀和發(fā)展趨勢(shì)。

1 數(shù)字圖像處理技術(shù)研究現(xiàn)狀

所謂圖像處理是指利用計(jì)算機(jī)來處理圖像的過程,主要是實(shí)現(xiàn)改善圖像的視覺效果,研究的內(nèi)容主要包括圖像數(shù)字化、圖像增強(qiáng)、圖像還原以及圖像分割等。數(shù)字圖像處理最早來源于20世紀(jì)20年代的報(bào)紙業(yè),到20世紀(jì)50年代,隨著計(jì)算機(jī)的發(fā)展,數(shù)字圖像處理技術(shù)得到人們的普遍關(guān)注,數(shù)字圖像處理技術(shù)隨著太空計(jì)劃得到很大的發(fā)展,最具有典型的例子,是對(duì)月球照片的處理。

進(jìn)入到20世紀(jì)70年代后,數(shù)字圖像處理技術(shù)隨著計(jì)算機(jī)斷層掃面(CT)的出現(xiàn)得到發(fā)展,在以后的時(shí)間里,數(shù)字圖像處理技術(shù)不斷有新的研究成果,1975年EWI公司研究的CT裝置獲得諾貝爾獎(jiǎng),目前數(shù)字圖像技術(shù)已廣泛應(yīng)用在各行各業(yè)中。

2 數(shù)字圖像處理技術(shù)的應(yīng)用

數(shù)字圖像處理技術(shù)目前在各行各業(yè)中都得到了很大的進(jìn)展。在遙感航空航天方面,不少國家都派出了偵查飛機(jī)對(duì)目標(biāo)地區(qū)進(jìn)行空中攝影,進(jìn)而通過圖像處理技術(shù)來分析照片,節(jié)省了人力、物理,也能夠從圖片中得到其他的有用信息。在20世紀(jì)60年代以來,美國以及其他的一些國家發(fā)射了資源遙感衛(wèi)星,由于成像條件非常差,因此圖像本身的質(zhì)量也不高,需要采取數(shù)字圖像處理技術(shù)處理,如采用多波段掃描器進(jìn)行掃描成像,圖像分辨率為30m,這些圖像轉(zhuǎn)變?yōu)閿?shù)字信號(hào)傳送下來,再經(jīng)過處理。數(shù)字圖像處理技術(shù)在各國的應(yīng)用中已非常廣泛,如用在森林調(diào)查、災(zāi)害監(jiān)測(cè)、資源勘查以及城市規(guī)劃中。

數(shù)字圖像處理技術(shù)最早來源于醫(yī)藥方面,因此在生物醫(yī)學(xué)工程方面,數(shù)字圖像處理技術(shù)也發(fā)揮出了巨大作用,除了上文所講述的CT之外,還有一些顯微圖像處理技術(shù),主要是識(shí)別紅細(xì)胞、白細(xì)胞以及染色體分析等,在醫(yī)學(xué)診治方面X光肺圖像增強(qiáng)、心電圖分析以及超聲波圖像處理技術(shù)等發(fā)揮出了重要作用。

在通信工程方面,目前通信主要的發(fā)展趨勢(shì)為綜合性的多媒體通信,也就是將電視、計(jì)算機(jī)以及電話聯(lián)合在一起在數(shù)字通信網(wǎng)上傳輸,在傳輸?shù)倪^程中最為復(fù)雜和困難的地方集中在圖像的處理中,比如說,彩色電視信號(hào)速率為100Mbit/s以上,想要傳輸出去就需要壓縮信息的比特量,因此技術(shù)成敗的關(guān)鍵就在于編碼壓縮。目前國家正在大力研發(fā)的新的編碼方法,如小波變換圖像壓縮編碼以及自適應(yīng)圖像網(wǎng)絡(luò)編碼等。

在工業(yè)和工程方面,主要的應(yīng)用集中在自動(dòng)裝置配線中檢測(cè)零件的質(zhì)量、彈性力學(xué)照片的應(yīng)力分析以及郵政信件的自動(dòng)分檢等,另外在智能機(jī)器人中也有應(yīng)用。在軍事、公安方面,數(shù)字圖像處理技術(shù)的應(yīng)用主要集中在導(dǎo)彈的精確制導(dǎo)、偵查照片以及圖像的傳輸和顯示方面,在公安方面,主要應(yīng)用在鑒別人臉、識(shí)別指紋以及圖片復(fù)原方面。數(shù)字圖像處理技術(shù)除了以上所講述的應(yīng)用領(lǐng)域之外,在電視圖像的編輯、服裝設(shè)計(jì)、發(fā)型設(shè)計(jì)以及文物資料復(fù)原等方面也有廣泛的使用。

3 數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)

目前數(shù)字圖像技術(shù)隨著科技的進(jìn)步得到了很大的發(fā)展,隨著低成本硬件相關(guān)技術(shù)的發(fā)展可以想象數(shù)字圖像技術(shù)將會(huì)得到更加廣泛的應(yīng)用,目前國內(nèi)的研究成果主要集中在一些診斷、圖像壓縮編碼以及目標(biāo)識(shí)別等方面,但是還沒有廣泛應(yīng)用在實(shí)際生活中。數(shù)字圖像處理技術(shù)將會(huì)向著高分辨率、立體化、超高速以及智能化等方面發(fā)展,下面具體講述數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)。

隨著計(jì)算機(jī)、人工智能以及思維科學(xué)研究的不斷發(fā)展,數(shù)字圖像處理技術(shù)在計(jì)算機(jī)視覺方面將會(huì)進(jìn)一步的發(fā)展,智能機(jī)器人的重要感覺器官是視覺,目前研究的開放話題集中在理解和識(shí)別三維應(yīng)力,將會(huì)應(yīng)用在軍事勘察、危險(xiǎn)環(huán)境作業(yè)以及家庭服務(wù)等方面,目前人們對(duì)于自身的視覺了解的還非常少,因此在計(jì)算機(jī)視覺方面還需要進(jìn)一步的探索。

數(shù)字圖像處理技術(shù)還會(huì)向著虛擬現(xiàn)實(shí)發(fā)展,所謂虛擬現(xiàn)實(shí)就是使用計(jì)算機(jī)構(gòu)成一個(gè)虛擬的三維空間,這項(xiàng)技術(shù)的發(fā)展是在計(jì)算機(jī)硬件技術(shù)的提高方面提出的,人們應(yīng)用機(jī)器人身上的攝像機(jī)能夠真實(shí)的感受到所在的環(huán)境,進(jìn)而操縱機(jī)器人的行為,另外網(wǎng)上虛擬現(xiàn)實(shí)也是未來的一個(gè)發(fā)展方向。人們?cè)谕瓿缮鐣?huì)生產(chǎn)中往往習(xí)慣使用自身的認(rèn)識(shí)和工具,將這些掌握在自身手中,因此目前時(shí)代的發(fā)展趨勢(shì)就是將原來二維的東西向著三維發(fā)展,如三維重建技術(shù)在地圖方面的使用,在軍事方面能夠使用電子沙盤實(shí)現(xiàn)任意角度的轉(zhuǎn)化和計(jì)算,也能夠真實(shí)的直觀的反應(yīng)兩點(diǎn)之間的障礙物等,還能夠?qū)崿F(xiàn)模擬飛行路線,為作戰(zhàn)指揮帶來極大的便利。在計(jì)算機(jī)中進(jìn)行三維重建目前的熱點(diǎn)和難點(diǎn)問題主要是計(jì)算機(jī)視覺研究領(lǐng)域。在圖像壓縮、識(shí)別以及分割方面,目前已取得很大的研究進(jìn)展,目前圖像處理面臨的新的問題主要是圖像專業(yè)壓縮算法、圖像識(shí)別算法等。

4 結(jié)束語

綜上所述,本文先分析了數(shù)字圖像處理技術(shù)研究現(xiàn)狀和主要的應(yīng)用領(lǐng)域,進(jìn)而研究數(shù)字圖像技術(shù)的發(fā)展趨勢(shì)。目前數(shù)字圖像處理技術(shù)已廣泛的應(yīng)用在生活中,如在網(wǎng)絡(luò)、手機(jī)等中的應(yīng)用,數(shù)字圖像處理技術(shù)的發(fā)展與人們的生活息息相關(guān),隨著技術(shù)的不斷發(fā)展,數(shù)字圖像處理技術(shù)還會(huì)不斷得到進(jìn)步,這些還需要更多的人努力去研究。

參考文獻(xiàn):

[1]孔大力,崔洋.數(shù)字圖像處理技術(shù)的研究現(xiàn)狀與發(fā)展方向[J].山東水利職業(yè)學(xué)院院刊,2012(04):11-14.

[2]陳炳權(quán),劉宏立,孟凡斌.數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(01):63-70.

[3]呂戈靜.淺談數(shù)字圖像處理技術(shù)的現(xiàn)狀及發(fā)展[J].電腦知識(shí)與技術(shù),2012(33):8035-8036.

[4]丁可.數(shù)字圖像處理技術(shù)研究與發(fā)展方向[J].經(jīng)濟(jì)研究導(dǎo)刊,2013(18):246+270.

第6篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

關(guān)鍵詞:圖像識(shí)別;SURF算法;特征點(diǎn);魯棒性

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A

圖像識(shí)別,是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。圖像的局部不變特征有著在多種圖像變換(如光照變換,幾何變換等)下的不變性、獨(dú)特性、低冗余性以及無需預(yù)先對(duì)圖像分割等特點(diǎn),已經(jīng)被廣泛應(yīng)用于圖像匹配領(lǐng)域。基于特征不變的方法具有精度高、執(zhí)行速度快、壓縮信息量和魯棒性好等優(yōu)點(diǎn)。尺度不變特征轉(zhuǎn)換(Scale-invariant feature transform,SIFT)算法便是其中的代表,該算法由David Lowe于1999年在ICCV上提出,并于2004年完善總結(jié)。SIFT算法匹配能力較強(qiáng),能提取穩(wěn)定的特征,可以處理兩幅圖像之間發(fā)生平移、旋轉(zhuǎn)、仿射變換、視角變換和光照變換等情況下的匹配問題,但該算法數(shù)據(jù)量大,復(fù)雜度高,耗時(shí)長,同時(shí)也存在著特征提取及匹配速度慢,在灰度變化相似的區(qū)域容易產(chǎn)生誤匹配的缺陷,限制了該算法的應(yīng)用。SURF算法是針對(duì)SIFT算法的不足而改進(jìn)的一種有效算法。

1SURF算法描述

快速魯棒特征[1](Speeded-up Robust Features,SURF)是一種高魯棒性的局部特征點(diǎn)檢測(cè)器,由Herbert Bay等人于2006年在ECCV上提出的。該算法比SIFT更快更加具有魯棒性,對(duì)圖像分辨率、旋轉(zhuǎn)、尺度縮放、平移和亮度變化等保持不變,而且對(duì)仿射變換、噪聲以及視角變化等也能保持一定程度的穩(wěn)定性。

SURF算法的基本流程主要包括:特征點(diǎn)檢測(cè)、特征點(diǎn)描述和特征點(diǎn)匹配三部分。該算法中有三個(gè)關(guān)鍵技術(shù),分別為:使用積分圖像完成圖像卷積操作,減少了時(shí)間計(jì)算的復(fù)雜度,提高計(jì)算速度;采用基于Hessian矩陣的檢測(cè)器檢測(cè)特征值,其在可重復(fù)性和穩(wěn)定性方面都優(yōu)于基于HarTis的檢測(cè)器;采用Haar小波作為特征描述子,Harr特征速度快,能夠減少計(jì)算時(shí)間并增加魯棒性。

1.1積分圖像

積分圖像是一種對(duì)原始圖像的特征表示方法。對(duì)于一幅灰度的圖像,積分圖像中的任意一點(diǎn)(x,y)的值是指從圖像的左上角到這個(gè)點(diǎn)所構(gòu)成的矩形區(qū)域內(nèi)所有的點(diǎn)的灰度值之和[2]。圖1所示填充區(qū)域即為點(diǎn)(x,y)的積分值。

1.2尺度空間的建立

圖像的尺度空間是在視覺信息(圖像信息)處理模型中引入一個(gè)被視為尺度的參數(shù),通過連續(xù)變化尺度參數(shù)獲得不同尺度下的視覺處理信息,然后綜合這些信息以深入地挖掘圖像的本質(zhì)特征。一幅圖像的尺度空間可定義為原始圖像與高斯核的卷積運(yùn)算,圖像的尺度大小可以用高斯標(biāo)準(zhǔn)差來表示[3]。在計(jì)算機(jī)視覺領(lǐng)域, 尺度空間被表示為一個(gè)圖像金字塔。在SIFT算法中,輸入圖像函數(shù)反復(fù)與高斯函數(shù)的核卷積并反復(fù)對(duì)其進(jìn)行二次抽樣,但因?yàn)槊繉訄D像依賴于前一層圖像, 并且需要重設(shè)圖像尺寸,所以使得運(yùn)算量較大。SURF算法與SIFT算法在使用金字塔原理上的不同之處在于SURF算法申請(qǐng)?jiān)黾訄D像核的尺寸,允許尺度空間的多層同時(shí)被處理,并且不需要對(duì)圖像進(jìn)行二次抽樣, 從而提高了算法性能。同時(shí)SURF算法采用了尺度插值和3*3*3的非極值抑制方法以提取尺度不變的特征點(diǎn)。圖2中A圖是運(yùn)用傳統(tǒng)方式建立的一個(gè)圖像金字塔結(jié)構(gòu),運(yùn)算會(huì)反復(fù)使用高斯函數(shù)對(duì)子層進(jìn)行平滑處理, 且圖像的尺寸是變化的。B圖的SURF算法保持原始圖像不變而只是改變?yōu)V波器的大小。

1.3Hessian特征檢測(cè)

2算法實(shí)現(xiàn)

根據(jù)SURF算法的基本原理,設(shè)計(jì)算法的實(shí)現(xiàn)過程。首先通過視頻采集設(shè)備獲取模板圖像,并對(duì)其建立積分圖像和構(gòu)建尺度空間結(jié)構(gòu),再通過視頻采集設(shè)備捕捉當(dāng)前視頻幀,然后檢測(cè)出模板圖像及當(dāng)前視頻幀的特征點(diǎn), 并保存每個(gè)特征點(diǎn)各項(xiàng)特性的描述信息,最后比較模板圖像與當(dāng)前幀圖像特征點(diǎn)的描述子信息進(jìn)行圖像匹配。

3OpenCV技術(shù)

OpenCV(Open Source Computer Vision Library)[5]于1999年由Intel建立,是一個(gè)基于(開源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺庫,可以運(yùn)行在Linux、Windows和Mac OS操作系統(tǒng)上。OpenCV輕量級(jí)而且高效,由一系列C函數(shù)和少量C++類構(gòu)成, 實(shí)現(xiàn)了計(jì)算機(jī)視覺,圖像處理和模式識(shí)別等方面的很多通用算法。

OpenCV為Intel公司的Integrated Performance Primitives(IPP)提供了透明接口,這意味著如果有為Intel處理器優(yōu)化的IPP庫,OpenCV將在運(yùn)行時(shí)自動(dòng)加載這些庫。OpenCV致力于真實(shí)世界的實(shí)時(shí)應(yīng)用,通過優(yōu)化的C代碼的編寫對(duì)其執(zhí)行速度帶來了可觀的提升,編寫程序過程中調(diào)用OpenCV的基礎(chǔ)函數(shù)庫, 即可完成十分復(fù)雜的開發(fā)任務(wù), 極大的提高開發(fā)效率。

3.1OpenCV的特點(diǎn)

1) 跨平臺(tái),Windows,Linux,Mac OS;

2) 免費(fèi),開源;

3) 代碼經(jīng)過優(yōu)化,可用于實(shí)時(shí)處理圖像;

4) 統(tǒng)一的結(jié)構(gòu)和功能定義;

5) 強(qiáng)大的矩陣運(yùn)算和圖像處理能力;

6) 具有底層和高層的應(yīng)用開發(fā)包;

7) 用戶接口方便靈活。

3.2OpenCV的功能

1) 對(duì)圖像數(shù)據(jù)的操作,包括分配、釋放、復(fù)制和轉(zhuǎn)換數(shù)據(jù)。

2) 具有對(duì)矩陣和向量的操作以及線性代數(shù)的算法程序,包括矩陣、解方程,特征值以及奇異值。

3) 具有基本的數(shù)字圖像處理能力,如可進(jìn)行濾波、邊緣檢測(cè)、角點(diǎn)檢測(cè)、采樣與差值、色彩轉(zhuǎn)換、形態(tài)操作、直方圖和圖像金字塔等操作。

4) 對(duì)運(yùn)動(dòng)的分析,如對(duì)光流、運(yùn)動(dòng)分割和跟蹤的分析。

5) 對(duì)目標(biāo)的識(shí)別,可采用特征法和隱馬爾科夫模型(HMM)法。

6) 具有基本的GUI功能,包括圖像與視頻顯示、鍵盤和鼠標(biāo)事件處理及滾動(dòng)條等。

3.3OpenCV模塊

1) CV核心函數(shù)庫,實(shí)現(xiàn)圖像處理,結(jié)構(gòu)分析,運(yùn)動(dòng)分析,對(duì)象識(shí)別,攝像機(jī)標(biāo)定和3D重構(gòu)等功能。

2) CVAUX輔助函數(shù)庫,實(shí)現(xiàn)通過立體視覺來實(shí)現(xiàn)的動(dòng)作識(shí)別,基于輪廓線的形狀匹配,模式識(shí)別,紋理描述等功能。

3) CXCORE數(shù)據(jù)結(jié)構(gòu)與線性代數(shù)庫,實(shí)現(xiàn)數(shù)據(jù)變換,矩陣運(yùn)算等功能。

4) HIGHGUI圖像界面函數(shù)庫,實(shí)現(xiàn)圖像獲取,用戶界面設(shè)計(jì)等功能。

5) ML機(jī)器學(xué)習(xí)函數(shù)庫,包括模式分類和回歸分析等。

4Android上的系統(tǒng)實(shí)現(xiàn)

Android是基于Linux開放性內(nèi)核的操作系統(tǒng),是Google公司在2007年l1月5日公布的手機(jī)操作系統(tǒng)。Android采用軟件堆層的架構(gòu),主要分三部分:底層以Linux核心為基礎(chǔ),提供基本功能;中間層包括函數(shù)庫和虛擬機(jī);最上層是各種應(yīng)用軟件。Android應(yīng)用程序用Java語言編寫。每個(gè)應(yīng)用程序都擁有一個(gè)獨(dú)立的Dalvik虛擬機(jī)實(shí)例,這個(gè)實(shí)例駐留在一個(gè)由Linux內(nèi)核管理的進(jìn)程中[6]。

在Android系統(tǒng)上使用OpenCV來實(shí)現(xiàn)該系統(tǒng),需利用JNI編寫相應(yīng)的本地代碼組件并通過Android NDK工具集將其嵌入到Android應(yīng)用程序中。首先,利用Android應(yīng)用程序框架編寫相應(yīng)的Java代碼;然后通過JNI與OpenCV提供的函數(shù)編寫本地C/C++代碼,并使用Android NDK將本地代碼文件編譯生成可由Java代碼調(diào)用的共享庫(動(dòng)態(tài)鏈接庫),最后通過SDK生成完整的Android應(yīng)用程序[7]。

4.1JNI

JNI(Java Native Interface),即JAVA本地調(diào)用。它允許Java代碼和其他語言編寫的代碼進(jìn)行交互。

5結(jié)論

本文提出了一種基于SURF算法的圖像識(shí)別方法,并運(yùn)用此方法實(shí)現(xiàn)了一套基于Android平臺(tái)的圖像識(shí)別系統(tǒng)。由于系統(tǒng)需要進(jìn)行大量的圖像處理運(yùn)算, 因此通過使用Android NDK調(diào)用OpenCV圖像處理函數(shù)庫以提高編程效率,。系統(tǒng)通過手機(jī)攝像頭提取視頻幀, 并使用SURF算法對(duì)其進(jìn)行快速魯棒特征檢測(cè)。實(shí)驗(yàn)結(jié)果表明, 該方法復(fù)雜度低、實(shí)時(shí)性好并且具有良好的魯棒性,將系統(tǒng)用于移動(dòng)設(shè)備圖像識(shí)別加密,以及視頻監(jiān)控等方面,會(huì)使其擁有更好的識(shí)別效率和可靠性。

參考文獻(xiàn):

[1]彭欣,劉富強(qiáng),宋華軍.基于SURF目標(biāo)跟蹤算法研究[J].長春理工大學(xué)學(xué)報(bào), 2011,34(2):138-141.

[2]徐秀云.基于特征點(diǎn)的景象匹配技術(shù)研究[D].南京:南京理工大學(xué),2009:1-68.

[3]高健, 黃心漢, 彭剛,等. 一種簡化的SIFT圖像特征點(diǎn)提取算法[J].計(jì)算機(jī)應(yīng)用研究,2008,25(7):2 213-2 215.

[4]VASILEIOS K,CHRISTOPHOROS NIKOU,ARISTIDIS LIKAS.Visual Tracking by Adaptive Kalman Filtering and Mean Shift[J].Springer-Verlag Berlin Heidelberg,2010,6040:153-162.

[5]黎松,平西定,丁益洪.開放源代碼的計(jì)算機(jī)視覺類庫OpenCV的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與技術(shù),2005,22(8):134-136.

[6]韓超,梁泉.Android系統(tǒng)原理及開發(fā)要點(diǎn)詳解[M]北京:電子工業(yè)出版社,2010:70-93.

[7]韓露.一種Java與OpenCV結(jié)合實(shí)現(xiàn)的目標(biāo)檢測(cè)模塊[J].計(jì)算機(jī)應(yīng)用,2008(3):773-775.

[8]HUIYU ZHOU,YUAN YUAN,CHUNMEI SHI.Object tracking using SIFT features and mean shift[J]. Computer Vision and Image Understanding,2009,113:345-352.

[9]HERBERT BAY, ANDREAS ESS, TINNE TUYTELAARS,et al.Speeded-Up Robust Features(SURF)[J].Preprint submitted to Elsevier,2008:233-245.

[10]TA D N CHEN,W C GELFAND,N PULLI K.SURFTrac:Efficient Tracking and Continuous Object Recognition using Local Feature Descriptors[C]//Coumputer Vision and Pattern Recognition(CVPR'09),2009:2 937-2 943.

[11]紀(jì)華,吳元昊,孫宏海,等.結(jié)合全局信息的SIFT特征匹配算法[J].光學(xué)精密工程,2009,17(2):439-444.

[12]CHAVES A,GUSTAFUSON D.Vision——Based Obstacle Avoidance Using SIFT Features[C]//Proceedings of the 5th International Symposium on Advances in Visual Computing.2009:550-557.

[13]公磊,周聰.基于Android的移動(dòng)終端應(yīng)用程序開發(fā)與研究[J].計(jì)算機(jī)與現(xiàn)代化,2008(8):85-89.

第7篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

本文深入地分析了當(dāng)前實(shí)施人臉檢測(cè)技術(shù)的可行性,并對(duì)本方案實(shí)施的優(yōu)勢(shì)進(jìn)行了概括。

【關(guān)鍵詞】人臉檢測(cè)技術(shù) 計(jì)算機(jī)技術(shù) 識(shí)別技術(shù)

1 人臉檢測(cè)的前景

人臉檢測(cè)作為近年來生物識(shí)別領(lǐng)域的一個(gè)熱門研究方向,具有操作方便,用戶易于接受,事后追蹤能力強(qiáng)等優(yōu)點(diǎn)。但是因?yàn)槿四槞z測(cè)與識(shí)別運(yùn)行的過程往往需要大量的運(yùn)算,并且其算法并不簡單,因此目前大部分人臉檢測(cè)與識(shí)別系統(tǒng)的設(shè)計(jì)與開發(fā)都需要立足于計(jì)算機(jī)技術(shù)。下面筆者將會(huì)對(duì)以計(jì)算機(jī)平臺(tái)為基礎(chǔ)的人臉檢測(cè)的實(shí)現(xiàn)過程展開詳細(xì)的論述與分析。

2 相關(guān)技術(shù)研究現(xiàn)狀

2.1 人臉圖像的獲取與預(yù)處理

一般情況下,攝像頭負(fù)責(zé)對(duì)人臉圖像的攝取,除此之外,專門的圖像庫也是人臉圖像的來源之一。前者多應(yīng)用于系統(tǒng)的應(yīng)用階段,一般來說,它不僅僅可以作為應(yīng)用系統(tǒng)存在,也可以作為研究系統(tǒng)存在;而后者多應(yīng)用于研究階段,并且它只能作為研究系統(tǒng)存在,是基于標(biāo)準(zhǔn)人臉圖像庫而存在的。

獲得需要的圖像之后,接下來就要對(duì)圖像進(jìn)行預(yù)處理,這一環(huán)節(jié)對(duì)于人臉檢測(cè)與識(shí)別系統(tǒng)的應(yīng)用來說,是非常關(guān)鍵的。在獲取圖像的過程中,會(huì)受到外部復(fù)雜環(huán)境的影響,例如燈光亮度、配套設(shè)施好壞、噪聲干擾、對(duì)比不明顯等等。并且,由于距離與焦距存在的差異,導(dǎo)致無法確定人臉?biāo)幍木咧谩R虼?,圖像預(yù)處理這一環(huán)節(jié)是必不可少的,有了這一環(huán)節(jié)才能確保圖像上人臉?biāo)幬恢门c大小比較恰當(dāng)。人臉扶正、人臉圖像增強(qiáng)及其幾何歸一化和灰度歸一化等都是圖像預(yù)處理環(huán)節(jié)主要的工作內(nèi)容。而圖像變換增強(qiáng)、直方圖均衡法、非線性平滑濾波、圖像的歸一化等則是圖像預(yù)處理過程之中所運(yùn)用的主要方法。

2.2 人臉檢測(cè)技術(shù)

人臉識(shí)別是否能夠具有較好的識(shí)別性能,取決于人臉檢測(cè)的性能水平的高低,因此可以說,人臉檢測(cè)是人臉識(shí)別得以實(shí)現(xiàn)的前提條件。借助人臉檢測(cè)算法技術(shù),檢查并測(cè)驗(yàn)靜態(tài)圖像(動(dòng)態(tài)視頻幀),從而準(zhǔn)確的對(duì)此圖像(視頻)進(jìn)行判斷,從而知道此圖像是否具有人臉圖像,假若判斷此圖像具有人臉圖像,則需要明確其所處區(qū)域及圖像數(shù)值大小,這就是人臉檢測(cè)。高效率與檢測(cè)精準(zhǔn)是用戶對(duì)人臉檢測(cè)的一個(gè)普遍性評(píng)價(jià),現(xiàn)如今這項(xiàng)技術(shù)已經(jīng)獲得了用戶的認(rèn)可,專家學(xué)者也對(duì)其展開了更深入的分析研究。

人臉圖像所囊概的特征是非常豐富的,例如膚色、人的輪廓、結(jié)構(gòu)等特征都是極具代表性的,此外其系列圖像往往還會(huì)涉及到一些其他信息,例如運(yùn)動(dòng)狀態(tài)等?;谶@些特征信息,研究者設(shè)計(jì)了許多人臉識(shí)別的檢測(cè)算法,按照這些方法的思想策略大致可將人臉檢測(cè)方法分為4類:基于知識(shí)的方法、基于模塊匹配的方法、基于外觀形狀的方法和基于特征的方法。

2.3 人臉識(shí)別技術(shù)

借助對(duì)相應(yīng)的人臉識(shí)別算法的運(yùn)用,辨別出圖像上的人臉的身份信息,第一步是對(duì)圖像進(jìn)行搜索,從而找出圖像上的人臉目標(biāo),然后識(shí)別人臉目標(biāo)體的身份信息,這就是人臉識(shí)別。

以人臉識(shí)別技術(shù)的發(fā)展?fàn)顩r作為劃分的依據(jù),研究工作往往將人臉識(shí)別技術(shù)劃分為四種類別,分別為:其一是幾何特征為基礎(chǔ)的;其二是以統(tǒng)計(jì)特征為基礎(chǔ)的;其三是以機(jī)器靴子為基礎(chǔ)的;其四是以局部模式為基礎(chǔ)的;

3 選擇的硬件平臺(tái)

3.1 圖像輸入

人臉圖像的輸入部分可以是普通的USB攝像機(jī)、網(wǎng)絡(luò)攝像機(jī)等,也可以將已經(jīng)拍攝好的圖像存儲(chǔ)在硬盤等存儲(chǔ)設(shè)備。因此其應(yīng)用往往不會(huì)受限于特定的場(chǎng)所。

如果攝像機(jī)選擇的性能比較差一些,會(huì)增加后面算法的復(fù)雜度;此外還會(huì)對(duì)人臉檢測(cè)與識(shí)別的最終效果造成一定的影響;為了提高系統(tǒng)的性能,所以應(yīng)該選擇性能比較好,產(chǎn)生的相片噪聲比較小的相機(jī)。

3.2 中央處理

本方案中的中央處理部分選取的是計(jì)算機(jī)的CPU;因?yàn)楝F(xiàn)在CPU的功能強(qiáng)大,再加上良好的微軟系統(tǒng),使得系統(tǒng)的性能大大的提升。

作為系統(tǒng)的中心處理部分,應(yīng)該選擇一臺(tái)專門的服務(wù)器來處理圖像的檢測(cè)和識(shí)別。這是由于圖像往往需要占據(jù)大量的內(nèi)存,在實(shí)施算法的過程之中會(huì)耗用較多的資源。

4 檢測(cè)系統(tǒng)的組成

4.1 計(jì)算機(jī)視覺庫OpenCV的介紹

Open CV是計(jì)算機(jī)視覺庫,它是跨平臺(tái)的,并且以(開源)發(fā)行為基礎(chǔ),能夠在很多操作系統(tǒng)上運(yùn)用,例如Linux、Windows、Mac OS,其具有的C函數(shù)跨平臺(tái)的中、高層API高達(dá)五百個(gè)。由于其有著豐富的視覺處理算法,因此在數(shù)字圖像處理領(lǐng)域之中的運(yùn)用非常普遍,例如物體、人體、人臉等的識(shí)別。本文后面分析工作的開展都是以O(shè)pen CV計(jì)算機(jī)視覺庫為基礎(chǔ)的。

4.2 人臉圖像采集模塊

原始的人臉圖像一般是在用戶注冊(cè)時(shí)采集的,一般會(huì)在幾副到十幾幅之間, 且采集到的這些人臉圖像需包含該人臉的不同的表情和多種姿態(tài)。人臉采集是人臉檢測(cè)的第一個(gè)步驟,筆者在前文現(xiàn)狀分析的基礎(chǔ)上,為使人臉檢測(cè)更加精確,結(jié)合了人眼與人臉檢測(cè)兩種技術(shù)。成功獲取人臉圖像后將會(huì)步入圖像預(yù)處理這一步驟,相應(yīng)的工作內(nèi)容不再贅述。

當(dāng)然進(jìn)行人臉識(shí)別時(shí)的圖像采集工作也是由此模塊來完成,采集完需要進(jìn)行歸一化、圖像均衡、灰度化、直方圖增強(qiáng)等預(yù)處理,之后根據(jù)當(dāng)前處于訓(xùn)練階段還是識(shí)別階段將其送入人臉特征提取模塊。

4.3 人臉特征提取模塊

這一模塊的主要工作是提取人臉圖片的特征,隨后開展降維處理,最終在數(shù)據(jù)庫之中錄入該特征,方便人臉圖像識(shí)別模塊對(duì)圖像的識(shí)別。在前文人臉識(shí)別技術(shù)研究現(xiàn)狀分析的基礎(chǔ)上,筆者認(rèn)為此模塊工作的開展,首先可以采取人臉區(qū)域先分塊再提取特征的方法。

4.4 人臉圖像識(shí)別模塊

人臉識(shí)別系統(tǒng)的好壞很大程度上取決于人臉識(shí)別的設(shè)計(jì)水平與其所挑選的計(jì)算方法,因此可以說,人臉識(shí)別系統(tǒng)的關(guān)鍵在于人臉識(shí)別?,F(xiàn)如今,以小波分析為基礎(chǔ)、以視覺聯(lián)想為基礎(chǔ)、以人臉表情為基礎(chǔ)的人臉識(shí)別技術(shù)是運(yùn)用最普遍的。因此,本文的關(guān)鍵點(diǎn)就在于此,要查閱相關(guān)資料,從而挑選出最恰當(dāng)?shù)乃惴ā?/p>

5 結(jié)論

我們以O(shè)penCV和計(jì)算機(jī)為平臺(tái),對(duì)人臉圖像的預(yù)處理、人臉圖像的特征提取和人臉圖像的識(shí)別算法進(jìn)行仿真分析和優(yōu)化。這樣,我們就可以充分利用人臉識(shí)別現(xiàn)有的算法,并進(jìn)行優(yōu)化,來實(shí)現(xiàn)快速高效的檢測(cè)和識(shí)別系統(tǒng)。

參考文獻(xiàn)

[1]朱文佳,戚飛虎.快速人臉檢測(cè)與特征定位 [J].中國圖像圖形學(xué)報(bào),2005,10(11):1455-1458.

[2]王志良,孟秀艷.人臉工程學(xué)[M].北京:機(jī)械工業(yè)出版社,2008.

作者簡介

宋家慧(1978-),女,山東省蒼山縣人。大學(xué)本科學(xué)歷?,F(xiàn)為廣西機(jī)電職業(yè)技術(shù)學(xué)院講師。研究方向?yàn)橛?jì)算機(jī)應(yīng)用、數(shù)據(jù)庫應(yīng)用和數(shù)據(jù)挖掘。

第8篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

關(guān)鍵詞:運(yùn)動(dòng)目標(biāo)跟蹤;生成方法;圖像感知哈希;OPENCV

中圖分類號(hào):TP392 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)14-0179-03

隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,計(jì)算機(jī)視覺已經(jīng)成為研究熱點(diǎn)之一,運(yùn)動(dòng)目標(biāo)跟蹤更是計(jì)算機(jī)視覺領(lǐng)域的熱門課題。如今運(yùn)動(dòng)目標(biāo)跟蹤技術(shù)已經(jīng)廣泛用于監(jiān)控、交通、軍事、醫(yī)療的等領(lǐng)域。視頻是一幀一幀連續(xù)播放的圖像序列,目標(biāo)跟蹤是指從視頻的某一幀開始,通過目標(biāo)檢測(cè)方法找到到運(yùn)動(dòng)目標(biāo)或者人工指定跟蹤目標(biāo),在之后的連續(xù)圖像序列中持續(xù)對(duì)目標(biāo)進(jìn)行識(shí)別和跟蹤。

目標(biāo)跟蹤方法通常分為判別方法和生成方法兩種。判別方法把跟蹤看成一個(gè)二分類的問題:以目標(biāo)物體作為正樣本,背景作為負(fù)樣本,通過訓(xùn)練分類器可以把目標(biāo)從背景中分離出來,從而實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤。目前很多判別方法提出,其中STRUCK是判別方法中最杰出的[2],但是此方法需要大量的計(jì)算,速度較慢,并不能滿足實(shí)時(shí)跟蹤的需求。生成方法首先學(xué)習(xí)外觀模型來表示目標(biāo),然后在搜索區(qū)域的候選模型中選擇出與目標(biāo)模型誤差最小的一個(gè)作為跟蹤結(jié)果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始圖像的整體模板法,即LK方法。僅僅使用原始圖像作為模板,不能很好地提取目標(biāo)外觀特征,適應(yīng)目標(biāo)外觀變化,且需要的計(jì)算量較大。Hager和Belhumeur 等人改進(jìn)了LK方法,對(duì)原始圖像進(jìn)行降維,使用對(duì)光照不敏感的低維特征作為目標(biāo)外觀的表示。在此基礎(chǔ)上,Black和Jepson又提出了使用一定的學(xué)習(xí)策略進(jìn)行模型更新,從而更好的處理目標(biāo)外觀的變化。此時(shí)生成跟蹤方法的框架已經(jīng)形成。隨后很多模型的不同特征被用于跟蹤。如Comaniciu人等結(jié)合顏色直方圖和數(shù)學(xué)上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自適應(yīng)尺度變換的改進(jìn)方法camshift。為了更好的處理遮擋和提升實(shí)時(shí)性能,局部稀疏表示(PCA、稀疏編碼等)和多種特征的聯(lián)合表示也被用于目標(biāo)跟蹤。[1][2]

跟蹤的過程中會(huì)出現(xiàn)眾多的干擾因素影響跟蹤的性能,如尺度變換,光照變化,偏移,遮擋等問題。處理這些因素的關(guān)鍵在于構(gòu)造有效且魯棒的外觀表示模型。文獻(xiàn)[1]證明了模型表示的選擇對(duì)于跟蹤性能的影響最大。于是近些年來,跟蹤問題更多的焦點(diǎn)集中在尋找有效的表示模型上。本文提出了一個(gè)有效的生成方法,使用圖像感知哈希作為模型表示進(jìn)行跟蹤,

具有尺度不變性和運(yùn)算速度快的優(yōu)點(diǎn),并且引入了模型更新策略,從而解決了目標(biāo)跟蹤中出現(xiàn)的偏移、遮擋問題。

1圖像感知哈希

感知哈希是指將具有相同感知內(nèi)容的多媒體信息映射為一段數(shù)字摘要,用來對(duì)媒體信息進(jìn)行比對(duì)。圖像感知哈希則是對(duì)數(shù)字圖像的感知信息進(jìn)行摘要。傳統(tǒng)的哈希技術(shù)僅僅簡單地把圖片看作一個(gè)二進(jìn)制文件進(jìn)行處理,而沒有考慮到圖像上的感知信息。隨著網(wǎng)絡(luò)上有損壓縮格式的使用,傳統(tǒng)的哈希算法如MD5、SHA1等方式不再適用于圖片的匹配,于是提出了圖像感知哈希技術(shù),利用的圖片的感知特征作為摘要信息來進(jìn)行圖像的識(shí)別和認(rèn)證[4]。

在MD5、SHA1這樣的加密哈希方法中,得到的哈希值僅僅是一段固定長度的二進(jìn)制數(shù)字,和其本身的內(nèi)容沒有關(guān)系。單向性和抗碰撞性要求它對(duì)輸入的二進(jìn)制數(shù)據(jù)的比特變化敏感,也就是說,即使輸入數(shù)據(jù)一位的比特變化,也會(huì)導(dǎo)致輸出哈希值的明顯的隨機(jī)變化。

對(duì)于數(shù)字圖像而言,圖像數(shù)據(jù)格式的變化,普通的圖像潤飾或者加工操作,圖像通信的信道噪聲等在劇烈改變圖像二進(jìn)制數(shù)據(jù)的同時(shí),一般都只會(huì)影響圖像呈現(xiàn)信息的質(zhì)量,而不會(huì)改變其內(nèi)容。因此大部分感知哈希算法都具有共同的基本特性:圖像可以放大縮小,可以有不同的方向、角度,甚至可以有細(xì)微的顏色差別,其哈希值都應(yīng)該保持不變或者在一個(gè)指定的閾值內(nèi)變化。而以上的特性也正好適用于目標(biāo)跟蹤中用來匹配目標(biāo)。

2提出的算法

近些年來,已經(jīng)有很多不同的圖像感知哈希算法提出[5]。其中包含很多復(fù)雜的甚至可以加密的方法,但是經(jīng)測(cè)試,即使將很簡單的感知哈希算法作為特征使用到跟蹤中,也能起到很好的效果。

2.1模型表示

本文中采取的感知哈希作為跟蹤目標(biāo)的模型表示,計(jì)算方法如下:

1)將原圖像轉(zhuǎn)化為灰度圖,灰度圖就可以很好的保存圖像輪廓和細(xì)節(jié),減少計(jì)算量,提高速度。

2)縮小圖像尺寸,把原大小轉(zhuǎn)化為8*8的方形圖像??s小尺寸可以大幅度減少圖像的高頻信息,保留低頻信息。低頻信息反映了圖像的整體框架,具有對(duì)放大、縮小、平移、模糊的不變性,這也是圖像哈??梢宰鳛槟繕?biāo)跟蹤匹配特征的關(guān)鍵原因。

3)計(jì)算所有像素灰度的平均值,用于和每個(gè)像素比較。

4)將所有的像素值與平均值進(jìn)行對(duì)比,大于等于平均值記為1,小于平均值記為0。

5)把這64個(gè)2進(jìn)制位由在原圖像從左到右從上到下的順序排列,形成哈希值。

以Lena圖為例,計(jì)算圖像感知哈希的步驟如圖1所示:

2.2 運(yùn)動(dòng)模型和觀察模型

跟蹤算法使用圖像感知哈希作為模型特征,以兩個(gè)哈希值之間的漢明距離作為評(píng)判相似度的標(biāo)準(zhǔn)(觀察模型)。漢明距離表示哈希值中對(duì)應(yīng)位置二進(jìn)制位不同的個(gè)數(shù),漢明距離越大,說明圖像越不相似,反之則越相似。

漢明距離的計(jì)算:d(x,y)=∑x[i]y[i],如下所示。

由[1]我們得知,在選取合適特征情況下,即便是用很簡單的跟蹤框架也能夠?qū)崿F(xiàn)很好的跟蹤效果。本系統(tǒng)在第一幀使用人工標(biāo)注的方法圈定要跟蹤的目標(biāo),之后的每一幀使用滑動(dòng)窗口作為運(yùn)動(dòng)模型搜尋目標(biāo):在當(dāng)前目標(biāo)2*2的范圍內(nèi)尋找目標(biāo),使用漢明距離作為觀察模型來從候選的模型中選取最接近目標(biāo)的一個(gè)。如圖2。

2.3偏移問題

在模型更新的過程中,由于誤差積累,會(huì)導(dǎo)致跟蹤結(jié)果偏移。對(duì)于此問題,本算法采取使用第一幀和上一幀的權(quán)重共同跟蹤的方法,第t幀的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一幀中目標(biāo)模型所占的權(quán)重。隨著時(shí)間變化,第一幀的權(quán)重應(yīng)逐漸減小。本方法中取α=1/(1+t)。

2.4 遮擋問題

當(dāng)模型被遮擋時(shí),如果繼續(xù)更新,會(huì)導(dǎo)致更新到覆蓋物更新到了錯(cuò)誤的模型。所以本方法中的模型更新針對(duì)遮擋也提出了解決方法。d(h)表示漢明距離,當(dāng)0

2.5算法流程

1)在視頻的某一幀使用鼠標(biāo)拖拽圈定要跟蹤的目標(biāo),作為模型T,大小為p*q,左上角像素的位置為(m,n)。

2)計(jì)算選中窗口區(qū)域的感知哈希值H(T)。

3)下一幀F(xiàn)中使用在當(dāng)前位置的2*2大小的窗口中滑動(dòng),計(jì)算每個(gè)大小為p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j為子窗口Fi,j 左上角的像素在F圖中的坐標(biāo),稱為參考點(diǎn)。i,j的取值范圍:m-p/2

4)比較搜索窗口和模型窗口的哈希值的漢明距離D(H(T),H(Fi,j)),選取所有子窗口中漢明距離最小的子窗口作為跟蹤結(jié)果。

5)根據(jù)提出的模型更新機(jī)制決定是否將跟蹤結(jié)果Fi,j作為下一幀的跟蹤模型T,重復(fù)步驟2到步驟5。

3 基于Opencv的系統(tǒng)實(shí)現(xiàn)及仿真實(shí)驗(yàn)

Opencv是一個(gè)開源的數(shù)字圖像處理和計(jì)算機(jī)視覺的函數(shù)庫,實(shí)現(xiàn)了圖形圖像處理和計(jì)算機(jī)視覺方面的很多通用算法,方便開發(fā)人員將注意力集中于算法的實(shí)現(xiàn)而不需要自己寫一些底層操作代碼,避免造成時(shí)間和精力上的浪費(fèi)。

Opencv提供了數(shù)組、序列、矩陣、樹等基本結(jié)構(gòu),也包含了差分方程求解、傅里葉分析、積分運(yùn)算、特殊函數(shù)等眾多高級(jí)數(shù)學(xué)計(jì)算函數(shù),以及各種圖像處理操作和目標(biāo)跟蹤、攝像機(jī)校準(zhǔn)、三維重建等高級(jí)視覺函數(shù)。本設(shè)計(jì)中的基本功能如讀取視頻,鼠標(biāo)選取操作,縮放圖像,彩色圖像轉(zhuǎn)化為灰度圖像等基本功能都由opencv提供的函數(shù)實(shí)現(xiàn)。

本設(shè)計(jì)基于windows10+visual studio 2013+opencv2.4.11環(huán)境,實(shí)現(xiàn)了在固定的背景的情況下進(jìn)行穩(wěn)健的目標(biāo)跟蹤,具有尺度不變性和光照不變性,達(dá)到不需要預(yù)先訓(xùn)練的每秒30幀以上的實(shí)時(shí)跟蹤效果。圖3為程序在第82、269、550、736幀跟蹤到的結(jié)果。

4 結(jié)論

實(shí)驗(yàn)結(jié)果表明,在目標(biāo)跟蹤中引入圖像匹配中的感知哈希方法作為跟蹤特征,有較快的運(yùn)行速度、準(zhǔn)確度和魯棒性,可以作為一種良好的特征用于目標(biāo)跟蹤。雖然與Object Tracking Benchmark[2]中排名靠前的算法相比,本設(shè)計(jì)仍然有差距,但是提出了一種將圖像感知哈希引入跟蹤的概念。近些年來還不斷有新的感知哈希算法提出,不乏兼具尺度不變性,旋轉(zhuǎn)不變性等良好特性的感知哈希算法,試想將這些方法用于運(yùn)動(dòng)目標(biāo)跟蹤,會(huì)具有更好的跟蹤效果,可作為目標(biāo)跟蹤發(fā)展的下一步研究方向。

參考文獻(xiàn):

[1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015.

[2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015.

[3] 徐光柱,雷幫軍.實(shí)用性目標(biāo)檢測(cè)與跟蹤算法原理及應(yīng)用[M].北京,國防工業(yè)出版社, 2015.

[4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996.

第9篇:計(jì)算機(jī)視覺的優(yōu)點(diǎn)范文

【關(guān)鍵詞】計(jì)算機(jī)技術(shù) 殘障人士 影響 發(fā)展

一 計(jì)算機(jī)技術(shù)帶給殘障人士生活上的影響

(1)對(duì)殘障人士基本生活保障

隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)已經(jīng)進(jìn)入社會(huì)生活的各個(gè)領(lǐng)域,它已經(jīng)和人們的生活息息相關(guān)。它不僅能通過計(jì)算機(jī)技術(shù)來提高工作效率、獲取需要的知識(shí)以及進(jìn)行娛樂。與此同時(shí),處于弱勢(shì)的殘疾人群體,也可以通過計(jì)算機(jī)與外界溝通、交流并獲取自己所需知識(shí)。一般情況下,殘疾人因?yàn)樾袆?dòng)不便,或者由于語言上的障礙不能正常的外界交流,常失去和其他人公平競(jìng)爭的機(jī)會(huì),這致使很多殘疾人的生活得不到保障。但是,計(jì)算機(jī)技術(shù)的發(fā)展則使他們得到了學(xué)習(xí)知識(shí)的機(jī)會(huì),通過計(jì)算機(jī)獲取相應(yīng)的知識(shí),以此來提升自身的能力,使自己的基本生活得到保障。

(2)對(duì)殘障人士學(xué)習(xí)的保障

通過計(jì)算機(jī),殘疾人可以不用行動(dòng)或通過交談就可以完成工作,他們也可以通過計(jì)算機(jī)來獲取知識(shí)從而增加自身的知識(shí)儲(chǔ)備量。殘疾人在“聽”、“說”、“看”、“做”等方面有著不同的缺陷,但利用計(jì)算機(jī)技術(shù)可以彌補(bǔ)他們的缺陷方面。如人機(jī)交互技術(shù):隨著語音識(shí)別和計(jì)算機(jī)視覺技術(shù)的發(fā)展,人機(jī)交互技術(shù)成為殘障人士克服各種障礙的重要工具。在一些殘疾人聯(lián)合會(huì),負(fù)責(zé)人通過組織肢體殘疾者學(xué)習(xí)電腦操作技術(shù),使他們可以借助高科技手段,真正的融入社會(huì)中去。殘疾人借助計(jì)算機(jī)的幫助可以使自己更加靈活的進(jìn)行工作。

(3)對(duì)殘障人士疾病輔助的保障

計(jì)算機(jī)具有速度快、精度高、可靠性高的優(yōu)點(diǎn), 通過計(jì)算機(jī)技術(shù)我們可以設(shè)計(jì)出有利于殘疾人生活的工具。在以前,輪椅要通過手來搖動(dòng)或者人推動(dòng)才能移動(dòng),而現(xiàn)在通過在輪椅上安裝微型的計(jì)算機(jī),就可以通過語音或者預(yù)設(shè)來實(shí)現(xiàn)移動(dòng)。在這方面大大提高了殘疾人出行不便的問題。社會(huì)上的一些患有先天性聾啞的兒童,通過對(duì)他們進(jìn)行康復(fù)訓(xùn)練,糾正他們的發(fā)音,每天記錄他們的學(xué)習(xí)情況,把記錄錄入到計(jì)算機(jī)中,然后通過一些分析軟件來進(jìn)行分析,分析出他們每天的進(jìn)步情況,以便為他們制定出更好的康復(fù)計(jì)劃。計(jì)算機(jī)給殘疾人的生活帶來各種便利,提高了他們各方面的效率,通過計(jì)算機(jī)網(wǎng)絡(luò)的鏈接,使殘疾人與社會(huì)更加的貼近,在一定的程度上擴(kuò)大了他們的生存空間。

二 計(jì)算機(jī)技術(shù)在殘障設(shè)施上的發(fā)展

(1)計(jì)算機(jī)技術(shù)在“聽、看”方面的發(fā)展

隨著計(jì)算機(jī)技術(shù)的發(fā)展,讓盲人閱讀漢字已經(jīng)成為可能。通過掃描把文字用聲音的方式輸出,盲人最終也可以通過計(jì)算機(jī)技術(shù)來閱讀文字。如今有聽力障礙的殘疾人有的會(huì)佩戴上人工耳蝸,人工耳蝸它是一種電子裝置,能夠幫助耳聾患者重新恢復(fù)聽力。它的原理就是代替了已經(jīng)病變受損的聽覺器官,把聲音通過電信號(hào)傳遞給內(nèi)耳耳蝸,刺激分布在那里的聽覺神經(jīng),然后大腦就形成了聽覺。而人工眼是使盲人能夠看得見的一個(gè)現(xiàn)代化的科技產(chǎn)品,他通過電子設(shè)備把景物拍攝下來,然后傳送給人的相關(guān)神經(jīng)。這些技術(shù)的出現(xiàn)使得殘障人士的生活方式、交往方式以及思維方式都發(fā)生了很大的改變,可見,計(jì)算機(jī)技術(shù)的發(fā)展對(duì)輔助殘障人士設(shè)施的發(fā)展產(chǎn)生了深遠(yuǎn)的影響。

(2)自然人機(jī)交互技術(shù)領(lǐng)域的發(fā)展

伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,人機(jī)交互技術(shù)也取得了部分的成就,目前,自然人機(jī)交互技術(shù)的飛速發(fā)展給殘疾人帶來了很大的方便。近期自然人機(jī)交互主要研究及進(jìn)展有筆式交互、語音交互、基于計(jì)算機(jī)視覺技術(shù)的人機(jī)交互、基于傳感器的交互。腦電波交互、手臂機(jī)交互等比較前沿的人機(jī)交互研究也正在開展。像肌電、腦電技術(shù)的開展將讓肢體有障礙的人士行動(dòng)自如。20世紀(jì)70年代我國的肌電假肢得到了很好的發(fā)展,現(xiàn)在此技術(shù)已經(jīng)得到廣泛的應(yīng)用。高位截肢患者的肌肉雖然已經(jīng)被截去,但其控制運(yùn)動(dòng)的神經(jīng)系統(tǒng)還依然存在。但神經(jīng)移植術(shù)[2]為解決這一問題開辟了途徑,這種技術(shù)就是利用肌的信號(hào)控制多自由度假肢。還有手語識(shí)別和合成將會(huì)使有聽覺障礙的患者“說話”。手語識(shí)別即是指通過計(jì)算機(jī)采集設(shè)備獲得聾啞人手語數(shù)據(jù),采用模式識(shí)別算法,結(jié)合上下文知識(shí),獲知手語含義,進(jìn)而翻譯成語音,傳達(dá)給不懂手語的正常人。而手語合成則是一個(gè)和上述過程相反的過程,即是正常人通過語音表達(dá),然后計(jì)算機(jī)將語音翻譯成手語并表現(xiàn)出來,向有聽覺障礙的患者傳遞信息。這樣,有聽覺障礙的人就可以“聽見”聲音了。自然語言理解始終是人機(jī)交互的最重要目標(biāo),雖然目前在語言模型、語料庫、受限領(lǐng)域應(yīng)用等方面均有進(jìn)展,但由于它的難度,自然語言理解仍是科學(xué)家和語言學(xué)家的一個(gè)長期研究目標(biāo)。

三、結(jié)論

綜上所述,計(jì)算機(jī)技術(shù)是一個(gè)融匯技術(shù),經(jīng)濟(jì),法律和社會(huì)工作的一門學(xué)科,從它身上不僅僅能看出對(duì)社會(huì)有巨大的價(jià)值,還能看到對(duì)殘疾人的巨大幫助。然而我國在計(jì)算機(jī)輔助殘疾人技術(shù)的開發(fā)設(shè)計(jì)與利用服務(wù)方面還十分的落后,需要培養(yǎng)大量的的輔助技術(shù)領(lǐng)域的引領(lǐng)者,策劃者與服務(wù)者,以推動(dòng)各種高品質(zhì)的輔助技術(shù)產(chǎn)品的開發(fā)和輔助技術(shù)服務(wù)的發(fā)展;需要通過發(fā)展高等輔助技術(shù)教育培養(yǎng)高層次研究人員,以總結(jié),完善和發(fā)展該學(xué)科的理論與技術(shù),發(fā)展輔助技術(shù)高等教育對(duì)支持殘疾人獨(dú)立生活,促使他們向生產(chǎn)性社會(huì)成員方面發(fā)展,開發(fā)新的潛在市場(chǎng),有重大意義。我們要通過實(shí)驗(yàn)來培養(yǎng)實(shí)際的工作能力、合作精神以及嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,這樣我們才會(huì)使我國的計(jì)算機(jī)技術(shù)繼續(xù)進(jìn)步,那樣才會(huì)更大幅度的改善殘疾人的生活水平,殘疾人才會(huì)擁有更加美好的未來。計(jì)算機(jī)技術(shù)的發(fā)展,給殘疾人帶來了本質(zhì)的改變,讓他們能夠更有效的使用計(jì)算機(jī),改善了他們的生活狀況。我們相信,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展與完善,它將能為殘疾人帶來更多的便利與幫助。

參考文獻(xiàn):

免责声明

本站为第三方开放式学习交流平台,所有内容均为用户上传,仅供参考,不代表本站立场。若内容不实请联系在线客服删除,服务时间:8:00~21:00。

AI写作,高效原创

在线指导,快速准确,满意为止

立即体验
文秘服务 AI帮写作 润色服务 论文发表