前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的人工智能的商業(yè)化應用主題范文,僅供參考,歡迎閱讀并收藏。
報告從醫(yī)療人工智能的發(fā)展角度出發(fā),以商業(yè)落地為切入點,總結出中國醫(yī)療人工智能發(fā)展10大洞察。梳理了國內10項主流的醫(yī)療AI產(chǎn)品,醫(yī)療人工智能領域中十大主流產(chǎn)品,并從技術成熟度、使用效果、發(fā)展情況、企業(yè)案例等角度進行分析。
2018中國醫(yī)療人工智能十大洞察從人工智能在醫(yī)療健康領域的四個核心應用場景——醫(yī)學影像、虛擬助理、健康管理和藥物研發(fā)的角度,提出出中國醫(yī)療人工智能發(fā)展的十大洞察及相關觀點。
1. 部分智能影像診斷企業(yè)將在2018年獲得三類器械證,正式進入商業(yè)化階段。
2. 智能影像診斷競爭格局基本形成,“偽醫(yī)療AI企業(yè)”基本出局,新入場技術型玩家基本沒有獲得風投的可能,商業(yè)機會已然錯過。
3 .語音電子病歷:落地醫(yī)院成本高,產(chǎn)品需進行科室定制化,客單價低,主要用于病理科、影像科等。
4. 智能問診:知識圖譜搭建是關鍵,目前僅發(fā)揮導診、輔助檢索或連接醫(yī)患的作用。院內場景“預問診”需求量大,具備落地能力.
5. 國人健康管理意識尚待培育,健康大數(shù)據(jù)尚待采集與整合。企業(yè)以B端為主要切入口。
6. 精神心理治療師嚴重缺乏,AI或可成為替代性工具。
7. 藥物研發(fā)中化合物數(shù)據(jù)質量對于AI企業(yè)是關鍵。
8. 借助國際力量,中國AI藥物研發(fā)企業(yè)從無到有,預計2018年起將涌現(xiàn)更多玩家,AI藥物研發(fā)或將是未來的新風口。
9. 產(chǎn)品形態(tài)以軟件/SaaS為主,收取軟件授權費的商業(yè)模式存在一定局限性。軟硬一體化產(chǎn)品的商業(yè)落地更具優(yōu)勢。
10. 中國醫(yī)療整體數(shù)據(jù)量大,但針對細分場景的數(shù)據(jù)量和質量仍無法滿足算法模型的訓練需求;隨訪數(shù)據(jù)的缺失,使國內在類似“腫瘤患者五年存活率”等領域的研究一片空白。
醫(yī)療人工智能應用場景與技術路線人工智能與醫(yī)療健康結合點在哪里?下圖呈現(xiàn)的是人工智能技術在醫(yī)療領域的主流應用場景與技術路線,通過該圖能夠對中國醫(yī)療人工智能的格局有清晰的了解。
中國十大醫(yī)療人工智能產(chǎn)品總覽為了更深入的解讀商業(yè)落地的現(xiàn)狀,在報告中,億歐智庫主要按照技術成熟度和使用效果兩大維度對醫(yī)療人工智能十大產(chǎn)品進行了分析與評估。其中,針對技術成熟度和使用效果兩大維度,主要通過產(chǎn)品出現(xiàn)時間、落地情況、發(fā)展情況、企業(yè)數(shù)量、行業(yè)人士和專家訪談進行判斷。另外,還從產(chǎn)品的發(fā)展情況、涉足的企業(yè)案例等角度更加具體地進行分析。
醫(yī)療人工智能六大發(fā)展趨勢結合政策和商業(yè)落地產(chǎn)品的現(xiàn)狀,億歐智庫認為市場在今年呈現(xiàn)出六大趨勢:
1. 2018年起,AI影像產(chǎn)品落地速度會加快,產(chǎn)品性能成熟度將不斷提高。
2. 隨著技術成熟度提高,語音電子病歷醫(yī)院普及率加快,頭部企業(yè)可形成規(guī)模效應
3. 智能問診隨著知識圖譜的不斷完善,預問診功能可以有效提升醫(yī)生效率
4. 健康大數(shù)據(jù)的發(fā)展,會使AI在健康管理場景下的應用程度會進一步提高。
5. AI在精神心理健康的的滲透程度會更深,未來可能成為這一領域的核心推動力
6. AI+藥物研發(fā)領域將會誕生出獨角獸。
醫(yī)療人工智能發(fā)展四大挑戰(zhàn)一是數(shù)據(jù)數(shù)量問題:中國醫(yī)療整體數(shù)據(jù)量大,但針對不同病種的數(shù)據(jù)量和質量參差不齊,有些病種的訓練數(shù)據(jù)缺乏;健康大數(shù)據(jù)孤島問題有所緩解,但仍未達到深度學習的階段。
二是數(shù)據(jù)質量問題:AI數(shù)據(jù)處理中標注的準確性關乎結果的準確性,近兩年之內還是需要大量醫(yī)生去標注。藥物研發(fā)中的數(shù)據(jù)質量對于研發(fā)效率的提升至關重要。
三是人才問題:AI算法人才與醫(yī)學人才知識體系不同,如何融合各自優(yōu)勢發(fā)揮最大價值,值得企業(yè)思考。
中國電子信息產(chǎn)業(yè)發(fā)展研究院總工程師烏寶貴參加了本次大會并代表主辦方致辭。烏寶貴回顧了人工智能的歷史,肯定了人工智能60年來的發(fā)展成績,并指出,中國人工智能產(chǎn)業(yè)正步入一個嶄新的階段。從科學研究角度來看,中國在深度學習等領域的學術研究水平,已經(jīng)走在世界前列;從龍頭企業(yè)發(fā)展角度來看,阿里等國內企業(yè)在人工智能領域已經(jīng)具備和國際巨頭抗衡的實力;從創(chuàng)新創(chuàng)業(yè)角度來看,人工智能已經(jīng)成為國內“雙創(chuàng)”最活躍的領域之一;從應用創(chuàng)新角度來看,制造、交通、家居、教育、金融、大健康等眾多領域的應用正全面展開;從產(chǎn)業(yè)鏈角度來看,從智能芯片到IT基礎設施,從底層架構到模型算法,從大數(shù)據(jù)到云平臺,從智能終端到智能應用,國內在各個層面均取得了突破性進展。他表示,人工智能不僅僅是一個概念,而是下階段技術創(chuàng)新、應用創(chuàng)新的新焦點,是市場發(fā)展的新熱點,也是我國推動產(chǎn)業(yè)轉型升級的重要支點。
中國科學院自動化研究所復雜系統(tǒng)管理與控制國家重點實驗室主任王飛躍參加了本次論壇并發(fā)表演講。王飛躍以《邁向人機混合虛實互動的平行智能》為主題,追溯了智能的本源,探討了平行時代的智能基礎設施X5.0,并展望了智能產(chǎn)業(yè)和智能社會。王飛躍認為,陽為智能,陰為情報,相輔相成,智能是開放的情報,情報是封閉的智能,智能的本質是利用已知解決未知,從已知到未知只能依靠想象。王飛躍提出,物理世界與心理世界、人工世界共同構成平行世界,平行世界需要平行智能。開放智能算法,開發(fā)人工世界,最終消除“智力的不對稱”是新智能時代的歷史任務。人機混合、虛實互動的平行智能,是“激活”的人工智能,是未來人、組織、各種類的智能機器、裝置、過程、系統(tǒng)所必備的“生存”形式,是智能產(chǎn)業(yè)的基礎設施。X5.0 時代的智能體系包括:一個核心――平行,兩個支撐――ACP 和CPSS,三個主題――智能系統(tǒng)、智慧管理和社會智能。平行智能各種各類的虛實互動X5.0 系統(tǒng)是智能社會的基礎設施,不久的將來,一個個體的實力,很大程度上可能并不取決于其本身,而取決于與其伴生的軟件定義的人工映像。
中國電子信息產(chǎn)業(yè)發(fā)展研究院電子信息產(chǎn)業(yè)所副所長溫曉君參加了本次大會,并以《電子信息產(chǎn)業(yè)新興熱點及趨勢――人工智能與虛擬現(xiàn)實》為主題發(fā)表演講。溫曉君指出,泛在、互聯(lián)、融合、智能成為產(chǎn)業(yè)發(fā)展新趨勢,技術創(chuàng)新是國內經(jīng)濟新舊動能轉換,經(jīng)濟結構轉型升級的核心推動力量之一,是從根本上打開增長之鎖的鑰匙。溫曉君重點解讀了人工智能和虛擬現(xiàn)實的發(fā)展現(xiàn)狀和趨勢。溫曉君分享了智能感知、人腦芯片、深度學習、大數(shù)據(jù)等人工智能前沿技術,移動社交、智能搜索、機器人、無人駕駛等人工智能前沿應用,指出“基礎資源+技術+應用”的人工智能產(chǎn)業(yè)生態(tài)逐步形成。我國人工智能產(chǎn)業(yè)需構建開放生態(tài)體系、合作搭建基礎資源、促進產(chǎn)業(yè)鏈深度合作、開拓可持續(xù)應用需求 。在虛擬現(xiàn)實方面,溫曉君判斷,消費端市場早期一定爆發(fā)于歐美等發(fā)達國家,國內市場短期內以產(chǎn)業(yè)鏈布局蓄力和消費者提升消費認知為主;行業(yè)應用一定從高附加值行業(yè)或價值鏈的高端環(huán)節(jié)興起,應用成本與效率提升必須首先得到權衡。他指出,虛擬現(xiàn)實的趨勢為:消費市場的普及化、行業(yè)需求的明晰化、投資熱潮的全球化、基礎平臺的開放化、技術創(chuàng)新的協(xié)同化。他建議,強化頂層設計,面向行業(yè)需求規(guī)劃應用路徑;加強重點攻關,盡快突破行業(yè)應用技術瓶頸;制定標準規(guī)范,開展行業(yè)應用聯(lián)合測試驗證;推進試點示范,以點帶面擴大行業(yè)應用范圍和影響力。
搜狗、英特爾、陌上花(衣+)等企業(yè)代表分別從各自的領域出發(fā),分享了人工智能的實踐與思考。
北京搜狗科技有限公司CTO楊洪濤分享了關于互聯(lián)網(wǎng)產(chǎn)品自然交互的經(jīng)驗。他指出,人機之間交互的學習成本在不斷降低,變得越來越接近人的自然能力,語音正在成為最自然的交互形式。在他看來,自然交互= 技術 + 計算力 + 數(shù)據(jù) + 產(chǎn)品。技術是擴散的,計算力穩(wěn)步增長, 只有數(shù)據(jù)和產(chǎn)品才是私有財產(chǎn),將成為競爭的壁壘。要想做好自然交互,需要充分利用“產(chǎn)品+數(shù)據(jù)”。會上,楊洪濤還分享了搜狗輸入法即將推出的智能回復功能。
英特爾中國研究院院長宋繼強博士就《人工智能驅動的智能交互,推進個人機器人產(chǎn)業(yè)化》發(fā)表演講。他說,人工智能與人機交互推動科技進步,人工智能應用的終極平臺是自主系統(tǒng)。他分析,個人自主服務機器人理想與現(xiàn)實的差距在于智能組合的實現(xiàn)難度,其中運動不易,認知更難。人工智能聯(lián)手智能交互,通過商業(yè)化成功帶動人工智能的發(fā)展和成本下降。宋繼強分享了幾種人工智能驅動智能交互的應用模式,并提出了個人機器人的智能度分級建議,展望了個人機器人的商業(yè)化迭代 ,即在用戶需求推動下,由能力達標到價格達標,再到可靠性達標。
當我們想忽視它的時候,一些陳舊的科幻故事會跳出來,將當時的設想和如今的技術產(chǎn)品擺到我們眼前:看,多少個荒謬的想象,在現(xiàn)實中就是不可思議地成真,還被應用了!當我們想推辭說,擁有人類智慧的機器人,技術實現(xiàn)上還遠得很呢!但一個個機器人打敗人類的例子又活生生地公布在新聞中,把這個技術性“能夠”和道德性“應該”的話題,不斷地逼到我們面前。
如今越來越多的人,在新奇地看著那些會說、會笑、會動的機器人時,會忍不住疑問,未來會不會發(fā)生我們都不曾理解和預想的事情?像宇宙大爆炸一般的技術奇點會不會不期而至?人類會成功主宰我們自己的世界嗎?那個時候,我們又該說人類是聰明還是愚蠢呢?
在人工智能再次成為當下熱點話題的今天,英國倫敦帝國理工學院認知機器人學系教授默里?沙納漢帶著他的新書《技術奇點》來到中國,希望為這個人工智能起步不久的國度,帶來更多的思考和討論。
人工智能新的春天
《鳳凰周刊》:如今人工智能在當下又掀起全球關注的熱潮,這一輪人工智能的發(fā)展狀況是怎樣的?
默里?沙納漢:人工智能指的是計算機機器人,他們能在不同環(huán)境之下做出正確決定,完成任務。目前,人工智能技術最新的進展是讓機器人擁有學習力,以及擁有更強大的處理龐大數(shù)據(jù)的能力。比如說,我們可以教一個電腦辨認和創(chuàng)造圖像,給每個圖像編號,電腦學習這些無數(shù)的圖片后,可以創(chuàng)造一個新的圖像,我們從來沒有見過的。
《鳳凰周刊》:人工智能的發(fā)展過程是什么樣的?
默里?沙納漢:在西方,“人工智能”并非新鮮詞匯。上世紀八九十年代,人工智能研發(fā)熱潮興起,美國、日本等國家熱情高漲,政府進行了大量投入和研究,后來很多預想并沒有實現(xiàn),人工智能又陷入了引人疑問的寒冬期。近20年來,人工智能經(jīng)歷了三個里程碑:1997年,IBM機器人“深藍”打敗世界國際象棋冠軍加里?卡斯帕羅夫;2001年,又有IBM的機器人在一款美國游戲中,打敗人類對手獲得冠軍;2016年,谷歌的機器人“Alpha Go”打敗了圍棋大師李世石。
最近的這一次,再次引發(fā)了人們對人工智能的強烈關注。在我看來,人工智能正在迎來又一個春天。是否會像前一輪一樣大起又大落呢?我認為不會,因為現(xiàn)在的很多人工智能已經(jīng)應用到了我們的生活設備當中,實現(xiàn)了商業(yè)化,形成了產(chǎn)業(yè)效應,比如說無人駕駛汽車、醫(yī)療產(chǎn)品等,未來會是一個良性的循環(huán),這就是為什么谷歌、臉書、百度等大公司都有很高的投資和研發(fā)熱情。
我注意到,中國出臺的“十三五”計劃,也明確提出了人工智能將是一個值得開發(fā)的重點領域。百度公司投資人工智能已有一段時間,現(xiàn)在小米公司也宣布要投資人工智能技術。
《鳳凰周刊》:人工智能對我們目前的生活有何影響?
默里?沙納漢:這一輪人工智能的影響,可以分為短期和長期來看。短期內5至10年,人工智能可以用在個性化醫(yī)療,搜集個人全面的健康數(shù)據(jù),為治療提供全面的數(shù)據(jù)服務;另一方面,一些產(chǎn)品很可能會融入我們現(xiàn)在已經(jīng)高度依賴的金融、能源、媒體、安全等領域。從50至100年的長階段來看,人工智能可能出現(xiàn)我們在科幻電影中,看到的人性化的人工智能技術。作為研究人工智能40年的專家,我認為,到2100年人性化的人工智能技術將會達到一個新的高度。
和人類一樣的機器人
《鳳凰周刊》:您的新書《技術奇點》正是討論了這兩個階段的影響,為什么叫“技術奇點”?
默里?沙納漢:聽說因為一部大陸電視劇,“奇點”一詞在中國很熱?!捌纥c”在物理學、數(shù)學中都有定義,在人類歷史中,“奇點”指的是,由于技術的迅速發(fā)展,人類社會的一切都出現(xiàn)了改變,生活在今天的我們將無法理解。
這本書就是討論,人工智能和神經(jīng)技術兩個領域的技術進步,會加速這個“技術奇點”的到來。我們可以把目前的人工智能興起和應用,稱為人工智能的第一次浪潮,這個短期的發(fā)展是商業(yè)化、產(chǎn)業(yè)化的;而未來一個世紀可能會出現(xiàn)超人工智能(即有人類意識的人工智能),這個長期的發(fā)展,我們需要用一個更大的人類與機械關系視角去看待和討論。后者看起來離我們還很遙遠,但是從技術變革的歷史來看,也不過是一瞬。
《鳳凰周刊》:從現(xiàn)實技術的角度,人工智能擁有人類的意識和感情,這離我們還有多遠?您最近擔任科學顧問的科幻電影《機械姬》也有涉及這個主題。
默里?沙納漢:機器人是否會有以及是否應該有人類一樣的意識和感情,這個富有爭議的話題,已經(jīng)在科學界和科幻界討論了半個世紀。早在1950年,大家熟知的“計算機之父”艾倫?圖靈,就曾經(jīng)發(fā)表過學術文章《計算機與智能》,他預測到2000年,人們談論機器也能思考時,會是一件很正常的事情。雖然到2000年這個預言沒有實現(xiàn),但是以上我們提到的人工智能的發(fā)展歷程,讓我們看到未來的可能性。
近年來,我把注意力更多地放在神經(jīng)技術領域,目前我們正在小白鼠的大腦上進行實驗,看是否可以實現(xiàn)全腦仿真,與生物大腦不同,數(shù)字基質的大腦可以多次復制。數(shù)字基質的大腦還可以加速,這一點也與生物大腦不同。所以,如果我們能通過全腦仿真制造人類水平的人工智能,那么只要運算能力足夠強大,就可以制造一個以超高速運轉的人類水平的人工智能社區(qū)。如果人工智能不是按照仿生方法制造,而是從無到有創(chuàng)造的,這個道理也適用。事實上,只要是電腦程序,都可以復制或加速。而且,目前有很多仿生技術,也讓這個預言越來越有成真的希望。
記者:你認為,我們可以在多大程度上把人類的意識和生理功能放到機器人身上?
默里?沙納漢:讓機器人多大程度上擁有人類的思考和創(chuàng)造能力,以及是否要有性能力等,這是一個復雜的問題。涉及到社會層面的道德和責任,以及人類和機器人的關系。但我想指出的是,很多科幻小說和電影,把有意識的機器人最后妖魔化、邪惡化,說它會代替人類或者謀反人類等,這些都是因為人性對未來的恐懼而產(chǎn)生的想象,我們不要被這些想象帶得太深。事實上,機器人是安全的,很多風險是可控的。
一次突破就可能改變世界
《鳳凰周刊》:有時候,技術發(fā)展可以達到一個新的高度,但是人性本身或者說人類社會未必能接受或承受,所以會使得技術在一定程度上發(fā)展減慢停滯。你認為這是一件好事還是壞事?
默里?沙納漢:每一次技術革新的時候,我們的人性也被影響,面對未知和不確定,我們的一個自然反應是被吸引,同時又害怕。從短期來看,有時候放慢是好事,因為商業(yè)化總是會不自覺地推著一項技術和應用大肆向前。比如說,社交媒體已經(jīng)在年輕人中非常流行,但我們的社會也需要一些時間去學習如何處理社交媒體。某些人會很關注別人的個人生活,但其實是沒有意義的。同理,人工智能也是一樣。但是從長期來看,我們不能因為人性本身的局限性,就完全阻止創(chuàng)造未來更多的可能性。
《鳳凰周刊》:按照您在書中說的,從長遠歷史來看,人類現(xiàn)在只是走在人工智能的開始階段。那么我們在研發(fā)人工智能的時候,我們到底在研發(fā)什么?一個機械奴隸,一個人類伙伴,還是有可能比人類還聰明的“老師”?
默里?沙納漢:這是個很有意思的問題。在未來40到50年,我們需要很嚴肅地思考和面對這個問題?,F(xiàn)在我自己也沒有答案。
2013年4月,何搏飛辭去了一家美國上市公司中國區(qū)總經(jīng)理的職務。他用幾個月的時間在中國尋找創(chuàng)業(yè)伙伴,結果卻讓人失望。當時,他已經(jīng)做好打算,和這個團隊隨便聊半個小時,然后就飛去美國硅谷。
何搏飛推開門,看見幾個光著上身的年輕人坐在電腦前,整個屋子被各種大小的顯示屏圍繞。隨后,他和團隊CTO趙勇從下午兩點一直聊到了凌晨兩點,就決定加入擔任CEO。這家公司的名字叫做“格靈深瞳”。
格靈深瞳是一家計算機視覺和人工智能的技術公司,通過深度數(shù)據(jù)和機器學習算法讓計算機主動獲取三維視覺信息,并進行精確的實時智能分析。簡單來說,他們想讓計算機像人一樣,看見并理解這個世界。
“計算機視覺的技術已經(jīng)存在了幾十年,我們想要做第一個將計算機視覺商業(yè)化的公司?!焙尾w說。切入智能安防監(jiān)控領域是格靈深瞳選擇將計算機視覺商業(yè)化的第一步。今年6月,格靈深瞳獲得了紅杉資本數(shù)千萬美元的A輪融資。10月,其智能安防系統(tǒng)開始在國有四大銀行中的三大銀行進行試點。
格靈深瞳CTO趙勇創(chuàng)業(yè)之前在Google工作,是Google Glass的核心研發(fā)團隊成員之一。Google的工作原則是80/20,員工可以利用20%的時間自由創(chuàng)新。趙勇利用空閑的時間,重新開始研究自己在美國博士期間的研究方向―計算機視覺的人工智能。
計算機視覺過去主要建立在光學鏡頭采集的二維圖像上。光學鏡頭在生成圖像時,會丟失掉一個維度“深度”,只保留長度和寬度。當時人們覺得,通過二維圖像加上算法,就能夠讓計算機看懂世界。但趙勇和他布朗大學的博士導師并不同意這個觀點。他們堅持認為,計算機必須要通過三維信號才能夠看懂這個世界。因此,他們主張要增加“深度”這一維度的信息?!拔覀冇袃芍谎劬Γ褪菫榱伺袛嗌疃?。人腦比計算機聰明多少倍?人腦進行判斷還需要三個維度的信息,計算機只通過兩個維度怎么能夠準確判斷?”何搏飛對《第一財經(jīng)周刊》說。格靈深瞳的這一代智能安防系統(tǒng)上一共裝有3個鏡頭。一個是和普通安防系統(tǒng)一樣的RGB攝像頭,另外兩個用來發(fā)射和接收激光。激光發(fā)射鏡頭能夠在1/30秒的時間里發(fā)送36萬束激光,安防系統(tǒng)借助它們掃描出現(xiàn)實世界的三維立體圖像。
這3個鏡頭就相當于計算機的“眼睛”。格靈深瞳所做的,不僅是給計算機裝上“眼睛”,而且給計算機設置了一套“視網(wǎng)膜神經(jīng)系統(tǒng)”,讓計算機能夠看懂“眼睛”里出現(xiàn)的東西。
借助機器學習算法,格靈深瞳的系統(tǒng)能夠同時分辨多人的運動軌跡和行動速度,并一一精確記錄。比如早上8時的北京地鐵站,人群正處于早高峰極端擁擠的狀態(tài),格靈深瞳可以從中分辨出一個穿紅衣服的女孩,精確跟蹤她在人群中的行走軌跡。同時,格靈深瞳的系統(tǒng)還能夠監(jiān)測人類肢體的運動幅度和速度,從而精確識別人們的姿勢和正在做的事情。
最初,趙勇和團隊已經(jīng)解決了基本的技術問題,但還沒有想好商業(yè)化應該選擇的行業(yè)。辦公區(qū)域前的大黑板上密密麻麻地寫著80多條可能的商業(yè)化方向,包括安防、教育、醫(yī)療等等。這些是格靈深瞳團隊的工程師們一個晚上頭腦風暴之后的成果。
“你們這是科學家在實驗室里想問題的方式?!笔煜ど虡I(yè)的何搏飛對趙勇說?!叭绻耢`深瞳的目標是成為全球最好的計算機視覺和人工智能公司,最需要的是什么?”“海量的數(shù)據(jù)?!壁w勇說。
要獲得海量的數(shù)據(jù),有兩種方法。第一個是像Google街景一樣,自己到各地去拍攝采集。另外一種,是通過現(xiàn)成的行業(yè)和設備實現(xiàn)。有沒有一個行業(yè),已經(jīng)在所有能夠采集數(shù)據(jù)的地方都裝上了攝像頭?趙勇和何搏飛同時想到了安防。安防是一個足夠大的市場。2013年中國安防市場的復合增長率為30%,銷售收入約為4000億元。美國的攝像頭與人口比是1:10,但在中國的北京和上海這個數(shù)字還只是1:50。
更難得的是,格靈深瞳的技術正可以解決安防領域目前面臨的兩個難題―看不見和找不到。一方面,一個安保人員往往要同時負責監(jiān)看100多個攝像頭,隨便里面某個攝像頭拍攝到突發(fā)事件,當時就被監(jiān)控人員發(fā)現(xiàn)的可能性非常小。另一方面,想要查找監(jiān)控錄像中的某一段錄像也非常困難,就算快進,一段6個小時的視頻也得近1個小時才能看完。而格靈深瞳的智能計算機視覺系統(tǒng)可以很好地解決這些問題。
選擇安防領域作為商業(yè)化切入口之后,趙勇和何搏飛開始分析市場和客戶。他們發(fā)現(xiàn)安防系統(tǒng)在機場、火車站、廣場等場景應用最多。但場景一多,很多東西就無法控制。他們希望首先找到一個具有高度可復制性的場景,他們將目光投向了銀行?!爸袊你y行幾乎都長得一模一樣。由于銀監(jiān)會有嚴格的條例規(guī)定,它們的需求也都一樣。而且銀行本身底子厚,它們有很強的應用安防新技術的動力。”何搏飛告訴《第一財經(jīng)周刊》。
一開始跟銀行談合作時,何搏飛和趙勇將重點放在了暴力事件的監(jiān)控和報警上面。但他們發(fā)現(xiàn)實際情況并不如自己所想。暴力事件的概率極小,因此在很長一段時間內,格靈深瞳無法向銀行展示出產(chǎn)品優(yōu)勢。
銀行的工作人員告訴他們,比起外部風險,銀行更頭疼的是內部風險。銀行一直有雙人加鈔的規(guī)定,一個人保管鑰匙,一個人保管密碼。但這條規(guī)定執(zhí)行得并不好,就算排班排了兩人,也常出現(xiàn)一個人出去抽支煙,另一個人自己加鈔的情況。媒體曾經(jīng)報道有顧客在ATM機中取出過假鈔,就是加鈔過程中出了問題。
何搏飛和趙勇將這點作為了產(chǎn)品的突破口。經(jīng)過一段時間的研發(fā),他們的安防監(jiān)控已經(jīng)能夠確保當ATM機的加鈔蓋子被打開的時候,必須有兩個人在場。甚至當一個人輸入密碼時,另一個人沒有轉過身,系統(tǒng)都能夠自動報警。銀行長久以來的難題被格靈深瞳解決了,它們開始接受格靈深瞳成為自己的安防合作伙伴。2013年12月,格靈深瞳進入全國網(wǎng)點最多的銀行中國農(nóng)業(yè)銀行進行無人監(jiān)控安防測試。2014年10月,格靈深瞳在國有四大銀行的三大銀行中進行大規(guī)模推廣試點,測試地區(qū)包括北京、重慶等省市。
摘要:汽車作為重要的交通出行工具,它的出現(xiàn)和應用極大程度的改善了人們的生活狀態(tài),隨著經(jīng)濟的發(fā)展,汽車行業(yè)的發(fā)展規(guī)模越來越大,對應的技術水平也越來越高,當前汽車產(chǎn)業(yè)的三大技術突破:車載網(wǎng)絡、無人駕駛技術以及新能源中無人駕駛技術主要針對現(xiàn)代人對汽車駕駛的新需求,它的研發(fā)和應用將徹底扭轉人們的駕駛習慣,改變駕車方式,并逐步促進車聯(lián)網(wǎng)的形成和完善。
關鍵詞:智能輔助駕駛系統(tǒng);車聯(lián)網(wǎng);技術應用
智能輔助駕駛系統(tǒng)目前在一些高端品牌的車輛中已經(jīng)有所應用,例如寶馬、沃爾沃等,智能輔助駕駛系統(tǒng)的使用提高了行車的安全性,當駕駛員處于疲勞狀態(tài)下,或是執(zhí)行了錯誤的操作、車況遭遇意外時,輔助系統(tǒng)能夠智能化控制車輛的行駛狀態(tài),保護行車安全。車聯(lián)網(wǎng)則是車與人、車與路、車與車之間的信息共享,通過傳感設備,建立車輛與公眾網(wǎng)絡之間的聯(lián)系。在車聯(lián)網(wǎng)當中,通過傳感設備和信息共享,智能輔助駕駛系統(tǒng)就能夠準確獲知車輛的當前行駛狀態(tài),并進行路徑規(guī)劃,進行智能操作,輔助駕駛員保持車況穩(wěn)定。在下文當中,筆者將對智能輔助駕駛系統(tǒng)在車聯(lián)網(wǎng)中的應用進行分析,加快實現(xiàn)無人駕駛。
一、 智能輔助駕駛系統(tǒng)分析
(一) 算法技術
算法技術是智能輔助駕駛系統(tǒng)中最為重要的技術部分,要決定了智能輔助駕駛系統(tǒng)的智能化程度以及其能夠保障駕駛安全。國內相關企業(yè)所提出的算法技術比較受到認可的是上海趨視信息科技有限公司所推出的ADAS輔助駕駛系統(tǒng)算法版本,該算法模塊應用了趨視科技自動3D場景建模與深度學習算法模塊,對汽車行駛狀況的計算和分析較為準確,且應用比較簡單,即使是普通駕駛員也能進行操作。近年來,隨著科技的發(fā)展,國內很多的科技公司都相繼推出了智能輔助駕駛系統(tǒng),其中的算法技術都是大同小異,理論上具有一定的操作性,但是實際應用價值較低,還需要進一步改進。國外MOBILEYE所推出的智能輔助駕駛系統(tǒng)雖然優(yōu)越于國內技術,但也不盡完善,且售價非常昂貴。未來的智能駕駛輔助系統(tǒng)應當趨于平民化、實效化方向發(fā)展。
(二) 相機科技
趨視科技的輔助駕駛系統(tǒng)主要是用單個光學相機集成車輛行駛畫面,并將其傳輸至顯示界面,其技術優(yōu)勢在于解決了傳感器攝影的數(shù)據(jù)融合問題,應用成本低,但可靠性比較高。
(三) 相機的自動標定技術
相機自動標定技術的研發(fā)節(jié)約了相機設備的安裝和調試成本,而且可以自動標定位置,發(fā)現(xiàn)并處置相機的意外移動,時刻保持趨視的完整性和正確性,保證智能駕駛輔助系統(tǒng)性能的應用。
在基于光學攝像機的智能輔助駕駛系統(tǒng)中,車輛狀態(tài)的物理數(shù)據(jù),如車速,車輛本身相對于車道線的位置,以及車輛周圍的距離等,都是基于目標檢測的圖像內容,依據(jù)相機內部和外部的標定參數(shù)進行計算的。因此,校準參數(shù)的準確性是非常重要的?,F(xiàn)有的智能輔助駕駛系統(tǒng),通常使用一個特定的相機,所以相機的焦距等內部參數(shù)等是默認的,需要專業(yè)人員通過特殊工藝調整相機的外標定參數(shù),如高度等,確保在使用狀態(tài)下的攝像機角度不會改變。這些高標準安裝要求必然會增加使用成本。但對于自動標定技術而言,通過檢測圖像中的目標和實際的物理尺寸對攝像機的內部參數(shù)和外部參數(shù)進行連續(xù)實時匹配,不僅不需要使用特定的攝像機,也可以用來改變攝像機的位置,并自動檢測相機角度,自動調整內部系統(tǒng)的算法。該技術使智能輔助駕駛系統(tǒng)被用來作為智能手機的一個移動應用程序,促進了智能駕駛輔助系統(tǒng)的推廣應用。
(四) 視頻技術
視頻技術是智能輔助駕駛系統(tǒng)中比較重要的一項技術,而且具有實際應用性,但是增加了視頻技術的智能駕駛輔助系統(tǒng)計算量非常大,國際主流廠商現(xiàn)在都需要使用專用芯片進行數(shù)據(jù)處理,而不是依賴于硬件性能,該技術的重點是開發(fā)高效的算法來解決計算問題。從這一點出發(fā),應用樹結構專家系統(tǒng)能夠智能分析模塊數(shù)據(jù),利用專家系統(tǒng)可以增加有針對性的深度學習,利用圖像特征減少深度學習的維度,得到學習統(tǒng)計的魯棒性,同時保持系統(tǒng)的邏輯和效率。目前上海趨勢科技已經(jīng)在x86芯片平臺上實現(xiàn)了基于1080p的視頻智能輔助系統(tǒng),現(xiàn)在正在移植到一般的Android和IOS移動平臺。
二、智能輔助駕駛系統(tǒng)在車聯(lián)網(wǎng)中的應用
ADAS輔助駕駛系統(tǒng)已經(jīng)應用于寶馬、沃爾沃等高端車型,但國內汽車行業(yè)還沒有普及這一智能輔助駕駛系統(tǒng)。汽車行業(yè)的發(fā)展和改革需要一個漫長的周期,一項新技術,需要至少兩到三年的測試才能進入實際應用階段。到目前為止,國內還沒有人工智能(AI)與國內汽車廠商合作,完成對其汽車輔助駕駛系統(tǒng)的全面測試,更談不上真正意義上的商業(yè)化。
目前,上海趨視已經(jīng)開始與國內領先的汽車制造商上汽通用開展了技術交流和技術評價等合作,這標志著智能輔助駕駛系統(tǒng)以及相關科技已經(jīng)逐步的受到了國內汽車制造商的認可,科技公司和汽車廠商將會進入全方位研究測試階段,相信在不久之后,國內將出現(xiàn)大量的具有智能駕駛輔助系統(tǒng)的汽車。
智能輔助駕駛系統(tǒng)的應用必須遵循三個階段:商業(yè)試驗、商業(yè)應用、數(shù)據(jù)應用。人工智能產(chǎn)業(yè)仍處于商業(yè)實驗的第一階段。目前,市場上表現(xiàn)出了對人工智能技術的極度渴望,尤其對于智能輔助駕駛系統(tǒng)來說,但是人工智能技術的發(fā)展卻一直跟不上市場需求。主要問題是人工智能的準確性較低,不能提供一個完整、可靠的系統(tǒng),存在錯誤和遺漏,對于汽車駕駛來說,這種漏洞是百分之百不允許出現(xiàn)的,以人臉識別為例,如果在駕駛過程中,智能輔助駕駛系統(tǒng)多次錯報和漏報人臉識別結果,就會帶來嚴重的安全隱患,也會使得用戶逐步對智能輔助駕駛系統(tǒng)失去信心。錯報、漏報是人工智能在試驗階段必須解決的問題。
而在國外,以色列MOBILEYE公司已經(jīng)成功的將基于視覺的智能駕駛輔助系統(tǒng)應用在了一些高端車輛上,并受到了廠商的認可,這標志著國外汽車行業(yè)的智能駕駛輔助系統(tǒng)已經(jīng)進入了商業(yè)應用階段。其它的視覺技術依舊等待創(chuàng)新,尤其是人臉識別技術,小范圍、近距離的人臉識別已經(jīng)較為成熟和完善,正在準備進入商業(yè)應用階段,但是廣義上、大范圍的人臉識別技術還有待開發(fā)。
結束語:
未來,趨視科技以及其它人工智能企業(yè)將進一步加大技術研發(fā)力度,不斷完善智能輔助駕駛系統(tǒng),優(yōu)化算法技術、相機技術等相關技術,盡快實現(xiàn)車與車、車與路以及車與人之間的信息交互,提高信息計算和分析的準確性。此外,國內科技公司還需繼續(xù)對行為分析算法進行大規(guī)模升級,大大提高識別的精度,滿足更多行業(yè)的應用需求。
參考文獻:
[1]徐邦振; 湯一平; 蔡國寧.基于機器視覺的輕量級駕駛輔助系統(tǒng)[J].計算機科學,2015(S2):172-173.
[2]方景輝; 徐偉明; 朱曉峰; 王春新.基于物聯(lián)網(wǎng)與三維可視化技術的變電站智能輔助控制系統(tǒng)的研究與應用[J].電氣自動化,2012(03);248-249.
[3]余濤; 俞立中; 王錚; 嚴網(wǎng)林.自主式智能系統(tǒng)及其在汽車安全輔助駕駛中的應用[j].公路交通科技,2012(06):143-144.
“機器人替代我演奏還需多長時間?”第一次參與科技跨界的小提琴演奏家呂思清問。
“谷歌已經(jīng)通過深度學習,模仿一位大畫家的畫風。現(xiàn)在谷歌的畫作已經(jīng)達到普通人難以區(qū)分的程度?!庇腥烁嬖V他。
“音樂表演是最高層次的精神活動,機器人短期內替代不了音樂家?!绷硗獾娜朔瘩g說。
“剛才你們談了幾種機器人的應用場景,我覺得還少了一塊音樂教育?!眳嗡记逭f,“機器人、人工智能可能會提供一種因材施教的新教學途徑?!?/p>
這是優(yōu)必選科技在召開的主題為“機器人,不止于此”的會,請一些跨界嘉賓來交流,主要是公布其人工智能戰(zhàn)略布局。
COO養(yǎng)CTO
用機器人為人們提供包括教育在內的多元服務,正是優(yōu)必選科技創(chuàng)始人周劍的夢想。8年前,周劍帶著十幾個小伙子走上智能機器人的創(chuàng)業(yè)路。他內心的最大夢想是做出能夠普及的人形服務機器人。
剛創(chuàng)業(yè)時,周劍遇到的最大瓶頸是,國內連組裝一臺小的伺服舵機都非常難,而國外伺服舵機又非常昂貴。
接下來的4年中,在耗盡在商場上打拼的半億元積蓄,克服技術難關后,周劍他們研發(fā)出“最重要的是既便宜又高質量”的伺服舵機技術。
這個伺服舵機讓他有信心在2012年成立優(yōu)必選科技,投身機器人和人工智能平臺。
周劍認定了人形機器人。“手機App這類數(shù)據(jù)采集手段,收集到的數(shù)據(jù)其實是非常非常少的,它很難全面定義一個人。”他說,“我曾反復強調,我們需要主動的數(shù)據(jù)收集。如果有像ASIMO那樣的人形機器人進入家庭,像父母家人一樣,與我們朝夕相處,通過語音、視覺平臺主動收集我們的數(shù)據(jù),為我們勾畫出完整畫像,再配合BAT公司的云端合作,這才能形成嚴謹?shù)倪壿嬮]環(huán)。”
周劍也與亞馬遜團隊討論了很久。在此之前,亞馬遜推出了智能音箱Echo?!拔覀兒髞磉_成了一致,認為未來人機交互的中心一定是人形機器人。它就是你的家庭成員,與你可以坦誠交流,這不是一個音箱可以做到的”。
要做出人形機器人是非常難的。全球一些大型公司和實驗室已探索多年。它需要大規(guī)模資金投入,需要高尖技術人才,還需要整合大量資源。
“我對自己的定位是要落地,所以才有了兩條腿走路的戰(zhàn)略?!敝軇φf。
“左腿要賺錢”。周劍預計優(yōu)必選2017年的銷售收入將在10億到15億元之間。他對實現(xiàn)這個收入有信心。“近幾年我們一直在高速增長。2014年收入190萬元,2015年5000萬元,今年是3億元?!敝軇φf。
2017年,優(yōu)必選的收入來自與“大塊頭”的合作。這是周劍的信心來源之一。2017年1月,優(yōu)必選和亞馬遜將在CES展上共同一款機器人?!皝嗰R遜和我們都認為這是個廣闊的市場”。既然亞馬遜Echo音箱賣了幾百萬臺,機器人銷售也不會弱,這將是優(yōu)必選科技收入增長來源之一。
優(yōu)必選的第二個收入增長來自于IP產(chǎn)品。要知道IP產(chǎn)品是影視界、體育界大亨的重要收入來源。在這個智能時代,過去靜態(tài)的IP衍生品變成活靈活現(xiàn)、可以互動的機器人將是個趨勢。這方面的銷量也被看好。
2016年,蘋果主動找到優(yōu)必選,它對優(yōu)必選的機器人很感興趣。之后,優(yōu)必選和蘋果合作的JIMU STEAM教育機器人就登陸全球部分Apple Store零售店。STEAM機器人是一種既能組裝、又能編程的機器人,它對學生在多方面都有影響,也順應美國總統(tǒng)奧巴馬發(fā)起的“編程一小時”運動。優(yōu)必選正在形成一套課程,要逐步進入校內外教育市場。
周劍認為,這類產(chǎn)品要讓孩子使用到真正的機器人技術,如伺服舵機、控制及各種傳感器。而且價格不能太貴,才能真正落地。
“從2016年推出到全球布局,這可能也是2017年我們比較大的收入來源?!敝軇φf。按照布局,北美2017年會有4000家店,歐洲2000家店,國內有2000家店。
周劍還布局To B的Cruzr機器人,目標是在銀行、商超、海關、安防監(jiān)控場景下的應用,已經(jīng)拿到多個訂單。
“我們做的每個東西都是有原因的。左腿基于商業(yè)化走路,賺到錢后投入到‘右腿的未來技術研發(fā)上’,積累更多東西。”周劍笑談,“我們是COO來養(yǎng)CTO?!?/p>
機器人的“軀干與智能”
周劍所說的未來技術,是為他的“人形服務機器人”積蓄資源。
最近,悉尼大學教授陶大程即將加入優(yōu)必選,擔任優(yōu)必選“人工智能首席科學家”?!叭斯ぶ悄茴I域都知道陶教授?!敝軇φf。陶是歐洲科學院院士、澳大利亞科學最高榮譽尤里卡獎獲得者。2016年,陶大程團隊獲得了包括NIST PaSC、ActivityNet等權威賽事的冠軍。
“我們每天獲取的信息70%、80%以上來自視覺。因此,視覺研究我們主要抓在自己的手上?!敝軇φf。
“未來非常關鍵的技術是模型壓縮。我們要把大模型變成小模型,實現(xiàn)在人形機器人本地的計算,而不依賴于云計算,這樣也能降低人形機器人的電能開銷?!?陶大程對《IT經(jīng)理世界》說。同時,視覺研究還包括基于視頻的視覺理解、單/多態(tài)的情緒識別以及視頻的室內定位導航和避障等。
“有了這些技術,當你跟機器人Alpha相遇說:你好,Alpha,并同時把手伸過去時,Alpha能理解這是要跟他握手,然后會把手伸過來?!碧战淌谛蜗蟮亟榻B。
優(yōu)必選同時聘請清華大學趙明國教授擔任其“人形機器人首席科學家”,在機器人運動控制上展開合作?!摆w教授幾乎是全中國屈指可數(shù)的堅持20年只做雙足人形機器人的人士之一?!敝軇φf。他領導的聯(lián)合實驗室將繼續(xù)專注于雙足機器人運動控制技術研究。
記者的一位朋友,從小受過專業(yè)圍棋的訓練,長大后又從事過很長一段時間程序員的工作,對于圍棋的奧妙深有體會,因此在李世石與AlphaGo的人機大戰(zhàn)開始前,他曾拍著胸脯說,對戰(zhàn)的結果一定是5∶0,人類輕松獲勝??墒鞘虑榈慕Y果呢?事與愿違。通過此事,記者的這位朋友對于人工智能(AI)有了更新的認識。
不可否認,人工智能給人們帶來了無窮無盡的想象空間。人工智能到底能給人類社會的發(fā)展帶來多大影響?人們的工作和生活是否將從此產(chǎn)生質的飛躍?現(xiàn)在人工智能技術的發(fā)展到底進入到什么樣的階段?11月1日―2日,一年一度的C&C用戶論壇暨iEXPO 2016在日本東京舉行。我們或許能從這次大會一窺人工智能領域的新動向。
NEC主辦的C&C用戶論壇暨iEXPO大會今年已經(jīng)是第20屆,“Orchestrating a brighter world”(協(xié)同創(chuàng)造更美好的世界)成了本屆大會最響亮的口號。NEC希望借助在人工智能和物聯(lián)網(wǎng)(IoT)方面的諸多技術和產(chǎn)品創(chuàng)新,更好地肩負起構建安心、安全、高效、公平社會的責任。
改變已經(jīng)發(fā)生
“人工智能市場的增長已經(jīng)超出了人們的想象。”NEC全球總裁兼首席執(zhí)行官新野隆在大會的主旨演講中開宗明義,“人口增長帶來的巨大壓力,新型城鎮(zhèn)化發(fā)展引發(fā)的各類社會問題,人與人、人與物之間廣泛而復雜的連接……為了更好地解決這些問題,我們必須更充分、有效地利用ICT的創(chuàng)新?!?/p>
人類社會正面臨一場新的數(shù)字化革命,而云計算、人工智能、可視化、大數(shù)據(jù)、安全、物聯(lián)網(wǎng)等技術將成為支撐這一變革的技術驅動力。作為一個傳統(tǒng)的ICT廠商,NEC將如何應對這一變革,揚長避短?NEC中國總代表兼日電(中國)有限公司總裁吉田直樹表示:“我們的優(yōu)勢主要體現(xiàn)在具有很強的綜合實力,憑借深厚的技術積淀,以及長年服務大型企業(yè)級客戶累積的經(jīng)驗,可以為行業(yè)用戶提供全面的針對其應用需求量身訂制的解決方案?!?/p>
新野隆特別強調了NEC的三大技術優(yōu)勢――人工智能、連接性、網(wǎng)絡安全。NEC在這些技術領域的許多創(chuàng)新之作都可以在本次大會的展示區(qū)看到。據(jù)NEC的工作人員介紹,往屆大會的展示區(qū)通常是按技術和解決方案的類別來劃分,而今年有了很大的改變,以助力數(shù)字化變革為核心,突破了技術間的界限,以藍色、紅色和綠色三種顏色來劃分展區(qū):藍色代表“AI和IoT引發(fā)的數(shù)字化革命”,主要展示NEC在AI和IoT領域的最新技術成果;紅色代表“加快數(shù)字化變革的先進技術”,主要包括大數(shù)據(jù)、網(wǎng)絡安全、SDN和云平臺;綠色代表“利用AI和IoT加速構建更美好的世界”,主要展示NEC的AI和IoT在制造、流通、通信、醫(yī)療、市場營銷、安全、智慧城市等領域的成功應用。
在展區(qū)中,讓記者印象最深刻的還是NEC在網(wǎng)絡空間安全方面的技術創(chuàng)新和應用。人臉識別可以說是NEC最擅長的一項技術,不僅識別速度快,而且準確率極高,已經(jīng)在機場、海關,以及涉及公共安全的很多應用場合得到了廣泛部署。在人臉識別技術展臺前,記者做了一次親身體驗。負責演示的技術人員現(xiàn)場用平板電腦給記者拍攝了一張照片,并上傳到后臺的數(shù)據(jù)庫中,然后記者走到攝像頭前,NEC的人臉識別系統(tǒng)幾乎是瞬間就認出了記者。
其實,人臉識別在今天來看已經(jīng)不是什么新鮮事,許多中國廠商也在這方面有所建樹。“在人臉識別方面,我們會將其他廠商不做或做不到,但又是NEC所擅長的技術和解決方案帶入中國市場,凸顯自身的差異化競爭優(yōu)勢。”吉田直樹介紹說,“我剛剛參加了在北京舉行的2016中國國際社會公共安全產(chǎn)品博覽會,目的是進一步了解中國客戶的需求,以及中國同類廠商的動態(tài)。雖然很多廠商都可以提供針對特定個體的人臉識別解決方案,但是目前在數(shù)百人中快速找到特定的人還是一個難題,而這正是NEC的強項。”
NEC還將人工智能技術用于網(wǎng)絡安全領域,探測未知的網(wǎng)絡安全威脅。NEC的自主學習型系統(tǒng)異常監(jiān)測技術,可以在攻擊發(fā)生后到產(chǎn)生實際危害前的這一時間段內,及時發(fā)現(xiàn)系統(tǒng)異常并報警,從而盡量避免造成實際的安全損害。NEC已經(jīng)將這套融入了人工智能的系統(tǒng)異常監(jiān)測技術用于公司內部的16萬臺設備上,更好地保證了公司業(yè)務的正常運行。
人工智能在行動
在本次大會上,記者還看到NEC將人工智能用于健康和醫(yī)療、物流,以及智能工廠等諸多領域。比如,NEC將人工智能與可穿戴設備相結合,用于工廠的設備管理、業(yè)務流程控制,以及遠程監(jiān)控等,可以及時發(fā)現(xiàn)生產(chǎn)中的問題,持續(xù)提升生產(chǎn)效率。在物流行業(yè),即使是一個新手,他只要通過一副智能眼鏡和一塊智能手表,就可以根據(jù)貨運單的要求,準確找到貨物存放的貨架,然后將貨物運送到指定的地點。這同樣得益于NEC的人工智能技術與可穿戴設備相結合的解決方案。
其實,早在半個多世紀前,NEC就已經(jīng)開始在可視化、分析、控制等領域展開了研究,尤其是在聲音和圖像識別、語義解析、機器學習、風險預測、控制和優(yōu)化等方面取得了非常多的成果,并廣泛應用于多個商業(yè)場景。這為今天NEC構建先進的人工智能技術群奠定了堅實的基礎。在可視化、分析、控制和引導三大領域,NEC擁有多項世界領先或唯一的技術創(chuàng)新成果。
舉例來說,在人工智能方面,應用了NEC世界最高精度的面部識別技術的出入境系統(tǒng)、可以察覺因肉眼無法發(fā)現(xiàn)的微小狀態(tài)變化導致故障的飛機故障預警系統(tǒng)、基于機器學習技術的可精確預測訂貨需求的零售訂貨系統(tǒng)等,已經(jīng)廣泛應用于創(chuàng)造安心、安全環(huán)境的公共安全領域、大型社會基礎設施的監(jiān)控、強化企業(yè)營銷、提升業(yè)務效率等方面。NEC希望通過人與人工智能技術的協(xié)調,最終實現(xiàn)生活的智慧化。
就在本次大會召開前,NEC剛剛了幾款人工智能和物聯(lián)網(wǎng)解決方案。NEC the WISE NeoFace Watch Image Data Mining可以快速對圖像數(shù)據(jù)進行分析。據(jù)稱這是目前世界上最快速、準確率最高的人臉識別解決方案。另外,像Auto Responses Solution可以更加準確地理解文本文件中上下文的意思。NEC the WISE IoT Platform提供了一個驗證平臺,讓那些有關物聯(lián)網(wǎng)應用方面的創(chuàng)意可以更快速地轉化為商業(yè)化的產(chǎn)品。新野隆介紹說,NEC還與大阪大學、東京大學等高校合作開發(fā)用于人工智能方面的低功耗智能芯片等。NEC與通用集團合作推出的IoT方案已經(jīng)在某些領域付諸實施。
上文提及的NEC最新推出的產(chǎn)品名前面都有“NEC the WISE”的字樣,其實這是NEC今年正式的人工智能技術群的統(tǒng)一品牌名稱。在本次大會的現(xiàn)場,“NEC the WISE”的標志無處不在。NEC the WISE表明,NEC將協(xié)調人與AI技術,為創(chuàng)造安心、安全、高效、公平的社會做出貢獻。
人工智能的核心之一是數(shù)據(jù)。人工智能技術的應用必須與大數(shù)據(jù)有機地結合一起。吉田直樹表示:“收集數(shù)據(jù)只是第一步,更重要地是如何對數(shù)據(jù)進行有效的分析和預測。從技術的角度講,人工智能的推進要從兩方面入手,一是基礎技術研究,二是與實際應用相結合研發(fā)出針對不同行業(yè)和應用場景的解決方案。NEC在全球各地的研究院將主要精力放在人工智能基礎技術研究方面。NEC與各國當?shù)氐暮献骰锇?,以及各行業(yè)的用戶協(xié)作,共同開發(fā)適合不同行業(yè)需求的人工智能解決方案?!?/p>
NEC the WISE所代表的人工智能產(chǎn)品是NEC物聯(lián)網(wǎng)整體解決方案的一部分,它還要與其他相關軟硬件,以及行業(yè)應用需求緊密結合。未來,NEC會把物聯(lián)網(wǎng)作為一個獨立業(yè)務計算收入。
本次大會傳遞的信息十分明確:NEC將積極推進人工智能技術的開發(fā)與應用,并以大數(shù)據(jù)、物聯(lián)網(wǎng)、安全、云計算等為核心,提供創(chuàng)新的解決方案,支持企業(yè)的數(shù)字化變革。本次大會也可以看作是NEC全面向人工智能和物聯(lián)網(wǎng)領域進軍的誓師大會。它為NEC未來十年甚至更長遠的發(fā)展定下了基調――協(xié)同創(chuàng)造更加美好的世界。
差異化和本地化是關鍵
數(shù)字化轉型、人工智能、物聯(lián)網(wǎng)等都是當下最熱門的話題,也是所有ICT廠商共同關注的焦點。對于NEC來說,挑戰(zhàn)在于如何做出差異化,如何在中國市場上更好地實現(xiàn)本地化發(fā)展。
吉田直樹講述了NEC的原則:第一,人無我有,做別人沒有的技術和產(chǎn)品,比如在大數(shù)據(jù)方面,很多廠商都可以做大數(shù)據(jù)的收集和處理,那么NEC就把重點放在大數(shù)據(jù)的分析和預測上;第二,在注重自主創(chuàng)新的基礎上,加強同合作伙伴之間的協(xié)作創(chuàng)新,比如NEC與農(nóng)業(yè)有機栽培方面的專業(yè)公司合作,利用ICT的創(chuàng)新改進西紅柿的栽培,推而廣之,就是將NEC在構建大型基礎設施方面的經(jīng)驗與特定行業(yè)或應用領域專業(yè)公司的技術特長相結合,取長補短,實現(xiàn)理想的經(jīng)濟效益和社會效益。
結合NEC在中國的業(yè)務發(fā)展,上面的兩條原則具體體現(xiàn)為,根據(jù)中國用戶和市場的實際情況,選擇最適合的合作和發(fā)展模式,提供差異化的產(chǎn)品和解決方案,尋找屬于NEC的藍海市場。
根據(jù)中國的具體情況,NEC將當前的發(fā)展重點放在了安全、流通和零售,以及智慧城市等領域。安全包括與政府相關的公共安全,以及企業(yè)內部的安全兩個方面。NEC的策略是,積極與本地的伙伴合作,在一些自己擁有優(yōu)勢的細分安全領域進行投入。NEC在流通和零售行業(yè)的業(yè)務前景十分廣闊。隨著電子商務的快速發(fā)展,物流可能是一個新的瓶頸。NEC有針對物流行業(yè)的融入了人工智能和物聯(lián)網(wǎng)技術的解決方案。另外,在便利店的管理方面,NEC也有先進的解決方案,比如很多便利用店的POS機就是NEC的產(chǎn)品。POS機是信息匯聚的一個源頭,以后針對POS機的數(shù)據(jù)進行智能分析也是NEC的強項。
>> 控制人工智能?你也可以 人工智能可以猜心了? Affectiva:讓人工智能“讀懂”你 人工智能可以講一個大故事 人工智能讓你成為藝術家 人工智能,比你想象的更快 人工智能很重要,鮑勃?迪倫也很重要 地平線機器人:基于人工智能,讓硬件也擁有大腦 虐電腦?被電腦虐?《金戈鐵馬》人工智能等你驗證 EmoSPARK:一個為了讓你快樂而生的人工智能魔塊 寂寞沒人理睬?微軟要開發(fā)人工智能和你聊天 你所恐懼的“人工智能”到底是什么? 人工智能為什么搶不走你的飯碗 你看到的人工智能可能是假的 “人工智能”之父 人工智能 AI人工智能 人工智能 Icon 擁抱人工智能 人工智能時代 常見問題解答 當前所在位置:中國 > 管理 > 控制人工智能?你也可以 控制人工智能?你也可以 雜志之家、寫作服務和雜志訂閱支持對公帳戶付款!安全又可靠! document.write("作者: 王杰夫")
申明:本網(wǎng)站內容僅用于學術交流,如有侵犯您的權益,請及時告知我們,本站將立即刪除有關內容。 >> 創(chuàng)始人戴文淵曾是百度鳳巢系統(tǒng)的總架構師。在構建鳳巢時,他便嘗試簡化搭建機器學習模型的工程。
康執(zhí)璽用鼠標從屏幕邊上拖來一些長方形的模塊,并把它們用線依次連接起來,一個人工智能機器學習的模型就做好了,前后用了不到一刻鐘。根據(jù)模型初始數(shù)據(jù)的不同,這個模型可以有不同的功能,例如識別信用卡詐騙,或是檢測垃圾郵件。
“如果沒有先知平臺,搭建一個識別信用卡詐騙模型可能需要花費數(shù)據(jù)團隊幾個月的時間,”康執(zhí)璽告訴《第一財經(jīng)周刊》,“普通技術員工經(jīng)過一個月的訓練,差不多能熟練使用先知平臺上的模型?!笨祱?zhí)璽是第四范式先知平臺的產(chǎn)品負責人,為了讓普通技術人員也可以輕松搭建機器學習模型,他和團隊已經(jīng)不間斷工作了一年之久。
第四范式是一個提供AI機器學習模型的通用型平臺。該公司的算法工程團隊開發(fā)了一系列的基礎設施組件,以此組成了大規(guī)模分布式機器學習框架(General Distributed Brain Technology,GDBT)??祱?zhí)璽稱,未來兩年,普通技術人員可以在“先知平臺”上做出類似AlphaGo復雜度的人工智能,“這里面的難點不是AlphaGo本身,難點是如何讓普通人也可以做出AlphaGo”。
目前市面上比較流行的計算框架,例如Hadoop、Sparkd更適合執(zhí)行傳統(tǒng)的數(shù)據(jù)倉庫技術(ETL)任務。而第四范式“先知平臺”的框架由C++語言編寫,可以在單機、MPI、Yarn、Mesos等多個分布式環(huán)境運行,例如很多企業(yè)在計算時所用的硬件資源并不相同,GDBT可以針對不同的硬件資源、不同的算法場景,就調度、計算模式、機器學習算法部件的抽象等做優(yōu)化。
成立兩年多來,第四范式相繼拿到紅杉資本和創(chuàng)新工場數(shù)千萬元人民幣的天使輪和A輪融資。雖然還沒實現(xiàn)自負盈虧,但是創(chuàng)始人戴文淵稱,公司已經(jīng)開始有了營收。
AI for Everyone,這既是第四范式的公司目標,也是戴文淵2014年決定從華為諾亞方舟實驗室離職創(chuàng)業(yè)的原因。在這之前,他最常問自己的問題是“人工智能要創(chuàng)造更大的價值,要通過什么方式去做”。
過去十幾年,人工智能在學術領域一直處于發(fā)展瓶頸期。直到2007年左右,還在讀碩士的戴文淵和一些同行感覺到機器學習在理論上取得了很大進展,這時候就需要海量數(shù)據(jù)來推動人工智能的發(fā)展。戴文淵認為,這個機會很可能發(fā)生在互聯(lián)網(wǎng)公司,于是2009年他進入百度工作,參與搭建百度鳳巢。這是一個全新的廣告銷售系統(tǒng),百度鳳巢系統(tǒng)背后的人工智能需要識別信息、廣告,以及智能地匹配不同的權重因素。
作為百度鳳巢的總架構師,戴文淵需要當一個全才―不只要懂機器學習的原理,還要精通數(shù)學統(tǒng)計、編程、分布式計算,以及要有很強的架構能力?!安粌H要設計算法,還要懂業(yè)務”,戴文淵為此專門用半年的時間學習網(wǎng)絡營銷,只有這樣才能明白人工智能可以應用在哪些方面。百度鳳巢用了三四百人,花了三四年才做出來,投入的成本之大,甚至影響到了百度公司的業(yè)績,為此李彥宏還出面向股東做過解釋。不過,如今百度鳳巢已經(jīng)成為拉動百度利潤增長的核心,人工智能終于有了產(chǎn)業(yè)效果。
對于戴文淵來說,百度鳳巢的成功意味著AI for Someone已經(jīng)實現(xiàn),更關鍵的是,他從中看到了AI for Everyone的機會。但是讓人工智能服務每個技術人員的目標還有重重困難,當前,絕大多數(shù)的AI技術都集中在Google、Facebook、百度等互聯(lián)網(wǎng)公司巨頭手中,作為商業(yè)公司的它們不可能將AI核心技術完全開放出來。比如Google,雖然開源了深度學習系統(tǒng)TensorFlow,但是這套系統(tǒng)上手難度高,另一方面,與Google自家的服務深度綁定,對于不想依附Google的中小企業(yè)并不友好。
因此戴文淵認為,與其等待大公司的“施舍”,不如做一家人工智能的企業(yè)服務公司,專門為那些養(yǎng)不起大型AI團隊的公司提供AI服務。
在構建百度鳳巢時,戴文淵開始嘗試簡化搭建機器學習模型的工程。工作之余,他動手寫了一堆機器學習的組件,并找來一個實習生,讓后者通過這些機器學習組件搭建一個全新的模型。短短一個月,這名實習生做出了一個機器學習的模型。這個結果讓戴文淵很振奮,如果一個實習生一個月就能做出來一個機器學習模型,那招來10個實習生,經(jīng)過培訓,一年就能服務120個客戶。事實上,這也成為第四范式最初的運作模式。
然而這種模式很快就遇到了問題。首先是人才的短缺,戴文淵意識到這相當于把人工智能公司做成勞動密集型公司,但人工智能的人才資源嚴重不足。另一方面,由于出售的產(chǎn)品是一套機器學習的模型,買家只能使用卻無法修改,一旦出了問題或者遇到需要調整的地方,還需要第四范式再次提供服務。
因此在最初階段,金融客戶只愿意把一些非核心的的項目外包給第四范式。對于大型金融機構來說,風險控制是業(yè)務核心,交給第三方公司去做相當于命脈交到其他人手里,這是它們無法接受的。
了解到實際的客戶需求后,戴文淵意識到第四范式還是要做一個通用型平臺,“就像在賣建造機器學習模型的釘子和錘子”。在這種模式下,第四范式只負責提供機器學習的工具,工具用來做什么就與他們無關了。一個金融機構購買先知平臺后開發(fā)了十幾套機器學習模型,至于有沒有用來開發(fā)風控模型這些核心產(chǎn)品,“這就是商業(yè)機密了,我們也不清楚”,戴文淵說。
雖然看起來產(chǎn)品形態(tài)更加簡單了,開發(fā)難度反而比之前大了好幾倍。從產(chǎn)品上看,釘子和錘子因為要給普通人用,所以耐用性要好,比如對于建模時所輸入的數(shù)據(jù)不能挑剔,即使數(shù)據(jù)有空缺、格式不對,也不可以宕機。從內核上看,考慮到工具將來的迭展,底層代碼要從頭開始寫,原來戴文淵在百度鳳巢時寫的組件不夠用了。
徐立有著典型的人工智能科學家背景,在香港中文大學就讀博士期間,其與導師賈佳亞教授研發(fā)的圖像去模糊技術將圖像清晰度提升了100倍,被視為是全球圖像處理的一大突破。以研發(fā)實力聞名的商湯也一度被“學術氣息”所標簽化。徐立認為,人工智能還遠未走向技術同質化的時代,若技術上不構成領先性和差異化,將難以跟上行業(yè)變化。對于人工智能的商業(yè)落地,商湯則自有一套驅動行業(yè)的經(jīng)營哲學。
21CBR:智能視頻目前是“人工智能+安防”的行業(yè)熱點,你在去年也提過類似觀點,這塊的市場存量有多大?
徐立:安防一直是國家大力發(fā)展的領域,也是十三五規(guī)劃的重點行業(yè)。從政府投入來看,今年也要投入2000-3000億。傳統(tǒng)安防領域的最大廠商,去年營業(yè)額在300多億。所以,這塊目前有足夠的市場空間。
今年的視頻業(yè)務和去年的人臉識別有些類似。去年,業(yè)內都在嘗試和落地人臉識別的具體應用,到今年進入相對成熟期,業(yè)務增長很快。今年,智能視頻業(yè)務也在各地展開試點,整體發(fā)展正處在一個大的行業(yè)機會點上。
視頻業(yè)務何時落地,核心問題在于明確產(chǎn)品的商用標準。工業(yè)界的一個標準紅線是評估產(chǎn)品是否超過所謂人眼的準確率,這也是人臉識別逐漸商用化的原因。但是視頻內容的分析和人相比效果上還有差距。目前全球每天有2.5億只安防攝像頭在記錄,視頻數(shù)據(jù)輸入達到一定規(guī)模,但在智能處理上還很欠缺,而核心算法的突破將成為最關鍵的落地因素之一。
21CBR:商湯切入安防領域有哪些布局,如何構建自己的智能視頻生態(tài)鏈?
徐立:商湯在安防領域的產(chǎn)品體系分為兩類:一類是成熟的業(yè)務系統(tǒng),需要基于客戶方的具體業(yè)務邏輯進行設計,比如怎樣做多視頻協(xié)調,如何做人像處理等,代表產(chǎn)品是SenseFace人臉布控系統(tǒng)和SenseVideo視頻結構化系統(tǒng),另一類是業(yè)務系統(tǒng)中的核心算法模塊,包括動靜態(tài)比對服務器、人群分析服務器和結構化服務器等,儆諳嘍員曜薊的產(chǎn)品。
舉例來說,我們在視頻結構化系統(tǒng)上做了很大突破。以往的視頻結構化系統(tǒng)只能通過身高、性別等屬性來查詢視頻信息,SenseVideo實現(xiàn)了自然語言的信息查詢。我們做了1.3萬人的案例測試,總共生成了9000多個自然語言構成的關鍵詞。對于辦案人員來說,通過自然語言來描述罪犯、完成案件信息的視頻檢索是更常見的業(yè)務邏輯,也比根據(jù)屬性搜索來得更加精準,未來將是一個新的業(yè)務形態(tài)。
目前商湯在安防市場相較領先,前十大安防廠商一半以上是我們客戶,商湯為其提供標準化模塊和業(yè)務子系統(tǒng)。同時,我們也在國內重點城市建立本地化業(yè)務。去年,商湯的智能視頻業(yè)務(Intelligent Video Analytics)已占公司整體業(yè)務的40%,今年這一勢頭依舊良好。
21CBR:比起發(fā)展客戶,商湯似乎更擅長行業(yè)聯(lián)盟,商湯的市場開拓邏輯怎樣的?
徐立:首先,無論賣什么產(chǎn)品,最后都要接觸到甲方。但是,我一直認為,B2B企業(yè)如果要起量、要規(guī)?;a(chǎn)品一定是相對標準化的。如果每次銷售的方案都是定制化服務,企業(yè)的ROI(投資回報率)就會比較低。相反,集成商則可以將商湯與電信方、施工方等等連接起來,在各地做出標桿性的項目,再用標準化的形式去鋪開。
這里的標準化不是一蹴而就的,而是來自產(chǎn)品和項目的逐次迭代。比如前面提到的比對服務器,再往上可能是一套帶著攝像頭的子系統(tǒng),最后則是一整套的訓練部署平臺。通過深入行業(yè)、做細項目,商湯不斷把標準化的范圍擴大,并聚合客戶的需求從而形成共有需求,最終完成標準化產(chǎn)品的打磨過程。
因此,商湯一直把自己定位成一個技術公司,而不是集成商公司。商湯能做的是集中力量攻破核心算法和技術。這個技術不是單點的、閉門造車的技術,而是以打通上下游的客戶需求、構建產(chǎn)業(yè)鏈條來實現(xiàn)的。就像英特爾不直接向終端用戶銷售芯片,而是通過上下游的合作伙伴,比如主板廠商、主機廠商等實現(xiàn)筆記本電腦的銷售,但用戶仍然了解產(chǎn)品背后有英特爾領先的芯片技術,這也是商湯所追求的:做行業(yè)的賦能者。
21CBR:業(yè)界普遍在談AI同行業(yè)的深度結合,各家公司從技術表現(xiàn)來看也大致相當。對此你怎么看?
徐立:很多人覺得,深度學習已經(jīng)形成開源生態(tài),技術沒那么重要了,打通行業(yè)才是關鍵。這里面有一個重要前提:深度學習是否已經(jīng)成熟、不會再變化了。然而,學術界目前有關深度學習的文章大部分都是工程實踐型的,新的實驗結果不斷前人做出的理論解釋,指導下一代工業(yè)級應用的技術原理有待被歸納總結,人工智能距離成熟的“黑盒”還差得很遠。
例如,從近年來物體識別競賽的結果看,識別準確率在2013-2017年之間提升了300%,基本與摩爾定律吻合。也就是說,在某些垂直領域,算法的演進已經(jīng)進入摩爾定律時代,不是既有算法的變化,本質上是重新設計出一套新的引擎算法,從而形成巨大的提升空間。未來三五年間,深度學習還將迎來革命性的變化,現(xiàn)有的算法如果不趕上,就會被淘汰。