前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺知識點主題范文,僅供參考,歡迎閱讀并收藏。
【關鍵詞】粗糙集 屬性簡約;AC聚類;ID3算法;用電客戶
1. 引言
(1)隨著電力體制改革的推進和電力市場化進程的加快,供電企業(yè)在電力市場上面臨著越來越激烈競爭。一方面,用電客戶逐漸成為競爭的焦點,提高用電客戶滿意度與供電企業(yè)自身的經(jīng)濟效益緊密相關;另一方面,供電企業(yè)先消費后付款的特殊交易方式,造成有些用電客戶拖欠電費。因此,供電企業(yè)需要對用電客戶進行有效的信用評價,對不同信用等級的客戶采用不同的營銷策略,建立信用激勵機制,提高供電企業(yè)用電營銷輔助決策水平。
(2)目前,隨著用電客戶信用評價成為供電企業(yè)客戶關系管理的重要內(nèi)容,有關用電客戶信用評價方面的研究成果也在不斷的增多。目前常用的方法主要有綜合評估法[3]、模糊多屬性方法[4]、主客觀評價的方法[5]、模糊偏序方法[6]等。這些研究從不同角度,為解決用電客戶信用評價問題提供了一些值得借鑒的思路和方法。上述方法在進行用電客戶信用評價時各有特點,但其評價指標較多,精煉性稍顯不足。隨著信用評價體系指標不斷增多,指標之間不可避免的存在一定的關聯(lián)性、交叉性,其重要性也不盡相同,從復雜的指標體系中篩選出重要的指標也是進行用電客戶信用評價的一個重要方面,因而本文把在指標屬性約簡方面具有強大優(yōu)勢的粗糙集理論引入用電客戶的信用評價中。
(3)粗糙集是一種處理不精確、不相容和不完全數(shù)據(jù)的數(shù)學工具,這一理論主要的應用是對含有大量冗余信息的知識系統(tǒng)進行約簡,它不僅具有模擬人類邏輯思維的能力,而且能有效地分析和處理不精確、不一致、不完整的信息[9]。該方法的主要優(yōu)點在于它不需要預先給定某些特征或?qū)傩缘臄?shù)量描述和模型假定,但單純地使用粗糙集理論不一定總能有效地解決不精確或不確定的實際問題。因此本文在粗糙集基礎上,采用AC聚類的方法,實現(xiàn)對用電客戶的信用評價。最后結合ID3算法,得到用電客戶信用評價的決策規(guī)則,具有一般性的指導意義。
2. 基本原理
2.1 粗糙集理論[1,12]。
2.1.1 定義1 某個屬性子集PA,x,y∈U 為兩個數(shù)據(jù)實體,如果有a ∈B,f(x,a)=f(y,a)這時稱x ,y 在屬性集 A上是不可分辨的,也稱為等價關系。在信息系統(tǒng)中,不可分辨關系可以定義為:IND(P)={(x,y)∈U×U|a ∈P,f(x,a)=f(y,a)}
由這種等價關系導出的對 U的劃分記為 U/IND(P)。
2.1.2 定義2 粗糙集理論的不確定性是建立在上、下近似的概念上的。令XU 是一個集合, IND(P)是 U上的等價關系,則:上近似集 IND(P)-(X)=∪{Y∈U/IND(P),YX},下近似集 IND(P)-(X)=∪{Y∈U/IND(P),Y∩X≠}
設T=(U,A,C,D) 是決策表,如果去掉屬性 a,得到的表 T1=(U,A-{a},c-{a},D)與表 T=(U,A,C,D) 相比,有PosC(D)=PosC-?。鸻}(D),則稱屬性 a是關于 D可省的。其中, PosC(D)=UX∈U/IND(D)P-(X)是D 關于 P的正域。
相對于決策屬性集合,如果有無條件屬性Ci 對決策屬性集合的影響不大,則可認為 Ci 的重要程度不大。屬性集中Ci 的重要度可表示為[9]:
μ(i) =card(PosC(D)-PosC-|Ci|(D))/card(U) (1)
其中,card 為元素個數(shù)屬性。
根據(jù)所求得屬性的重要度,可以獲得其在屬性集合中的相對權重。對求得的屬性重要度進行權值化處理可得[9]:
wi = μ(i) /∑n i=1 μ(i) (2)
其中, wi 是第i 項屬性的權重, μ(i) 為第i 項屬性的屬性重要度, n為屬性的個數(shù)。
2.2 AC算法的原理。
(1)由Laurence發(fā)展起來的相似體合成算法AC?。ˋnalog Complexion)首先成功地應用于氣象的預測,經(jīng)過不斷的發(fā)展與改進,在理論和應用方面取得了不少突破性的進展,已經(jīng)能夠取得很好的預測效果。后來烏克蘭的A.G.Ivakheneko院士把它應用于聚類,并且把AC算法和GMDH結合起來,將GMDH的核心思想應用到AC聚類算法中。國內(nèi)對AC算法的研究主要是建立在四川大學賀昌政教授研究的基礎之上。
(2)AC算法可以看作是對復雜對象的預測、聚類和分類的一種序列模式識別方法[14]。AC聚類算法,假設每個樣本(或者變量)作為一個模式,通過計算其他模式與該模式的相似程度,從而把較為相似的模式歸為一類,不相似的模式歸為不同的類。AC聚類算法中兩個模式的差異用兩個模式的距離表示,通常用歐式距離或海明距離表示。
(3)由于不同時期的相似模式可能具有不同的平均值和標準方差。為了下面將進行的模式間相似性的度量,必須尋找待選模式到參照模式的變換,來描述這些差異,即將模式變換到同一基準點上,從而使其具備可比性。一般取線性變換:
(4)AC聚類算法把所有的樣本組成的數(shù)據(jù)集和看作一個狀態(tài)空間,對每一個樣本的聚類,把他們看作是一個狀態(tài)空間的聚類。狀態(tài)空間以變量 x1,x2,…xm為軸,對象 Oi是空間待分類的點。每個對象Oi 或多或少與其他對象有所不同。這種差別能由 sikh算得,k=1,2, …,N;hi=1,2, …,N 。因此,聚類的基礎是對稱的相似性矩陣
siNN =|sikh|。聚類的任務是將狀態(tài)空間再分成個相似對象的類。
(5)近年來,AC算法由于結合歸納自組織數(shù)據(jù)挖掘方法和先進的選擇程序而增強了應用能力[13],通常,AC算法包含3個步驟:一是待選模式的產(chǎn)生;二是待選模式的變換;三是相似模式的選取。
3. 粗糙集及AC聚類算法的應用
3.1 粗糙集對信用評價指標的約簡。
(1)信用評價根據(jù)評價對象的不同,可選取不同的評價指標?;谖覈秒娍蛻舻囊恍┗厩闆r,確定本文信用評價的指標[4~5](見圖1):
以上指標屬于條件屬性C ,決策屬性 D=最后總得分(由專家打分得到)。
本文以某供電企業(yè)的12家客戶的數(shù)據(jù)為例,進行信用評價。首先采用等距離法對樣本數(shù)據(jù)進行離散化處理,STEP=(MAX-MIN)/3,MAX表示每一列的最大值,MIN表示每一列最小值,把每一列的屬性值分為3個等級,高(MIN+2*STEP,MAX)用3表示,中(MIN+ STEP,MIN+2*STEP)用2表示,低(MIN,MIN+ STEP)用1表示,得出個指標值轉換成Rough Set的數(shù)據(jù)格式。
由于條件屬性C1 的子指標資產(chǎn)負債率(C1 4?。槟嬷笜?,即比率越低則客戶償債能力越強,反之償債能力越弱。本文采用閾值法[2]對該指標進行了無量綱化處理,將其轉化為正指標。決策表1表示的是離散后的條件屬性 C1 的相關數(shù)據(jù)。
根據(jù)二級指標的權重,分別加權得到一級指標C1 的相關數(shù)據(jù),結合其它指標的相關數(shù)據(jù),匯總得到表2。其中D 表示各個客戶價值類型,即最終信用等級,將通過下文的AC聚類算法得到。
3.2 AC聚類算法的應用。
利用AC聚類法,運用Knowledge Miner軟件處理,按照90%相似度進行聚類,分為3類,按照從高到低的順序排列,具體分類如下:
根據(jù)AC聚類的Class Membership,我們設這三類的Y 值為3,2,1,分別表示高、 中、低。整理后可得表2。
該供電企業(yè)的12個用電客戶可以分為三類,信用較好;信用一般;信用較差。
根據(jù)評價的結果,該供電企業(yè)可以針對不同信用等級客戶實行差異化的營銷策略。
4. 規(guī)則知識挖掘
根據(jù)以上計算分析結果,本文采用數(shù)據(jù)挖掘技術中的ID3算法對用電客戶的信用信息進行知識挖掘,從中得出可以對其他用電客戶進行信用評價的一般性規(guī)則知識。
利用ID3算法,得到以下信用評價的決策樹:
(1)首先,商業(yè)信用在用電客戶信用評價中占有最大的信息增益,在決策中決定作用。
商業(yè)信用較好的客戶,其信用也較好;商業(yè)信用較差的客戶,其信用也較差。商業(yè)信用一般的客戶需要結合其他三個方面的內(nèi)容才能確定其信用等級。
(2)其次,法律信用的信息含量也很高,即使商業(yè)信用一般,如果法律信用較好,該客戶的信用等級仍屬于“高”。
(3)最后,當商業(yè)信用、法律信用及安全信用都處于“一般”的情況下,合作信用,無論是一般,還是較差,其信用等級都處在“低”的水平上。
5. 結論
本文運用粗糙集理論和AC聚類算法對用電客戶進行信用評價,結合了粗糙集在屬性簡約方面的強大功能,克服了冗余屬性對運算量的影響,從而簡化了信用評價的指標體系,提高了評估的效率。并利用AC聚類算法進行聚類分析,結合ID3算法挖掘出具有一般意義的用電客戶信用評價得規(guī)則知識。為用電客戶的信用評價以及供電企業(yè)的客戶關系管理提供了一種較為有效的決策支持方式。
參考文獻
[1] Pawlak Z.Rough set theoretical aspects of reasoning about date[M].Poland:Warsaw,1991.
[2] 胡永宏,賀思輝.綜合評價方法[M].北京:科學出版社,2000.
[3] 伍萱.客戶信用管理體系的建立[J].中國電力企業(yè)管理,2002 (11):33~35.
[4] 李翔,楊淑霞,黃陳鋒.基于模糊多屬性決策法的用電客戶信用評價[J].電網(wǎng)技術,2004 ,28(21):55~59.
[5] 楊淑霞,呂世森,喬艷芬.用電客戶信用的主客觀評價及分析[J].中國電力,2005,38(6):1~4.
[6] 吳為濤.電力客戶信用等級分析[D].北京:華北電力大學學士學位論文,2004.
[7] 鐘波,肖智,周家啟.組合預測中基于粗糙集理論的權重的確定方法[J].重慶大學學報,2002.
[8] 楊振峰,郭景峰,常峰.一種基于粗集的簡約方法[J].計算機工程,2003(6):15~16.
[9] 雷紹蘭,孫才新,周濠,張曉星.模糊粗糙集理論在空間電力負荷預測中的應用[J].電網(wǎng)技術,2005,29(9):26~30.
[10] 楊綸標,高英儀編著.模糊數(shù)學原理及應用[M].3版.廣州:華南理工大學出版社,2001.3.
[11] 張文修,吳偉志,梁吉業(yè)等. 粗糙集理論與方法[M].北京:科學出版社, 2001.
[12] Lemke F, Mueller J A. Self-organizing Data
Mining for a Portfolio Trading System. Journal for Computational Intelligence in Finance. 1997, 5(3): 12~26.
[13] 賀昌政.自組織數(shù)據(jù)挖掘與經(jīng)濟預測[M].北京:科學出版社,2005.
[14] 廖斌,何躍.基于AC聚類方法和GMDH的品牌競爭力分析[J].科技情報開發(fā)與經(jīng)濟,2005, 15(15): 135~137.
(大連東軟信息學院電子工程系,遼寧大連116023)
摘要:智能科學與技術概論課程是智能科學與技術專業(yè)重要的必修基礎課,對整個專業(yè)課程體系有概括性的引導作用,對學生深入學習后續(xù)課程有很大幫助。文章從智能科學與技術概論課程的教學實際出發(fā),提出該課程的整體課程規(guī)劃,并根據(jù)學生的學習情況驗證其適用性。
關鍵詞 :智能科學;專業(yè)基礎必修課;課程規(guī)劃
基金項目:2012年遼寧省普通高等學校本科工程人才培養(yǎng)模式改革試點項目(G2201249)。
第一作者簡介:林寶尉,男,講師,研究方向為計算機視覺、模式識別,linbaowei@neusoft.edu.cn。
0 引言
智能科學與技術概論課程是智能科學與技術專業(yè)的必修基礎課。學生通過學習基礎課,能夠了解整個專業(yè)的知識構成、體系結構以及發(fā)展方向,便于將來學習必修專業(yè)課,包括模式識別、人工智能、智能機器人等課程。在這個過程中,如何讓學生順利地過渡到更高層次的專業(yè)課學習中,如何提高其學習興趣,如何幫助學生深入了解各門專業(yè)課之間的層次關系,都是該專業(yè)設置過程中需要考慮的問題。智能科學與技術概論的規(guī)劃起到了承上啟下的作用。雖然專業(yè)導引課也從全局對該專業(yè)的情況進行了介紹,但其內(nèi)容以學生職業(yè)引導、興趣培養(yǎng)為主,對專業(yè)課程的設置并無過多展開。因此,智能科學與技術概論課程的設置十分必要。
1 課程規(guī)劃設置
1.1 能力指標
課程將學生的能力體系分為5個部分:技術知識與推理能力、開發(fā)式思維與創(chuàng)新、個人職業(yè)能力、態(tài)度與習慣、時間構思設計實現(xiàn)和社會貢獻,與其對應的二級、三級及詳細指標見表1。每個能力指標平均對應4個學時,共32個學時。
1.2 講授方式
(1)精講多練。通過講解智能科學的相關內(nèi)容并結合相關實驗,讓學生掌握智能科學的基礎知識,提高其學習興趣,為后續(xù)課程的學習打下良好基礎。
(2)以項目為導向組織教學,通過案例教學,將構思、設計、實施和運行引入教學過程中。
(3)鼓勵學生自主學習,加強基本職業(yè)能力的訓練。教學過程中注意互動和引導,運用講授教學、練習教學、實驗教學、案例教學等多種教學方法完成教學任務。
(4)教學實施過程中,提供豐富的教學資源,如多媒體課件、案例、網(wǎng)絡資源、優(yōu)秀學生作品和外文技術資料等。
(5)對學生進行多方面考核與評價。結合課程實施過程,從知識掌握、能力水平、態(tài)度表現(xiàn)等方面,對學生進行全方位的考核。
1.3 講授內(nèi)容
該課程講授內(nèi)容分為3個單元,具體內(nèi)容如下。
單元一:智能科學導論,主要涉及智能科學與技術的目標界定、學科分類、涉及范圍、學科定位、人類認知以及學科簡史等知識點。該單元將在2個學時中完成,并要求學生課外學習2個學時。
單元二:學科基礎理論知識,主要涉及機器系統(tǒng)、視覺感知、高級語言編程等知識點。該單元主要介紹支撐學科的相關課程,并在實踐課中使用高級語言編寫簡單系統(tǒng)。該單元共10個課時,其中包括4個實踐課時。
單元三:專業(yè)課介紹,主要涉及數(shù)字圖像處理介紹、模式識別介紹、計算機視覺介紹、智能機器人介紹等相關必修專業(yè)課的入門介紹,并在每次課程結束后配合實踐編程、工具使用、機器人搭建等實踐環(huán)節(jié)提高學生的學習興趣,使其全面認識后續(xù)專業(yè)學習。該單元共20個學時,其中包括12個實踐課時。
1.4 實驗設置
實驗課程共16個學時,包括4次實驗,詳細內(nèi)容如下。
實驗一:數(shù)字圖像處理實驗。使用課程中講授的Matlab語言,實現(xiàn)數(shù)字圖像的傅里葉變換、邊緣檢測功能。該實驗共4個課時,配合單元一以及單元二的部分知識點,使學生基本掌握Matlab編程語言,并理解數(shù)字圖像處理的基本知識。
實驗二:模式識別機器學習實驗。該實驗利用高級程序語言,實現(xiàn)數(shù)據(jù)的SVM算法以及KMeans算法,讓學生理解模式識別以及機器學習等知識。該實驗共4個學時。
實驗三:計算機視覺實驗。使用圖像拼接、3D場景重建等相關專業(yè)工具,實現(xiàn)二維圖片的3D重現(xiàn)。該實驗共4個學時。
實驗四:機器人實驗。學生在機器人實驗室,實際動手組裝博創(chuàng)模塊化機器人,并編程實現(xiàn)機器人運動調(diào)試。該實驗共4個學時,實驗地點為模塊化機器人實驗室。
1.5 結課考試
在教學的各個環(huán)節(jié),教師從出勤情況、日常表現(xiàn)、作業(yè)、實驗、結課項目及結課報告的完成情況對學生進行全方位的考核,其中結課項目、調(diào)查報告及實驗作業(yè)占最終成績的90%。結課項目為小組項目,4個學生為一個小組完成系統(tǒng)的設計、編寫、調(diào)試等步驟,并組織5名教師對每個小組進行答辯考核。
2 問題及改進
學校于2012年申請創(chuàng)辦智能科學與技術專業(yè)。該專業(yè)培養(yǎng)學生掌握計算機基礎、電子電路、控制方法、智能信息處理與識別等基本知識,使其具備信息處理、自動控制、人工智能系統(tǒng)開發(fā)等基本能力。智能科學與技術概論課程在大二下學期開設,共32學時,其中理論教學16學時,實踐教學16學時。通過理論教學和實踐教學,學生了解了智能科學的基礎理論知識,掌握該專業(yè)核心專業(yè)課的關系,認識相關后續(xù)課程,并能夠使用簡單的算法和工具,為日后深入學習專業(yè)課打下良好基礎。
2.1 教材選擇
由于本專業(yè)辦學時間較短,沒有足夠的針對智能科學與技術概論的教材可供選擇?,F(xiàn)階段使用較多的教材為《智能科學與技術導論》以及《智能科學》。《智能科學與技術導論》是鐘義信主編、北京郵電大學出版社出版的、適合智能專業(yè)大一新生使用的專業(yè)教材,對整個專業(yè)有詳細的介紹,適合作為新生的專業(yè)導引課程,安排16個學時較為合適,并不適于我校智能科學與技術概論課程的要求?!吨悄芸茖W》是史忠植主編、清華大學出版社出版的專業(yè)教材,該教材對整個智能專業(yè)的重要內(nèi)容都有涉及,系統(tǒng)地介紹了智能科學的概念和方法,吸收了腦科學、認知科學、人工智能、數(shù)理邏輯、社會思維學、系統(tǒng)理論、科學方法論和哲學等方面的研究成果,適合高年級學生使用,安排64個學時較為合適,也不適于我校情況。
鑒于上述原因,我們設計該課程時,前半部分理論知識介紹使用了《智能科學與技術導論》,后半部分專業(yè)課程介紹使用自制課件。經(jīng)過2輪的教學實踐以后,我們將根據(jù)教材使用情況編寫自用的講義教材。
2.2 內(nèi)容設計
該課程內(nèi)容會介紹智能專業(yè)的重要專業(yè)課,但要在32學時內(nèi)完成所有專業(yè)課程的介紹,并保證該課程內(nèi)容不與專業(yè)導引課以及智能信息處理導引課沖突,難度很大,因此選擇最合適的講授內(nèi)容,對于該課程的授課效果非常重要。
在授課過程中我們發(fā)現(xiàn),學生對簡單的數(shù)字圖像處理、計算機視覺的流行應用以及動手要求強的機器人課程興趣較大,但對數(shù)學推導要求較高的模式識別、機器學習等課程接受程度較低。該課程的教學目的是讓學生了解相關課程的意義、歷史、發(fā)展等知識,所以,建議加大實驗動手課程的課時比例,讓學生多使用相關知識、算法和應用,盡量避開復雜的數(shù)學推導。
2.3 資源配置
學校的智能科學與技術專業(yè)創(chuàng)建于電子工程系,依托電子系的軟硬件實驗室,培養(yǎng)學生的軟硬件知識儲備,提高學生的實際動手能力。其中,軟件算法將配合嵌入式設備進行硬件集成,并指導學生設計具有智能算法應用的硬件設備。教學過程中將使用校實驗室中的模式識別嵌入式開發(fā)板、博創(chuàng)模塊化機器人平臺以及Turtlebot智能機器人平臺。該課程在實際講授時,理論課以及算法相關實驗在大班進行,硬件實踐課程在小班進行,能取得較好的授課效果。
3 實施效果
在該課程設計內(nèi)容的指導下,智能科學與技術概論已經(jīng)完成了2輪的課程教學,并在課程結束后組織學生填寫調(diào)查問卷。題目分兩類,第一類包括課程目標是否清晰、該課程能否提起學生對該專業(yè)課的學習興趣、該課程的實驗設計能否有效提高學生的動手能力,以及該課程的內(nèi)容相關設計是否優(yōu)秀。統(tǒng)計結果如圖1所示。除極個別學生外,大多數(shù)學生都選擇了符合以及完全符合,說明該課程設計可以滿足教學要求。第二類問題總結學生在課程中獲取的知識能力,包括編程調(diào)試、理論知識應用、信息獲取、技術文檔寫作、自主學習、分析問題、解決問題等,為多選題。從圖2可以看出,學生對各項能力的認可率均超過50%,其中信息獲取、分析問題等能力的認可率接近80%,說明該課程設計基本滿足教學目標。
4 結語
智能科學與技術概論對智能專業(yè)學生的深入學習起到了重要的引導作用。我們根據(jù)自身的實際情況出發(fā),設計出適合該專業(yè)學生的課程設計安排。經(jīng)過兩輪的實施效果證明,該課程的設計方式比較適合學生。隨著課程的持續(xù),我們將不斷解決存在的問題,并編寫適合我校學生使用的教材。
參考文獻:
[1]鐘義信,智能科學技術導論[M].北京:北京郵電大學出版社,2007.
[2] Edward FC,Johan M,Soren O.重新認識工程教育:國際CDIO培養(yǎng)模式與方法[M].顧佩華,沈民奮,陸小華,譯.北京:高等教育出版社,2009.
據(jù)統(tǒng)計,2017年中國人工智能核心產(chǎn)業(yè)規(guī)模超過700億元,隨著各地人工智能建設的逐步啟動,預計到2020年,中國人工智能核心產(chǎn)業(yè)規(guī)模將超過1600億元,年復合增長率將達31.7%。
隨著人工智能技術的不斷成熟,人工智能創(chuàng)業(yè)的難度逐步降低,越來越多的創(chuàng)業(yè)公司加入人工智能的陣營。
2018年被稱為人工智能爆發(fā)的元年,人工智能技術應用所催生的商業(yè)價值逐步凸顯。人工智能逐步切入到社會生活的方方面面,帶來生產(chǎn)效率及生活品質(zhì)的大幅提升。智能紅利時代開啟!資本、巨頭和創(chuàng)業(yè)公司紛紛涌入,將人工智能拉到了信息產(chǎn)業(yè)革命的風口。
如何把握產(chǎn)業(yè)動向,抓住風口機會?創(chuàng)業(yè)邦研究中心憑借在人工智能等前言科技領域持續(xù)研究、洞察的能力,在對國內(nèi)人工智能創(chuàng)業(yè)公司進行系統(tǒng)調(diào)研的基礎上,推出《2018中國人工智能白皮書》,對人工智能的核心技術、主要應用領域、巨頭和創(chuàng)業(yè)公司的布局、未來發(fā)展態(tài)勢和投資機會進行了深度解析。
第一部分人工智能行業(yè)發(fā)展概述
1.人工智能概念及發(fā)展
人工智能(Artificial Intelligence, AI)又稱機器智能,是指由人制造出來的機器所表現(xiàn)出來的智能,即通過普通計算機程序的手段實現(xiàn)的類人智能技術。
自1956年達特茅斯會議提出“人工智能”的概念以來,“人工智能”經(jīng)歷了寒冬與交替的起起伏伏60多年的發(fā)展歷程。2010年以后,深度學習的發(fā)展推動語音識別、圖像識別和自然語言處理等技術取得了驚人突破,前所未有的人工智能商業(yè)化和全球化浪潮席卷而來。
人工智能發(fā)展歷程
2.人工智能產(chǎn)業(yè)鏈圖譜
人工智能產(chǎn)業(yè)鏈可以分為基礎設施層、應用技術層和行業(yè)應用層。
A基礎層,主要有基礎數(shù)據(jù)提供商、半導體芯片供應商、傳感器供應商和云服務商。
B技術層,主要有語音識別、自然語言處理、計算機視覺、深度學習技術提供商。
C應用層,主要是把人工智能相關技術集成到自己的產(chǎn)品和服務中,然后切入特定場景。目前來看,自動駕駛、醫(yī)療、安防、金融、營銷等領域是業(yè)內(nèi)人士普遍比較看好方向。
人工智能產(chǎn)業(yè)鏈
資料來源:創(chuàng)業(yè)邦研究中心
第二部分人工智能行業(yè)巨頭布局
巨頭積極尋找人工智能落地場景,B、C 端全面發(fā)力。
資料來源:券商報告、互聯(lián)網(wǎng)公開信息,創(chuàng)業(yè)邦研究中心整理
第三部分機器視覺技術解讀及行業(yè)分析
1.機器視覺技術概念
機器視覺是指通過用計算機或圖像處理器及相關設備來模擬人類視覺,以讓機器獲得相關的視覺信息并加以理解,它是將圖像轉換成數(shù)字信號進行分析處理的技術。
機器視覺的兩個組成部分
資料來源:互聯(lián)網(wǎng)公開信息,創(chuàng)業(yè)邦研究中心整理
2.發(fā)展關鍵要素:數(shù)據(jù)、算力和算法
數(shù)據(jù)、算力和算法是影響機器視覺行業(yè)發(fā)展的三要素。 人工智能正在像嬰兒一樣成長,機器不再只是通過特定的編程完成任務,而是通過不斷學習來掌握本領,這主要依賴高效的模型算法進行大量數(shù)據(jù)訓練,其背后需要具備高性能計算能力的軟硬件作為支撐。
深度學習出現(xiàn)后,機器視覺的主要識別方式發(fā)生重大轉變,自學習狀態(tài)成為視覺識別主流,即機器從海量數(shù)據(jù)里自行歸納特征,然后按照該特征規(guī)律使圖像識別的精準度也得到極大的提升,從70%+提升到95%。
3.商業(yè)模式分析
機器視覺包括軟件平臺開發(fā)和軟硬件一體解決方案服務。整體用戶更偏向于B端。軟件服務提供商作為技術算法的驅(qū)動者,其商業(yè)模式應以“技術層+場景應用”作為突破口。軟硬件一體化服務供應商作為生態(tài)構建者,適合以“全產(chǎn)業(yè)鏈生態(tài)+場景應用”作為突破口,加速商業(yè)化。
(1)軟件服務:技術算法驅(qū)動者—“技術層+場景應用”作為突破口
這種商業(yè)模式主要是提供以工程師為主的企業(yè)級軟件服務。有海量數(shù)據(jù)支撐,構建起功能和信息架構較為復雜的生態(tài)系統(tǒng),推動最末端的消費者體驗。
此類商業(yè)模式成功關鍵因素:深耕算法和通用技術,建立技術優(yōu)勢,同時以場景應用為入口,積累用戶軟件。視覺軟件服務按處理方式和存儲位置的不同可分為在線API、離線SDK、私有云等。
國內(nèi)外基礎算法應用對比
資料來源:互聯(lián)網(wǎng)公開信息,創(chuàng)業(yè)邦研究中心整理
(2)軟硬件一體化:生態(tài)構建者—“全產(chǎn)業(yè)鏈生態(tài)+場景應用”作為突破口
軟硬一體化的商業(yè)模式是一種“終端+軟件+服務”全產(chǎn)業(yè)鏈體系。成功的因素是大量算力投入,海量優(yōu)質(zhì)數(shù)據(jù)積累,建立算法平臺、通用技術平臺和應用平臺,以場景為入口,積累用戶。亮點是打造終端、操作系統(tǒng)、應用和服務一體化的生態(tài)系統(tǒng),各部分相輔相承,銳化企業(yè)競爭力,在產(chǎn)業(yè)鏈中擁有更多話語權。
4.投資方向
(1)前端智能化,低成本的視覺解決模塊或設備
從需求層面講,一些場景對實時響應是有很高要求的。提供某些前端就本身有一定計算能力的低成本的視覺模塊和設備將有很大市場需求。前置計算讓前端設備成為數(shù)據(jù)采集設備和數(shù)據(jù)處理單元的合體,一方面提升了處理速度,另一方面可以處理云端難以解決的問題。
機器視覺在消費領域落地的一個障礙是支持高性能運算的低功耗、低價位芯片選擇太少。從低功耗、高運算能力的芯片出發(fā),結合先進的算法開發(fā)模塊和產(chǎn)品,這類企業(yè)將在機器視覺領域擁有核心競爭力。
(2)深度學習解決視覺算法場景的專用芯片
以AI芯片方式作為視覺處理芯片有相當大的市場空間。以手勢識別為例,傳統(tǒng)的識別方案大都基于顏色空間,如 RGB,HSV ,YCrBr,無法排除類膚色物體及黑色皮膚對識別精度的干擾。借助深度學習,如通過 R-CNN 訓練大量標注后的手勢圖像數(shù)據(jù),得到的模型在處理帶有復雜背景及暗光環(huán)境下的手勢識別問題時,比傳統(tǒng)方案的效果好很多。
(3)新興服務領域的特殊應用
前沿技術帶來的新領域(如無人車、服務機器人、谷歌眼鏡等),對機器視覺提出了新要求。機器視覺可以讓機器人在多種場合實現(xiàn)應用。服務機器人與工業(yè)機器人最大的區(qū)別就是多維空間的應用。目前國內(nèi)的機器視覺,涉及三維空間、多維空間,其技術基本上處在初始階段,未來存在較大市場增長空間。
(4)數(shù)據(jù)是爭奪要點,應用場景是著力關鍵
機器視覺的研究雖然始于學術界,但作為商業(yè)應用,能解決實際問題才是核心的競爭力。當一家公司先天能夠獲得大量連續(xù)不斷的優(yōu)質(zhì)場景數(shù)據(jù),又有挖掘該數(shù)據(jù)價值的先進技術時,商業(yè)模式和數(shù)據(jù)模式上就能形成協(xié)同效應。創(chuàng)業(yè)公司要么通過自有平臺獲取數(shù)據(jù),要么選擇與擁有數(shù)據(jù)源的公司進行合作,同時選擇一個商業(yè)落地的方向,實現(xiàn)快速的數(shù)據(jù)循環(huán)。
第四部分智能語言技術解讀及行業(yè)分析
1.語音識別技術
(1)語音識別技術已趨成熟,全球應用持續(xù)升溫
語音識別技術已趨成熟,全球應用持續(xù)升溫。語音識別技術經(jīng)歷了長達60年的發(fā)展,近年來機器學習和深度神經(jīng)網(wǎng)絡的引入,使得語音識別的準確率提升到足以在實際場景中應用。深度神經(jīng)網(wǎng)絡逐步找到模型結構和調(diào)參算法來替代或結合高斯混合算法和HMM算法,在識別率上取得突破。根據(jù)Google Trends統(tǒng)計,自2008年iPhone及谷歌語音搜索推出以來語音搜索增長超35倍。百度人工智能專家吳恩達預測,2020年語音及圖像搜索占比有望達到50%。Echo熱銷超過400萬,帶動智能音箱熱潮。
(2)語音識別進入巨頭崛起時代,開放平臺擴大生態(tài)圈成主流
語音識別即將進入大規(guī)模產(chǎn)業(yè)化時代。隨著亞馬遜Echo的大賣,語音交互技術催生的新商機,吸引大大小小的公司構建自己主導的語音生態(tài)產(chǎn)業(yè)鏈。各大公司紛紛開放各自的智能語音平臺和語音能力,欲吸引更多玩家進入他們的生態(tài)系統(tǒng)。
(3)語音識別技術發(fā)展瓶頸與趨勢
低噪聲語料下的高識別率在現(xiàn)實環(huán)境使用中會明顯下降到70-80%,遠場識別、復雜噪聲環(huán)境和特異性口音的識別是下一個階段需要解決的問題。
麥克風陣列類前端技術不僅是通過降噪和聲源定位帶來識別率的提高,帶環(huán)境音的語料的搜集、標注可用于模型的訓練,有助于打造更新一代的語音識別引擎技術。語音巨頭已經(jīng)在布局。
在IOT包括車載領域,云端識別并非通行的最優(yōu)方案,把識別引擎結合場景進行裁剪后往芯片端遷徙是工程化發(fā)展的方向。
2.自然語言處理(NLP)發(fā)展現(xiàn)狀
(1)多技術融合應用促進NLP技術及應用的發(fā)展
深度學習、算力和大數(shù)據(jù)的爆發(fā)極大促進了自然語言處理技術的發(fā)展。深度學習在某些語言問題上正在取得很大的突破,比如翻譯和寫作。2014年開始LSTM、Word2Vec以及Attention Model等技術研究的進展,使DL有了路徑在語義理解領域取得突破,并且已經(jīng)有了明顯的進展。對話、翻譯、寫作新技術成果里都開始逐漸混合入DL的框架。2014-2015年,硅谷在語義理解領域的投資熱度劇增。
深度學習能最大程度發(fā)揮對大數(shù)據(jù)和算力資源的利用,語義理解的發(fā)展還需要深度學習、搜索算法、知識圖譜、記憶網(wǎng)絡等知識的協(xié)同應用,應用場景越明確(如客服/助理),邏輯推理要求越淺(如翻譯),知識圖譜領域越成熟(如數(shù)據(jù)飽和度和標準性較強的行業(yè)),技術上實現(xiàn)可能性相對較低。在各種技術融合應用發(fā)展的情況下,具備獲取一定優(yōu)質(zhì)數(shù)據(jù)資源能力并可結合行業(yè)Domain knowledge構建出技術、產(chǎn)品、用戶反饋閉環(huán)的企業(yè)會有更好的發(fā)展機會。
(2)NLP主要應用場景
問答系統(tǒng)。問答系統(tǒng)能用準確、簡潔的自然語言回答用戶用自然語言提出的問題?;竟ぷ髟硎窃诰€做匹配和排序。比如 IBM 的 Watson,典型的辦法是把問答用FAQ索引起來,與搜索引擎相似。對每一個新問題進行檢索,再將回答按匹配度進行排序,把最有可能的答案排在前面,往往就取第一個作為答案返回給用戶。
圖像檢索。同樣也是基于深度學習技術,跨模態(tài)地把文本和圖片聯(lián)系起來。
機器翻譯。機器翻譯的歷史被認為與自然語言處理的歷史是一樣的。最近,深度學習被成功地運用到機器翻譯里,使得機器翻譯的準確率大幅度提升。
對話系統(tǒng)。對話系統(tǒng)的回復是完全開放的,要求機器能準確地理解問題,并且基于自身的知識系統(tǒng)和對于對話目標的理解,去生成一個回復。
(3)創(chuàng)業(yè)公司的機遇
1)機器翻譯方面:經(jīng)過多年的探索,機器翻譯的水平已經(jīng)得到大幅度提升,在很多垂直領域已經(jīng)能夠在相當大程度上替代一部分人工,機器翻譯技術的商業(yè)化應用已經(jīng)開始進入大規(guī)模爆發(fā)的前夜。
2)應用于垂直領域的自然語言處理技術
避開巨頭們對語音交互入口的競爭,以某一細分行業(yè)為切入點,深耕垂直領域,對創(chuàng)業(yè)公司也是一個不錯的選擇。
第五部分人工智能在金融行業(yè)的應用分析
人工智能產(chǎn)業(yè)鏈包含基礎層、技術層、應用層三個層面。基礎層的大數(shù)據(jù)、云計算等細分技術被應用到金融征信、保險、理財管理、支付等金融細分領域;技術層的機器學習、神經(jīng)網(wǎng)絡與知識圖譜應用于金融領域的征信與反欺詐、智能投顧、智能量化交易,計算機視覺與生物識別應用于金融領域的身份識別,語音識別及自然語言處理應用于金融領域的智能客服、智能投研;應用層的認知智能應用于金融領域的智能風控。
人工智能在金融行業(yè)的典型應用情況
資料來源:創(chuàng)業(yè)邦研究中心
第六部分人工智能在醫(yī)療行業(yè)的應用分析
1.人工智能在醫(yī)療行業(yè)的應用圖譜
人工智能在醫(yī)療行業(yè)的應用潛力巨大,目前在健康管理、輔助診療、虛擬助理、醫(yī)學影像、智能化器械、藥物挖掘和醫(yī)院管理等領域均有企業(yè)在布局,其中醫(yī)學影像、藥物挖掘、健康管理,輔助診療、虛擬助理的應用發(fā)展速度較快。
圖 人工智能在醫(yī)療行業(yè)的應用圖譜
資料來源:創(chuàng)業(yè)邦研究中心
2.人工智能在醫(yī)療行業(yè)的具體應用場景
醫(yī)學影像。人工智能應用于醫(yī)學影像,通過深度學習,實現(xiàn)機器對醫(yī)學影像的分析判斷,是協(xié)助醫(yī)生完成診斷、治療工作的一種輔助工具,幫助更快的獲取影像信息,進行定性定量分析,提升醫(yī)生看圖/讀圖的效率,協(xié)助發(fā)現(xiàn)隱藏病灶。 人工智能通過影像分類、目標檢測、圖像分割、圖像檢索等方式,完成病灶識別與標注,三維重建,靶區(qū)自動勾畫與自適應放療等功能,應用在疾病的篩查、診斷和治療階段。目前較為火熱的應用有肺部篩查、糖網(wǎng)篩查、腫瘤診斷和治療等。
藥物挖掘。人工智能在藥物研發(fā)上的應用可總結為臨床前和臨床后兩個階段。臨床前階段:將深度學習技術應用于藥物臨床前研究,在計算機上模擬藥物篩選的過程,包括靶點選擇、藥效和晶型分析等,預測化合物的活性、穩(wěn)定性和副作用,快速 、準確地挖掘和篩選合適的化合物或生物,提高篩選效率,優(yōu)化構效關系。臨床后階段:針對臨床試驗的不同階段,利用人工智能技術對患者病歷進行分析,迅速篩選符合條件的被試者,監(jiān)測管理臨床試驗過程中的患者服藥依從性和數(shù)據(jù)收集過程,提高臨床試驗的準確性。
虛擬助理。醫(yī)療虛擬助理是基于醫(yī)療領域的知識系統(tǒng),通過人工智能技術實現(xiàn)人機交互,從而在就醫(yī)過程中,承擔診前問詢、診中記錄等工作,成為醫(yī)務人員的合作伙伴,使醫(yī)生有更多時間可以與患者互動。醫(yī)療虛擬助理根據(jù)參與就醫(yī)過程的功能不同,主要有智能導診分診,智能問診,用藥咨詢和語音電子病歷等方向。
第七部分智能駕駛行業(yè)分析
1.智能駕駛行業(yè)產(chǎn)業(yè)鏈
智能駕駛行業(yè)的中心業(yè)務是以Google、百度為代表的智能駕駛操縱解決方案提供商和以特斯拉、蔚來為代表的成車廠商。該類廠商,上接上游軟硬件提供商,下接公司和消費者,在整個業(yè)務鏈中扮演至關重要的一環(huán)。
產(chǎn)業(yè)鏈上游廠商多為細分技術提供商,如深度學習、人機交互、圖像識別和新材料、新制造新能源等。
智能駕駛產(chǎn)業(yè)鏈圖譜
資料來源:創(chuàng)業(yè)邦研究中心
2.智能駕駛市場分析
伴隨著 ADAS 技術的不斷更新,推斷全球 L1-L5 智能駕駛市場的滲透率會在接下來 5年內(nèi)處于高速滲透期,然 后伴隨半無人駕駛的普及進入穩(wěn)速增長期。在未來的 2025 年無人駕駛放量階段后,依賴全產(chǎn)業(yè)鏈的配合而進入市場成熟期。預測到2030年,全球 L4/5 級別的自動駕駛車輛滲透率將達到 15%,單車應用成本的顯著提升之 外,從 L1-L4 級別的智能駕駛功能全面滲透為汽車產(chǎn)業(yè)帶來全面的市場機會。
按照 IHS Automotive 保守估計,全球 L4/L5 自動駕駛汽車產(chǎn)量在 2025 年將接近 60 萬輛,并在 2025- 2035 年間獲得高速發(fā)展,年復合增長率將達到43%,并在2035年達到2100萬輛。另有接近 7600 萬輛的汽車具備部分自動駕駛功能,同時會帶動產(chǎn)業(yè)鏈衍生市場的大規(guī)模催化擴張。
根據(jù)獨立市場調(diào)研機構 Strategy Engineers 的預測,L4 高度自動駕駛等級下,自動駕駛零部件成本約在 3100 美元/車,其中硬件占比 45%,軟件占比 30%,系統(tǒng)整合占比 14%,車聯(lián)網(wǎng)部分占比 11%。按照全球 1 億輛量 產(chǎn)規(guī)模計算,理想假設所有車輛全部達到 L4 高度自動駕駛水平,那么全球自動駕駛零部件市場規(guī)模在 2020 年 將達到 3100 億美元。
第八部分中國人工智能企業(yè)畫像分析
隨著人工智能技術的不斷成熟,人工智能創(chuàng)業(yè)的難度逐步降低。創(chuàng)新的大門吸引眾多創(chuàng)業(yè)企業(yè)進入。為了觀察行業(yè)風向,助力創(chuàng)新企業(yè)發(fā)展,創(chuàng)業(yè)邦研究中心對國內(nèi)200多家人工智能創(chuàng)業(yè)公司進行了系統(tǒng)調(diào)研,從發(fā)展能力、創(chuàng)新能力、融資能力等多維度指標,評選出“2018中國人工智能創(chuàng)新成長企業(yè)50強”。
地域分布
全國88%的人工智能企業(yè)聚集在北京、上海、廣東和江蘇。其中,北京人工智能企業(yè)最多,占比高達39.66%;其次是上海,人工智能企業(yè)占比達21.55%;位列第三的是廣東,人工智能企業(yè)占達15.52%。北京以領先全國其他地區(qū)的政策環(huán)境、人才儲備、產(chǎn)業(yè)基礎、資本支持等,成為人工智能創(chuàng)業(yè)首要陣地;華東地區(qū)的上海、江蘇、浙江均有良好的經(jīng)濟基礎和科技實力,人工智能應用實力雄厚,也聚集了一批人工智能垂直產(chǎn)業(yè)園;廣東互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)達,企業(yè)對數(shù)據(jù)需求強烈,依靠大數(shù)據(jù)產(chǎn)業(yè)鏈推動人工智能產(chǎn)業(yè)發(fā)展。
行業(yè)分布
從行業(yè)大類分布來看,行業(yè)應用層的企業(yè)占比最大,為56.03%;其次是應用技術層的企業(yè),占比達31.04%;基礎技術層的企業(yè)占比最小,僅為12.93%。隨著人工智能技術的發(fā)展,人工智能與場景深度融合,應用領域不斷擴展,行業(yè)應用公司比重不斷提升。在基礎層技術方面,國際IT巨頭占據(jù)行業(yè)領先地位, 國內(nèi)與國際差距明顯,中小初創(chuàng)企業(yè)很難進入。
從行業(yè)應用來看,智能金融企業(yè)占比最大,為16.92%;其次是機器人企業(yè),占比達15.38%;位列第三的是智能駕駛和智能教育,占比均為12.31%。金融行業(yè)的強數(shù)據(jù)導向為人工智能的落地提供了產(chǎn)業(yè)基礎,智慧金融被列入國家發(fā)展規(guī)劃中,龐大的金融市場為人工智能落地帶來了發(fā)展前景。機器人作為人工智能產(chǎn)業(yè)落地輸出, 目前市場需求較大,商業(yè)機器人占據(jù)較大份額。中國智能駕駛市場在資本推動下進入者較多,企業(yè)積極推動應用落地,百度、北汽等大型企業(yè)嘗試商業(yè)化落地智能駕駛汽車。人工智能推動教育個性化落地,相關初創(chuàng)企業(yè)涉入教育藍海,推動智慧教育的發(fā)展。
收入情況
收入分布在500-10000萬之間的企業(yè)最多,占比達49.14%;500萬以下的企業(yè)位居其次,占比達 26.72%;位列第三的是10000-100000萬之間的企業(yè),占比為17.24%。
最新估值
企業(yè)最新估值均在億元級別,且分布較為均衡。三成企業(yè)估值超過15億元,還有企業(yè)估值達到百億級別,如優(yōu)必
選科技、達闥科技和商湯科技等,將來或?qū)④Q身人工智能獨角獸企業(yè)。(備注:分析樣本量剔除一半未披露企業(yè))
第九部分典型企業(yè)案例分析
1.Atman
企業(yè)概述
Atman由來自微軟的人工智能科學家和產(chǎn)業(yè)經(jīng)驗豐富的產(chǎn)品團隊創(chuàng)辦,提供專業(yè)領域機器翻譯、機器寫作、知識圖譜、大數(shù)據(jù)智能采集挖掘等語言智能產(chǎn)品,致力于成為醫(yī)學、新聞、法律等專業(yè)領域語言智能專家,為專業(yè)領域用戶賦能,推動專業(yè)領域用戶進入人工智能時代,助力專業(yè)領域文字智能水平實現(xiàn)跨越式提升。Atman已為強生、新華社參考消息、北大法寶、君合律師事務所等世界領先藥企、新聞媒體、法律服務機構開發(fā)機器翻譯、機器寫作、知識圖譜、大數(shù)據(jù)智能采集挖掘等語言智能產(chǎn)品。
目前Atman在北京和蘇州兩地運營,能快速響應全國各地客戶需求。
企業(yè)團隊
創(chuàng)始人&CEO:馬磊
清華大學計算機系畢業(yè),曾先后在微軟研究院和工程院擔任研究員和架構師,機器學習專家、多次創(chuàng)業(yè)者、曾主導多項人工智能重大項目,和申請國際專利共計15+項。
Atman公司核心團隊由來自微軟、百度、法電等領域高端人才和資深技術人才組成,公司員工40人,其中碩士以上學歷占比60%,技術開發(fā)人員占比70%,一半以上來自微軟亞洲研究院和工程院。
核心技術與產(chǎn)品
技術方面,擅長機器學習(深度學習、強化學習、群體智能)在復雜問題的應用,和國際專利15項,Atman神經(jīng)網(wǎng)絡機器翻譯系統(tǒng)于2016年9月首秀,早于谷歌的GNMT,專業(yè)領域翻譯效果在公測標準和行業(yè)客戶測試中均持續(xù)領先。核心產(chǎn)品為垂直領域機器翻譯、機器寫作、知識圖譜抽取構建、大數(shù)據(jù)智能挖掘等語言智能產(chǎn)品。
Atman的機器翻譯產(chǎn)品可自動翻譯編輯專業(yè)文獻、報告、音視頻和網(wǎng)頁,支持私有部署和云端混合部署,提供包括數(shù)據(jù)隱私安全以及自學習的端到端解決方案。
機器寫作可對海量數(shù)據(jù)進行快速搜索、過濾、聚類,根據(jù)行業(yè)需求自動生成專業(yè)文檔,適用于所有專業(yè)寫作場景,可大幅減少專業(yè)報告寫作過程中的繁復工作,大幅提升專業(yè)領域?qū)懽餍省?/p>
知識圖譜可實現(xiàn)海量數(shù)據(jù)的語義檢索、長鏈推理、意圖識別、因果分析,形成一個全局知識庫。大數(shù)據(jù)智能采集挖掘系統(tǒng)為專業(yè)領域用戶提供智能數(shù)據(jù)源管理、海量專業(yè)數(shù)據(jù)獲取和非結構化數(shù)據(jù)自動解析并結合知識圖譜提供auto-screening、知識重構、專業(yè)決策輔助,幫助用戶建立強大的以專業(yè)大數(shù)據(jù)為基礎的業(yè)務輔助能力。
2.黑芝麻
企業(yè)概述
黑芝麻智能科技有限公司是一家視覺感知核心技術與應用軟件開發(fā)企業(yè),2016年分別在美國硅谷和上海成立研發(fā)中心,主攻領域為嵌入式圖像、計算機視覺,公司核心業(yè)務是提供基于圖像處理、計算圖像以及人工智能的嵌入式視覺感知平臺,為ADAS及自動駕駛提供完整的視覺感知方案。
目前公司和博世、滴滴、蔚來、上汽、上汽大通、EVCARD、中科創(chuàng)達、車聯(lián)天下和云樂新能源等展開深入合作,提供基于視覺的感知方案;除此之外,公司還在消費電子、智能家居等領域布局為智能終端提供視覺解決方案。目前公司已經(jīng)完成A+輪融資。
企業(yè)團隊
團隊核心成員來自于OmniVision、博世、安霸、英偉達和高通等知名企業(yè),平均擁有超過15年以上的產(chǎn)業(yè)經(jīng)驗,畢業(yè)于清華、交大、中科大和浙大等知名高校。
創(chuàng)始人&CEO:單記章此前在硅谷一家全球頂尖的圖像傳感器公司工作近20年,離職前擔任該公司的技術副總裁一職,工作內(nèi)容覆蓋了圖像傳感器研發(fā)和設計、圖像處理算法研發(fā)和圖像處理芯片設計。
核心技術和產(chǎn)品
在汽車領域,黑芝麻可提供車內(nèi)監(jiān)控方案(DMS),自動泊車方案(AVP),ADAS/自動駕駛感知平臺方案。黑芝麻智能科技提供的解決方案包括算法和芯片兩個核心部分:黑芝麻感知算法從基礎的控光技術,到面向AI的圖像處理技術出發(fā)來提高成像質(zhì)量,以及應用深度神經(jīng)網(wǎng)絡訓練,結合視頻處理和壓縮技術,形成從傳感器端到應用端的處理過程;黑芝麻芯片平臺采用獨有的神經(jīng)網(wǎng)絡架構,包括獨有的圖像處理,視頻壓縮和計算機視覺模塊,與黑芝麻視覺算法結合,采用16nm制程,設計功耗2.5w,每秒浮點計算達20T。
3.乂學教育
企業(yè)概述
乂學教育,成立于2014年,是一家網(wǎng)絡教育培訓機構,采用人工智能和大數(shù)據(jù)技術,為學生提供量身定制學習解決方案和個性化學習內(nèi)容。核心團隊來自美國Knewton、Realizeit、ALEKS等人工智能教育公司,銷售團隊有全國40億toC銷售額的經(jīng)驗。
企業(yè)自主研發(fā)了針對中國K12領域的學生智適應學習產(chǎn)品,其核心部分是以高級算法為核心的智適應學習引擎“松鼠AI”,該產(chǎn)品擁有完整自主知識產(chǎn)權,能夠模擬真實特級教師教學。企業(yè)發(fā)表的學術論文得到了全球國際學術會議AIED、CSEDU、UMAP認可,并在紐約設計了人工智能教育實驗室,與斯坦福國際研究院(SRI)在硅谷成立了人工智能聯(lián)合實驗室。
主要產(chǎn)品
學生智適應學習是以學生為中心的智能化、個性化教育,在教、學、評、測、練等教學過程中應用人工智能技術,在模擬優(yōu)秀教師的基礎之上,達到超越真人教學的目的。該產(chǎn)品性價比高,以人工智能+真人教師的模式,做到因材施教,有效解決傳統(tǒng)教育課時費用高,名師資源少,學習效率低等問題。
智適應學習人工智能系統(tǒng)
智適應學習人工智能系統(tǒng)模擬特級教師,采用圖論、概率圖模型,機器學習完成知識點拆分和個人學習畫像,采用神經(jīng)網(wǎng)絡、邏輯斯蒂回歸和遺傳算法為學生實時動態(tài)推薦最佳學習路徑,實現(xiàn)個性化教育。
業(yè)務模式
線上與線下,2B和2C相結合。以松鼠AI智適應系統(tǒng)教學為主,真人教師輔助,學生通過互聯(lián)網(wǎng)在線上學習課程。開創(chuàng)教育新零售模式,授權線下合作學校,已在全國100多個城市開設500多家學校。
4.云從科技
企業(yè)概述
云從科技成立于2015年4月,是一家孵化于中國科學院重慶研究院的高科技企業(yè),專注于計算機視覺與人工智 能。云從科技是人工智能行業(yè)國家隊,是中科院戰(zhàn)略先導項目人臉識別團隊唯一代表,唯一一家同時受邀制定人 臉識別國家標準、行業(yè)標準的企業(yè)。2018年,云從科技成為祖國“一帶一路”戰(zhàn)略實行路上的人工智能先鋒,與 非洲南部第二大經(jīng)濟體津巴布韋政府完成簽約。
云從科技奠定了行業(yè)領導地位: 國家肯定,國家發(fā)改委2017、2018年人工智能重大工程承建單位;頂層設計,唯一同時制定國標、部標和行標的人工智能企業(yè);模式創(chuàng)新,三大平臺解決方案,科學家平臺、核心技術平臺和行業(yè)應用平臺。
企業(yè)核心團隊
創(chuàng)始人
周曦博士,師從四院院士、計算機視覺之父—ThomasS.Huan黃煦濤教授,專注于人工智能識別領域的計算機視覺 研究。入選中科院“百人計劃”,曾任中國科學院重慶研究院信息所副所長、智能多媒體技術研究中心主任。
周曦博士帶領團隊曾在計算機視覺識別、圖像識別、音頻檢測等國際挑戰(zhàn)賽中7次奪冠;在國際頂級會議、雜志 上發(fā)表60余篇文章,被引用上千次。
核心技術團隊
云從科技依托美國UIUC和硅谷兩個前沿實驗室,中科院、上海交大兩個聯(lián)合實驗室上海、廣州、重慶、成都四 個研發(fā)中心組成的三級研發(fā)架構。目前研發(fā)團隊已經(jīng)超過300人,80%以上擁有碩士學歷。
技術優(yōu)勢
全方位多維智能學習模塊適應不同場景要求;模塊化設計為在工業(yè)視覺、醫(yī)學影像、自動駕駛AR等領域擴展打下良好基礎。
云從科技具有高技術壁壘:世界智能識別挑戰(zhàn)賽成績斐然,在CLEAR、 ASTAR、 PASCAL VOC、 IMAGENET、FERA以及微軟全球圖像識別挑戰(zhàn)賽上共計奪得7次世界冠軍;在銀行、公安等行業(yè)智能識別技術 PK實戰(zhàn)中,85次獲得第一;2018年,云從科技入選MIT全球十大突破性技術代表企業(yè)。
在跨鏡追蹤(ReID)技術上取得重大突破。Market-1501,DukeMTMC-reID,CUHK03三個數(shù)據(jù)同時集體刷 新世界記錄, Market-1501上的首位命中率達到96.6%,首次達到商用水平。
正式在國內(nèi)“3D結構光人臉識別技術”,可全面應用于手機、電腦、機具、設備、家電。相較以往的2D人 臉識別及以紅外活體檢測技術,3D結構光人臉識別技術擁有不需要用戶進行任何動作配合完成活體驗證的功能, 分析時間壓縮到了毫秒級以及不受環(huán)境光線強弱的影響等諸多優(yōu)點,受到國際巨頭公司的關注。
行業(yè)應用
目前國內(nèi)有能力自建系統(tǒng)的銀行約為148家。截止2018年3月15日,已經(jīng)完成招標的銀行約為121家,其中云從科 技中標了88家總行平臺,市場占有率約為72.7%;在安防領域推動中科院與公安部全面合作,通過公安部重大課題研發(fā)火眼人臉大數(shù)據(jù)平臺等智能化系統(tǒng),在民航領域,已經(jīng)與中科院重慶院合作覆蓋80%的樞紐機場。
5.Yi+
企業(yè)概述
北京陌上花科技是領先的計算機視覺引擎服務商,為企業(yè)提供視覺內(nèi)容智能化和商業(yè)化解決方案。致力于“發(fā)現(xiàn)視覺信息的價值”。
旗下品牌Yi+是世界一流的人工智能計算機視覺引擎,衣+是時尚商品搜索引擎。公司在圖像視頻中對場景、通用物體、商品、人臉的檢測、識別、搜索及推薦均達到領先水平。
目前公司和阿里巴巴、愛奇藝、優(yōu)酷土豆、中國有線、CIBN、中信國安、海信、華為、360等數(shù)十家頂級機構/產(chǎn)品深度合作,通過提供邊看邊買引擎、圖像視頻內(nèi)容分析引擎、人臉識別引擎等基于視覺識別技術的數(shù)據(jù)結構化產(chǎn)品服務于海量用戶,同時幫助政府機構、廣電系統(tǒng)、內(nèi)容媒體、零售商、電商、視聽設備等行業(yè)實現(xiàn)智能分析、智能互動與場景營銷。目前公司已經(jīng)獲得B輪融資。
企業(yè)團隊
團隊成員來自于斯坦福、耶魯、帝國理工、新加坡國大、南洋理工、清華、北大、中科院等名校及谷歌、微軟、IBM、英特爾、阿里巴巴、騰訊、百度、華為等名企。
創(chuàng)始人&CEO:張默
北京大學軟件工程碩士, 南洋理工大學創(chuàng)業(yè)創(chuàng)新碩士。連續(xù)創(chuàng)業(yè)者, 曾任華為算法工程師、微軟WindowsMobile工程師、 IBM SmarterCity 架構師,北方區(qū)合作伙伴經(jīng)理,主機Linux中國區(qū)負責人,中國區(qū)開源聯(lián)盟負責人,年銷售額數(shù)億。 2013年創(chuàng)業(yè)于美國硅谷和新加坡,2014年6月在中國設立北京陌上花科技有限公司。
核心技術與產(chǎn)品
技術方面,在國際頂級計算機視覺競賽ImageNet中,成績曾超過谷歌、斯坦福等,2015-2016年2年獲得十項世界第一。2018年3月,人臉識別準確率位列LFW榜首。Yi+通過遵循無限制,標記的外部數(shù)據(jù)協(xié)議。 Yi+的系統(tǒng)由人臉檢測,人臉對齊和人臉描述符提取組成。使用多重損失和訓練數(shù)據(jù)集訓練CNN模型,其中包含來自多個來源的約10M個圖像,其中包含150,000個人(訓練數(shù)據(jù)集與LFW沒有交集)。在測試時, Yi+使用原始的LFW圖像并應用簡單的L2norm。圖像對之間的相似性用歐氏距離來測量,最終取得優(yōu)異成績。
公司的核心產(chǎn)品主要包括視覺搜索引擎,圖像視頻分析引擎以及人臉識別和分析引擎:
行業(yè)解決方案
針對營銷、安防、相機和電視的不同特點,推出相應解決方案。
營銷+AI。場景化廣告方案中,大屏AI助理信息流推薦、神字幕、物體/人臉AR動態(tài)貼圖、video-out、場景化角標與廣告濾鏡等形式的廣告內(nèi)容推薦,適用于快消、汽車、電商、IT、金融、旅游服務等多個行業(yè)。
智慧城市+AI。使用計算及視覺助力智慧城市,在智慧安防、智慧交通、智慧園區(qū)等方面提供解決方案。在智慧安防實時識別上,實時處理直播攝像頭信息,算法反應敏捷,相應迅速。建立智慧園區(qū)方案模型,考慮擴展性&靈活性、數(shù)據(jù)管理、松散耦合性、安全性、實時整合性以及功能性和非功能性需求等技術方案要素,從業(yè)務和技術兩方面整合解決方案實現(xiàn)步驟。
電視+AI。電視+AI的解決方案賦予智能電視多樣播放能力和營銷能力。
相機+AI。相機更具交互能力。用戶通過搜索關鍵字標簽同步展示圖片,打通相冊和購物一站式體驗。準確識別人物屬性特征,動態(tài)適應表情變化,可以在視頻以及圖像中對人臉實時檢測,基于深度學習技術,進行人臉相似度檢測,實現(xiàn)面部關鍵點定位、妝容圖像渲染,試用與粉底、唇彩以及眼影等多種虛擬試裝方式。實時檢測攝像頭中出現(xiàn)的物品、場景和人臉等,添加AR效果,SDK支持本地檢測、識別、追蹤,平均檢測幀率可達到25fps。
新零售+AI。Yi+新零售解決方案是基于公司自主研發(fā)的人臉識別、商品識別和其他圖像識別算法技術為核心,建立一整套基于人臉、商品的智能零售門店管理方案。Yi+新零售解決方案主要包含數(shù)據(jù)采集、算法模型說明和部署方案三部分,其中數(shù)據(jù)采集包括人臉數(shù)據(jù)采集、商品數(shù)據(jù)采集;算法模型說明包括識別算法訓練、商品識別、識別輸出;部署方案包括本地部署、云端部署、本地部署與云端部署結合。
6.擎創(chuàng)科技
企業(yè)簡介
擎創(chuàng)科技成立于2016年,專注于將人工智能和機器學習賦予傳統(tǒng)IT運維/企業(yè)運營管理,為企業(yè)客戶提供智能運維大數(shù)據(jù)分析解決方案,從而取代和改善對高技能運維人員嚴重依賴的現(xiàn)狀。2017年,擎創(chuàng)科技已實現(xiàn)全年2000萬營收,迅速成為國內(nèi)AIOps領域的領跑者和中流砥柱。2018年初,擎創(chuàng)科技完成了數(shù)千萬人民幣的A輪融資,由火山石投資領投,晨暉創(chuàng)投、元璟資本及新加坡STTelemedia跟投。
核心團隊
擎創(chuàng)團隊的核心成員主要由BMC、微軟等美國企業(yè)服務上市公司的運維老兵,與新浪、餓了么等知名互聯(lián)網(wǎng)公司的大數(shù)據(jù)、算法專家組成,核心團隊成員至少擁有10年以上的行業(yè)經(jīng)驗。其中CEO楊辰是國內(nèi)最頂級的B端銷售,曾帶領團隊獲得10倍的業(yè)績增長;CTO葛曉波擁有長達15年的企業(yè)級軟件開發(fā)和運維經(jīng)驗;而產(chǎn)品總監(jiān)屈中泠則來自甲方,創(chuàng)業(yè)前為浦發(fā)硅谷銀行企業(yè)架構師,深知甲方對企業(yè)運維產(chǎn)品的需求。這個曾經(jīng)深耕于運維企業(yè)服務市場的團隊,如今在智能運維企業(yè)服務賽道繼續(xù)領跑,讓擎創(chuàng)科技成為最懂企業(yè)的客戶,最值得企業(yè)客戶信賴的軟件廠商。
主要產(chǎn)品
“夏洛克AIOps” 作為擎創(chuàng)自主研發(fā)的大數(shù)據(jù)智能運維主打產(chǎn)品,自2016年上線以來,已從1.0版本升級至1.9版本,可應用在金融、大型制造業(yè)、鐵路民航、能源電力等涉及國家發(fā)展和民生問題的多種行業(yè)。在2017全球運維大會上,夏洛克AIOps獲得由中國信息通信研究院與高效運維社區(qū)聯(lián)合頒發(fā)的“年度最具影響力AIOps產(chǎn)品”獎。
“夏洛克AIOps”充分利用自研算法輔助客戶實現(xiàn)IT運維價值,結合客戶的現(xiàn)有情況,規(guī)劃從傳統(tǒng)ITOM至AIOps智能運維的一站式路徑,助其運營落地,由此打破數(shù)據(jù)孤島,建立統(tǒng)一的大數(shù)據(jù)智能分析平臺,實現(xiàn)以人工智能為核心,驅(qū)動傳統(tǒng)IT運維監(jiān)、管、控三個層面,并將相關運維數(shù)據(jù)及業(yè)務數(shù)據(jù)實時展現(xiàn)。
“夏洛克AIOps”擁有多項自研算法,猶如運維界的福爾摩斯,能迅速發(fā)現(xiàn)并定位運維問題的根因,實現(xiàn)秒級排障,最大程度避免企業(yè)產(chǎn)生重大損失。更有價值的是,“夏洛克AIOps”還能通過長期的數(shù)據(jù)積累和機器學習,運用新型深度神經(jīng)網(wǎng)絡算法對企業(yè)的業(yè)務數(shù)據(jù)進行預測,幫助企業(yè)提前規(guī)劃IT資源,高效預防各類黑天鵝事件的發(fā)生。
商業(yè)模式
目前,擎創(chuàng)科技已與多家金融和制造行業(yè)標桿客戶形成穩(wěn)定的合作關系,包括浦發(fā)銀行、浦發(fā)硅谷銀行、國家開發(fā)銀行、上海鐵路局、銀聯(lián)、海爾、浙江能源等。針對不同客戶,采用個性化的商業(yè)模式進行服務,目前主要有私有模式和SaaS模式兩種,都具有較強的可復制性。
核心優(yōu)勢
關鍵詞:Python編程;教學設計;非計算機專業(yè);編程語言
Python是一門免費、開源的跨平臺高級動態(tài)編程語言,可以處理系統(tǒng)運維、圖形處理、數(shù)據(jù)庫編程、多媒體編程、軟件分析、Web編程、科學計算與可視化、機器學習、人工智能等,擁有眾多狂熱的支持者,使得各個領域的人員能快速實現(xiàn)和驗證自己的思路與創(chuàng)意。Python早就廣泛應用到企業(yè)之中,早在2004年,Google便已決心在快速開發(fā)方面使用Python。近日,IEEESpectrum了第四屆頂級編程語言交互排行榜。因為有各種不同語言的排行,所以IEEESpectrum依據(jù)不同的變量對流行度進行了排行。Python擊敗Java,C,C++等語言,躍居編程語言交互排行榜第一名。非計算機專業(yè)學習編程的目的并非為了培養(yǎng)專業(yè)的編程開發(fā)人員,而是一方面為了鍛煉學生邏輯思維、扎實的問題分析能力;另一方面為了方便學生在各個領域進行研究實踐。Python語言的優(yōu)勢在于資源豐富,擁有堅實的數(shù)值算法、圖標和數(shù)據(jù)處理基礎設施,建立了非常良好的生態(tài)環(huán)境,吸引了大批科學家以及各領域的專家使用。這也是非計算機專業(yè)學生學習Python編程的必要性。
1編程語言的學習對非計算機專業(yè)的重要性
1.1程序設計基礎在非計算機專業(yè)開設情況
我國大學針對非計算機專業(yè)開設的程序設計基礎課程,使用C語言作為基礎語言的較多。C語言作為程序設計基礎語言,能夠讓學生明白程序運行原理,計算機各個部件如何交互,程序在內(nèi)存中是怎樣的狀態(tài)以及操作系統(tǒng)與程序有怎樣的關系。但是對于非計算機專業(yè)學生來說,C語言語法復雜,調(diào)試程序困難,學生缺少對計算機體系的整體認識,也無需了解計算機底層知識,后續(xù)工作很難使用C語言來解決問題,所以并不適合教授給沒有任何計算機認知背景的非計算機專業(yè)學生。Java語言也是部分高校面向全校開設的程序設計基礎編程公選課,是一門面向?qū)ο蟮木幊陶Z言,具有簡單性、分布式、健壯性、可移植性、平立、動態(tài)性等特點。Java語言廣泛應用在Android應用、金融業(yè)應用的服務器程序、網(wǎng)站、嵌入式領域、大數(shù)據(jù)技術和科學應用等領域。但是對于非計算機專業(yè)學生而言,Java語言學習成本比較高,工作后的應用場景較少,語言本身重點關注代碼復用性和可移植性,這些特點說明Java并不適用于非計算機專業(yè)學生[1]。
1.2非計算機專業(yè)選擇Python的原因
Python語言由荷蘭人GuidovanRossum于1989年發(fā)明,第一個公開發(fā)行版發(fā)行于1991年,已經(jīng)有28年的歷史。Python在設計上堅持了清晰劃一的風格,這使得其成為一門易讀、易維護,并且被大量用戶所歡迎的、用途廣泛的語言。Python的設計哲學是“優(yōu)雅”“明確”“簡單”,具有豐富和強大的庫[2]。Python語言是最接近自然語言的編程語言,代碼簡潔高效,對于沒有編程經(jīng)驗的學生來說較易上手,學生無需糾結語法和程序編寫方式,而是更快的抽象問題并提出解決方案,這樣更容易激發(fā)學生的學習熱情。非計算機專業(yè)涉及范圍較廣,Python所能完成的工作也非常廣泛,除了Web編程、圖形處理、計算機視覺、軟件分析、物聯(lián)網(wǎng)管理、科學計算與可視化等領域,一些意想不到的領域Python也能涉及。例如Python也能夠用于電影視覺特效的制作,其中就包括了《星球大戰(zhàn)》某些電影特效的制作,從集體渲染到批量處理再到影片合成,Python將所有步驟都緊密黏合在了一起。2017年,“人工智能”首次被列入政府工作報告,Python也借助人工智能(ArtificialIntelligence,AI)和數(shù)據(jù)科學,攀爬到了編程語言生態(tài)鏈的頂級位置。隨著AI應用的發(fā)展,數(shù)百萬之眾的教師、公司職員、工程師、翻譯、編輯、醫(yī)生、銷售、管理者和公務員將裹挾著各自領域中的行業(yè)知識和數(shù)據(jù)資源,涌入Python和AI大潮之中,深刻地改變整個IT,或者說數(shù)據(jù)科技(DataTechnology,DT)產(chǎn)業(yè)的整體格局和面貌。
2非計算機專業(yè)Python編程教學設計
對于非計算機專業(yè)學生,學習編程語言是很有挑戰(zhàn)性的,學生專業(yè)不同,思維方式也不相同。為了引發(fā)學生學習興趣,達到較好的教學效果,教師要轉變課堂上的角色,讓學生成為課堂的主角[3]。針對該課程和學生特點,提出“分方向的理論與實踐指導”,學生可以有重點、有目標地進行學習。
2.1教學目標
計算機編程延伸到非計算機專業(yè),對學生的掌握計算機理論知識和實踐技能要求較高?!俺绦蛟O計基礎”作為入門課程,除了教授學生一門編程語言的概念、語法及使用,還要教會學生編程思想、分析問題和解決問題的能力。
2.2教學內(nèi)容
非計算機專業(yè)Python編程教學涵蓋的基本內(nèi)容包括:基礎知識、Python序列、流程控制語句、函數(shù)、面向?qū)ο蟪绦蛟O計等。后續(xù)應當著重針對學生的學習方向或者興趣點,有針對性地講解Python的標準庫和擴展庫,并以案例或者項目的形式展現(xiàn)Python在各個領域中的應用。通常,不同學校的公選課的學時不同,32學時或者48學時。無論多少,學生都無法只利用上課時間達到最佳的學習效果,所以課下的自主學習尤為重要。在學習每個知識點后,教師安排部分課下自主學習的內(nèi)容,以幫助學生更充分地掌握所學內(nèi)容,并安排大量與實際工作學習相關案例。
2.3教學方法
除了講授法、案例法等傳統(tǒng)教學方法,教師應當充分分析學生特點,并時刻觀察學生的反應。教師在引入新概念、新理論時要以學生學習或者生活中熟悉的內(nèi)容為切入點,自然并具有邏輯性,能夠解決問題,引發(fā)學習積極思考問題。實踐是編程語言學習必不可少的過程,通過實踐夯實理論知識,并親自動手操作解決實際問題。教師應當分專業(yè)引導學生參與課題或項目中的部分模塊,給學生創(chuàng)造更多機會去實踐,學生完成課題或項目后,充分體驗到編程的樂趣,從而更好地激發(fā)學生學習興趣。
2.4拓展學生視野
由于學生專業(yè)不同,教師應當充分備課,了解Python在各個領域中的突出應用,并學習相關領域中的應用背景與相關知識。如果能將所學知識帶入實際情境中,學生用于解決工作和學習中遇到的各類非通用計算問題,理解并實踐計算思維[3]。在拓展學生視野的過程中同時增進了教與學的相互促進,教師與學生都積極參與到教與學的互動中,提升了教學效果。隨著互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)深度融合以及人工智能的火熱,前沿性、基礎性、交叉性的學科研究越來越多,有利于培養(yǎng)學生的創(chuàng)新意識和開拓精神。
3結語
身為教育工作者,從教與學的理論上思考編程語言公選課的教學問題。筆者認為,“分方向的理論與實踐指導”能夠培養(yǎng)學生基于自身學習、研究方向,學好用活書本知識,更重要的是與實踐應用相聯(lián)系,有利于培養(yǎng)學生的創(chuàng)新能力、探究精神和創(chuàng)新思維能力。本文提出了面向非計算機專業(yè)學生開設Python編程教學入門的必要性,并針對該編程語言特點闡述了“分方向的理論與實踐指導”的教學設計,這是編程公選課教學適應高素質(zhì)人才培養(yǎng)要求的一種嘗試。只有在教學過程中,聯(lián)系本校學生實際情況,不斷創(chuàng)新、改革,才能使教學設計達到更好的效果,為社會培養(yǎng)真正有用的人才。
[參考文獻]
[1]王立翔.基于計算思維的python語言課程教學改革芻議[J].教育現(xiàn)代化,2017(15):12-13.
[2]嵩天,黃天羽,禮欣.Python語言:程序設計課程教學改革的理想選擇[J].中國大學教學,2016(2):42-47.
關鍵詞:計算機專業(yè);校企合作;“3+1”;人才培養(yǎng);實踐教學
文章編號:1672-5913(2013)03-0108-05
中圖分類號:G642
進入21世紀,隨著我國高等教育規(guī)模的不斷擴大,從1999年到2009年的10年間,我國新建地方性本科院校已達200多所,占全國普通本科院??偭康?/3。原教育部副部長吳啟迪指出新建本科院校應以培養(yǎng)高級應用型人才為主,服務于地方經(jīng)濟建設和社會進步。新建本科院校由于缺乏辦學經(jīng)驗,在專業(yè)特色建設和實踐教學環(huán)節(jié)等方面存在諸多問題。根據(jù)榆林學院“立足榆林,面向陜西,輻射周邊,為榆林建成陜甘寧蒙晉接壤區(qū)中心城市、國家能源化工基地和陜西現(xiàn)代特色農(nóng)業(yè)基地的‘兩基地、一中心’服務,著力培養(yǎng)高素質(zhì)應用型人才”的辦學定位,為滿足服務地方經(jīng)濟建設和信息社會對IT人才的需要,榆林學院信息工程學院從2005級學生開始,進行校企合作“3+1”人才培養(yǎng)模式的探索與實踐。
1 改革思路與措施
首先,我們制定切實可行的“3+1”人才培養(yǎng)模式課程教學體系,基本思想就是把4年的學習分成2個階段。第1階段是學生在大學前3年完成公共基礎平臺、學科基礎平臺和專業(yè)基礎(含專業(yè)選修)課程學習;第2階段是學生從大四開始進入企業(yè)實訓,結合企業(yè)項目和開發(fā)平臺學習相關的開發(fā)工具和技術。其次,企業(yè)負責幫助學生進行8門課程的實踐培訓,以便與校內(nèi)相應課程進行學分置換,并指定具有工程師以上職稱的技術人員與校內(nèi)教師共同指導學生完成畢業(yè)設計,保證學生順利畢業(yè)并獲取學士學位。這些都有利于提高校外實訓效果,全面提高計算機專業(yè)畢業(yè)生的就業(yè)質(zhì)量和就業(yè)率,解決畢業(yè)生就業(yè)問題,具體措施有以下幾個方面。
1)為配合“3+1”人才培養(yǎng)模式的實施,我們對2006版人才培養(yǎng)方案進行修訂,以下稱2009版人才培養(yǎng)方案。公共基礎課程及課時是由國家教育部明確規(guī)定的,因此我們主要對數(shù)學基礎類課程、硬件基礎類課程和部分專業(yè)課程進行整合和調(diào)整。把高等數(shù)學(上、下)、線性代數(shù)、概率論與數(shù)理統(tǒng)計的總學時由26時減至203學時;把匯編語言、微機原理與接口技術整合成組成原理與匯編語言,壓縮了92學時;將大學物理(上、下)壓縮了32學時;把電路、模電和數(shù)電3門課程整合為電子技術基礎,壓縮了98學時;結合多位專家的建議,去掉計算機導論及實驗課程,減少了75學時;對安排有課程設計的核心課程的課內(nèi)實驗課時也進行壓縮;增加選修課程以滿足學生興趣的多樣性,有利于學生對專業(yè)前沿技術的了解和掌握。修訂后的教學計劃符合《高等學校計算機科學與技術專業(yè)發(fā)展戰(zhàn)略研究報告暨專業(yè)規(guī)范(試行)》和《高等學校計算機科學與技術專業(yè)人才專業(yè)能力構成與培養(yǎng)》所規(guī)定的專業(yè)核心課程及學時的要求。
2)積極推進計算機專業(yè)實驗內(nèi)容和實驗模式的改革和創(chuàng)新,進行理論、實驗、實訓“三位一體”的教學模式探索與改革,以做到“精理論、重實驗、強實訓、會設計”。通過增加綜合性和設計性實驗項目,減少驗證性實驗等方式,提高學生的創(chuàng)新意識、實際動手能力、分析和解決問題能力。在2009版人才培養(yǎng)方案中,實踐學分占到總學分的33%。
3)建立穩(wěn)定的校企合作實習和實訓基地。學校要與實訓機構共同研究基地建設規(guī)劃,合理制訂實習計劃,真正把培養(yǎng)學生的全面素質(zhì)和綜合能力、提高學生的就業(yè)競爭力作為首要任務來考慮。榆林學院現(xiàn)已與西安軟件服務外包學院、西安行知匯元、西安加中、西安達內(nèi)、北京用友軟件學院、北京渥瑞達等多家實訓機構簽訂了合作協(xié)議。
4)建立雙師型專業(yè)教學團隊。學校利用假期派教師參加各種雙師型教師培訓班,或由合作企業(yè)派出具有項目開發(fā)經(jīng)驗的工程師結合真實案例,有針對性地對榆林學院教師進行項目開發(fā)類課程的培訓及項目實踐指導,提高教師的項目開發(fā)能力。目前,已有7位教師取得相關機構頒發(fā)的雙師型資格培訓證書。
2 三級遞進式實踐教學體系建設
按照“3+1”人才培養(yǎng)模式的培養(yǎng)目標,我們建立了圖1所示從“課內(nèi)實驗-課程設計-項目實訓(含畢業(yè)設計)”的三級遞進式實踐教學體系。為保證該實踐教學體系正常運行,信息工程學院在2009年新建了Web工程、系統(tǒng)測試與分析、計算機視覺、項目實訓4個創(chuàng)新實驗室,由教授或博士擔任實驗室負責人,同時成立相應的科研團隊,以團隊為單位申請校級科研、教改和橫向課題,在年終獎勵成績突出的科研團隊并給予崗位津貼。此方法極大地激發(fā)了榆林學院教師的科研熱情,使得榆林學院申報科研項目數(shù)連續(xù)2年在省、校兩級科研項目申報中名列第一。同時,我們還建立了“主講教師進實驗室,實驗教師進課堂”制度;將理論教學與實驗教學緊密結合,促進課程建設與改革,也使教師能夠不斷進步和提高。
同時,我們圍繞“能力分解、階梯推進”的課程實驗改革思路和基于階段項目訓練的課程體系建設規(guī)劃,結合計算機科學與技術專業(yè)課程的特點,對專業(yè)課程的實驗環(huán)節(jié)進行重組和系統(tǒng)性規(guī)劃。我們?yōu)轫椖繉嵱柺屹忂M上海睿亞訓IT實踐能力提升平臺(PCIP),該平臺是針對高校教育行業(yè)量身打造的一款涵蓋軟件開發(fā)、軟件測試、電子商務、嵌入式、物聯(lián)網(wǎng)等多個軟件領域項目開發(fā)實踐軟件。該平臺不僅可以通過標準化的企業(yè)實戰(zhàn)項目案例及系統(tǒng)化的知識體系,為客戶提供完整的理論和實踐體系,還可以模擬企業(yè)實際開發(fā)流程,涵蓋軟件工程的全生命周期,提供從需求分析、基本設計、詳細設計到實現(xiàn)、測試的體驗式教育平臺,將軟件行業(yè)的職業(yè)化場景真正引入課程體系和教學全過程中,依托軟件企業(yè)的真實案例和項目資源庫,使學生在學習專業(yè)知識的同時接受“職業(yè)化”熏陶。圍繞綜合實驗課程案例,對現(xiàn)有課程實驗進行重組,課程設計的規(guī)劃重點是能把各課程的知識點貫穿統(tǒng)一,為綜合項目實驗服務。調(diào)整后的課程實驗關系如圖2所示。
3 實施效果及評價
自2008年5月榆林學院開始嘗試校企合作“3+1”人才培養(yǎng)模式以來,參與就業(yè)實訓的學生共有170人,占到畢業(yè)生總人數(shù)的50%。經(jīng)社會和用人單位反饋,這部分學生的綜合素質(zhì)較高,專業(yè)能力較強。在大學生就業(yè)市場普遍不景氣的情況下,信息工程學院畢業(yè)生的就業(yè)率非但沒有下降反而有所提高。畢業(yè)生的就業(yè)范圍主要是各類IT企業(yè)、服務外包、電子商務、電子政務、電信公司、銀行、證券公司等單位,主要分布在北京、上海、天津、廣州、武漢、深圳等13個一線城市和大連、蘇州、貴陽、東莞、昆山等10個二線城市。實訓生就業(yè)分析統(tǒng)計如表1所示。
本項目研究結束之后,我們將總結經(jīng)驗并完善培養(yǎng)模式,將此培養(yǎng)模式推廣應用到信息工程學院信息管理與信息系統(tǒng)專業(yè)及榆林學院其他工科專業(yè)的人才培養(yǎng)中。
3.1畢業(yè)生就業(yè)率及就業(yè)質(zhì)量得到提升
在2010年和2011年的畢業(yè)生就業(yè)反饋座談會上,參加“3+1”就業(yè)實訓的學生對教改的感受最深刻,也是教改最大的受益者,他們普遍認同校企合作“3+1”人才培養(yǎng)模式。這主要表現(xiàn)在兩方面:一是就業(yè)面拓寬,學生經(jīng)過1年的實訓已具備了較好的工程素質(zhì)和實際工作能力,因此比較受企業(yè)歡迎,挑選工作單位的余地大,所得薪金也相對較高;二是崗位適應能力強,學生在企業(yè)實訓中已了解到在企業(yè)中為人處事的態(tài)度與方法,因此工作后很容易融入企業(yè)文化,有很好的親和力和團隊合作精神,易開展工作,也容易出成績。用人單位與企業(yè)對經(jīng)過“3+1”就業(yè)實訓的學生認可度較高,這些學生因具有實訓經(jīng)歷和生產(chǎn)研發(fā)經(jīng)驗,與同期到企業(yè)工作的其他大學生相比,角色轉換快,動手能力強,工作作風硬,肯吃苦,沒有一般大學生的嬌、驕氣,很容易受到企業(yè)重視,能更快地得到重用和提拔。
3.2該人才培養(yǎng)模式的應用推廣
在計算機本科專業(yè)“3+1”人才培養(yǎng)模式3年試點的基礎上,榆林學院數(shù)學系數(shù)學及應用數(shù)學本科專業(yè)的13名學生在2010年7月也參與到就業(yè)實訓中來。該人才培養(yǎng)模式在學校就業(yè)指導中心的支持下逐步擴展到能源學院和管理學院部分專業(yè),并已得到學校、教務處、就業(yè)指導中心等主管部門的肯定。
4 存在的問題與思考
4.1加強雙師型隊伍建設
參加校企合作“3+1”實訓的學生為什么能找到好的工作?因為他們經(jīng)過1年有針對性的崗位技能訓練后,一到公司或企業(yè)就能干活。每個學生每天學習近10小時,其中8個小時在機房寫代碼,真正體現(xiàn)了應用型人才培養(yǎng)要遵循“精講多練”的思想。實訓機構能做到的事情,為何在學校就做不到呢?我們一直在反思這個問題。除了人才培養(yǎng)方案制訂過程中存在問題之外,還有教師自身問題,缺乏雙師型教師是問題的關鍵所在。因此,雙師型教師隊伍的建設迫在眉捷,學校人事部門應出臺相關政策,除了引進雙師型教師外,還應要求青年教師到公司或企業(yè)進行項目開發(fā),即轉型培養(yǎng)。
4.2加快校內(nèi)項目實訓平臺建設
目前,實訓機構作為學校和企業(yè)的橋梁,幫助校企實現(xiàn)合作。沒有去實訓機構參加實訓的學生,即在校學生,如何按照該模式在校內(nèi)進行培訓呢?建立一個企業(yè)化的項目實訓仿真平臺是當務之急。學校建立“虛擬軟件工廠”就是一個很好的實踐,這個平臺既能培養(yǎng)教師的項目管理能力,又能充分調(diào)動學生的學習積極性和主動性。通過與培訓企業(yè)、軟件外包企業(yè)合作,學生可以按照外包企業(yè)的軟件開發(fā)標準和業(yè)務流程進行軟件開發(fā)。信息工程學院在2010年9月,成立了由海歸博士負責的“項目實訓”實驗室,下設7個項目組團隊,分別是手機開發(fā)部、JAVA開發(fā)部、NET開發(fā)部、PHP開發(fā)部、網(wǎng)頁制作部、圖像聲音研究部、C++開發(fā)部,團隊成員來自全校各專業(yè)。
關鍵詞:機器學習;深度學習;推薦算法;遠程教育
深度學習(DeepLearning),也叫階層學習,是機器學習領域研究的分支,它是學習樣本數(shù)據(jù)的表示層次和內(nèi)在規(guī)律,在學習的過程中獲取某些信息,對于數(shù)據(jù)的解釋有巨大幫助。比如對文字數(shù)據(jù)的學習,在網(wǎng)絡上獲取關鍵字,對圖像數(shù)據(jù)的學習,進行人臉識別等等。
一、深度學習發(fā)展概述
深度學習是機器學習領域里一種對數(shù)據(jù)進行表征學習的方法。一句話總結三者之間的關系就是:“機器學習,實現(xiàn)人工智能的方法;深度學習,實現(xiàn)機器學習的技術。深度學習目前是機器學習和人工智能領域研究的主要方向,為計算機圖形學、計算機視覺等領域帶來了革命性的進步。機器學習最早在1980年被提出,1984年分類與回歸樹出現(xiàn),直到1986年,Rumelhart等人反向傳播(BackPropaga-tion,BP)算法的提出,解決了感知模型只能處理線性分類的問題,1989年出現(xiàn)的卷積神經(jīng)網(wǎng)絡(ConvolutionalNeuralNet-works,CNN)也因此得到了一定的發(fā)展。在1990年至2012年,機器學習逐漸成熟并施以應用,GeoffreyHinton在2006年設計出了深度信念網(wǎng)絡,解決了反向傳播算法神經(jīng)網(wǎng)絡中梯度消失的問題,正式提出了深度學習的概念,逐漸走向深度學習飛速發(fā)展的時期。隨后,各種具有獨特神經(jīng)處理單元和復雜層次結構的神經(jīng)網(wǎng)絡不斷涌現(xiàn),深度學習技術不斷提高人工智能領域應用方面的極限。
二、深度學習主要模型
1、卷積神經(jīng)網(wǎng)絡卷積神經(jīng)網(wǎng)絡(ConvolutionalNeuralNetworks,CNN)是指有著深度結構又包含著卷積計算的前饋神經(jīng)網(wǎng)絡。卷積物理上理解為系統(tǒng)某一時刻的輸出是有多個輸入共同疊加的結果,就是相當于對一個原圖像的二次轉化,提取特點的過程。卷積神經(jīng)網(wǎng)絡實際上就是一個不斷提取特征,進行特征選擇,然后進行分類的過程,卷積在CNN里,首先對原始圖像進行特征提取。所以卷積神經(jīng)網(wǎng)絡能夠得到數(shù)據(jù)的特征,在模式識別、圖像處理等方面應用廣泛。一個卷積神經(jīng)網(wǎng)絡主要由三層組成,即卷積層(convolutionlayer)、池化層(poolinglayer)、全連接層(fullyconnectedlayer)。卷積層是卷積神經(jīng)網(wǎng)絡的核心部分,通過一系列對圖像像素值進行的卷積運算,得到圖像的特征信息,同時不斷地加深節(jié)點矩陣的深度,從而獲得圖像的深層特征;池化層的本質(zhì)是對特征圖像進行采樣,除去冗雜信息,增加運算效率,不改變特征矩陣的深度;全連接將層間所有神經(jīng)元兩兩連接在一起,對之前兩層的數(shù)據(jù)進行分類處理。CNN的訓練過程是有監(jiān)督的,各種參數(shù)在訓練的過程中不斷優(yōu)化,直到得到最好的結果。目前,卷積神經(jīng)網(wǎng)絡的改進模型也被廣泛研究,如全卷積神經(jīng)網(wǎng)絡(FullyConvolutionalNeuralNetworks,F(xiàn)CN)和深度卷積神經(jīng)網(wǎng)絡(DeepConvolutionalNeuralNetworks,DCNN)等等。2、循環(huán)神經(jīng)網(wǎng)絡區(qū)別于卷積神經(jīng)網(wǎng)絡在圖片處理領域的應用,循環(huán)神經(jīng)網(wǎng)絡(RecurrentNeuralNetwork,RNN)主要應用在自然語言處理領域。RNN最大的特點就是神經(jīng)元的輸出可以繼續(xù)作為輸入,再次利用到神經(jīng)元中循環(huán)使用。RNN是以序列的方式對數(shù)據(jù)進行讀取,這也是RNN最為獨特的特征。RNN的串聯(lián)式結構適用于時間序列的數(shù)據(jù),可以完好保持數(shù)據(jù)中的依賴關系。循環(huán)神經(jīng)網(wǎng)絡主要有三層結構,輸入層,隱藏層和輸出層。隱藏層的作用是對輸入層傳遞進來的數(shù)據(jù)進行一系列的運算,并將結果傳遞給輸出層進行輸出。RNN可用于許多不同的地方。下面是RNN應用最多的領域:1.語言建模和文本生成,給出一個詞語序列,試著預測下一個詞語的可能性。這在翻譯任務中是很有用的,因為最有可能的句子將是可能性最高的單詞組成的句子;2.語音識別;3.生成圖像描述,RNN一個非常廣泛的應用是理解圖像中發(fā)生了什么,從而做出合理的描述。這是CNN和RNN相結合的作用。CNN做圖像分割,RNN用分割后的數(shù)據(jù)重建描述。這種應用雖然基本,但可能性是無窮的;4.視頻標記,可以通過一幀一幀地標記視頻進行視頻搜索。3、深度神經(jīng)網(wǎng)絡深度神經(jīng)網(wǎng)絡(deepneuralnetworks,DNN)可以理解為有很多隱藏層的神經(jīng)網(wǎng)絡。多層神經(jīng)網(wǎng)絡和深度神經(jīng)網(wǎng)絡DNN其實也是指的一個東西,DNN有時也叫做多層感知機(Mul-ti-Layerperceptron,MLP)。DNN內(nèi)部的神經(jīng)網(wǎng)絡層也是分為三類,輸入層,隱藏層和輸出層,一般來說第一層是輸入層,最后一層是輸出層,而中間的層數(shù)都是隱藏層。深度神經(jīng)網(wǎng)絡(DNN)目前作為許多人工智能應用的基礎,并且在語音識別和圖像識別上有突破性應用。DNN的發(fā)展也非常迅猛,被應用到工業(yè)自動駕駛汽車、醫(yī)療癌癥檢測等領域。在這許多領域中,深度神經(jīng)網(wǎng)絡技術能夠超越人類的準確率,但同時也存在著計算復雜度高的問題。因此,那些能夠解決深度神經(jīng)網(wǎng)絡表現(xiàn)準確度或不會增加硬件成本高效處理的同時,又能提升效率和吞吐量的技術是現(xiàn)在人工智能領域能夠廣泛應用DNN技術的關鍵。
三、深度學習在教育領域的影響
1、學生學習方面通過網(wǎng)上學習的實時反饋數(shù)據(jù)對學生的學習模式進行研究,并修正現(xiàn)有教學模式存在的不足。分析網(wǎng)絡大數(shù)據(jù),相對于傳統(tǒng)在線學習本質(zhì)區(qū)別在于捕捉學生學習過程,有針對性,實現(xiàn)學生個性化學習。舉個例子,在學習過程中,可以通過學習平臺對學生學習課程所花費的時間,參與的程度,知識的偏好等等數(shù)據(jù)加以分析。也可以通過學生學習某門課程的次數(shù),鼠標點擊次數(shù)、停留的時間等,來推斷學生學習情況。通過以上或類似數(shù)據(jù)匯總分析,可以正向引導學生學習,并給予積極的學習評價。這種利用計算機收集分析出來的客觀數(shù)據(jù),很好展示了學生學習行為的結果,總結學習規(guī)律,而不需要教師多年的教學經(jīng)驗來判斷。對于教育研究者而言,利用深度學習技術可以更客觀準確地了解學生,使教學工作良好發(fā)展更進一步。2、教學方面學習平臺的數(shù)據(jù)能夠?qū)虒W模式的適應度進行預測,通過學生的考試成績和對教師的線上評價等加以分析,能夠預測出某一階段的教學方式發(fā)發(fā)是否可行,影響如何。通過學生與教師的在線互動,學生測驗時完成的時間與完成的結果,都會產(chǎn)生大量的有效的數(shù)據(jù),都可以為教師教學支持服務的更好開展提供幫助,從而避免低效率的教學模式造成教學資源的浪費。
四、成人遠程教育中深度學習技術的可應用性
深度學習方面的應用在眾多領域都取得了成功,比如電商商品推薦、圖像識別、自然語言處理、棋類博弈等等。在遠程教育方面,深度學習的技術還有很大的發(fā)揮空間,智能網(wǎng)絡教育的實現(xiàn)是人們的眾望所盼。若要將深度學習技術應用到遠程教育平臺,首先要清楚學生的需求和教學資源如何分配。1、針對學生的學習需求與學習特征進行分析美國斯坦福大學克里斯皮希研究團隊的研究成果顯示,通過對學生知識學習進行時間建模,可以精確預測出學生對知識點的掌握情況,以及學生在下一次學習中的表現(xiàn)。深度學習的應用可以幫助教師推測出學生的學習能力發(fā)展水平。通過學生與教學環(huán)境的交互行為,分析其學習風格,避免教師用經(jīng)驗進行推斷而產(chǎn)生的誤差。2、教學資源的利用與分配深度學習技術能夠形成智能的分析結論。計算機實時采集數(shù)據(jù)集,對學生的學習情況加以分析,使教師對學生的學習狀態(tài)、情緒狀態(tài)等有更加清晰、準確的了解。有了上面良好的教學模式,教師對學生的學習狀態(tài)有了更準確的掌握,對學生的學習結果就有了更科學的教學評價?;谏疃葘W習的人工智能技術,還可以輔助教師實現(xiàn)智能閱卷,通過智能閱卷自動總結出學習中出現(xiàn)的問題,幫助教師減少重復性勞動,減輕教師負擔。作為成人高校,遠程教育是我們的主要教學手段,也是核心教學方式,學校的教學必定是在學生方便學習的同時,以學生的學習效果為重。通過深度學習技術,可以科學地分析出學生的學習效果,對后續(xù)教與學給予科學、可靠的數(shù)據(jù)支撐。我們可以在平臺上為每位同學建立學習模型,根據(jù)學生的學習習慣為其定制個性化方案,按他們的興趣進行培養(yǎng),發(fā)揮他們專業(yè)的潛能。同時,可以將學生正式在線參加學習和考試的學習行為和非學習時間瀏覽網(wǎng)站的行為結合到一起,更加科學地分析出學生在學習網(wǎng)站上感興趣的地方。采用深度學習算法,根據(jù)學生學習行為產(chǎn)生的海量數(shù)據(jù)推算出學生當前狀態(tài)與目標狀態(tài)之間的差距,做到精準及時的學習需求反饋。有助于幫助學生明確學習目標,教師確立教學目標,真正做好因材施教?;谏疃葘W習各種智能識別技術,可以為教師的線上教學活動增光添彩,在反饋學生學習狀態(tài)的同時,采用多種形式的教學方法吸引學生的注意力,增強教學活動的互動性,達到良好的教學效果。