公務(wù)員期刊網(wǎng) 精選范文 數(shù)據(jù)分析分析技術(shù)范文

數(shù)據(jù)分析分析技術(shù)精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)據(jù)分析分析技術(shù)主題范文,僅供參考,歡迎閱讀并收藏。

數(shù)據(jù)分析分析技術(shù)

第1篇:數(shù)據(jù)分析分析技術(shù)范文

關(guān)鍵詞:聯(lián)機數(shù)據(jù)分析;處理數(shù)據(jù);分析和轉(zhuǎn)換數(shù)據(jù)

中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)03-0006-03

為了提升大學(xué)物理公共課程的教學(xué)水平,更好地了解學(xué)生的學(xué)習(xí)情況,需要引用聯(lián)機數(shù)據(jù)技術(shù),通過科學(xué)建立模型對教學(xué)數(shù)據(jù)進行處理和分析。維度模型的建立是為了能夠全方位地剖析數(shù)據(jù)。

1 建立數(shù)據(jù)模型

建立模型是為了更加直觀地表達數(shù)據(jù)和事實。對于同一批數(shù)據(jù),人們總是會以不同的角度對其進行觀察,這就是維度。維度模型從不同的角度分析數(shù)據(jù),最終得出一張事實表。

如圖1所示,維度模型包括了教材維度表,學(xué)期維度表,教師維度表,學(xué)生維度表和教學(xué)事實表。為了更好地分析教學(xué)效果,維度模型從四個不同的角度進行分析,每一張維度表上都注明了詳細的數(shù)據(jù)內(nèi)容。最后,在總結(jié)四張維度表的基礎(chǔ)上,概括了最終的教學(xué)事實表。

2 OLAP技術(shù)

2.1 數(shù)據(jù)的采集

原有的Visual和SQL數(shù)據(jù)庫上儲存了學(xué)生的信息,教師的信息以及教學(xué)的數(shù)據(jù)等等。如圖二所示,教務(wù)數(shù)據(jù)庫中包含了課程信息表,學(xué)生信息表以及選課成績表。DTS工具能夠從不同的數(shù)據(jù)庫中自動抽取需要進行分析的數(shù)據(jù),并且將其全部集中在一個新的數(shù)據(jù)庫中。新的SQL數(shù)據(jù)庫既可以儲存信息,還能夠?qū)π畔⑦M行管理。聯(lián)機分析處理技術(shù)從不同的角度分析數(shù)據(jù),有助于全面了解學(xué)生的學(xué)習(xí)情況和教師的教學(xué)質(zhì)量。

2.2 數(shù)據(jù)分析的結(jié)構(gòu)

從圖2中可以看出,數(shù)據(jù)分析的結(jié)構(gòu)包括了四層,其中最底層的是各種信息數(shù)據(jù)庫和文本文件,在此基礎(chǔ)上建立數(shù)據(jù)ETL,然后建立相應(yīng)的維度模型,最后利用聯(lián)機分析技術(shù)對數(shù)據(jù)進行分析。采集數(shù)據(jù)和轉(zhuǎn)換數(shù)據(jù)是使用聯(lián)機分析技術(shù)的基礎(chǔ),也是必不可少的一步。多維度分析是該結(jié)構(gòu)中的最后一步,最終的結(jié)果將會把數(shù)據(jù)轉(zhuǎn)換成圖表的形式呈現(xiàn)出來。

2.3 轉(zhuǎn)換數(shù)據(jù)

由于不同數(shù)據(jù)的語法可能存在差異,因此,把不同的數(shù)據(jù)轉(zhuǎn)換成相同的結(jié)構(gòu)顯得尤為必要。在聯(lián)機分析技術(shù)應(yīng)用的過程中,轉(zhuǎn)換數(shù)據(jù)是關(guān)鍵的一步,能否成功轉(zhuǎn)換數(shù)據(jù),決定了維度模型的建立是否具有科學(xué)性與全面性。轉(zhuǎn)換數(shù)據(jù)是為了解決語法,語義結(jié)構(gòu)不同引起的問題。

和數(shù)據(jù)語義不同相比,處理不同語法的數(shù)據(jù)顯得更為簡單。如果數(shù)據(jù)本身和目標數(shù)據(jù)之間存在語法結(jié)構(gòu)不同的問題,那么只需要通過函數(shù)對其進行轉(zhuǎn)換即可。一般來說,數(shù)據(jù)本身的內(nèi)容并不會影響轉(zhuǎn)換過程,只要建立原數(shù)據(jù)和目標數(shù)據(jù)之間的對應(yīng)關(guān)系,就能解決數(shù)據(jù)名稱存在沖突的問題。例如,學(xué)生數(shù)據(jù)庫本身的信息包括了學(xué)生的ID和班級,這就相當(dāng)于最終目標數(shù)據(jù)中學(xué)生對應(yīng)的名稱和班別。如果數(shù)據(jù)類型不同,可以運用相應(yīng)的函數(shù)對其進行轉(zhuǎn)換,例如trim()函數(shù)就能完成數(shù)據(jù)的轉(zhuǎn)換。下面是利用函數(shù)對原數(shù)據(jù)中學(xué)生的ID,專業(yè)以及院名進行轉(zhuǎn)換的過程,其轉(zhuǎn)換代碼如下:

Function Main()

DTSDestination(“ID”)=trim(DTSSourse(“名稱”))

DTSDestination(“專業(yè)”)=cstr(DTSSourse(“專業(yè)”))

DTSDestination(“院名”)=trim(DTSSourse(“學(xué)院”))

Main=DTSTransformStat_OK

End Function

轉(zhuǎn)換不同語義結(jié)構(gòu)的數(shù)據(jù)是一個復(fù)雜的過程,它需要重視數(shù)據(jù)本身的信息和內(nèi)容。因此,僅僅通過一步完成數(shù)據(jù)轉(zhuǎn)換的過程是幾乎不可能的,它需要將原數(shù)據(jù)進行一次次轉(zhuǎn)換,才能得到最終的目標數(shù)據(jù)。例如每一個教師都有以及開展項目,在原數(shù)據(jù)中只能看到項目的名稱和論文的名稱,如果需要將其轉(zhuǎn)換成教師的論文數(shù)量和項目數(shù)量,則需要經(jīng)過兩步的數(shù)據(jù)轉(zhuǎn)換。

2.4 數(shù)據(jù)結(jié)果分析

原數(shù)據(jù)從SQL中提取出來,然后通過函數(shù)對其進行轉(zhuǎn)換,最后利用聯(lián)機分析技術(shù)進行數(shù)據(jù)管理和分析,從不同的角度研究數(shù)據(jù),從而全面分析學(xué)生的學(xué)習(xí)情況和教師的教學(xué)情況。數(shù)據(jù)分析的方法有很多種,其目的都是為了全方位地剖析數(shù)據(jù)。

2.4.1 高校教師教學(xué)質(zhì)量的對比分析

在教師維度表中,我們已經(jīng)按照教師的從業(yè)年齡,學(xué)歷以及職稱對其進行劃分,不同職稱的教師,其教學(xué)質(zhì)量有著明顯的區(qū)別。教師的學(xué)歷不同,教齡有所差異,這都和教學(xué)效果息息相關(guān)。

2.4.2 不同時期對教學(xué)質(zhì)量的影響分析

聯(lián)機分析處理技術(shù)能夠從多角度分析數(shù)據(jù),教學(xué)質(zhì)量不可能是一成不變的,它與多個因素密不可分,時間也是其中一個因素。在不同的時期,由于政策的變動和外界因素的影響,教師的教學(xué)質(zhì)量也會隨之而受到不同程度的影響。

2.4.3 教學(xué)質(zhì)量和其他因素息息相關(guān)

除了時間和教師的水平會對教學(xué)質(zhì)量造成一定的影響,還有其他因素同樣會影響教學(xué)效果,例如:學(xué)生的學(xué)習(xí)能力,學(xué)校選用的課本等。綜合考慮各個因素對教學(xué)效果的影響,有利于教育部門更好地作出相應(yīng)的政策調(diào)整。

3 計算機分析處理技術(shù)中的數(shù)據(jù)處理方法分析

無可置疑,計算機技術(shù)的出現(xiàn)顛覆了人們傳統(tǒng)的思想和工作模式。如今,計算機技術(shù)已經(jīng)全面滲透到我們生活中和工作中的各個方面。不管是在工業(yè)生產(chǎn)還是科研數(shù)據(jù)處理中,計算機技術(shù)都發(fā)揮著不可替代的作用。如今我們需要處理的數(shù)據(jù)正與日俱增,這就意味著傳統(tǒng)的數(shù)據(jù)處理方法已經(jīng)無法滿足人們的需求了。儀表生產(chǎn)和系統(tǒng)控制要求數(shù)據(jù)具有高度精確性,這些數(shù)字在顯示之前,都必須經(jīng)過一系列的轉(zhuǎn)換,計算以及處理。首先,數(shù)據(jù)會以一種形式經(jīng)過轉(zhuǎn)換器,然后變成另一種新的形式,只有這樣計算機才能對數(shù)據(jù)進行處理和分析。處理數(shù)據(jù)是一個復(fù)雜多變的過程,它的方法并不是單一的,根據(jù)數(shù)據(jù)處理的目標不同,需要選擇不同的數(shù)據(jù)處理方法。例如,有的數(shù)據(jù)需要進行標度轉(zhuǎn)換,但有些數(shù)據(jù)只需要進行簡單計算即可,計算機技術(shù)的不斷進步是為了更好地應(yīng)對人們對數(shù)據(jù)處理新的需要。

計算機數(shù)據(jù)處理技術(shù)的應(yīng)用離不開系統(tǒng),它比傳統(tǒng)的系統(tǒng)更加具有優(yōu)越性:

1)自動更正功能,計算機系統(tǒng)在處理數(shù)據(jù)時,對于計算結(jié)果出現(xiàn)的誤差能夠及時修正,確保結(jié)果的準確度。

2)傳統(tǒng)模擬系統(tǒng)只能進行數(shù)據(jù)的簡單計算,而計算機系統(tǒng)則能夠處理復(fù)雜多變的數(shù)據(jù),其適用范圍和領(lǐng)域更加廣。

3)計算機系統(tǒng)不需要過多的硬件,只需要編寫相應(yīng)的程序就能夠完成數(shù)據(jù)的處理,在節(jié)省空間的同時也降低了數(shù)據(jù)處理的成本。

4)計算機系統(tǒng)特有的監(jiān)控系統(tǒng),能夠隨時監(jiān)測系統(tǒng)的安全性,從而確保數(shù)據(jù)的準確度。

對于不同的數(shù)據(jù),往往需要采用不同的處理方式,處理數(shù)據(jù)的簡單方法包括查表,計算等。除此之外,標度轉(zhuǎn)換,數(shù)字濾波同樣是應(yīng)用十分廣的處理技術(shù)。

3.1 數(shù)據(jù)計算

在各種數(shù)據(jù)處理方法中,計算法是最為簡單的一種,利用現(xiàn)有的數(shù)據(jù)設(shè)置程序,然后直接通過計算得出最終的目標數(shù)據(jù)。一般來說,利用這種方法處理數(shù)據(jù)需要遵循一個過程:首先,求表達式,這是計算法最基本的一步;其次,設(shè)計電路,在此之前必須將轉(zhuǎn)換器的位數(shù)確定下來;最后,利用第一步已經(jīng)求出的表達式運算數(shù)據(jù)。

3.2 數(shù)據(jù)查表

3.2.1 按順序查表格

當(dāng)需要搜索表格中的數(shù)據(jù)時,往往需要按照一定的順序和步驟。首先,明確表格的地址和長度,然后再設(shè)置關(guān)鍵詞,最后按照順序進行搜索。

3.2.2 通過計算查表格

這是一種較為簡單的方法,適用范圍并不廣。只有當(dāng)數(shù)據(jù)之間表現(xiàn)出明顯的規(guī)律或者數(shù)據(jù)之間存在某種關(guān)系時,才能夠使用這種方法查表格。

3.2.3 利用程序查表格

相比于上述的兩種方法,利用程序查表格是一種相對復(fù)雜的方法,但是這種方法的優(yōu)點在于查找效率高,并且準確度高。

3.3 數(shù)據(jù)濾波處理

采集數(shù)據(jù)并不難,但是確保每一個數(shù)據(jù)的真實性卻十分困難,尤其是在工業(yè)系統(tǒng)中,數(shù)據(jù)的測量難以確保絕對準確,因為在測量的過程中,外界環(huán)境對數(shù)據(jù)的影響往往是難以預(yù)估的。為了提高數(shù)據(jù)處理的精確度和準確率,需要借助檢測系統(tǒng)對采集的數(shù)據(jù)進行深加工。盡可能地讓處理的數(shù)據(jù)接近真實的數(shù)據(jù),并且在數(shù)據(jù)采集的過程中最大限度地減少外界因素對其的影響,從而提高計算結(jié)果的準確度。

濾波處理技術(shù)的應(yīng)用首先要確定數(shù)據(jù)的偏差,一般來說,每兩個測量數(shù)據(jù)之間都會存在一定的誤差,首先需要計算數(shù)據(jù)與數(shù)據(jù)之間可能出現(xiàn)的最大誤差。一旦超出這一數(shù)值,可以認定數(shù)據(jù)無效,只有符合偏差范圍內(nèi)的數(shù)據(jù),才能進行下一步的處理。

為了減少由于外界影響導(dǎo)致數(shù)據(jù)失真的情況,利用程序過濾數(shù)據(jù)是很有必要的。濾波技術(shù)有幾種,根據(jù)不同的需要可以選擇相應(yīng)的數(shù)據(jù)處理技術(shù),每一種數(shù)據(jù)濾波技術(shù)都有其適用范圍和優(yōu)點。數(shù)據(jù)濾波技術(shù)包括算術(shù)平均值濾波,加權(quán)平均值濾波,中值濾波,限幅濾波,限速濾波以及其他類型的濾波技術(shù)。

3.4 轉(zhuǎn)換量程和標度

在測量數(shù)據(jù)的過程中,每一種參數(shù)都有相應(yīng)的單位,為了方便數(shù)據(jù)處理,需要使用轉(zhuǎn)換器把數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的信號。標度轉(zhuǎn)換是必不可少的,為了加強系統(tǒng)的管理和監(jiān)測,需要不同單位的數(shù)字量。轉(zhuǎn)換方法包括非線性參數(shù)標度變換,參數(shù)標度變換,量程轉(zhuǎn)換,這幾種轉(zhuǎn)換方法在數(shù)據(jù)處理的過程中較為常見。當(dāng)計算過程遇到困難,可以結(jié)合其他的標度轉(zhuǎn)換方法進行數(shù)據(jù)處理。

3.5 非線性補償計算法

3.5.1 線性插值計算方法

信號的輸入和輸出往往會存在一定的關(guān)系。曲線的斜率和誤差之間存在正相關(guān)關(guān)系,斜率越大,誤差越大。由此可見,這一計算方法僅僅適用于處理變化不大的數(shù)據(jù)。當(dāng)曲線繪制選用的數(shù)據(jù)越多,曲線的準確程度越高,偏差越小。

3.5.2 拋物線計算方法

拋物線計算方法是一種常用的數(shù)據(jù)處理方法,只需要采集三組數(shù)據(jù),就可以連成一條拋物線。相比于直線,拋物線更加接近真實的曲線,從而提高數(shù)據(jù)的準確度。拋物線計算法的過程,只需要求出最后兩步計算中的M值,就能夠直接輸入數(shù)據(jù)得出結(jié)果。

3.6 數(shù)據(jù)長度的處理

當(dāng)輸入數(shù)據(jù)和輸出數(shù)據(jù)的長度不一,需要對其進行轉(zhuǎn)換,使數(shù)據(jù)長度達到一致。由于采集數(shù)據(jù)所使用的轉(zhuǎn)換器和轉(zhuǎn)換數(shù)據(jù)所選擇的轉(zhuǎn)換器不同,因此,當(dāng)輸入位數(shù)大于輸出位數(shù),可以通過移位的方法使位數(shù)變成相同。相反,當(dāng)輸入位數(shù)少于輸出位數(shù)時,可以使用填充的方法將其轉(zhuǎn)換成相同的位數(shù)。

4 結(jié)語

本文對聯(lián)機分析技術(shù)進行了詳細的論述,該技術(shù)的應(yīng)用對于評價教學(xué)效果有著重要的意義。在物理公共課程中,教學(xué)數(shù)據(jù)數(shù)量巨大,如果利用傳統(tǒng)的方法對其進行分析,將會耗費大量的人力物力,而采用OLAP技術(shù)則能更加快速準確地分析處理數(shù)據(jù)。數(shù)據(jù)分析是評估教學(xué)質(zhì)量必經(jīng)的過程,而使用QLAP技術(shù)是為了能夠多層次,全方位地分析各個因素對教學(xué)質(zhì)量的影響,從而更好地改進高校教育中存在的不足。除了分析物理課程數(shù)據(jù),聯(lián)機分析技術(shù)同樣適用于其他課程的數(shù)據(jù)處理和分析。

參考文獻:

[1] Ralph kimball,Margy Ross.The Data Warehouse Toolkit:the Complete Guide to Dimensional Modeling[M]..北京:電子工業(yè)出版社,2003.

第2篇:數(shù)據(jù)分析分析技術(shù)范文

【關(guān)鍵詞】用電信息采集系統(tǒng) 數(shù)據(jù)分析 處理技術(shù)

隨著時間的推移,用電信息采集系統(tǒng)中存儲的數(shù)據(jù)總量會線性遞增,龐大的信息儲備在反映信息愈加全面的同時增加了信息分類和處理的難度,所以其分析和處理技術(shù)需要隨著時代的發(fā)展不斷深化。

1 用電信息采集系統(tǒng)數(shù)據(jù)分析

由于用電信息采集系統(tǒng)內(nèi)的信息會隨著時間的推移而不斷增多,所以需要通過分類處理的形式對龐大的信息量進行逐層處理,這樣才可以提升系統(tǒng)對數(shù)據(jù)庫的處理效率,目前用電信息采集系統(tǒng)以時間為劃分標準,將信息分為以下三類:1類數(shù)據(jù)實時數(shù)據(jù)不具有時間序列屬性,通常只針對其更新而很少查詢,由于數(shù)據(jù)量龐大,其通常只具有15分鐘的實效,總加數(shù)據(jù)、測量點數(shù)據(jù)、終端數(shù)據(jù)是其主要形式,在存儲的過程中應(yīng)根據(jù)其不同的物理對象選擇與其相應(yīng)的存儲表;2類數(shù)據(jù)其主要顯示用電戶在過去一段時間內(nèi)的用電信息,為預(yù)付費管理、用電情況統(tǒng)計等工作提供數(shù)據(jù)支持,其與1類數(shù)據(jù)不同具有時間序列屬性,而且更新少而查詢多,15分鐘至1小時,1日、一個月等都可根據(jù)實際需要作為周期,其在存儲的過程中也可以根據(jù)不同的物理對象,選擇不同的存儲表;3類數(shù)據(jù)包括參數(shù)丟失或變更、回路異常、電能表顯示出現(xiàn)偏差等情況,由于其不同時間的發(fā)生頻率、使用方式等都存在差異,所以在存儲的過程中應(yīng)單獨分表,將用電信息按照屬性進行劃分極大地提升了采集系統(tǒng)的工作效率。

2 用電信息采集系統(tǒng)數(shù)據(jù)處理技術(shù)

用電信息采集系統(tǒng)其要同時對多種通信通道和終端進行管理,從而實現(xiàn)對用電戶用電信息管理、負荷及預(yù)付費控制,所以其并非單一計算機節(jié)點可獨立完成,需要以下技術(shù)輔助其實現(xiàn)如圖1所示。

2.1 集群技術(shù)

主要應(yīng)用于系統(tǒng)中的核心部位,例如數(shù)據(jù)庫、數(shù)據(jù)采集等,其主要是將多個獨立但都處于高速網(wǎng)絡(luò)中的計算機連接成一個整體,并通過單一系統(tǒng)對整體進行管理控制,利用集群技術(shù)可以實現(xiàn)大運量計算,目前主要應(yīng)用的集群技術(shù)主要有主/主和主/從兩種狀態(tài),其主要區(qū)別是當(dāng)一個節(jié)點處于正常工作狀態(tài)時是否需要有另一個節(jié)點處于備用狀態(tài),利用集群技術(shù)大幅度的提升了系統(tǒng)對數(shù)據(jù)的計算能力,從而提升了系統(tǒng)的數(shù)據(jù)處理效率及準確性。網(wǎng)絡(luò)負載均衡技術(shù),在實際操作中系統(tǒng)要處理大量的數(shù)據(jù),用戶等待系統(tǒng)反應(yīng)的時間通常較長,而網(wǎng)絡(luò)負載均衡技術(shù)的出現(xiàn)實現(xiàn)了對大量并發(fā)訪問、數(shù)據(jù)流量合理均等的分配至多臺節(jié)點設(shè)備,從而實現(xiàn)多臺設(shè)備同時進行數(shù)據(jù)處理,使原本復(fù)雜的數(shù)據(jù)處理任務(wù)被合理分化,不僅縮短了處理時間,而且有效的降低了系統(tǒng)在處理過程中出現(xiàn)信道堵塞的概率,提升了系統(tǒng)數(shù)據(jù)處理的性能,在響應(yīng)請求方面得到優(yōu)化。

2.2 內(nèi)存數(shù)據(jù)庫技術(shù)

是優(yōu)化系統(tǒng)數(shù)據(jù)處理能力的重要途徑,內(nèi)存數(shù)據(jù)庫技術(shù)實現(xiàn)了采集的信息直接在內(nèi)存中存儲,從而利用內(nèi)存隨機訪問的特點,在信息讀寫速度方面進行優(yōu)化,使數(shù)據(jù)信息的訪問性能得到提升,此項技術(shù)在數(shù)據(jù)緩存、數(shù)據(jù)算法等方面進行了針對性的設(shè)計,使系統(tǒng)的信息處理速度提升十倍以上,為實時查詢提供了可能,極大地促進了后付費和預(yù)付費的融合,使系統(tǒng)數(shù)據(jù)處理性能得到完善。批量數(shù)據(jù)處理技術(shù),由于在實際工作中由于系統(tǒng)需要對大量的數(shù)據(jù)進行分類處理,逐個信息處理的可行性非常低,需要對大批量數(shù)據(jù)進行集中處理,但在應(yīng)用批量數(shù)據(jù)處理技術(shù)的同時要對數(shù)據(jù)庫的表結(jié)構(gòu)、SQL語句進行優(yōu)化處理并對數(shù)據(jù)庫中的數(shù)據(jù)表合理管理,例如將個體數(shù)據(jù)表的數(shù)據(jù)量限制在2GB以內(nèi),確保其訪問性能不受影響;將數(shù)據(jù)按照分類存儲于不同的磁盤,保證查詢質(zhì)量;在優(yōu)化SQL語句時盡量保證帶有參數(shù)等,只有數(shù)據(jù)庫性能良好,批量數(shù)據(jù)處理技術(shù)才可以應(yīng)用,不然會適得其反。

2.3 SAN存儲技術(shù)

隨著系統(tǒng)采集數(shù)據(jù)量的增加,以服務(wù)器為中心的處理模式會嚴重影響網(wǎng)絡(luò)性能,從而影響系統(tǒng)對數(shù)據(jù)的處理效率,所以將備份和傳輸不占用局域網(wǎng)資源的SAN技術(shù)引入到系統(tǒng)處理中非常具有現(xiàn)實意義,其以光纖通道為途徑,使信息存儲不再受距離和容量的限制,系統(tǒng)的信息采集性能得到有效提升。ODI技術(shù),在實際工作中有時需要對某一類信息進行集中處理,而系統(tǒng)中的數(shù)據(jù)復(fù)雜散落不易處理,所以需要將同類信息按模塊分類存儲,ODI存儲技術(shù)恰好是以模塊或儲存庫為核心而展開的應(yīng)用技術(shù),它將系統(tǒng)的數(shù)據(jù)庫分為一個主存儲庫和多個有關(guān)聯(lián)的工作存儲庫,數(shù)據(jù)處理人員利用ODI存儲技術(shù)可以根據(jù)實際情況制定存儲模塊或?qū)Υ鎯δK內(nèi)部信息進行更改,從而實現(xiàn)批量數(shù)據(jù)處理腳本的集中管理,使批量處理的效率大幅度提升。

3 結(jié)論

目前電力用戶用電信息采集系統(tǒng)不僅要實現(xiàn)準確、全面、及時的采集數(shù)據(jù),而且要高效、準確的對采集的信息進行計算處理,以供相關(guān)部門的查詢和應(yīng)用,所以在優(yōu)化系統(tǒng)存儲空間的同時,要加大系統(tǒng)對數(shù)據(jù)處理的能力。

參考文獻

[1]朱彬若,杜衛(wèi)華,李蕊.電力用戶用電信息采集系統(tǒng)數(shù)據(jù)分析與處理技術(shù)[J].華東電力,2011,12(10):162-166.

[2]董俐君,張芊.數(shù)據(jù)處理與智能分析技術(shù)在用電信息采集系統(tǒng)中的應(yīng)用[J].華東電力,2013,12(27):255-256.

[3]況貞戎.用電信息采集系統(tǒng)中主站采集平臺設(shè)計與實現(xiàn)[D].成都:電子科技大學(xué),2014.

第3篇:數(shù)據(jù)分析分析技術(shù)范文

關(guān)鍵詞:數(shù)據(jù)倉庫;數(shù)據(jù)挖掘;教務(wù)數(shù)據(jù);深度挖掘

中圖分類號:TP393 文獻標識碼:A

1 引言

在信息時代,信息技術(shù)的快速發(fā)展對社會各個領(lǐng)域都產(chǎn)生了一定的影響,在電子商務(wù)中反映尤為突出。對于學(xué)校教務(wù)系統(tǒng)的應(yīng)用相對較晚,但教務(wù)數(shù)據(jù)對學(xué)校而言,是最基本的數(shù)據(jù),這些數(shù)據(jù)的保留是學(xué)校運作的根本。對教務(wù)數(shù)據(jù)的分析也是對學(xué)校教學(xué)效果的評定,能夠從龐大的教務(wù)數(shù)據(jù)中挖掘出更潛在的信息,既是對學(xué)校運行狀況的更深入了解,又有利于學(xué)校對未來發(fā)展方向的決策。

2 教務(wù)管理狀況分析

教務(wù)管理不僅是處理學(xué)校的日常事務(wù),它更重要的作用體現(xiàn)在可以反映學(xué)校的教學(xué)效果和分析學(xué)校培養(yǎng)方向的正確性,并以此幫助學(xué)校向更好的方向發(fā)展。教務(wù)數(shù)據(jù)分析的處理到目前為止經(jīng)歷了人工和計算機處理的兩大階段。

2.1 人工處理階段

為了反映較大范圍教務(wù)情況的整體特征,教務(wù)部門通常要付出龐大的人力和物力收集和分析大量數(shù)據(jù)。這個數(shù)據(jù)的收集通常要經(jīng)歷一個較長的時間,間隔一段時間還必須重復(fù)執(zhí)行。比如開課計劃、學(xué)生成績、教室使用情況等。然而,分析收集來的海量數(shù)據(jù)更是教務(wù)部門頭疼的一件事。

還沒有出現(xiàn)計算機前,光靠人工來處理數(shù)據(jù)有時還會面臨這樣的窘境:上一期的數(shù)據(jù)結(jié)果還沒分析出來,下一期的數(shù)據(jù)收集又要開始了,因此整個數(shù)據(jù)收集和分析工作變得沒有任何意義。另外,有些數(shù)據(jù)需要間隔一段時間重新收集,然后進行短期和長期的分析數(shù)據(jù)。比如成績分析,若按照4年制本科為一個分析周期。首先,每學(xué)期教務(wù)部門要進行一次短期成績分析。其次每學(xué)年教務(wù)部門就需對即將畢業(yè)的本科前4年的所有成績做一次中長期成績分析。然而,如果學(xué)校還需了解長期以來各級學(xué)生的學(xué)習(xí)情況,則還必須知道近10年、20年、50年甚至更長時間的成績發(fā)展趨勢,那么光靠人工去翻閱以前的數(shù)據(jù)就是件很困難的工作了。所以人工處理數(shù)據(jù)階段,有許多教務(wù)數(shù)據(jù)分析工作受到很大限制。

2.2 計算機處理階段

自計算機出現(xiàn)后,許多領(lǐng)域的工作發(fā)生了翻天覆地的變化,教務(wù)管理同樣也不會忽略如此有效的技術(shù)手段。20世紀80年代以來,我國一直關(guān)注信息化在各領(lǐng)域的應(yīng)用,教務(wù)管理信息化的發(fā)展大致經(jīng)歷了以下三個階段:面向數(shù)據(jù)處理的第一代教務(wù)管理、面向信息處理的第二代教務(wù)管理、面向知識處理的第三代教務(wù)管理。在前兩個階段中,許多教務(wù)工作確實提高了效率,但是教務(wù)海量數(shù)據(jù)中隱含的價值仍不能被有效發(fā)掘與利用。正如在一大座金山中,獲取更有價值的黃金還需更細致更有效的清理和挖掘。

雖然在前些年,學(xué)校各級部門具備了一定的信息化基礎(chǔ)設(shè)施,為構(gòu)建信息化教務(wù)系統(tǒng)奠定了基礎(chǔ)。但是,由于缺乏統(tǒng)一的規(guī)劃,學(xué)校各子系統(tǒng)或多或少存在“信息孤島”的問題,也沒有有效的方法從海量數(shù)據(jù)資源中快速挖掘更有價值的知識信息。因此,耗費成本收集的數(shù)據(jù)沒有利用就被棄置了,教務(wù)數(shù)據(jù)分析僅停留在表面。

由于信息技術(shù)的發(fā)展,信息化時代逐漸進入第三展中,即有效應(yīng)用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)挖掘知識。

3 DW和DM技術(shù)

數(shù)據(jù)倉庫(DataWare,即DW)是指一個面向主題的、集成的、非易失的且隨時間變化的數(shù)據(jù)集合,用來支持管理人員的決策[1]。當(dāng)大量的數(shù)據(jù)被整合在一起后,從用戶分析角度來看,使用這些數(shù)據(jù)的手段是多方面和多層次的。面向知識處理的教務(wù)系統(tǒng)應(yīng)能夠自動剔除掉不需要的數(shù)據(jù),按照用戶的要求整合雜亂的數(shù)據(jù)資源,獲取某些可用的屬性。而且,學(xué)校的決策通常是經(jīng)過觀察長期發(fā)展的狀況而制定的。其間,需要分析5年、10年,甚至幾十年的大量相關(guān)數(shù)據(jù)資源。因此,教務(wù)數(shù)據(jù)需要被長期且穩(wěn)定的存儲。在日常收集數(shù)據(jù)和整理數(shù)據(jù)時,利用數(shù)據(jù)倉庫的思想來進行,有利于我們充分發(fā)揮數(shù)據(jù)挖掘技術(shù)進行知識的挖掘。

數(shù)據(jù)挖掘(Data Mining,即DM)是指從大量的數(shù)據(jù)中,抽取出潛在的、有價值的知識(模型或規(guī)則)的過程。數(shù)據(jù)挖掘就是從大量數(shù)據(jù)中提取或“挖掘”知識。

首先,我們要確定數(shù)據(jù)挖掘的對象有哪些。數(shù)據(jù)資源可以從多方面獲得,如系統(tǒng)分析設(shè)計人員向不同范圍的業(yè)務(wù)對象調(diào)研獲得,或反之業(yè)務(wù)對象主動向系統(tǒng)設(shè)分析設(shè)計人員提出;在互聯(lián)網(wǎng)時代,從網(wǎng)絡(luò)中獲得數(shù)據(jù)資源更快更多了。

其次,要有效地應(yīng)用數(shù)據(jù)挖掘技術(shù),就要遵循科學(xué)的應(yīng)用流程。一般的挖掘流程是:(1)確定挖掘?qū)ο螅唬?)數(shù)據(jù)準備;(3)數(shù)據(jù)挖掘,即模式提??;(4)結(jié)果分析,即模式評估。[2]

數(shù)據(jù)挖掘功能用于指定數(shù)據(jù)挖掘任務(wù)中要找的模式類型。數(shù)據(jù)挖掘任務(wù)一般可以分為兩類:描述和預(yù)測。描述性挖掘任務(wù)刻畫數(shù)據(jù)庫中數(shù)據(jù)的一般特性。預(yù)測性挖掘任務(wù)在當(dāng)前數(shù)據(jù)上進行推斷,以進行預(yù)測。數(shù)據(jù)挖掘系統(tǒng)要能夠挖掘多種類型的模式,以適應(yīng)不同的用戶需求或不同的應(yīng)用。數(shù)據(jù)挖掘功能以及它們可以發(fā)現(xiàn)的模式類型包括:class/concept description、Association analysis、Classification and prediction、Clustering、Outlier analysis等。

4 建立面向知識處理的教務(wù)數(shù)據(jù)分析系統(tǒng)

按照上述數(shù)據(jù)挖掘的基本流程,以教務(wù)系統(tǒng)中成績分析為例介紹如何讓教務(wù)系統(tǒng)實現(xiàn)面向知識的處理。

4.1 構(gòu)建教務(wù)系統(tǒng)的數(shù)據(jù)倉庫

這部分主要分為四個任務(wù):確定教務(wù)系統(tǒng)中的數(shù)據(jù)源;Web數(shù)據(jù)的預(yù)處理;多維Web數(shù)據(jù)模式的建立;應(yīng)用OLAP技術(shù)。

4.1.1確定教務(wù)系統(tǒng)中的數(shù)據(jù)源

教務(wù)系統(tǒng)的數(shù)據(jù)主要從兩個方面獲得:

(1)各學(xué)院開課計劃、學(xué)校學(xué)計劃;

(2)教師提交的各門課程的成績。

第一方面的數(shù)據(jù)主要由學(xué)校、各學(xué)院按照培養(yǎng)計劃每學(xué)期提交,包括各專業(yè)班級的課程安排、授課教師、課時、學(xué)分等。這部分數(shù)據(jù)主要以Excel表格形式提交,教務(wù)部門對這部分的數(shù)據(jù)收集與存儲大部分停留在文檔形式。

第二方面的數(shù)據(jù)主要在學(xué)期末由授課教師分專業(yè)班級和課程提交。目前,這部分的數(shù)據(jù)收集有的以紙質(zhì)文檔形式收集,有的以Excel文檔形式收集,也有的實現(xiàn)了數(shù)據(jù)庫收集存儲。

在進行數(shù)據(jù)挖掘之前,首先要將這兩方面的數(shù)據(jù)完全實現(xiàn)數(shù)據(jù)庫收集與存儲。隨著教務(wù)數(shù)據(jù)與日俱增,還需使用數(shù)據(jù)倉庫來管理這些數(shù)據(jù)。

目前,有許多學(xué)校實現(xiàn)了在線登錄成績的信息化。那么如何對龐大的Web數(shù)據(jù)建立數(shù)據(jù)倉庫呢?

4.1.2 Web數(shù)據(jù)的預(yù)處理

通過Web收集的數(shù)據(jù)稱之為原始數(shù)據(jù),管理員可根據(jù)需要用某些字段記錄相關(guān)數(shù)據(jù)。如:專業(yè)班級名稱,教師登錄名,課程名稱,成績比例,分數(shù),提交時間等。對Web數(shù)據(jù)的預(yù)處理包括兩步。第一步:清除噪音,即去掉對知識挖掘無關(guān)的數(shù)據(jù)。第二步:轉(zhuǎn)化數(shù)據(jù),即將原始數(shù)據(jù)按照挖掘需求,通過重新組織或簡單計算轉(zhuǎn)換成規(guī)范模式。

4.1.3多維Web數(shù)據(jù)模式的建立

分為三步進行。第一步,選取維。多維數(shù)據(jù)便于我們從多個角度、多個側(cè)面對數(shù)據(jù)庫中的數(shù)據(jù)進行觀察、分析,以深入了解包含在數(shù)據(jù)中的信息和內(nèi)涵。N維數(shù)據(jù)矩陣用C(A1, A2, . .., Am ,count)模式表示,其中Ai代表第i維,i=1,2,...,n, count是變量,反映數(shù)據(jù)的實際意義。

數(shù)據(jù)單元用r[A1:a1,...,An:an,count]模式表示,即為維Ai選定一個維成員ai,i=l,…,n,這些維成員的組合唯一確定了變量count的一個值。通常,需要了解成績的分布情況,可以選取專業(yè)班級維、時間維、課程維構(gòu)建數(shù)據(jù)矩陣,以形成多維視圖。

第二步,構(gòu)造多維視圖。先選取Date維(按學(xué)期組織)、Class維(按專業(yè)班級組織)用二維形式表示每個專業(yè)班級各學(xué)期的成績狀況。然后加入第三維Course維(按課程組織),進一步構(gòu)建成績分布的三維視圖。視圖顯示的事實是Course_Class_Analyse(課程專業(yè)學(xué)習(xí)情況)。

第三步,創(chuàng)建多維數(shù)據(jù)模式。最流行的數(shù)據(jù)倉庫數(shù)據(jù)模型是多維數(shù)據(jù)模型。最常見的模型范例是星型模式。

4.1.4應(yīng)用OLAP技術(shù)

OLAP,即在線聯(lián)機處理。應(yīng)用OLAP技術(shù)可以很方便地從Web數(shù)據(jù)矩陣中作出一些簡單的結(jié)論性分析,如回答一些問題:(1)哪些專業(yè)班級學(xué)習(xí)情況較好,哪些較差?(2)哪些專業(yè)課程成績較高,哪些較低?我們可以充分利用多維數(shù)據(jù)模型上的OLAP操作,如下鉆(drill-down)、上卷(roll-up)、切片分析(slice)和切塊分析(dice)等技術(shù)對問題進行求解。

4.2 挖掘模式的有效應(yīng)用

應(yīng)用數(shù)據(jù)挖掘技術(shù)可以自動發(fā)現(xiàn)學(xué)生學(xué)習(xí)傾向和專業(yè)發(fā)展趨勢。

4.2.1數(shù)據(jù)挖掘技術(shù)應(yīng)用的范圍

雖然現(xiàn)在已有很多學(xué)校都建立了自己的教務(wù)管理網(wǎng)站,但教職工與學(xué)生僅僅只在Web上進行成績的登錄和查詢。這樣的教務(wù)網(wǎng)站只是提供了收集數(shù)據(jù)的快捷途徑,并沒有從根本上體現(xiàn)本身應(yīng)有的應(yīng)用價值。教務(wù)系統(tǒng)希望能夠從其門戶網(wǎng)站中收集大量原始數(shù)據(jù),并依此發(fā)掘更深入的服務(wù)信息。同時,學(xué)校高層也希望能從教務(wù)系統(tǒng)中發(fā)現(xiàn)學(xué)生的學(xué)習(xí)情況,課程計劃的實施效果等。這些都需要從海量的教務(wù)數(shù)據(jù)中應(yīng)用特定的挖掘模型反映出來?;诖?,對于下一次培養(yǎng)計劃的修訂才有現(xiàn)實的數(shù)據(jù)支撐。

4.2.2應(yīng)用挖掘模式提取和分析知識

根據(jù)不同的應(yīng)用要求,在數(shù)據(jù)挖掘模式中選擇合適的方法進行計算,提取有效數(shù)據(jù),得出知識。對于教務(wù)系統(tǒng)而言,可以應(yīng)用聚類方法確定特定不同成效的學(xué)生與課程的分布,從而識別出一些問題:

(1) 對于某個專業(yè)班級,哪些課程學(xué)習(xí)效果較好;

(2) 對于學(xué)習(xí)效果較好的課程,是因為教學(xué)效果好,還是開課計劃恰當(dāng);

(3) 對比同一門課的不同專業(yè)班級,以輔助各學(xué)院分析培養(yǎng)計劃的適應(yīng)性。

5 結(jié)束語

關(guān)于DW and DW 技術(shù)對教務(wù)數(shù)據(jù)分析的應(yīng)用,還有許多值得繼續(xù)深入研究。但是,不論從哪個方向進行研究,都必須要以提高教務(wù)處理能力為宗旨,讓教務(wù)資源發(fā)揮最大的輔助決策價值。

參考文獻:

[1] Colin White. Data Warehousing: Cleaning and Transforming Data [M], InfoDB, 2002.

[2] 林宇. 數(shù)據(jù)倉庫原理與實踐[M],北京: 人民郵電出版社, 2003.

第4篇:數(shù)據(jù)分析分析技術(shù)范文

一、工程概況

無錫市軌道交通1號線江海路站~火車站站區(qū)間線路長1300m,出江海路站后,在通順橋前以350m(右線360m)曲線半徑向東南偏轉(zhuǎn),于通順橋和廢棄水閘之間下穿慶豐河(區(qū)間下穿段河面寬度22米),再下穿錫澄二村大片居民樓后轉(zhuǎn)至規(guī)劃海澄路,近距離經(jīng)過康橋麗景小區(qū)后線路以400m(右線410m)曲線半徑向西南方向偏轉(zhuǎn),先后下穿慶豐河(區(qū)間下穿段河面寬度27米)、北新河(區(qū)間下穿段河面寬度26.5米)、慶豐集團廠房、慶豐里居委會、慶豐小區(qū),垂直下穿錫滬西路后進入無錫火車站站。線路中線間距為13.0~17.3m。隧道斷面穿越土層大部分為粉質(zhì)粘土、粘土層,部分斷面上部位于粉土夾粉質(zhì)粘土層。

本工程采用一臺Ф6380的土壓平衡盾構(gòu), 在江海路站北端頭左線組裝調(diào)試完成后,向廣石路站推進,推進結(jié)束后調(diào)頭到右線;在廣石路站南端頭再次組裝調(diào)試后,向江海路站推進。

二、監(jiān)測方案的設(shè)計

在地下工程中進行沉降監(jiān)測,絕不是單純地為了獲取信息,而是把它作為施工管理的一個積極有效的手段,因此監(jiān)測數(shù)據(jù)應(yīng)能確切地預(yù)報破壞和變形等未來的動態(tài),施工監(jiān)測是一項系統(tǒng)工程,監(jiān)測工作的成敗與監(jiān)測方法的選取及測點的布置直接相關(guān)。按以下5條原則進行監(jiān)測方案的設(shè)計:

1、可靠性原則2、多層次監(jiān)測原則3、重點監(jiān)測關(guān)鍵區(qū)的原則4、經(jīng)濟合理原則5、方便實用原則

2.1監(jiān)測點的布置

2.1.1地表沉降和隧道沉降

沿兩個盾構(gòu)隧道軸線按5m間距布設(shè)地表沉降測點。同時,按30m間距布設(shè)地表橫向沉陷槽測點,每個斷面約9~12個測點。每個聯(lián)絡(luò)通道在中間各布置一個斷面,每個斷面約9個測點,橫向間距1~7m。在隧道開挖影響范圍內(nèi)(2倍洞徑)的主要地下管線上方地表沿管線軸線按5~10m間距布設(shè)地下管線沉降測點。地表及地下管線沉降監(jiān)測布點應(yīng)使測點樁頂部突出地面5mm以內(nèi)。

2.1.2地面建筑物沉降監(jiān)測

在區(qū)間盾構(gòu)隧道施工影響范圍內(nèi)的房屋承重構(gòu)件或基礎(chǔ)角點、中部及其它構(gòu)筑物特征部位布設(shè)測點。

2.2監(jiān)測頻率和周期

2.2.1監(jiān)測頻率

根據(jù)“無錫市地鐵一號線GD01TJSG-07標區(qū)間設(shè)計方案T-55區(qū)間隧道監(jiān)控量測圖”監(jiān)測范圍及頻率如表5-1。

表監(jiān)測頻率一覽表

在區(qū)間隧道盾構(gòu)出洞前布設(shè)監(jiān)測點,取得穩(wěn)定的測試數(shù)據(jù),在盾構(gòu)出洞后即開始監(jiān)測,30m范圍內(nèi)監(jiān)測頻率保持每天2次。盾構(gòu)正常推進后,監(jiān)測頻率基本保持在每天1次。在整個盾構(gòu)推進施工過程中監(jiān)測頻率可根據(jù)工程需要隨時調(diào)整,以滿足現(xiàn)場施工需要。監(jiān)測測量的周期應(yīng)滿足觀測到測點變形達到相對穩(wěn)定時為止。

2.2.2監(jiān)測周期

本車工程施工監(jiān)測總工期以委托方要求的監(jiān)測開工日期為起點,至隧道施工完畢或施工影響區(qū)域內(nèi)的受影響的建(構(gòu))筑物沉降變形穩(wěn)定為止。沉降變形穩(wěn)定標準:參照《建筑變形測量規(guī)范》JGJ 8-2007相關(guān)內(nèi)容確定,即“當(dāng)最后100d的沉降速率小于0.01~0.04mm/d時可認為已經(jīng)進入穩(wěn)定階段”。

三、監(jiān)測結(jié)果及其分析

根據(jù)以往工程實例,我們把盾構(gòu)施工引發(fā)地表沉降過程劃分為如下五個階段,并根據(jù)這五個階段來對監(jiān)測的數(shù)據(jù)進行整理和分析。

第一階段:盾構(gòu)到達前較遠處盾構(gòu)距離監(jiān)測點20m外時,沉降主要為因盾構(gòu)施工對土層的輕微擾動、路面車輛活荷載碾壓以及地下水位下降引起的固結(jié)沉降。

第二階段:盾構(gòu)到達前較近處盾構(gòu)距離監(jiān)測斷面20~10m時,因盾構(gòu)推力對土體擾動影響的進一步加大、地下水位變化、施工參數(shù)(如土壓、推力等)變化等多方面因素影響,地表產(chǎn)生輕微沉降或隆起。

第三階段:盾構(gòu)掘進階段盾構(gòu)切口到達監(jiān)測點時,因盾構(gòu)刀盤對土體的擾動和盾構(gòu)參數(shù)的設(shè)置共同對其地表沉降造成的影響。

第四階段:盾尾脫離監(jiān)測點,沉降主要為漿液未及時充填、同步注漿量不足、施工中土體應(yīng)力狀態(tài)變化較大等多種因素引起地層損失,這是盾構(gòu)施工過程中產(chǎn)生地表沉降最主要的組成部分。

第五階段:固結(jié)沉降階段由于盾構(gòu)推進中的擠壓作用和盾尾壓漿作用等因素,土體骨架還會發(fā)生持續(xù)較長的壓縮變形。在此土體蠕變過程中產(chǎn)生的地面沉降為施工后期沉降。

3.1縱、橫向地表沉降分析

3.1.1橫向地表沉降分析

經(jīng)過實測數(shù)據(jù)分析,隧道中線上方沉降量最大,沿兩側(cè)逐漸減小,大部分沉降曲線形狀基本符合PECK的正態(tài)分布曲線。如下圖所示:

由上圖分析得出,盾構(gòu)掘進主要影響區(qū)域在隧道軸線8m范圍內(nèi)。沉降槽曲線基本沿隧道軸線點呈典型的正態(tài)分布,在軸線處的沉降值最大,在隧道洞徑范圍是沉降的主要范圍(距軸線4m處的沉降分別是最大沉降的67%、51%、);距軸線4~8m為次要沉降區(qū),距軸線6m處的沉降分別是最大沉降的25%、30%、) 距軸線10m外的沉降量小于1mm,12m外的沉降量小于0.5mm。

3.1.2縱向地表沉降分析

在敞開式掘進情況下,在刀盤切口前方約6m(約1倍隧道直徑)以外,地面基本無沉降跡象,部分出現(xiàn)輕微隆起趨勢(隆起量在2mm左右);在刀盤切口離開監(jiān)測點約8m左右開始產(chǎn)生沉降,刀盤切口離開監(jiān)測點5m至10m(約等于盾構(gòu)機長度9m)是沉降主要發(fā)展階段,這個范圍的地層主要受盾構(gòu)刀盤旋轉(zhuǎn)及開挖面出土卸載影響,以及盾構(gòu)機通過時盾殼對圍巖擾動的影響,沉降量約占總沉降量的80%以上;刀盤切口離開監(jiān)測點13~15m后沉降趨于穩(wěn)定,在這個范圍,盾構(gòu)已通過,對地層的擾動消失,同時,盾尾脫出后產(chǎn)生的圍巖與管片間的建筑空隙得到了盾尾同步注漿的及時同步填充,對地層產(chǎn)生了很好的支撐作用,有效地抑制了地層沉降的進一步發(fā)展。

3.2建筑物的沉降分析

本區(qū)間,盾構(gòu)隧道主要下穿錫澄二村兩棟六層民房,該民房建筑年代久遠,為淺基礎(chǔ)磚混結(jié)構(gòu),施工風(fēng)險較大,這也對沉降監(jiān)測提出了很高的要求。

錫澄二村房屋沉降統(tǒng)計表

盾構(gòu)隧道通過錫澄二村產(chǎn)生的影響非常較小,累計沉降值普遍小于3mm,差異沉降不到1mm。由此可見,如果盾構(gòu)掘進過程中的各項參數(shù)的選擇合理,就能大大降低施工的風(fēng)險,說明是可控的。

3.3沉降與掘進土倉壓力的關(guān)系

(1)掌子面土倉壓力的平衡狀態(tài)變化對開挖面前方的地層影響不大,盾構(gòu)掘進期間土倉壓力總體控制較好。

由掌子面土倉壓力的平衡狀態(tài)變化引起的地表沉降在-3mm左右,沉降數(shù)值普遍很小,說明盾構(gòu)土倉壓力設(shè)置合理。從總體上看,地表絕大多數(shù)表現(xiàn)為下沉,這也說明盾構(gòu)掘進時土倉壓力仍可調(diào)整得大一些。一般情況下,盾構(gòu)土壓壓力的設(shè)置應(yīng)使盾構(gòu)上方的地表有略微隆起為好。

⑵在掘進160米后,根據(jù)監(jiān)測結(jié)果,修正了盾構(gòu)掘進參數(shù)(土倉壓力),建立有效土倉壓力平衡,是控制地層損失、減小地層變位的有效手段。由上圖可見,在同等條件下,土倉壓力增大則地表沉降減小,甚至有略微的隆起,達到了較好的效果。

在城市盾構(gòu)施工比例越來越大的今天,上述認識對于盾構(gòu)隧道沉降監(jiān)測設(shè)計、盾構(gòu)施工等有使用價值。具有一定的優(yōu)勢以及廣闊的應(yīng)用前景。

第5篇:數(shù)據(jù)分析分析技術(shù)范文

在我國經(jīng)濟結(jié)構(gòu)調(diào)整和轉(zhuǎn)型升級的時代背景下,高等學(xué)校通過產(chǎn)學(xué)研合作服務(wù)社會的功能和實現(xiàn)方式迫切需要轉(zhuǎn)型升級。如2015年通過的《中華人民共和國促進科技成果轉(zhuǎn)化法》修訂稿,2016年國務(wù)院出臺的“實施《中華人民共各國促進科技成果轉(zhuǎn)化法》若干規(guī)定等,表明國家對成果轉(zhuǎn)化的高度重視,而技術(shù)合同經(jīng)費作為技術(shù)轉(zhuǎn)移轉(zhuǎn)化的一個重要指標,該指標可以體現(xiàn)一個學(xué)校技術(shù)轉(zhuǎn)移轉(zhuǎn)化的活躍度及市場價值。本文試圖以江蘇涉農(nóng)高校近3年技術(shù)合同經(jīng)費情況以來找到我校與其他高校的差距,并提出方法與對策。

1 近3年統(tǒng)計數(shù)據(jù)(萬元)

數(shù)據(jù)分析:

1)根據(jù)省技術(shù)市場提供的數(shù)據(jù),高校納入統(tǒng)計的學(xué)校共計41所,大部分是理工類的學(xué)?;蚓C合性大學(xué),涉農(nóng)高校共4所,南農(nóng),南林、揚大、江南。綜合3年來看,我們幾年都逐年進步,但和江南大學(xué)和揚州大學(xué)差距還是比較大.在技術(shù)轉(zhuǎn)讓上,我校的數(shù)據(jù)并不落后,但在技術(shù)開發(fā)上差距較大,這點,我們和林大比較相似,主要數(shù)據(jù)貢獻體現(xiàn)在技術(shù)咨詢和技術(shù)服務(wù)上,也體現(xiàn)農(nóng)業(yè)或林業(yè)技術(shù)的公益性強的特點。但我校的技術(shù)轉(zhuǎn)讓又遠超過林大,說明我們科研實力還是遠超對方的。

2)技術(shù)開發(fā)少,一個是項目少,二是單項開發(fā)合同額也少。項目少說明我校參與社會服務(wù)或者說與企業(yè)的合作還是小眾行為的,合同額小說明農(nóng)業(yè)技術(shù)開發(fā)相比工業(yè)技術(shù)來說要價更低,這也是體現(xiàn)了農(nóng)業(yè)技術(shù)商品化的特點。主要原因,可能是我校對于合同科研沒有進行一定的考量。相對于縱向經(jīng)費來說,橫向經(jīng)費不僅難拿而且在項目實現(xiàn)過程中付出時間和其他成本更高。有能力從事社會服務(wù)或進行合同科研的團隊往往優(yōu)先可能會考慮申請縱向項目,而且普通科研教師,往往縱向和橫向機會都很少。

3)從客觀上講,揚大和江南大學(xué)經(jīng)過并校及所在城市的關(guān)系,都已經(jīng)成為綜合性大學(xué),無論在師資、學(xué)科數(shù)及規(guī)模上都超過我們學(xué)校。揚大和江南大學(xué)都有不少理工科的學(xué)科,江南大學(xué)以前更是輕工類學(xué)科強校,除食品學(xué)院外,其余大部都是理工科,而且都擁有科技園。我校目前的發(fā)展方向中世界一流農(nóng)業(yè)大學(xué),行業(yè)性大學(xué)發(fā)展,這點和南林有點相似。

4)起步較晚,重視度不夠。2012年執(zhí)行新的對外服務(wù)管理方法后,我校的合同額無論從數(shù)量和總額上都有了明顯的提高,從2012年占揚大總額1/7,到2014年也占到揚大的1/4左右。但經(jīng)過這兩年運作之后,也有一個明顯的問題,就是后續(xù)無力,既無科技園又無孵化器。

5)在機構(gòu)上,揚大有社會合作與服務(wù)處與科技處科技成果推廣科統(tǒng)共同負責(zé)社會服務(wù)與產(chǎn)學(xué)研工作,科技處主要負責(zé)各類產(chǎn)學(xué)研相關(guān)的項目管理,社會處主要負責(zé)各類平臺的搭建。江南大學(xué)在管理上項目管理主要科研院內(nèi)成果處和江大技術(shù)工程公司,平臺搭建主要在產(chǎn)業(yè)技術(shù)研究院。

2 方法與對策

1)機構(gòu)整合,把產(chǎn)學(xué)研處和成果處進行整合,從成果的源頭進行,實現(xiàn)專利申請、持有、轉(zhuǎn)化一條龍服務(wù)。另外一種模式,推廣與轉(zhuǎn)化一體化。在新成果新技術(shù)的推廣過程,完成轉(zhuǎn)化的過程。

2)在成果轉(zhuǎn)化上,尤其是需要有產(chǎn)出的產(chǎn)學(xué)研合作,就要加強與農(nóng)藥企業(yè)、肥料企業(yè)、飼料企業(yè)、種子企業(yè)、農(nóng)機企業(yè)等合作,這類企業(yè)在生產(chǎn)中能做到標準化、規(guī)?;⒓夹g(shù)保密性強、產(chǎn)品明確、科研投入大、知識產(chǎn)權(quán)交易清晰,技術(shù)投入對于的企業(yè)的經(jīng)營有著明確的影響的。主要是有涉及生產(chǎn)工藝或生產(chǎn)線的農(nóng)資類企業(yè)。

3)要設(shè)立種子基金或者概念證明基金,以解決科研成果與企業(yè)產(chǎn)品開發(fā)之間的“死亡之谷”因為大學(xué)與企業(yè)本質(zhì)的不同,所以大學(xué)和企業(yè)在技術(shù)發(fā)展和推銷階段信息、動機的不對稱以及科學(xué)、技術(shù)和商業(yè)企業(yè)存在的制度距離,構(gòu)成了大學(xué)研究成果走向市場的障礙。這個目前國家主要通過孵化器和科技園及一些配套的政策來解決。但目前高校如果沒有相應(yīng)的孵化器或科技園。可以先通過種子基金來扶持一批有商業(yè)化前景的成果來進行深入開發(fā)。

4)成立涉農(nóng)科技企業(yè)的孵化器。與工業(yè)或其他領(lǐng)域的孵化器相比。涉農(nóng)科技企業(yè)有其獨特的要求。對于土地或?qū)嶒灮赜兄欢ǖ囊蟆,F(xiàn)在工業(yè)項目的孵化器比較多,專門為農(nóng)業(yè)的很少。

5)尤其是大的學(xué)科組,設(shè)立兼職的技術(shù)經(jīng)濟人。進行一系列的培訓(xùn)。可以負責(zé)所在學(xué)科組或?qū)W院的成果挖掘和技術(shù)交易等相關(guān)事務(wù),可以通過工作量或交易額提成的方式進行激勵。

6)繼續(xù)建立技術(shù)轉(zhuǎn)移中心。利用地方的資源進行有效的布點,深入了解地方的企業(yè)科技需求狀態(tài)。篩選有效信息,促進高校教師或?qū)W科團隊與地方及企業(yè)的合作。促進學(xué)??蒲谐晒霓D(zhuǎn)化及獲得更多科研經(jīng)費投入。

7)充分利用網(wǎng)絡(luò)平臺,現(xiàn)在各類技術(shù)交易平臺比較多,要選擇一些比較活躍的、有政府背景平臺,尤其針對農(nóng)業(yè)技術(shù)和農(nóng)業(yè)企業(yè)的更好,作為我們成果轉(zhuǎn)化的有效平臺。

8)轉(zhuǎn)化模式要多樣化。在知識產(chǎn)權(quán)管理方法的允許下,我們要更多以債權(quán)或股權(quán)的方式進行轉(zhuǎn)化。和資產(chǎn)經(jīng)營公司和各類投資公司合作,進行以商業(yè)化為目標的成果轉(zhuǎn)化。

第6篇:數(shù)據(jù)分析分析技術(shù)范文

1應(yīng)用威布爾分布法進行機械零件可靠性試驗數(shù)據(jù)分析

威布爾分布法是當(dāng)下進行機械零件可靠性試驗及數(shù)據(jù)分析常用的方法之一。應(yīng)用威布爾分布法進行機械零件可靠性試驗數(shù)據(jù)分析的研究,主要可以將研究內(nèi)容總結(jié)歸納為以下兩點。1.1威布爾分布法的基本概念。威布爾分步法在當(dāng)下已經(jīng)被全面應(yīng)用于可靠性工程的試驗中。應(yīng)用威布爾分布法,可以實現(xiàn)概率值的有效獲得,進而實現(xiàn)各項數(shù)據(jù)參數(shù)的有效評估,從而為各種壽命試驗的數(shù)據(jù)處理工作的有效開展奠定穩(wěn)定的基礎(chǔ)[1]。威布爾分布法概念中的幾個重要參數(shù)為t、b、tG以及T,分別代表所測試的對象的應(yīng)用年限隨機變量、所測試的對象的形狀特點以及其各項曲線分布情況、所測試的對象的基本位置信息以及其最低應(yīng)用年限和尺度參數(shù)、失效概率為0.632時的特征壽命。威布爾分布法的公式如下:()1bttoTtoFte−−−=−(1)1.2威布爾分布法在機械零件各項參數(shù)估計工作開展中的應(yīng)用。威布爾分布法在機械零件各項參數(shù)估計工作開展中的有效應(yīng)用,主要是借助圖解法和解析法。圖解法的應(yīng)用便捷易行,對于檢測人員的技術(shù)操作熟練程度要求也相對較低,但無法實現(xiàn)對于機械零件各項參數(shù)的精確核算。解析法則可以將先進的計算機技術(shù)全面應(yīng)用于機械零件可靠性試驗數(shù)據(jù)測試工作的開展中,但對于檢測人員的操作方法和技術(shù)性有較高要求。在試驗過程中,若是需要對機械零件的各項參數(shù)進行明確掌控時,建議應(yīng)用解析法,以實現(xiàn)對真實分布情況的可靠掌握[2]。明確威布爾分布法的基本概念后,進行威布爾分布法在機械零件各項參數(shù)估計工作開展中的應(yīng)用研究。在開展機械零件可靠性試驗數(shù)據(jù)評估工作中應(yīng)用威布爾分布法,可以發(fā)揮先進的計算機技術(shù)優(yōu)勢,更加全面地發(fā)揮其優(yōu)勢[3]。

2應(yīng)用回歸分析法進行機械零件可靠性試驗數(shù)據(jù)分析

回歸分析法在當(dāng)下也經(jīng)常被應(yīng)用于機械零件可靠性試驗數(shù)據(jù)分析工作的開展進程。開展回歸分析法在機械零件可靠性試驗數(shù)據(jù)分析中的應(yīng)用研究,主要可以將探究內(nèi)容總結(jié)歸納為以下幾點。2.1回歸分析法的基本概念回歸分析法的應(yīng)用,主要是進行數(shù)據(jù)統(tǒng)計原理應(yīng)用的進一步精確化。應(yīng)用數(shù)據(jù)統(tǒng)計原理,對各項數(shù)據(jù)進行線性處理,建立自變量和因變量之間的相互關(guān)系式,進而可以以回歸方程的形式進行分析內(nèi)容的更加具體的體現(xiàn)。根據(jù)當(dāng)下回歸分析法的具體應(yīng)用情況,主要可以將回歸分析法分為一元回歸分析法和多元回歸分析法兩大類。回歸分析法在應(yīng)用過程中,其方程為:y=bx+a(2)直線上,各點(x,y)到水平線的距離為:21niitybxa=b−−∑(3)2.2回歸分析法在機械零件各項參數(shù)工作開展中的應(yīng)用開展回歸分析法在機械零件各項參數(shù)工作開展進程中的應(yīng)用時,首先應(yīng)當(dāng)明確機械零件各項參數(shù)中的自變量和因變量,建立相應(yīng)的x與y的回歸方程,進而掌握機械零件各項參數(shù)的回歸概念。同時,對于代表機械零件應(yīng)用年限的參數(shù)t進行針對性分析,建立專門的參數(shù)t樣本容量,以實現(xiàn)對機械零件的失效概率和失效年限的有效估計。開展應(yīng)用回歸分析法進行機械零件可靠性試驗數(shù)據(jù)分析的具體研究可知,回歸分析法在機械零件可靠性試驗數(shù)據(jù)分析工作中的應(yīng)用,可以實現(xiàn)對機械零件各項數(shù)據(jù)的變換的線性關(guān)系的有效掌控,進而實現(xiàn)對機械零件各項參數(shù)更加宏觀、精確的掌控[4]。

3應(yīng)用最大似然法開展機械零件可靠性試驗數(shù)據(jù)的分析工作

最大似然法在機械零件可靠性試驗數(shù)據(jù)的分析工作開展進程中的應(yīng)用,可以有效實現(xiàn)機械零件可靠性試驗數(shù)據(jù)分析方式的進一步優(yōu)化。開展最大似然法的具體應(yīng)用研究,主要可以將研究內(nèi)容總結(jié)歸納為以下兩點。3.1最大似然法的基本概念。最大似然法被稱為最大估計法,這一參數(shù)統(tǒng)計法是由德國數(shù)學(xué)家首先提出的。最大似然法的應(yīng)用,可以利用應(yīng)用概率學(xué),通過對被測試對象的隨機抽查,進行整體樣本情況的全面估計。最大似然法的應(yīng)用方法和應(yīng)用原理相對簡單,具有較高的實用性,當(dāng)下也被廣泛應(yīng)用于各項評估工作。3.2最大似然法在機械零件評估工作開展進程中的應(yīng)用。應(yīng)用最大似然法進行機械零件評估工作的全面開展,首先應(yīng)當(dāng)明確機械零件的設(shè)計變量,將SUMT內(nèi)點法應(yīng)用于設(shè)計工作中,可以建立明確的失效年限變量參數(shù)關(guān)系。應(yīng)用過程中,最大似然法要注重數(shù)學(xué)模型的有效應(yīng)用,數(shù)學(xué)模型可表示為:2221311313131min()lnxxnixtxtxFxe=xxxxxx−−=−−−−−∑(4)開展最大似然法在機械零件可靠性試驗數(shù)據(jù)的分析工作開展進程中的應(yīng)用探究,可以實現(xiàn)對評估結(jié)果精確性的進一步分析,從而提升評估結(jié)果的可靠性[5]。

4三種機械零件可靠性試驗數(shù)據(jù)分析方法的總結(jié)

在進行威爾分步法、回歸分析法以及最大似然法三種方法的應(yīng)用研究后,開展三種機械零件可靠性試驗數(shù)據(jù)分析方法總結(jié)工作,根據(jù)具體情況有選擇性地選擇不同的數(shù)據(jù)分析方法,有效提升機械零件數(shù)據(jù)分析工作的實效性。通過分析可知,威爾分步法和回歸分析法具有較高的精確性,而最大似然法則具有較強的操作性。線性參數(shù)的有效應(yīng)用以及計算機繪圖技術(shù)的有效應(yīng)用,可以實現(xiàn)機械零件可靠性試驗數(shù)據(jù)分析結(jié)果的精確性。

5結(jié)語

根據(jù)當(dāng)下機械零件可靠性測試實驗開展的基本狀況,主要是應(yīng)用威布爾分布法進行機械零件可靠性試驗數(shù)據(jù)分析和應(yīng)用回歸分析法。通過對機械零件可靠性試驗數(shù)據(jù)分析以及應(yīng)用最大似然法開展機械零件可靠性試驗數(shù)據(jù)的分析,根據(jù)這三類方法的應(yīng)用情況進行相應(yīng)的評估結(jié)論總結(jié)。機械零件可靠性試驗數(shù)據(jù)分析工作的有效開展,可以有效提升機械零件整體的精確性,促使我國機械行業(yè)獲得更加廣闊的發(fā)展空間和更加理想的發(fā)展前景,從而為我國社會的整體發(fā)展提供更加強大的推動力。

作者:范圍廣 單位:萬向錢潮股份有限公司技術(shù)中心

參考文獻

[1]盧昊.基于矩方法的相關(guān)失效模式機械結(jié)構(gòu)系統(tǒng)可靠性穩(wěn)健設(shè)計[D].沈陽:東北大學(xué),2012.

[2]王新剛.機械零部件時變可靠性穩(wěn)健優(yōu)化設(shè)計若干問題的研究[D].沈陽:東北大學(xué),2010.

[3]張錫清.機械零件可靠性試驗數(shù)據(jù)的參數(shù)估計[J].機械設(shè)計,2016,(2):12-14,45.

第7篇:數(shù)據(jù)分析分析技術(shù)范文

關(guān)鍵詞:試驗數(shù)據(jù)分析 SPC 設(shè)計

中圖分類號:TP274.2 文獻標識碼:A 文章編號:1007-9416(2016)11-0142-01

南京中車浦鎮(zhèn)海泰制動設(shè)備有限公司是主要從事鐵路客車、動車組、城市軌道交通設(shè)備制動系統(tǒng)及其零部件和試驗裝置的研發(fā)、設(shè)計、制造、銷售、修理、租賃及技術(shù)咨詢、試驗檢測和技術(shù)服務(wù)的高新技術(shù)公司。公司現(xiàn)有數(shù)十臺各類非標設(shè)備用于產(chǎn)品的出廠試驗,每臺設(shè)備的試驗類型、試驗參數(shù)規(guī)格以及試驗報告都不相同。

試驗數(shù)據(jù)分析系統(tǒng)的目的就是需要將這些非標設(shè)備的試驗數(shù)據(jù)進行集中統(tǒng)一上傳存儲,并提供統(tǒng)一的查詢以及分析,使管理者或相關(guān)人員能迅速知曉產(chǎn)品性能參數(shù),通過對試驗數(shù)據(jù)的分析,了解產(chǎn)品的生產(chǎn)過程的結(jié)果,實時監(jiān)控產(chǎn)品試驗過程,對階段性產(chǎn)品試驗數(shù)據(jù)進行SPC分析。科學(xué)的區(qū)分出生產(chǎn)過程中產(chǎn)品質(zhì)量的隨機波動與異常波動,從而對生產(chǎn)過程的異常趨勢提出預(yù)警,以便生產(chǎn)管理人員及時采取措施,消除異常,恢復(fù)過程的穩(wěn)定,從而達到提高和控制質(zhì)量的目的。

1 系統(tǒng)整體設(shè)計

系統(tǒng)整體框架結(jié)構(gòu)包括三個部分:基于C/S的試驗臺應(yīng)用配置系統(tǒng) + 數(shù)據(jù)上傳適配器中間件 + 基于B/S的試驗臺數(shù)據(jù)分析系統(tǒng),如圖1所示。

C/S的應(yīng)用配置系統(tǒng)完成對不同類型試驗臺的應(yīng)用配置,配置內(nèi)容包括試驗臺的試驗子項內(nèi)容定義;試驗子項的存儲結(jié)構(gòu)定義;試驗子項的數(shù)據(jù)字典定義;試驗子項的規(guī)格值定義;試驗臺試驗報告單的報表格式及數(shù)據(jù)源定義。

數(shù)據(jù)上傳適配器接口基于配置數(shù)據(jù)庫中的配置實現(xiàn)將不同類型的試驗臺試驗數(shù)據(jù)進行上傳并存儲。

B/S試驗臺數(shù)據(jù)分析系統(tǒng)基于配置數(shù)據(jù)庫的配置,實現(xiàn)對不同類型的試驗臺試驗數(shù)據(jù)進行顯示以及分析。

2 數(shù)據(jù)上傳接口設(shè)計

在試驗過程中,每完成一個試驗項目,則將當(dāng)前試驗項目的試驗結(jié)果信息和參數(shù)信息通過調(diào)用Web Service接口上傳并轉(zhuǎn)儲至服務(wù)器中的數(shù)據(jù)庫中(如果遇到服務(wù)器故障的情況下數(shù)據(jù)本地保存)。

本地試驗數(shù)據(jù)上傳采用windows消息隊列方式。原理如圖2所示。

3 試驗數(shù)據(jù)報表顯示設(shè)計

由于試驗數(shù)據(jù)分析系統(tǒng)需要顯示不同試驗平臺下的試驗數(shù)據(jù)報表。在設(shè)計中需要根據(jù)不同類型的試驗臺定義報表顯示模版,定義模版中的數(shù)據(jù)源,最后將模版和數(shù)據(jù)源進行綁定并進行顯示。設(shè)計結(jié)構(gòu)如圖3所示。

基于XML定義報表模版對應(yīng)的數(shù)據(jù)源。XML文檔格式設(shè)計如下:

4 結(jié)語

本文提出了多樣性試驗平臺數(shù)據(jù)上傳、集中存儲、分析以及報表顯示的設(shè)計解決方案,并對整體系統(tǒng)的構(gòu)架做了詳細的設(shè)計及實現(xiàn),現(xiàn)系統(tǒng)正在穩(wěn)定運行中。系統(tǒng)運行SPC分析圖如圖4所示。

第8篇:數(shù)據(jù)分析分析技術(shù)范文

關(guān)鍵詞:信息化建設(shè);大數(shù)據(jù)分析;煤礦安全決策

通過不斷完善煤礦信息化應(yīng)用,煤礦已具備大數(shù)據(jù)分析應(yīng)用的建設(shè)條件,利用大數(shù)據(jù)分析為煤礦安全生產(chǎn)管理提供相應(yīng)的數(shù)據(jù)支持,對提高生產(chǎn)效率和煤礦安全管理水平,降低煤礦事故發(fā)生概率具有重大意義。

1煤礦信息化建設(shè)

為滿足煤礦安全生產(chǎn)的需要,目前煤礦已有的信息化系統(tǒng)包括井下人員定位系統(tǒng)、瓦斯監(jiān)測系統(tǒng)、通風(fēng)監(jiān)控系統(tǒng)、供電監(jiān)測系統(tǒng)、井下移動通信系統(tǒng)、設(shè)備運輸監(jiān)控系統(tǒng)、放炮作業(yè)監(jiān)控系統(tǒng)、提升機監(jiān)控系統(tǒng)、應(yīng)急廣播系統(tǒng)、排水監(jiān)控系統(tǒng)和視頻監(jiān)視系統(tǒng)等。這些信息化系統(tǒng)在煤礦日常管理、安全生產(chǎn)監(jiān)測和事故調(diào)查工作中發(fā)揮著重要作用?,F(xiàn)階段煤礦信息化系統(tǒng)雖已較為完善,但在數(shù)據(jù)采集、整理、分析應(yīng)用方面仍然存在許多問題:(1)系統(tǒng)之間聯(lián)通性不強。系統(tǒng)之間關(guān)聯(lián)程度不高,僅較少系統(tǒng)之間存在一定的關(guān)聯(lián),大部分系統(tǒng)為獨立運行系統(tǒng)。(2)各系統(tǒng)專業(yè)性較強。大部分系統(tǒng)僅限于極少數(shù)專業(yè)人員使用或個別部門使用,尚未普及或關(guān)注較少。(3)數(shù)據(jù)完整性差。由于系統(tǒng)故障等客觀原因的存在,導(dǎo)致系統(tǒng)數(shù)據(jù)不夠完整,缺失數(shù)據(jù)較多。(4)有效信息時效性差[1]。系統(tǒng)相對獨立,大部分系統(tǒng)均由專業(yè)部室管理,系統(tǒng)狀況或使用情況、監(jiān)測情況大多不能直接或及時到達管理人員或業(yè)務(wù)人員手中,造成信息滯后。(5)系統(tǒng)功能未能充分利用[2]。大部分系統(tǒng)功能只使用了部分或關(guān)鍵的系統(tǒng)功能。(6)數(shù)據(jù)更新維護效率不高。系統(tǒng)的變化管理不到位,部分數(shù)據(jù)需及時更新,但實際情況明顯滯后。(7)系統(tǒng)之間數(shù)據(jù)不一致。為滿足不同需求方的要求,多套系統(tǒng)之間信息內(nèi)容不一致。為解決以上問題,需要借助大數(shù)據(jù)分析手段,集成各個信息化系統(tǒng),采集各系統(tǒng)數(shù)據(jù),進行統(tǒng)一整理、分析,真正將信息化的作用充分發(fā)揮[3]。

2大數(shù)據(jù)分析應(yīng)用規(guī)劃

大數(shù)據(jù)分析需要將煤礦已有的安全監(jiān)測監(jiān)控、人員定位、煤炭產(chǎn)量監(jiān)控、工業(yè)視頻和礦壓監(jiān)測等系統(tǒng)進行集成,并結(jié)合3DGIS(三維地理信息系統(tǒng))技術(shù)進行直觀地展現(xiàn)和交互,實現(xiàn)各業(yè)務(wù)系統(tǒng)綜合監(jiān)控、統(tǒng)一調(diào)度、報警聯(lián)動,并對數(shù)據(jù)進行分析,建立安全評價模型,提高安全管理水平。總體架構(gòu)自下而上分別為數(shù)據(jù)采集層、數(shù)據(jù)傳輸層、數(shù)據(jù)存儲層、大數(shù)據(jù)分析建模層和表現(xiàn)交互層[4],如圖1所示。(1)數(shù)據(jù)采集層是對系統(tǒng)所需實時動態(tài)數(shù)據(jù)和非實時靜態(tài)數(shù)據(jù)兩方面的數(shù)據(jù)進行采集。①非實時靜態(tài)數(shù)據(jù)是各實體的地測信息數(shù)據(jù),即實體的地理位置、長寬高等幾何狀態(tài),采集目的是用來構(gòu)建實體的三維模型,此類數(shù)據(jù)一般可從地測資料中獲取,少部分可人工現(xiàn)場測繪;②實時動態(tài)數(shù)據(jù)是指井下環(huán)境參數(shù)、設(shè)備狀態(tài)和人員位置等的動態(tài)數(shù)據(jù),這類數(shù)據(jù)一般通過傳感器或攝像頭獲取。(2)數(shù)據(jù)傳輸層是將采集到的原始數(shù)據(jù)傳輸至系統(tǒng)進行后續(xù)處理。非實時靜態(tài)數(shù)據(jù)主要通過人工錄入和導(dǎo)入(電子表格),實時動態(tài)數(shù)據(jù)主要通過工業(yè)以太環(huán)網(wǎng)傳輸。礦已有部分系統(tǒng)將傳感器數(shù)據(jù)實時傳輸至井下分站,然后再傳輸至OPC服務(wù)器,這類系統(tǒng)只需從OPC服務(wù)器讀取實時數(shù)據(jù)即可。(3)數(shù)據(jù)存儲層是將得到的原始數(shù)據(jù)進行過濾、解析、轉(zhuǎn)換和存儲。刪除無用或冗余數(shù)據(jù),統(tǒng)一數(shù)據(jù)格式,對數(shù)據(jù)字段和含義進行解析和轉(zhuǎn)換,最終存儲到數(shù)據(jù)倉庫。監(jiān)測數(shù)據(jù)可按統(tǒng)一的OPC協(xié)議獲取方式從各系統(tǒng)的OPC服務(wù)器讀取,根據(jù)廠商提供的數(shù)據(jù)格式進行解析存儲。(4)大數(shù)據(jù)分析建模層是對數(shù)據(jù)倉庫中的數(shù)據(jù)分析和建模,為上層功能提供理論模型和算法支持。①三維建模功能,利用成熟的三維建模軟件,根據(jù)采集到的實體對象的靜態(tài)數(shù)據(jù)進行建模,最終形成礦區(qū)整體的三維模型;②空間分析是對于地理空間現(xiàn)象的定量研究,在三維建?;A(chǔ)上對點、線、面等地理實體進行分析,進行幾何量算、最短路徑計算等;③預(yù)警模型[5],建立煤礦安全統(tǒng)一預(yù)警指標體系和模型,實現(xiàn)預(yù)警信息的智能分析與及時推送,包括煤與瓦斯突出預(yù)警模型、自然發(fā)火預(yù)警模型、水害預(yù)警模型、沖擊地壓預(yù)警模型;④聯(lián)動模型是傳感器和各設(shè)備之間的關(guān)聯(lián)配置,實現(xiàn)各系統(tǒng)間的關(guān)聯(lián)展示;⑤風(fēng)險評價分析模型能實現(xiàn)對礦井和下屬各部門的總體安全評價與考核;⑥態(tài)勢預(yù)測分析是運用云計算、數(shù)學(xué)、統(tǒng)計學(xué)理論,充分利用海量樣本數(shù)據(jù)(歷史數(shù)據(jù)),對安全形勢進行預(yù)測。(5)表現(xiàn)交互層是對系統(tǒng)功能進行展現(xiàn)和交互,可直接從數(shù)據(jù)庫中獲取數(shù)據(jù)進行統(tǒng)計分析,也可對大數(shù)據(jù)分析結(jié)果進行展示。在三維建模的基礎(chǔ)上,實現(xiàn)各專業(yè)的綜合信息展示,直觀了解自身關(guān)注的重點實體和狀態(tài)信息。對重要設(shè)備、傳感器等實體可進行交互查看,達到與到現(xiàn)場相似的效果;在安全評價模型的支持下,展示各實體發(fā)生危險的理論值,協(xié)助決策;在預(yù)警模型的支持下,當(dāng)發(fā)現(xiàn)傳感器的數(shù)值超過設(shè)置的閾值時,系統(tǒng)進行聲光報警,并通過短信或微信方式通知相關(guān)人員;當(dāng)發(fā)生險情時,根據(jù)人員定位信息,可規(guī)劃避災(zāi)線路,統(tǒng)一調(diào)度救援;對數(shù)據(jù)進行統(tǒng)計,可導(dǎo)出各專業(yè)相應(yīng)的電子圖表;充分利用碎片化時間的優(yōu)勢,將PC端的部分功能同步到移動端(如安全環(huán)境監(jiān)測、人員定位、產(chǎn)量監(jiān)控、綜合查詢等),通過終端APP實現(xiàn)移動查看。

3系統(tǒng)建設(shè)預(yù)期效果

(1)實現(xiàn)礦井安全管理的綜合化和可視化。將礦井安全管理中的元素整合在一起,實現(xiàn)礦井各個生產(chǎn)環(huán)節(jié)的可視化,分析整個生產(chǎn)鏈條上的數(shù)據(jù),以識別生產(chǎn)問題、管理問題、質(zhì)量問題、跟蹤生產(chǎn)和安全。(2)安全管理信息的動態(tài)化管理,即時報警、信息推送。將一部分PC端的功能開發(fā)到移動端,可隨時隨地查詢和接收安全信息,掌握礦井安全生產(chǎn)狀況。(3)實現(xiàn)自定義配置。根據(jù)礦井安全生產(chǎn)管理的實際狀況,配置重點關(guān)注信息。例如雨季可重點顯示水文監(jiān)測信息,對于管理層可顯示礦井宏觀性指標信息和異常信息,對專業(yè)人員可顯示本專業(yè)相關(guān)信息。(4)實現(xiàn)應(yīng)急聯(lián)動。當(dāng)某一系統(tǒng)警戒值超過規(guī)定閾值即出現(xiàn)緊急情況時,則相關(guān)聯(lián)的系統(tǒng)、設(shè)備進行相關(guān)動作。(5)按系統(tǒng)、時間段進行數(shù)據(jù)統(tǒng)計分析,圖形化顯示,為領(lǐng)導(dǎo)層提供安全管理決策依據(jù)。。(6)通過三維建模,實現(xiàn)不同模式的場景展示。(7)提高工作效率。用戶只需要登錄一次就可以訪問所有集成的業(yè)務(wù)系統(tǒng)。數(shù)字化與自動化可使操作人員和技術(shù)人員快速獲取重要信息,輕松管理關(guān)鍵數(shù)據(jù),加快決策制定、故障排除,并提升設(shè)備性能與效率。

第9篇:數(shù)據(jù)分析分析技術(shù)范文

理性選擇理論對行為主體“認知”問題的學(xué)術(shù)處理,從“經(jīng)濟人”到“理性經(jīng)濟人”并沒有顯著的變化。古典經(jīng)濟學(xué)框架下的理性選擇理論以完全信息假設(shè)為前提,將行為主體(個人)界定為無本質(zhì)差異和不涉及個體間行為互動,不受認知約束的單純追求自身福利的“經(jīng)濟人”(約翰·伊特韋爾等,1996)。新古典經(jīng)濟學(xué)的理性選擇理論將行為主體界定為“理性經(jīng)濟人”,它同樣以完全信息假設(shè)為前提,研究了被古典經(jīng)濟學(xué)忽略的選擇偏好,通過對“偏好的內(nèi)在一致性”的解析,論證了個體能夠得知選擇結(jié)果的抽象認知(Von Neumann and Morgenstern,1947;Arrow and Debreu,1954)。這里所說的抽象認知,是指行為主體沒有經(jīng)歷具體認知過程而直接關(guān)聯(lián)于效用函數(shù)的一種認知狀態(tài),這種狀態(tài)在新古典理性選擇理論中的存在,表明“認知”是被作為外生變量處理的。

現(xiàn)代經(jīng)濟學(xué)的理性選擇理論開始嘗試將“認知”作為內(nèi)生變量來研究。現(xiàn)代主流經(jīng)濟學(xué)從人的有限計算能力、感知、意志、記憶和自控能力等方面研究了認知形成及其約束(Salvatore, 1999;Schandler,2006;Rubinstein,2007),認為認知是介于偏好與效用之間,從而在理論研究上處于不可逾越的位置,只有對認知進行研究,對偏好和效用的研究才能接近實際。現(xiàn)代非主流經(jīng)濟學(xué)注重于運用認知心理學(xué)來研究人的認知形成及其約束(Kahneman and Tversky,1973,1974,1979;Smith,1994),它通過實驗揭示了一些反映認知心理進而影響選擇行為的情景,如確定性效應(yīng)、錨定效應(yīng)、從眾行為、框架依賴、信息存疊等,以論證傳統(tǒng)理論忽視認知分析而出現(xiàn)的理論與實際之間的系統(tǒng)性偏差。

但是,經(jīng)濟學(xué)理性選擇理論對認知的分析和研究,是在預(yù)先設(shè)定規(guī)則的建構(gòu)理性框架內(nèi)進行理論演繹和推理的,它們對認知的解釋,通常表現(xiàn)為一種規(guī)則遵循。例如,新古典理性選擇理論關(guān)注個體應(yīng)怎樣符合理性(最大化)的選擇,而不是關(guān)注個體的實際選擇,它對認知的學(xué)術(shù)處理是從屬于效用最大化的(Harsanyi,1977)?,F(xiàn)性選擇理論所關(guān)注的,或是在忽略認知的基礎(chǔ)上建立解釋和預(yù)測實際選擇的理性模型來說明實現(xiàn)效用最大化的條件,以闡釋個體如何選擇才符合理性(Edgeworth,1981);或是通過行為和心理實驗來解說實際選擇的條件配置,以揭示實際選擇的效用函數(shù)(Kahneman and Tversky,1973,1974,1979;Smith,1994),因而對認知的學(xué)術(shù)處理同樣是從屬于效用最大化的。基于選擇的結(jié)果是效用,而認知與偏好都內(nèi)蘊著效用形成的原因,我們可以認為,經(jīng)濟學(xué)在將個人追求效用最大化視為公理的同時,也在相當(dāng)大的程度上表明理性選擇理論對效用函數(shù)的描述和論證,不是依據(jù)數(shù)據(jù)分析而是一種通過理論預(yù)設(shè)、判斷和推理得出的因果思維模式。

因果思維模式在信息完全和不完全情況下的效應(yīng)是不同的。在信息不完全狀態(tài)下,如果研究者以信息完全預(yù)設(shè)為分析前提,依據(jù)自己掌握的部分信息對問題研究做出因果邏輯判斷和推論,則其不一定能得到正確的認知。在信息完全狀態(tài)下,研究者不需要有預(yù)設(shè)的分析假設(shè),也不需要依賴邏輯判斷和推論,而是可以通過數(shù)據(jù)高概率地獲取正確的認知。經(jīng)濟學(xué)的信息完全假設(shè)對認知研究的影響是廣泛而深刻的。例如,新古典經(jīng)濟學(xué)假設(shè)選擇者擁有完全信息,能夠?qū)崿F(xiàn)效用最大化,它對偏好與認知以及認知與效用之間因果關(guān)系的邏輯處理,是通過可稱之為屬于該理論之亞層級預(yù)設(shè)的“給定條件約束”實現(xiàn)的(信息完全假設(shè)是第一層級預(yù)設(shè))。在該理論中,偏好被規(guī)定為是一種處于二元化的非此即彼狀態(tài),認知在“選擇者知曉選擇結(jié)果(效用)”這一亞層級預(yù)設(shè)下被跳越。很明顯,這種因果思維模式有助于使其建立精美的理性選擇理論體系,但由于沒有對認知階段作出分析,它很容易嚴重偏離實際。

現(xiàn)代主流經(jīng)濟學(xué)的理性選擇理論偏離現(xiàn)實的程度有所降低,原因在于開始重視認知的研究。半個多世紀以來的經(jīng)濟理論研究文獻表明,現(xiàn)代主流經(jīng)濟學(xué)的理性選擇理論正在做逐步放棄完全信息假設(shè)的努力,它對偏好與認知以及認知與效用之間因果關(guān)系的邏輯處理,是在質(zhì)疑和批評新古典經(jīng)濟學(xué)偏好穩(wěn)定學(xué)說的基礎(chǔ)是進行的,該理論用不穩(wěn)定偏好取代偏好的內(nèi)在一致性,解說了認知的不確定性,以及不完全信息和心理活動變動等如何對認知形成約束,以此質(zhì)疑和批評新古典經(jīng)濟學(xué)的期望效用函數(shù)理論,并結(jié)合認知分析對個體選擇的效用期望展開了深入的討論。相對于新古典經(jīng)濟學(xué)的理性選擇理論,雖然現(xiàn)代主流經(jīng)濟學(xué)的理性選擇理論仍然是因果思維模式,但它有關(guān)偏好與認知以及認知與效用之因果鏈的分析銜接,明顯逼近了實際。

現(xiàn)代非主流經(jīng)濟學(xué)的理性選擇理論不僅徹底放棄了完全信息假設(shè),而且徹底放棄了主流經(jīng)濟學(xué)中隱性存在的屬于新古典理論的某些“給定條件約束”。具體地講,它對偏好與認知以及認知與效用之間因果關(guān)系的論證,不是基于純理論層次的邏輯分析,而是從實驗過程及其結(jié)果對這些因果關(guān)系做出解說。至于效用最大化,該理論則認為認知與效用最大化的關(guān)聯(lián),并不像先前理論描述的那樣存在直接的因果關(guān)系。現(xiàn)代非主流理性選擇理論通過實驗得出一個試圖取代傳統(tǒng)效用函數(shù)的價值函數(shù)(Kahneman and Tversky,1979),該函數(shù)體現(xiàn)了一種以實驗為分析底蘊的不同于先前理論的因果思維模式,開啟了以實驗數(shù)據(jù)作為解析因果關(guān)聯(lián)的理論分析先河。但由于現(xiàn)代非主流理性選擇理論畢竟還是一種因果思維模式,因而同先前理論一樣,在理論建構(gòu)上它仍然具有局限性。

從理論與實踐的聯(lián)系看,經(jīng)濟學(xué)理性選擇理論的因果思維模式之所以具有局限性,乃是因為它用于分析的信息是不完全和不精確,甚至有時不準確,以至于造成認知不正確和決策失誤。當(dāng)研究者以不準確或不精確的信息來探尋因果關(guān)系時,極有可能致使認知出現(xiàn)偏差;而當(dāng)認知出現(xiàn)偏差時,理論研究和實際操作就會出問題。誠然,因果思維模式本身并沒有錯,但問題在于,單純從現(xiàn)象形態(tài)或單純從結(jié)果所做出的理論判斷和推論,不足以讓研究者揭示真實的因果關(guān)系。人們對因果關(guān)系的理解過程伴隨著認知的形成過程,在非數(shù)據(jù)支持的因果思維模式存在局限性的情況下,經(jīng)濟學(xué)家依據(jù)這種模式所構(gòu)建的理性選擇理論,難以得到符合實際的認知理論。那么,在未來世界是什么影響和決定認知呢?人類認知有沒有可能達到準確化呢?我們把目光聚焦于大數(shù)據(jù),或許能夠找到問題的答案。

二 、運用大數(shù)據(jù)能獲得正確認知嗎?

在迄今為止的經(jīng)濟理論研究文獻中,經(jīng)濟指標或行為指標所選用的樣本數(shù)據(jù),不是互聯(lián)網(wǎng)和人工智能時代所言的大數(shù)據(jù)。大數(shù)據(jù)具有極大量、多維度和完備性等特征,極大量和完備性表明大數(shù)據(jù)有可能提供完全信息,多維度意味著信息可以通過大數(shù)據(jù)的相關(guān)性得到甄別和處理。廣而論之,人類的行為活動表現(xiàn)為一個龐大的數(shù)據(jù)堆積,個別行為所產(chǎn)生的數(shù)據(jù)只是這個龐大數(shù)據(jù)的元素形式。如果我們以人們的投資和消費活動作為考察對象,對大數(shù)據(jù)蘊含的因果關(guān)系以及由此得出的認知進行分析,那么,我們可認為投資和消費不僅在結(jié)果上會產(chǎn)生大數(shù)據(jù),而且在運作過程中也會產(chǎn)生大數(shù)據(jù)。換言之,投資行為和消費行為在“結(jié)果”上顯示極大量數(shù)據(jù)的同時,也在“原因”上留下了極大量數(shù)據(jù)讓人們?nèi)プ匪?。因此,人類要取得因果關(guān)系的正確認知,離不開大數(shù)據(jù),而在樣本數(shù)據(jù)基礎(chǔ)上經(jīng)由判斷和推理得出的針對因果關(guān)系的認知,至少是不全面的,它不足以作為人們投資和消費選擇的科學(xué)依據(jù)。

1、運用大數(shù)據(jù)分析因果關(guān)系的條件配置

人類認知的形成離不開因果關(guān)系分析,但運用大數(shù)據(jù)來分析因果關(guān)系以求獲取正確的認知,必須具備以下條件配置:1、移動設(shè)備、物聯(lián)網(wǎng)、傳感器、社交媒體和定位系統(tǒng)等的覆蓋面要足夠大,以便能搜取到極大量和完備性的數(shù)據(jù);2、需要探索對極大量(海量)數(shù)據(jù)的算法,能夠?qū)Υ髷?shù)據(jù)進行分類、整合、加工和處理;3、需要厘清和區(qū)別數(shù)據(jù)的不同維度及權(quán)重,以至于能夠運用大數(shù)據(jù)來甄別因果關(guān)系的內(nèi)在機理。顯然,人類從兩百年前的工業(yè)革命到今天的信息革命,對數(shù)據(jù)的搜集、整合、加工和處理還不全然具備以上的配置條件,人類運用大數(shù)據(jù)來分析因果關(guān)系,還剛剛處于起步階段。

聯(lián)系經(jīng)濟學(xué)理論看問題,經(jīng)濟學(xué)家分析投資行為和消費行為以及對其因果關(guān)系的研究,主要是在抽象理論分析基礎(chǔ)上運用歷史數(shù)據(jù)來完成的。其實,對投資行為和消費行為的研究,不能只是從結(jié)果反映的數(shù)據(jù)來考量,即不能只是局限于歷史數(shù)據(jù)分析,還需要從即時發(fā)生的數(shù)據(jù),乃至于對未來推測的數(shù)據(jù)展開分析。這可以理解為是運用大數(shù)據(jù)思維來研究經(jīng)濟問題的真諦。從大數(shù)據(jù)觀點看問題,投資和消費的因果關(guān)系應(yīng)該是歷史數(shù)據(jù)流、現(xiàn)期數(shù)據(jù)流和未來數(shù)據(jù)流等三大部分構(gòu)成的。經(jīng)濟學(xué)實證分析注重的是歷史數(shù)據(jù)流,很少涉及現(xiàn)期數(shù)據(jù)流,從未考慮過未來數(shù)據(jù)流,因此,現(xiàn)有經(jīng)濟理論文獻的實證分析以及建立其上的規(guī)范分析,很難全面反映或揭示經(jīng)濟活動的真實因果關(guān)系。

2、未來幾十年大數(shù)據(jù)揭示因果關(guān)系的可行性

在互聯(lián)網(wǎng)悄然改變?nèi)祟惤?jīng)濟、政治和文化生活的當(dāng)今社會,互聯(lián)網(wǎng)的發(fā)展歷史可理解為經(jīng)歷了三個階段:從前期“人與信息對話”的1.0版本,經(jīng)由中期“信息與信息對話”的2.0版本,近期正走向“信息與數(shù)字對話”的3.0版本,互聯(lián)網(wǎng)版本的不斷升級是大數(shù)據(jù)運用范圍不斷擴大的結(jié)果,這是問題的一方面。另一方面,隨著互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)以及物聯(lián)網(wǎng)技術(shù)等的廣泛運用,人類各種活動的數(shù)據(jù)將極大量地被搜集,人們行為的因果關(guān)系也會以迂回方式通過數(shù)字關(guān)系顯露出來。特別地,若互聯(lián)網(wǎng)在將來發(fā)展成“數(shù)字與數(shù)字對話”的4.0版本,這樣的發(fā)展方向則明顯預(yù)示著數(shù)字關(guān)系將取代因果關(guān)系,或者說,數(shù)據(jù)思維將取代因果思維,人類將全面進入大數(shù)據(jù)和人工智能時代。

如果我們把互聯(lián)網(wǎng)版本的不斷升級以及大數(shù)據(jù)運用范圍的無邊界擴大,看成是未來幾十年運用大數(shù)據(jù)來分析因果關(guān)系的重要配置條件,那么,如何對大數(shù)據(jù)的整合、分類、加工和處理,以及如何通過大數(shù)據(jù)的完備性和相關(guān)性來獲取因果關(guān)系的真實信息,則是另外兩個重要的配置條件。工業(yè)革命后的人類科學(xué)文明對因果關(guān)系揭示的主要方法和路徑,是先利用掌握的信息再通過抽象思維建立復(fù)雜模型,然后在實驗室通過試錯法來設(shè)置能反映因果關(guān)系的參數(shù)使模型具有操作性;但這種方法和路徑涉及的數(shù)據(jù),是樣本數(shù)據(jù)而不是大數(shù)據(jù)。在大數(shù)據(jù)和人工智能時代,智慧大腦是使用“數(shù)據(jù)驅(qū)動法”來設(shè)置模型和參數(shù)的(吳軍,2016)。具體地講,是用云計算集約化及其運算模式來整合、分類、加工和處理大數(shù)據(jù),通過數(shù)據(jù)之間的相關(guān)性來探尋在樣本數(shù)據(jù)基礎(chǔ)上無法判斷和推論的信息;同時,對模型的處理,不是建立復(fù)雜模型而是建立許多簡單模型,并通過數(shù)以萬計的計算機服務(wù)器對模型進行優(yōu)化和設(shè)定相應(yīng)的參數(shù),以至于完完全全地運用大數(shù)據(jù)來揭示因果關(guān)系。

有必要說明的是,數(shù)據(jù)驅(qū)動法使用的數(shù)據(jù)不僅包括“行為數(shù)據(jù)流”,而且在某些特定場景中,還包括“想法數(shù)據(jù)流”;前者是指歷史數(shù)據(jù)和當(dāng)前發(fā)生的數(shù)據(jù),后者是指從已知數(shù)據(jù)的相關(guān)性所推測的未來數(shù)據(jù)。社會物理學(xué)認為,人們實際行為與“想法流”之間有著可以通過大數(shù)據(jù)分析而得到的可靠數(shù)量關(guān)系,這種關(guān)系會通過互聯(lián)網(wǎng)成為一種改變?nèi)藗冞x擇行為的重要因素(阿萊克斯?彭特蘭,2015)。誠然,在未來幾十年,數(shù)據(jù)驅(qū)動法是否能成功地成為解析因果關(guān)系的有效方法,尚有待于大數(shù)據(jù)運用的實踐,特別是有待于它在人工智能運用上之成效的檢驗。不過,數(shù)據(jù)驅(qū)動法作為解析因果關(guān)系的一種重要方法,無疑是智慧大腦的人機結(jié)合在大數(shù)據(jù)思維上的重要突破,它至少在如何展開大數(shù)據(jù)思維上打開了解析因果關(guān)系的窗口。

3、運用大數(shù)據(jù)分析因果關(guān)系所獲取的認知,包括對歷史數(shù)據(jù)分析的歷史認知,對現(xiàn)期數(shù)據(jù)分析的現(xiàn)期認知,以及推測未來數(shù)據(jù)而形成的未來認知

經(jīng)濟學(xué)家運用大數(shù)據(jù)來研究經(jīng)濟現(xiàn)象的因果關(guān)系,對經(jīng)濟現(xiàn)象原因和結(jié)果關(guān)聯(lián)的解讀,只有以極大量、多維度和完備性的數(shù)據(jù)為依據(jù),才是大數(shù)據(jù)意義上的思維。大數(shù)據(jù)思維較之于傳統(tǒng)邏輯思維,最顯著的特征是它可以通過對不同維度數(shù)據(jù)之間相關(guān)性的分析,得到比傳統(tǒng)邏輯思維要精準得多的信息。這里所說的精準信息,是指由大數(shù)據(jù)規(guī)定且不夾帶任何主觀判斷和推測的信息。例如,經(jīng)濟學(xué)家要得到特定時期某類(種)產(chǎn)品的投資和消費的認知,其大數(shù)據(jù)思維過程如下:1、搜集、整理和分類前期該類產(chǎn)品的投資和消費的極大量和完備性的數(shù)據(jù);2、加工和處理業(yè)已掌握的數(shù)據(jù),并在結(jié)合利潤收益率、投資回收期、收入水平和物價水平等的基礎(chǔ)上解析這些不同緯度的數(shù)據(jù);3、根據(jù)不同緯度數(shù)據(jù)的相關(guān)性,獲取該類產(chǎn)品投資和消費的精準信息,從而得出如何應(yīng)對該產(chǎn)品投資和消費的認知。當(dāng)然,這只是在梗概層面上對運用大數(shù)據(jù)分析而獲取認知的解說,現(xiàn)實情況要復(fù)雜得多。

然則,現(xiàn)有的關(guān)于投資和消費的模型分析以及建立其上的實證分析,主要是以非大數(shù)據(jù)的歷史數(shù)據(jù)作為分析藍本的,因此嚴格來講,經(jīng)濟學(xué)對投資和消費的因果關(guān)系分析所形成的認知,屬于典型的對歷史數(shù)據(jù)分析所形成的歷史認知。眾所周知,自經(jīng)濟理論注重實證分析以來,一直存在著如何“從事后評估走向事前決策”問題的討論。由于經(jīng)濟學(xué)家對投資和消費展開實證分析所使用的數(shù)據(jù),幾乎完全局限于(樣本)歷史數(shù)據(jù),這便導(dǎo)致對投資和消費的因果關(guān)系分析對現(xiàn)期認知和未來認知的缺位,它不能解決“從事后評估走向事前決策”問題。國內(nèi)一些著名的成功人士指責(zé)經(jīng)濟學(xué)家不能解決實際問題。在我們看來,不熟悉大數(shù)據(jù)的成功人士的這種指責(zé)是可以理解的,但深諳大數(shù)據(jù)的成功人士帶有調(diào)侃風(fēng)味的指責(zé)就不公允了。經(jīng)濟學(xué)家要在理論上立竿見影地解決實際問題,必須能得到現(xiàn)期數(shù)據(jù)和未來數(shù)據(jù)(而不僅僅是歷史數(shù)據(jù)),這需要計算機學(xué)家的配合和支持,否則便不能在精準信息的基礎(chǔ)上分析投資和消費的因果關(guān)系,但經(jīng)濟學(xué)家又不是計算機學(xué)家,因此,經(jīng)濟理論的科學(xué)化需要大數(shù)據(jù)挖掘、搜集、整合、分類、加工、處理、模型和參數(shù)設(shè)置、云計算等技術(shù)及其手段的充分發(fā)展。

歷史數(shù)據(jù)是存量,目前計算機對其處理的能力已綽綽有余,難點是在于模型和參數(shù)設(shè)置;現(xiàn)期數(shù)據(jù)是無規(guī)則而難以把控的流量,對這種流量數(shù)據(jù)的挖掘、搜集、整合、分類、加工和處理,取決于移動設(shè)備、物聯(lián)網(wǎng)、傳感器、社交媒體和定位系統(tǒng)的覆蓋面,以及云計算的集約化的運算能力;未來數(shù)據(jù)是一種展望流量,它依賴于對歷史數(shù)據(jù)和現(xiàn)期數(shù)據(jù)的把握而通過大數(shù)據(jù)思維來推測。如果說經(jīng)濟學(xué)家對投資和消費的因果分析以及由此產(chǎn)生的認知,主要取決于歷史數(shù)據(jù)和現(xiàn)期數(shù)據(jù),那么,解決“從事后評估走向事前決策”問題,既要依賴于歷史數(shù)據(jù)和現(xiàn)期數(shù)據(jù),也離不開未來數(shù)據(jù)。也就是說,在“歷史數(shù)據(jù) + 現(xiàn)期數(shù)據(jù) + 未來數(shù)據(jù) = 行為數(shù)據(jù)流 + 想法數(shù)據(jù)流”的世界中,經(jīng)濟學(xué)家要解決實際問題,其理論思維和分析手段都受制于大數(shù)據(jù)思維,經(jīng)濟學(xué)家運用大數(shù)據(jù)分析因果關(guān)系而得到正確認知的前提條件,是必須利用歷史數(shù)據(jù)、現(xiàn)期數(shù)據(jù)和未來數(shù)據(jù)以獲取精準信息。

就人類認知形成的解說而論,現(xiàn)有的社會科學(xué)理論是以信息的搜集、整理、加工、處理、判斷和推論,作為分析路徑來解釋認知形成的。當(dāng)認知被解釋成通過數(shù)據(jù)的挖掘、搜集、整合、分類、加工和處理而形成,對認知形成的解釋,就取得了大數(shù)據(jù)思維的形式。大數(shù)據(jù)思維是排斥判斷和推論的,它否定一切非數(shù)據(jù)信息,認為產(chǎn)生精準信息的唯一渠道是大數(shù)據(jù)。在現(xiàn)有的社會科學(xué)理論中,經(jīng)濟學(xué)的理性選擇理論對人類認知的分析和研究具有極強代表性,經(jīng)濟學(xué)家對投資選擇和消費選擇的解釋,便是理性選擇理論的代表性運用?;谌祟愓J知形成和變動的一般框架在很大程度上與理性選擇理論有關(guān)動機、偏好、選擇和效用等的分析結(jié)構(gòu)有很強的關(guān)聯(lián),我們可以結(jié)合這個理論來研究大數(shù)據(jù)思維下人們對經(jīng)濟、政治、文化和思想意識形態(tài)等的認知變動。事實上,經(jīng)濟學(xué)關(guān)于動機、偏好、選擇和效用等關(guān)聯(lián)于認知的分析,存在著一種可以通過對大數(shù)據(jù)思維的深入研究而得以拓展的分析空間,那就是大數(shù)據(jù)思維會導(dǎo)致人類認知的變動。

三 、大數(shù)據(jù)思維之于認知變動的經(jīng)濟學(xué)分析

我們研究這個專題之前有必要指出這樣一個基本事實:大數(shù)據(jù)思維可以改變?nèi)说恼J知路徑,可以改變不同階段或不同場景下的認知形成過程,但改變不了影響認知的動機、偏好、認知和效用等的性質(zhì)規(guī)定。如前所述,傳統(tǒng)經(jīng)濟學(xué)理性選擇理論在完全信息假設(shè)下,認為個體選擇的動機和偏好以追求最大化為軸心,傳統(tǒng)理論的這個真知卓見從未被后期理論質(zhì)疑;但由于傳統(tǒng)理論的完全信息假設(shè)存在著“知曉選擇結(jié)果”的邏輯推論,因而認知在傳統(tǒng)理論中是黑箱,也就是說,傳統(tǒng)理論無所謂認知的形成和變動問題?,F(xiàn)代主流經(jīng)濟學(xué)尤其是現(xiàn)代非主流經(jīng)濟學(xué)在不完全信息假設(shè)下開始重視對認知的研究,在他們看來,認知形成過程是從理智思考到信息加工和處理的過程;他們特別注重從心理因素來考察認知變動(Schandler,2006;Rubinstein,2007;),注重通過實驗且運用一些數(shù)據(jù)來分析和研究認知(Kahneman and Tversky,1974,1979;Smith,1994),但這些分析和研究不是對極大量、多維度和完備性的數(shù)據(jù)分析。因此,經(jīng)濟學(xué)理性選擇理論發(fā)展到今天,還沒有進入對大數(shù)據(jù)思維改變?nèi)祟愓J知問題的討論。

1、經(jīng)濟學(xué)家能否對選擇動機、偏好和效用期望等進行數(shù)據(jù)分析,決定其認知分析是否具有大數(shù)據(jù)思維的基礎(chǔ)

經(jīng)濟學(xué)關(guān)于人類選擇動機、偏好和效用期望等反映人們追求最大化的基本性質(zhì)分析,以及從這三大要素與認知關(guān)聯(lián)出發(fā),從不同層面或角度對認知形成的分析,主要體現(xiàn)在理性選擇理論中。但這方面顯而易見的缺憾,是不能對動機、偏好、認知和效用等展開數(shù)據(jù)分析?,F(xiàn)實的情況是,在大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能和機器學(xué)習(xí)等沒有問世或沒有發(fā)展到一定水平以前,經(jīng)濟學(xué)家對這些要素只能做抽象的模型分析。經(jīng)濟學(xué)理性選擇理論要跳出抽象模型分析,必須選擇具有解釋義或指示義的指標對動機、偏好和效用期望等進行數(shù)據(jù)分類分析,以便給認知的數(shù)據(jù)分析提供基礎(chǔ),顯然,這會涉及抽象行為模型的具體化和參數(shù)設(shè)計的具體化,需要得到大數(shù)據(jù)和云計算集約化運算模式的支持(吳軍,2016)。作為對未來大數(shù)據(jù)發(fā)展及其運用的一種展望,如果經(jīng)濟學(xué)家能夠圍繞最大化這一性質(zhì)規(guī)定來尋覓動機、偏好和效用期望等的特征值,并以之來設(shè)置參數(shù)和模型,則有可能對直接或間接關(guān)聯(lián)于動機、偏好和效用期望的大數(shù)據(jù)進行分析,從而為認知分析提供基礎(chǔ)。

大數(shù)據(jù)的極大量和完備性有可能消除信息不完全,這給認知的數(shù)據(jù)分析提供可行性。誠然,選擇動機、偏好和效用期望等只是反映人們選擇的現(xiàn)期意愿和未來愿景,其極強的抽象性決定這樣的數(shù)據(jù)分析還有很大困難,但由于選擇動機、偏好和效用期望等會通過實際行為迂回地反映出來,因而我們可以找到解決這一困難的路徑。例如,人們在準備投資和消費以前,一般有各種調(diào)研活動,即對影響投資和消費的信息進行搜集、整合、分類、加工和處理,值得注意的是,這些調(diào)研活動會在移動設(shè)備、物聯(lián)網(wǎng)、傳感器、定位系統(tǒng)和社交媒體中留下大數(shù)據(jù)的痕跡,這些數(shù)據(jù)痕跡會從某個層面或某個角度顯現(xiàn)出投資者和消費者選擇動機、偏好和效用期望的傾向或意愿。

智慧大腦依據(jù)什么樣的標準來數(shù)據(jù)化這些傾向或意愿,從而對選擇動機、偏好和效用期望以及進一步對認知展開數(shù)據(jù)分析呢?這里所說的標準,是指通過云計算和機器學(xué)習(xí)等對人們實際行為的數(shù)字和非數(shù)字信息進行相關(guān)性分類,把反映選擇動機、偏好和效用期望的具有共性特征的傾向或意愿進行整理和歸納,以確定符合選擇動機、偏好和效用期望之實際的參數(shù)。如果智慧大腦能夠利用大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能和機器學(xué)習(xí)等完成以上工作,根據(jù)認知是偏好與效用的中介這個現(xiàn)實,智慧大腦便可以對認知進行大數(shù)據(jù)分析。如果經(jīng)濟學(xué)家能夠利用智慧大腦提供的大數(shù)據(jù)分析成果,經(jīng)濟學(xué)理性選擇理論將會隨著信息不完全假設(shè)前提變?yōu)樾畔⑼耆僭O(shè)前提,選擇動機、偏好和效用期望的抽象分析變?yōu)閿?shù)據(jù)分析,認知的抽象框定或心理分析變?yōu)閿?shù)據(jù)分析而發(fā)生重大變化。以上的分析性討論,是我們理解大數(shù)據(jù)思維改變?nèi)祟愓J知之經(jīng)濟學(xué)解釋的最重要的分析基點。

2、運用大數(shù)據(jù)思維進行偏好分析會改變認知形成的路徑,使經(jīng)濟學(xué)理性選擇理論接近現(xiàn)實

現(xiàn)有的理性選擇理論有關(guān)動機和偏好的分析和研究(這里集中于偏好的討論),主要集中于偏好如何界定和形成以及如何隨認知和效用期望調(diào)整而發(fā)生變動等方面,并且這些分析和研究是采用“個體行為”為基本分析單元的個體主義方法論。在大數(shù)據(jù)時代,雖然個人、廠商和政府的選擇偏好仍然是追求最大化,個體選擇行為仍然是整個社會選擇的基礎(chǔ),個體主義方法論仍然在一定程度和范圍內(nèi)存在合理性,但互聯(lián)網(wǎng)平臺改變了選擇偏好的形成過程和機理。具體地說,現(xiàn)今人們的選擇偏好已不是經(jīng)濟學(xué)理性選擇理論意義上的選擇偏好,而更多地表現(xiàn)為是一種以最大化為底蘊的具有趨同化特征的偏好。例如,某種產(chǎn)品投資或消費的介紹會和研討會,對某種產(chǎn)品投資或消費的點贊和評價,中央政府和地方政府關(guān)于某種產(chǎn)品投資或消費的統(tǒng)計數(shù)據(jù),專家和新聞媒體對某種產(chǎn)品投資或消費的評說和報道,等等,都會成為人們選擇偏好出現(xiàn)一致性的催化劑。因此,經(jīng)濟學(xué)理性選擇理論跳出抽象模型分析,已經(jīng)在偏好分析上具備了大數(shù)據(jù)思維的條件和基礎(chǔ)。

智慧大腦與非智慧大腦的區(qū)別,在于能對人們消費和投資的偏好展開大數(shù)據(jù)分析,能通過大數(shù)據(jù)的搜集、整合、加工和處理,運用云計算得到來自不同維度數(shù)據(jù)之間相關(guān)性的精準信息,以至于能獲取建立在大數(shù)據(jù)分析基礎(chǔ)之上的認知。從理論上來講,偏好會影響認知但不能決定認知。就偏好影響認知而論,它主要是通過利益訴求、情感驅(qū)動、身心體驗和時尚追求等對認知產(chǎn)生誘導(dǎo)或牽引作用。但在非大數(shù)據(jù)時代,這些誘導(dǎo)或牽引作用無法數(shù)據(jù)化,于是經(jīng)濟學(xué)家對偏好影響認知的研究便只能以抽象模型來描述。大數(shù)據(jù)思維對偏好影響認知的處理,是使用以許多簡單而相對具體的模型取代高度抽象的單一模型,運用數(shù)據(jù)驅(qū)動法來設(shè)置參數(shù)和模型,對利益訴求、情感驅(qū)動、身心體驗和時尚追求等偏好特征進行解讀,這樣便實現(xiàn)了很多非數(shù)據(jù)化信息的數(shù)據(jù)化,從而使以偏好為基礎(chǔ)的在理論上對認知變動的研究有了新的分析路徑。

阿里巴巴公司正在奮力打造的線上和線下相結(jié)合的“新零售”模式,是以大數(shù)據(jù)分析和運用的阿里云平臺為背景和依托的。這個模式試圖通過充分搜集、整合、分類、加工和處理已發(fā)生的歷史消費數(shù)據(jù),正在發(fā)生的現(xiàn)期消費數(shù)據(jù)和有可能發(fā)生的未來消費數(shù)據(jù),捕捉人們消費偏好的動態(tài)變化,以期構(gòu)建符合大數(shù)據(jù)思維的全新商業(yè)業(yè)態(tài)。撇開新零售模式在運營過程中的諸如數(shù)據(jù)處理、機器學(xué)習(xí)和人工智能運用等技術(shù)問題,僅以該模式對人們消費行為的系統(tǒng)梳理、分級整合及相關(guān)處理來說,它無疑會在引領(lǐng)人們消費行為的同時促動消費趨同化偏好的形成。尤其值得關(guān)注和研究的是,隨著該模式運營所積累的數(shù)據(jù)量全然達到大數(shù)據(jù)的標準,人們的消費認知將會在消費趨同化偏好的導(dǎo)引下發(fā)生變化,這種情形不僅會發(fā)生在消費領(lǐng)域,投資領(lǐng)域也會出現(xiàn)投資趨同化偏好。很明顯,趨同化偏好具有共性特征,它在很大程度上是對個體選擇偏好的否定,對于這種偏好所導(dǎo)致的認知應(yīng)該怎樣理解呢?這個問題需要進一步研究。

3、在大數(shù)據(jù)時代,趨同化偏好會改變認知形成過程,消費者和投資者的認知不再是自己獨立思考和理智判斷的產(chǎn)物,而是在趨同化偏好驅(qū)動下對智慧大腦認知的認同

廠商的投資選擇偏好是追求利潤最大化,這一永恒的事實不妨礙或排斥投資趨同化偏好的形成。一般來講,大數(shù)據(jù)發(fā)展初期的互聯(lián)網(wǎng)平臺對選擇趨同化偏好形成的作用力,在消費領(lǐng)域要比投資領(lǐng)域來得更加直接和迅速。究其原因,是兩大領(lǐng)域的機會成本和風(fēng)險程度不同的緣故。但隨著大數(shù)據(jù)、云計算和機器學(xué)習(xí)等的充分發(fā)展,智慧大腦有可能對歷史、現(xiàn)期和未來的大量投資數(shù)據(jù)進行搜集、整合、加工和處理,有可能通過云計算集約化模式來分析不同維度數(shù)據(jù)之間相關(guān)性而獲得精準信息,同時,智慧大腦會根據(jù)市場“行為數(shù)據(jù)流”折射出“想法數(shù)據(jù)流”而產(chǎn)生預(yù)見能力,尋覓和遴選出高收益的投資方向和投資標的。若此,智慧大腦投資選擇的勝算率(利潤率)將會大大提高,廠商會效尤智慧大腦進行投資選擇,從而出現(xiàn)投資趨同化偏好。經(jīng)濟學(xué)曾經(jīng)對諸如“羊群效應(yīng)、蝴蝶效應(yīng)、從眾行為、信息重疊”等現(xiàn)象有過許多研究(羅伯特?希勒,2001),但嚴格來講,這些研究是描述性的,不是聯(lián)系偏好和認知等的分析性研究。

消費和投資的趨同化偏好主要是針對消費者和投資者的選擇行為方式而言的,它不改變消費和投資選擇偏好的追求效用最大化的性質(zhì)規(guī)定,這是問題的一方面。另一方面,在將來大數(shù)據(jù)充分發(fā)展的鼎盛時期,消費和投資的趨同化偏好會改變認知形成過程,這可以從兩種意義上來理解:1、從原先通過對信息進行搜集、整合、分類、加工和處理來獲取認知,轉(zhuǎn)變?yōu)橥ㄟ^對數(shù)據(jù)的搜集、整合、分類、加工和處理來獲取認知;2、消費者和投資者的認知不再是自己獨立思考和理智判斷的產(chǎn)物,而是在趨同化偏好的驅(qū)動下認同智慧大腦的認知。關(guān)于第一點,大數(shù)據(jù)思維的認知之所以會取代獨立思考和理智判斷的認知,乃是因為它能夠運用云計算集約化模式將消費和投資的歷史數(shù)據(jù)、現(xiàn)期數(shù)據(jù)甚至未來數(shù)據(jù)進行分類處理和相關(guān)性分析,能夠運用數(shù)以萬計的計算機服務(wù)器對特定事物的因果關(guān)系展開深度機器學(xué)習(xí),從而通過分類和歸納不同維度數(shù)據(jù)而得到精準信息(精準醫(yī)療就是基于此原理)。人類對因果關(guān)系探索的手段和路徑發(fā)生變化,認知的形成過程及其機理就會發(fā)生變化。

關(guān)于第二點,消費者和投資者在未來放棄對信息的搜集、整合、分類、加工和處理,認同和效尤智慧大腦的認知來進行選擇,這可理解為是他們進行效用比較(投入與收益)時的“幡然悔悟”。尤瓦爾?赫拉利(2017)有關(guān)一切有機和無機實體都可以運用算法來解構(gòu)的前景預(yù)期,(吳軍,2016)關(guān)于未來制造業(yè)、農(nóng)業(yè)、醫(yī)療、體育、律師業(yè)甚至新聞出版業(yè)都將由大數(shù)據(jù)統(tǒng)治的觀點,凱文?凱利(2014)以大數(shù)據(jù)和人工智能為分析底蘊對新經(jīng)濟十大重要準則的論述,均認為具有大數(shù)據(jù)思維且不作出主觀判斷的智慧大腦將是未來世界的操控者,而Master和AlphaGo戰(zhàn)勝世界頂級圍棋高手的實踐,則顯露了人工智能完全有可能戰(zhàn)勝人腦的端倪。現(xiàn)實中的普通消費者和投資者通常只是依據(jù)有限或不準確的信息進行消費和選擇,經(jīng)濟學(xué)家也只是根據(jù)有限或不準確的信息進行因果關(guān)系分析而得出認知,因此,相對于智慧大腦的選擇效用,消費者和投資者是相形見絀,經(jīng)濟學(xué)家的理論見解和政策主張往往不吻合實際。

智慧大腦是運用大數(shù)據(jù)思維而超越一般智人大腦的大腦。不過,從性質(zhì)上來講,極少數(shù)擁有智慧大腦的人通過對數(shù)據(jù)的搜集、整合、分類、加工和處理所得到的認知,仍然屬于人的認知。需要強調(diào)指出的是,這種認知不同于經(jīng)濟學(xué)理論及其他社會科學(xué)理論所闡述和論證的認知,它是在大數(shù)據(jù)思維驅(qū)動下的人類認知。對于這種新型認知的理解,如果我們結(jié)合經(jīng)濟學(xué)理性選擇理論對其展開解說,則有著基礎(chǔ)理論的分析價值。

4、在未來,智慧大腦的認知將引領(lǐng)非智慧大腦的認知,其結(jié)果是導(dǎo)致認知趨同化

熟悉經(jīng)濟學(xué)理性選擇理論的學(xué)者知道,無論經(jīng)濟學(xué)家是從信息的搜集、整合、分類、加工和處理獲取認知,還是通過心理分析或行為實驗獲取認知,他們都是在不完全信息或有限理性約束下進行的,這不僅存在著以不精準信息推論認知的問題,而且存在認知形成過程的主觀判斷問題。智慧大腦運用大數(shù)據(jù)思維所形成的認知的最大特點,是在接近完全信息基礎(chǔ)上獲取認知的,并且不夾帶任何主觀判斷?,F(xiàn)代未來學(xué)家曾分別從不同角度和層面對大數(shù)據(jù)、互聯(lián)網(wǎng)和人工智能展開了許多討論,他們的共同見解是認為大數(shù)據(jù)的極大量、多維度和完備性將有可能解決信息不完全問題(包含信息不對稱),并且能夠給人類選擇提供精準信息。倘若如此,人類的認知問題便完全成為智慧大腦對數(shù)據(jù)的搜集、整合、分類、加工和處理問題,一旦人類可以通過大數(shù)據(jù)思維獲取精準信息和完全信息,經(jīng)濟學(xué)理性選擇理論將會在根基上被顛覆。

智慧大腦只有極少數(shù)人才具備,絕大部分人(包括智人)都是非智慧大腦。在未來世界,智慧大腦將引領(lǐng)非智慧大腦進行選擇。這一引領(lǐng)過程是由前后相繼的兩個階段構(gòu)成:一是智慧大腦運用大數(shù)據(jù)對偏好進行分析,通過互聯(lián)網(wǎng)將偏好傳送給具有從眾心理和從眾行為傾向的非智慧大腦,形成非智慧大腦的趨同化偏好;另一是智慧大腦運用大數(shù)據(jù)分析獲取認知,同樣是通過互聯(lián)網(wǎng)讓非智慧大腦效尤智慧大腦的認知,形成趨同化認知,從而使非智慧大腦以智慧大腦的認知為認知來選擇。這些情形表明,未來人類智慧大腦將決定非智慧大腦的偏好和認知,進一步說,則是智慧大腦將影響非智慧大腦的選擇行為。這里有一個極其重要問題須討論:對絕大部分非智慧大腦而言,他們在選擇過程中是否還存在認知?事實上,無論是趨同化偏好還是趨同化認知,非智慧大腦的偏好和認知并沒有徹底消失,只是形成的路徑和內(nèi)容發(fā)生了變化。關(guān)于這個問題的討論,聯(lián)系經(jīng)濟學(xué)的認知理論進行比較分析,或許會有更深的理解。

如前所述,傳統(tǒng)經(jīng)濟學(xué)以完全信息為假設(shè)前提,將認知作為理性選擇模型的外生變量,“認知”是被理論分析跳越的?,F(xiàn)代經(jīng)濟學(xué)以不完全信息為假設(shè)前提,在理性選擇模型中,努力通過心理和實驗分析把認知作為內(nèi)生變量,易言之,“認知”被解釋為個體對信息進行搜集、整合、分類、加工和處理的結(jié)果,顯然,以上分析在分析對象、分析方法和分析路徑上,是與大數(shù)據(jù)思維不同的?,F(xiàn)代經(jīng)濟學(xué)理性選擇理論所分析的個體,是通過邏輯推論所抽象出來的蕓蕓眾生;雖然智慧大腦也可以看成是個體,但人數(shù)極少,是具有大數(shù)據(jù)思維之共同特征的個體?,F(xiàn)代經(jīng)濟學(xué)理性選擇理論是借助于偏好分析來研究認知的,雖然認知已在一定程度上被視為內(nèi)生變量,但分析方法和路徑仍然是邏輯判斷或推論為主;大數(shù)據(jù)思維對認知分析將會采用的方法和路徑,是搜集、整合、分類、加工和處理數(shù)據(jù),試圖從極大量、多維度和完備性的數(shù)據(jù)中獲取精準信息以得出認知。因此,盡管認知出現(xiàn)了趨同化,人類在大數(shù)據(jù)思維下仍然存在認知,只不過是非智慧大腦放棄自己的認知而統(tǒng)一于智慧大腦的認知罷了。

總之,偏好和認知的趨同化顯示了大數(shù)據(jù)思維的魅力,這種魅力根植于大數(shù)據(jù)能夠經(jīng)由智慧大腦而產(chǎn)生精準信息。其實,智慧大腦如何設(shè)置參數(shù)和模型,如何運用云計算集約化模式,如何利用互聯(lián)網(wǎng)以及尋覓廣泛使用人工智能的方法和途徑等,主要是計算機運用層面上的技術(shù)問題。我們研究大數(shù)據(jù)思維下人類認知變動需要重點關(guān)注的,是非智慧大腦究竟還有沒有認知,其效用期望會呈現(xiàn)什么樣的格局?既然非智慧大腦只是沒有獨立認知而不是完全跳越了認知,那么非智慧大腦便存在著效用期望,關(guān)于這種效用期望,我們可以聯(lián)系效用函數(shù)來解說。

四 、認知結(jié)構(gòu)一元化與效用期望變動的新解說

經(jīng)濟理論對選擇行為與效用期望之間動態(tài)關(guān)聯(lián)所建立的基本分析框架,展現(xiàn)出一幅“偏好認知選擇效用期望”的圖景。各大經(jīng)濟學(xué)流派的理性選擇理論對這幅圖景中的 “”有不同的解說和取舍(前文有所涉及),概括來說,或側(cè)重于分析這些箭頭前后要素之間的相互關(guān)聯(lián),或側(cè)重于分析這些箭頭前后要素之間的影響和決定作用。但就人們選擇動機和目的與效用之間的關(guān)聯(lián)而論,幾乎所有理論都不懷疑“追求自身利益最大化”的公理性,于是,“最大化”在成為效用函數(shù)核心變量的同時,也在一定程度上被作為理性選擇的判斷標準。以上圖景的邏輯分析鏈是建立在信息不完全分析假設(shè)上的,各大經(jīng)濟學(xué)流派的理性選擇理論對這條邏輯分析鏈各環(huán)節(jié)的不同解說所產(chǎn)生的理論分歧,可歸結(jié)為是在信息不完全假設(shè)分析框架內(nèi)的分歧。值得學(xué)術(shù)界關(guān)注的是,當(dāng)大數(shù)據(jù)在未來有可能提供完全信息時,這些分歧將會讓位于新的理論探討。

經(jīng)濟學(xué)家對效用函數(shù)的研究是與認知分析緊密相聯(lián)的。但無論是傳統(tǒng)經(jīng)濟理論還是現(xiàn)代經(jīng)濟理論,他們對效用函數(shù)以及最大化問題的研究存在著共性,即這些研究都是建立在抽象的認知結(jié)構(gòu)一元化基礎(chǔ)上的。具體地說,傳統(tǒng)經(jīng)濟理論在完全信息假設(shè)上認為,選擇者可以得到“獲悉選擇結(jié)果的認知”,從而主張用“最大化”來描述選擇者的效用函數(shù)?,F(xiàn)代主流和非主流經(jīng)濟理論在不完全信息假設(shè)上認為,選擇者受有限理性約束不可能得到“獲悉選擇結(jié)果的認知”,從而主張不可用“最大化”來描述選擇者的效用函數(shù)。這里所說的抽象認知結(jié)構(gòu)一元化,是指不是以具體的認知主體作為分析對象,而是把整個人類描述為一個同一的抽象主體,讓“最大化”問題成為效用函數(shù)的核心問題。在大數(shù)據(jù)思維的未來世界,隨著信息有可能出現(xiàn)完全化,“最大化”問題將會成為不是問題的問題。

誠然,智慧大腦對大數(shù)據(jù)進行搜集、整合、分類、加工和處理,并通過云計算、機器學(xué)習(xí)乃至于根據(jù)人工智能實踐來選擇參數(shù)和設(shè)置模型,仍然沒有越出追求自身利益最大化這一效用函數(shù)的性質(zhì)規(guī)定,但由于智慧大腦的認知形成過程是建立在具有極大量、多維度和完備性的大數(shù)據(jù)基礎(chǔ)之上的,大數(shù)據(jù)能夠提供完全信息的特點有可能會讓智慧大腦取得效用最大化。人類絕大部分選擇者是非智慧大腦者,從科學(xué)意義上來講,大數(shù)據(jù)對他們可謂是長期的黑箱,而他們依據(jù)自己認知所做出的選擇又不可能實現(xiàn)效用最大化,于是,非智慧大腦者將以智慧大腦者的認知作為自己認知而做出選擇,這便形成了大數(shù)據(jù)時代實際意義上的一元化認知結(jié)構(gòu)。如果說我們劃分智慧大腦和非智慧大腦是對人類選擇主體的一種新界定;那么,我們揭示這兩大選擇主體實際意義上的一元化認知結(jié)構(gòu),則是對大數(shù)據(jù)時代人類認知問題的一種新解說。

大數(shù)據(jù)背景下人類實際意義上的認知結(jié)構(gòu)一元化,將是未來發(fā)展的一種趨勢,相對于經(jīng)濟理論抽象意義上的認知結(jié)構(gòu)一元化,它容易把握和理解。但它在將來能否成為一種固定化趨勢,取決于智慧大腦在經(jīng)濟、政治、文化和思想意識形態(tài)等領(lǐng)域進行選擇時獲得的效用函數(shù)值。對于該效用函數(shù)值的預(yù)期,大數(shù)據(jù)思維下的智慧大腦是具備這種能力的。從經(jīng)濟理論分析看,對效用函數(shù)值的討論,將涉及內(nèi)蘊且展示效用函數(shù)的效用期望問題的討論。傳統(tǒng)經(jīng)濟學(xué)的期望效用函數(shù)理論,是一種運用數(shù)學(xué)模型論證選擇者能夠?qū)崿F(xiàn)最大化的理性選擇理論((Von Neumann and Morgenstern,1947;Arrow and Debreu,1954),現(xiàn)代非主流經(jīng)濟學(xué)是在分析風(fēng)險厭惡和風(fēng)險偏好的基礎(chǔ)上,用一條S型的價值(函數(shù))曲線取代傳統(tǒng)的效用函數(shù),并通過相對財富變動對選擇者感受的分析,解析了選擇者的效用期望會不斷發(fā)生調(diào)整的情形(Kahneman and Tversky,1979)。那么,大數(shù)據(jù)時代選擇者的效用期望會發(fā)生怎樣變動呢?

人類社會發(fā)展的歷史表明,人的主觀期望與實際選擇結(jié)果之間會發(fā)生經(jīng)常性偏離。選擇者的效用期望能否實現(xiàn)最大化,一是取決于選擇者能否得到完全信息,另一是取決于選擇者認知過程的科學(xué)化。事實上,現(xiàn)代經(jīng)濟學(xué)對傳統(tǒng)經(jīng)濟學(xué)以最大化為核心的效用函數(shù)的質(zhì)疑和批評,主要是圍繞信息不完全和忽略認知過程展開的。大數(shù)據(jù)時代存在著提供完全信息的可能性,而智慧大腦利用互聯(lián)網(wǎng)和運用云計算、機器學(xué)習(xí)和人工智能等手段,正在實現(xiàn)著認知過程的科學(xué)化,這便提出了經(jīng)濟學(xué)必須回答的兩大問題:1、大數(shù)據(jù)思維下的人類選擇是否可以實現(xiàn)最大化,2、大數(shù)據(jù)思維下選擇者的效用期望會不會發(fā)生調(diào)整。這是現(xiàn)代經(jīng)濟學(xué)沒有提及的兩大問題,但當(dāng)我們分別從智慧大腦和非智慧大腦來討論這兩大問題時,結(jié)論或許會讓篤信經(jīng)濟學(xué)經(jīng)典理論的學(xué)者大跌眼鏡。

在未來世界,隨著互聯(lián)網(wǎng)平臺的日新月異以及移動設(shè)備、物聯(lián)網(wǎng)、傳感器、社交媒體和定位系統(tǒng)等搜集大數(shù)據(jù)手段的覆蓋面的日益擴大,大數(shù)據(jù)的極大量、多維度和完備性給人類選擇提供了完全信息的基礎(chǔ)。智慧大腦在云計算、機器學(xué)習(xí)和人工智能等的支持下,以數(shù)據(jù)分析為基礎(chǔ)的認知過程也越來越科學(xué)化,于是,智慧大腦便可以知曉選擇過程的結(jié)果,有可能實現(xiàn)最大化,這說明智慧大腦不存在效用期望的調(diào)整問題。另一方面,非智慧大腦以智慧大腦的認知為自己的認知,其效用期望完全依附于智慧大腦的效用期望。具體地說,非智慧大腦不對數(shù)據(jù)進行搜集、整合、分類、加工和處理,跳越了認知過程,同樣不存在效用期望的調(diào)整問題。非智慧大腦效用期望完全依附于智慧大腦效用期望的情形,或者說,非智慧大腦以智慧大腦效用期望為自己效用期望的情形,統(tǒng)一于智慧大腦與非智慧大腦的認知結(jié)構(gòu)一元化。如果要追溯非智慧大腦效用期望的變動,那就是從原先屬于自己的效用期望轉(zhuǎn)變成了智慧大腦的效用期望。

智慧大腦有可能實現(xiàn)最大化,以及不存在效用期望調(diào)整是一回事,但智慧大腦能否在所建模型中給定效用期望值卻是另一回事。效用期望作為一種主觀預(yù)期或判斷,它不會在互聯(lián)網(wǎng)上留下可供大數(shù)據(jù)分析的歷史數(shù)據(jù)流、現(xiàn)期數(shù)據(jù)流和未來數(shù)據(jù)流,也就是說,不會在互聯(lián)網(wǎng)上留下可供大數(shù)據(jù)分析的行為數(shù)據(jù)流和想法數(shù)據(jù)流,這在決定智慧大腦難以跟蹤、模擬和推論效用期望值的同時,也給非智慧大腦放棄認知而效尤智慧大腦提供了某種聊以。推崇人工智能可以替代人腦的學(xué)者,好用Master和AlphaGo戰(zhàn)勝世界頂級圍棋高手的事實作為這種替代的立論依據(jù),但無論我們怎樣在大數(shù)據(jù)分析、機器學(xué)習(xí)和人工智能運用等方面進行深度挖掘,也找不到智慧大腦能在所建模型中給定效用期望值的科學(xué)依據(jù)。智慧大腦不能確定效用期望值,也就規(guī)定了非智慧大腦不能確定效用期望值。這又提出了一個在理論上有必要回答的問題:非智慧大腦還有沒有效用期望?

在經(jīng)濟社會,智慧大腦和非智慧大腦的投資和消費選擇的效用期望都是追求最大化,這一點是永恒的。但問題在于,非智慧大腦以智慧大腦的認知為自己認知,以智慧大腦的選擇作為自己選擇的情形,會使自己的效用期望完全停留在期望智慧大腦選擇結(jié)果的形式上,這可以解釋為大數(shù)據(jù)時代非智慧大腦的效用期望的一種變動。但對于這樣的效用期望的理解,與其說它是一種效用期望,倒不如說它是一種效用期待。社會經(jīng)濟的精英是人數(shù)極少的智慧大腦群體,但推動投資和消費的是占人口絕大多數(shù)的非智慧大腦群體。因此,非智慧大腦群體的偏好、認知、選擇和效用期望,應(yīng)該是理性選擇理論研究的重點。關(guān)于這一研究重點的邏輯和現(xiàn)實的分析線索,是大數(shù)據(jù)思維趨同化偏好趨同化認知認知結(jié)構(gòu)一元化最大化效用期望。不過,這條分析線索包含著許多本文或有所涉及或尚未涉及的交叉性內(nèi)容,它需要我們在繼續(xù)研究大數(shù)據(jù)思維改變?nèi)祟愓J知這一理論專題時,做出進一步深入的探討。