公務員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)技術在網(wǎng)絡輿情管理中作用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)技術在網(wǎng)絡輿情管理中作用范文,希望能給你帶來靈感和參考,敬請閱讀。

大數(shù)據(jù)技術在網(wǎng)絡輿情管理中作用

摘要:輿情作為信息傳播現(xiàn)象,屬于新聞傳播學科和情報學科的交叉領域,明確技術在網(wǎng)絡輿情課題中的作用有助于深入研究該問題。通過辨析網(wǎng)絡輿情、大數(shù)據(jù)技術概念及特征,探究大數(shù)據(jù)技術對網(wǎng)絡輿情發(fā)展及管理的影響。文章基于此分析如何將信息管理經(jīng)驗與技術相結(jié)合,為大數(shù)據(jù)技術輔助網(wǎng)絡輿情管理提供方向。

關鍵詞:網(wǎng)絡輿情;大數(shù)據(jù)技術;大數(shù)據(jù)時代

0引言

隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡輿情問題成為我國治國理政中的重要組成部分。以信息傳播為根源的網(wǎng)絡輿情,在大數(shù)據(jù)時代帶來的海量數(shù)據(jù)下愈發(fā)壯大。如何將技術與管理相結(jié)合,使二者彼此輔助共同解決網(wǎng)絡輿情問題成為網(wǎng)絡輿情領域的研究熱點。本文通過對大數(shù)據(jù)、網(wǎng)絡輿情的概念辨析,總結(jié)兩者特點,探究大數(shù)據(jù)與網(wǎng)絡輿情的關系,從而為未來網(wǎng)絡輿情管理提供方向。

1概念及特點辨析

1.1網(wǎng)絡輿情概念及特點

網(wǎng)絡輿情是指各種不同情緒、態(tài)度和意見以信息為載體,通過互聯(lián)網(wǎng)表達和傳播,從而傳達出人們對于某事件的認知、態(tài)度、情感和行為傾向。隨著互聯(lián)網(wǎng)的發(fā)展與普及,人們可以快速直接多維度地參與政治,對于事件發(fā)展起到不可預知的作用。網(wǎng)絡輿情是依托于互聯(lián)網(wǎng)存在的信息傳播現(xiàn)象,因此其特征與互聯(lián)網(wǎng)信息特點有相近性。第一,共享性。隨著科學技術的不斷提高,互聯(lián)網(wǎng)已經(jīng)成為新時代中最重要的社交平臺。在這個覆蓋全世界的大型平臺中,人們通過虛擬的網(wǎng)絡空間實現(xiàn)了真正意義的信息共享。第二,匿名性?;趯τ趥€人信息和網(wǎng)絡空間的自由,互聯(lián)網(wǎng)具有匿名性。因此信息和傳播信息的人都可能無跡可尋,這使得網(wǎng)絡輿情比傳統(tǒng)輿情更加難以監(jiān)管和懲處。第三,偏差性。根據(jù)2015年中國互聯(lián)網(wǎng)輿情報告,網(wǎng)絡輿情往往圍繞“斗”字,這個“斗”無關利益,是為了斗而斗,常有情緒引導的現(xiàn)象產(chǎn)生。缺乏理性、情緒至上的信息傳播往往會使信息失真,與其實際意義產(chǎn)生偏差[1]。

1.2大數(shù)據(jù)技術概念及特點

大數(shù)據(jù)技術源于移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計算技術高速發(fā)展帶來的“大數(shù)據(jù)”的處理需求。2008年美國計算社區(qū)聯(lián)盟發(fā)表的一份有影響力的白皮書《大數(shù)據(jù)計算》中首次提出大數(shù)據(jù)概念。2010年2月,肯尼斯庫克爾在《經(jīng)濟學人》上發(fā)表了大數(shù)據(jù)專題報告《數(shù)據(jù),無所不在的數(shù)據(jù)》,旨在提醒和呼吁世界重視日益增長的巨量數(shù)字信息。仍以極快速度增長的海量信息已經(jīng)影響到世界的各個領域,如經(jīng)濟、政治,甚至包括藝術等人文領域。普遍認為,大數(shù)據(jù)有著4“V”特征,即Volume(數(shù)據(jù)規(guī)模巨大)、Variety(數(shù)據(jù)類型多樣化)、Velocity(傳播速度快)和最重要的Value(價值密度稀疏)[2]。結(jié)合這些特征,大數(shù)據(jù)技術具有以下特點。(1)巨量數(shù)據(jù)的處理能力:隨著Web2.0時代的到來,以用戶需求為核心的互聯(lián)網(wǎng)模式導致信息輸出源驟增,大數(shù)據(jù)技術需滿足爆炸式的信息增長需求。(2)多樣化數(shù)據(jù)處理能力:大數(shù)據(jù)組成復雜,除傳統(tǒng)的結(jié)構化數(shù)據(jù),還包括許多半結(jié)構化和非結(jié)構化的數(shù)據(jù),通過大數(shù)據(jù)技術可將不同類型信息進行分析處理。(3)處理速度快:與傳統(tǒng)數(shù)據(jù)挖掘技術不同,經(jīng)大數(shù)據(jù)技術處理信息幾乎可以達到實時傳遞。通過分布式系統(tǒng)基礎架構Hadoop等技術可以在秒級時間范圍內(nèi)給出分析結(jié)果。(4)實現(xiàn)價值提純:大數(shù)據(jù)的價值總量很大,但價值密度通常較低。通過大數(shù)據(jù)技術去除信息冗雜等問題,從而實現(xiàn)價值提純。所謂大數(shù)據(jù)技術,其本質(zhì)即面對信息時代海量數(shù)據(jù)的處理技術,包括海量數(shù)據(jù)收集、數(shù)據(jù)存儲、數(shù)據(jù)挖掘、圖像視頻智能分析等多方面。根本在于為滿足信息處理需求,利用技術手段挖掘和運用海量數(shù)據(jù),從而輔助決策。

2大數(shù)據(jù)技術對于網(wǎng)絡輿情管理的影響

隨著網(wǎng)絡快速發(fā)展,網(wǎng)絡環(huán)境已經(jīng)成為重要的公民環(huán)境之一。通過對網(wǎng)絡信息的及時監(jiān)測了解公民思想,把控網(wǎng)絡輿情走向引導公民精神建設,借用網(wǎng)絡監(jiān)督促進政府決策的科學化,從而形成全方位的網(wǎng)絡輿情管理,保證我國網(wǎng)絡空間的安全及國家利益[3]。

2.1大數(shù)據(jù)與網(wǎng)絡輿情的關系

大數(shù)據(jù)所指的是在有限時間內(nèi)無法使用常規(guī)手段來獲取、整理并且處理的海量數(shù)據(jù)的集合[4]。如前文所說,所謂網(wǎng)絡輿情管理就是對于這些信息的分析處理。要從海量信息中尋找核心價值時,需要利用先進的科學技術手段來對信息進行處理與分析。網(wǎng)絡輿情基于大數(shù)據(jù)時代帶來的海量數(shù)據(jù)而產(chǎn)生,而網(wǎng)絡輿情管理也要依靠大數(shù)據(jù)技術來輔助,兩者相輔相成。

2.2大數(shù)據(jù)技術對網(wǎng)絡輿情管理提供可能性

在當前網(wǎng)絡輿情管理中,大數(shù)據(jù)技術為網(wǎng)絡輿情管理提供無限可能,面對網(wǎng)絡中紛雜的數(shù)據(jù)來源和龐大的數(shù)據(jù)量,擁有可以處理海量數(shù)據(jù)能力的大數(shù)據(jù)技術成為輿情信息處理分析平臺的基礎和核心。2.2.1大數(shù)據(jù)映射社會關系在過去人類上千年的歷史中都通過文字、圖畫、書籍等記錄世界變化,后人通過這些留存的史料窺探過去歷史的發(fā)展,訪求前人的思想。而大數(shù)據(jù)技術的進步,為互聯(lián)網(wǎng)中的海量數(shù)據(jù)提供存儲、分析、處理于一體的可能性。這些存在于互聯(lián)網(wǎng)的海量數(shù)據(jù)記錄著不同時期人們的觀點看法、情緒傾向和民生需求等,映射出當代的社會關系。近年來,社會科學逐漸重視對社會關系的研究,通過大數(shù)據(jù)技術對用戶行為的采集,可以關注網(wǎng)絡社交媒體上體現(xiàn)的廣泛社會交往方式,從而對輿情內(nèi)容所反映出的整體網(wǎng)民社會關系進行研究分析[5]。2.2.2大數(shù)據(jù)技術成為網(wǎng)絡輿情管理工具大數(shù)據(jù)技術分別從輿情數(shù)據(jù)的獲取、輿情信息的測量、輿情預測分析3個方面多維構建網(wǎng)絡輿情治理方法體系。

3輿情數(shù)據(jù)的獲取

互聯(lián)網(wǎng)時代提供了數(shù)據(jù)產(chǎn)生方式,輿情信息的獲取也不再依賴于傳統(tǒng)數(shù)據(jù)采樣,大數(shù)據(jù)技術通過采集用戶的網(wǎng)絡行為獲取輿情數(shù)據(jù)。傳統(tǒng)的抽樣調(diào)查是靜態(tài)信息獲取,信息獲取范圍有限,個體傾向嚴重容易忽略細節(jié)問題,造成輿情分析結(jié)果的偏差。針對靜態(tài)頁面,可以利用URL直接請求下載整個HTML頁面,對網(wǎng)頁內(nèi)容有效分類。再使用XPATH確定規(guī)則,對頁面進行解析以及篩選,進而獲得數(shù)據(jù)。但網(wǎng)絡輿情更多是動態(tài)的信息傳播產(chǎn)物。利用大數(shù)據(jù)技術獲取的網(wǎng)絡搜索記錄、瀏覽記錄和社交媒體工具使用記錄等用戶行為數(shù)據(jù),可以為輿情研究提供更為全面的數(shù)據(jù)基礎。針對使用動態(tài)加載技術的網(wǎng)頁,可以通過Selenium工具以及瀏覽器WebDriver模擬HTML頁面的用戶行為,運用事件函數(shù)判斷動態(tài)頁面的實際加載情況,最終獲得所需數(shù)據(jù)。此外,還可以通過對數(shù)據(jù)傳遞形式為JSON類型的數(shù)據(jù)進行路徑分析,通過修改其所對應的URL直接請求網(wǎng)站獲取格式為JSON的數(shù)據(jù)[6]。大數(shù)據(jù)技術對于海量信息的收集處理能力可以有效降低個體傾向?qū)τ跀?shù)據(jù)分析的影響。同時,不斷優(yōu)化大數(shù)據(jù)算法技術,提高大數(shù)據(jù)挖掘信息的效率,更準確地進行關鍵詞提取以及信息匹配也能有效地提高輿情分析結(jié)果的準確度和可信度。

3.1輿情信息的測量

如前文所述,互聯(lián)網(wǎng)的數(shù)字化記錄為網(wǎng)絡信息的存儲提供可能。大數(shù)據(jù)技術以分布式的方式存儲數(shù)據(jù),主要包括GFS,Hadoop等信息管理系統(tǒng)。以GFS為例,其開源版本HDFS將數(shù)據(jù)分成小的等大數(shù)據(jù)塊,并輔以副本用以容錯,系統(tǒng)支持巨量數(shù)據(jù)體量(PB級),可以實現(xiàn)一次寫入、多次讀取的需求[7]。通過這些數(shù)據(jù)的存儲技術,在網(wǎng)絡上的行為都會被記錄保存。通過對行為信息的分類提取,匯總形成我國輿論數(shù)據(jù)信息數(shù)據(jù)庫。政府想尋找具備輿論研究價值的信息,就可以以此為數(shù)據(jù)源。通過對數(shù)據(jù)的量化研究,可在一定程度上掌握用戶群體的行為、興趣以及習慣,用于評估網(wǎng)絡輿論的關注點、擴散情況以及群體態(tài)度。如通過對高頻詞的搜索與閱讀,了解該話題對網(wǎng)絡群體的吸引力;相關事件的評論與回復通常體現(xiàn)著某個議題引發(fā)的某一網(wǎng)絡群體的思考;轉(zhuǎn)發(fā)與分享等網(wǎng)絡行為可作為輿情監(jiān)測的重要指標,以評估輿論的擴散程度[8]。

3.2輿情預測分析

對比傳統(tǒng)的輿論預測,大數(shù)據(jù)分析能有效提升輿論結(jié)果的預測準確度。不斷更新的信息能為輿論預測提供更多的變量,避免數(shù)據(jù)分析的滯后性。通過數(shù)理分析,在關系分析和因果分析等實證方法上降低了傳統(tǒng)的經(jīng)驗主義、傳統(tǒng)主義等主觀性分析,有效提升對非結(jié)構化數(shù)據(jù)的處理能力,依托復雜網(wǎng)絡分析、數(shù)據(jù)可視化和語義分析等研究方法提升分析技術的科學性。

3.3大數(shù)據(jù)技術全方位提升輿情監(jiān)測指標

利用大數(shù)據(jù)技術可以對于網(wǎng)絡數(shù)據(jù)進行有效整理,提升信息質(zhì)量、真實有效的網(wǎng)絡數(shù)據(jù)信息是輿情監(jiān)測的基礎。輿情監(jiān)測最大的困難在于數(shù)據(jù)挖掘的過程中需要面對繁雜的信息,容易產(chǎn)生分析結(jié)果精度降低、偏差值過大的問題,導致對于輿情態(tài)勢不能準確判斷[9]。當前大數(shù)據(jù)技術算法主要包括數(shù)據(jù)分類、內(nèi)容摘要自動抽取、IP地址追蹤、觀點挖掘和情感計算等。在這些算法的作用下形成了我國網(wǎng)絡輿情監(jiān)測指標,即規(guī)定某一需求標準,以此標準為核心視角對所圈定范圍內(nèi)的數(shù)據(jù)進行分析。此外,網(wǎng)絡輿情是社會性問題,其監(jiān)測指標應滿足社會性需求,可以根據(jù)該標準判斷某事件對某區(qū)域社會是否會產(chǎn)生影響,波及范圍有多大,輿情發(fā)展趨勢是什么。不同地區(qū)對于同一事件的反應各不相同,這是因為不同地區(qū)的網(wǎng)民性格特點不同,關注的角度和傾向也不同。利用大數(shù)據(jù)技術可對不同網(wǎng)絡情感進行判斷,以情感主客體、情感傾向和情感強度為指標系統(tǒng)地進行監(jiān)測[10]。情感主體即為參與事件討論的網(wǎng)民,包括普通民眾意見領袖和官方主流機構等,通過測量該話題的討論量,可用來判斷該話題的實時熱度、網(wǎng)民的情感傾向以及政府對此事件的回應及態(tài)度。情感客體劃分百姓民生、國際政治、全球經(jīng)濟等具體領域。根據(jù)某一時期內(nèi)該領域話題被討論的次數(shù)來判斷輿情熱點集中在哪些領域,熱點話題都包括哪些。在情感傾向上分別設立支持、中立和反對的指標。對互聯(lián)網(wǎng)上的信息進行定量研究,比較不同情感傾向人數(shù)的差異,支持不同觀點的人數(shù),從而預測出未來輿情走勢。在情感強度上利用關鍵詞抽取技術抽取信息中的關鍵詞,對情感激烈程度進行分析,從而判斷該話題的情感強度。另外要利用網(wǎng)絡社交平臺的互動統(tǒng)計,如點贊數(shù)、評論數(shù)、轉(zhuǎn)發(fā)數(shù)等指標輔助判斷。

4思考與建議

大數(shù)據(jù)環(huán)境下,網(wǎng)絡信息具有數(shù)據(jù)量大、傳播速度快、形態(tài)多樣化的特點。面對海量數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)統(tǒng)計和輿情監(jiān)測方法存在缺陷。新時代的網(wǎng)絡輿情管理必須依托大數(shù)據(jù)技術實現(xiàn)高效準確的數(shù)據(jù)搜集和挖掘分析[11]。我國網(wǎng)絡輿情管理才剛剛起步,結(jié)合大數(shù)據(jù)技術管理模式還需要逐漸融合探索,未來需要注意以下幾點。

4.1明確當前網(wǎng)絡輿情管理中會面臨的挑戰(zhàn)

大數(shù)據(jù)技術的發(fā)展受限于各地區(qū)條件的差異,由于不同地區(qū)經(jīng)濟水平、受教育程度、互聯(lián)網(wǎng)普及程度、信息技術發(fā)達程度甚至文化都有所差異,因此導致大數(shù)據(jù)技術在實際應用中表現(xiàn)出顯著的地域差異性[12],而其中經(jīng)濟發(fā)展決定著地區(qū)資金富裕程度。大數(shù)據(jù)作為海量數(shù)據(jù)提取分析技術需要足夠資金支持,地方政府和中小企業(yè)能否重視網(wǎng)絡輿情分析系統(tǒng)的構建,投入資金支持是個嚴峻的問題。此外,對于網(wǎng)絡輿情數(shù)據(jù)的收集,大數(shù)據(jù)技術的優(yōu)勢更多體現(xiàn)在數(shù)據(jù)規(guī)模的龐大,而非質(zhì)量的優(yōu)秀。即使隨著相關算法技術不斷地提升,相比于過去已經(jīng)有效過濾無效重復信息,大大提高了輿情分析的準確程度,但是由數(shù)據(jù)良莠不齊造成的偏差仍然不容忽視。

4.2完善網(wǎng)絡輿情監(jiān)管體系

要著手建立以大數(shù)據(jù)技術為核心的網(wǎng)絡輿情監(jiān)管體系,充分挖掘數(shù)據(jù)價值,精準分析網(wǎng)絡錯綜復雜的輿情,從而達到對于網(wǎng)絡輿情監(jiān)管能力的提升。要不斷革新技術,實現(xiàn)監(jiān)測手段的不斷創(chuàng)新,從而提高數(shù)據(jù)的準確度。網(wǎng)絡輿情管理部門需要不斷提高輔助決策的水平,降低預測與實際結(jié)果的偏差[13]。

4.3善用大數(shù)據(jù)思維創(chuàng)新網(wǎng)絡輿情管理

首先,要改變傳統(tǒng)理念,將大數(shù)據(jù)思維充分融入網(wǎng)絡輿情的管理工作中。要從網(wǎng)絡輿情源頭展開治理工作,透過網(wǎng)絡輿情看到隱藏在其中的民情民意,重視社會治理工作與網(wǎng)絡輿情管理的相關性。提高網(wǎng)上政務信息公開程度以提高政府的公信力,提高主流媒體的影響力,加強對于輿情的引導作用。其次,要拓寬輿情管理范圍,合理利用大數(shù)據(jù)開放共享機制,掌控公民日常網(wǎng)絡生活中的動態(tài)信息,從而實現(xiàn)更全面的輿情監(jiān)控。最后,要提高對于輿情事件的應對能力,及時發(fā)現(xiàn)及時處理,避免因?qū)浨樾畔⒈O(jiān)管不及時、對于輿情態(tài)勢不重視而造成的輿論危機。

作者:張安琪 單位:黑龍江大學信息管理學院