公務員期刊網(wǎng) 論文中心 正文

淺談網(wǎng)絡傳播的大數(shù)據(jù)發(fā)展

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了淺談網(wǎng)絡傳播的大數(shù)據(jù)發(fā)展范文,希望能給你帶來靈感和參考,敬請閱讀。

淺談網(wǎng)絡傳播的大數(shù)據(jù)發(fā)展

摘要:隨著計算機的普及,依托于計算機的網(wǎng)絡傳播成為了主要的信息傳播途徑,與此同時,大數(shù)據(jù)也開始發(fā)展,開始急速的衍生和擴散,甚至可以說大數(shù)據(jù)下的計算機網(wǎng)絡已經(jīng)成為帶動國民經(jīng)濟發(fā)展的主體。但大數(shù)據(jù)應該如何理解、網(wǎng)絡傳播下大數(shù)據(jù)又將如何發(fā)展已成為新的研究趨勢。

關鍵詞:網(wǎng)絡傳播;大數(shù)據(jù)技術;大數(shù)據(jù)應用

一、網(wǎng)絡傳播下的大數(shù)據(jù)的誕生

自2005年Hadoop項目誕生,大數(shù)據(jù)就進入了人們的視野當中。大數(shù)據(jù)無疑是在網(wǎng)絡傳播的基礎上進一步衍生出來的“新產(chǎn)品”,想要系統(tǒng)的認知大數(shù)據(jù),就必須要全面而細致的分解它,應著手從三個層面來展開:第一層面是理論,理論是認知的必經(jīng)途徑,也是被廣泛認同和傳播的基線。在這里從大數(shù)據(jù)的定義、特征、問題等方面進行剖析。第二層面是技術,技術是大數(shù)據(jù)價值體現(xiàn)的手段和前進的基石。這部分主要是從大數(shù)據(jù)的開源、存儲、分析和展示技術進行詳盡的分析。第三層面是實踐,實踐是大數(shù)據(jù)的最終價值體現(xiàn)。大數(shù)據(jù)目前已被廣泛采用到生活當中,此部分主要分析網(wǎng)絡中的大數(shù)據(jù)應用。

二、網(wǎng)絡傳播下的大數(shù)據(jù)的理論分析

(一)大數(shù)據(jù)之概念及特點

“大數(shù)據(jù)”的概念最早由維克托•邁爾•舍恩伯格和肯尼斯•庫克耶在編寫《大數(shù)據(jù)時代》中提出,又稱為巨量資料,指需要新處理模式才具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。[1]在網(wǎng)絡傳播時代下,大數(shù)據(jù)主要呈現(xiàn)了以下四方面的特點:1.數(shù)據(jù)體量巨大(Volume)。當前,典型個人計算機硬盤的容量為TB量級,而一些大企業(yè)的數(shù)據(jù)量已經(jīng)接近EB量級。[2]2.數(shù)據(jù)類型繁多(Variety)。數(shù)據(jù)也分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化的數(shù)據(jù)即以文字呈現(xiàn)的數(shù)據(jù)結(jié)構(gòu),非結(jié)構(gòu)化的數(shù)據(jù)則包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等類型。3.價值密度低(Value)。海量數(shù)據(jù)并不能充足證明其重要性,換句話說就是,數(shù)據(jù)多并不代表價值高。4.處理速度快(Velocity)。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。

(二)大數(shù)據(jù)之問題所在

大數(shù)據(jù)、網(wǎng)絡傳播看似是一種簡單的依附與被依附的關系,二者相互依存、相互發(fā)展,但隨著這種關系的不斷行進和演化,一些問題也開始顯露。1.表面化。盡管大數(shù)據(jù)能夠非常好地檢測相關性,但是它并不會告訴我們相關性是如何得出的、得出的合理性以及哪一種相關性是有意義的。2.輔助化。盡管大數(shù)據(jù)搜集的數(shù)據(jù)是龐大的,有一定的事實證明比例,其可以輔助科學調(diào)查,但不可能成功地被完全代替。3.理想化。如今的大數(shù)據(jù)為世人展現(xiàn)的都是其不可估量的大好前途,但大數(shù)據(jù)的數(shù)據(jù)缺失、情況偶然、不準確數(shù)據(jù)不斷地被循環(huán)利用導致了更多問題的出現(xiàn),會引發(fā)更多的以偏概全,會導致思維的引向,甚至結(jié)論的錯誤。

三、網(wǎng)絡傳播下大數(shù)據(jù)技術的分析

(一)開源框架

HadoopHDFS,即HadoopFileSystem,是一款典型的開源文件系統(tǒng),其主要面向大文件的文件系統(tǒng),是分布式數(shù)據(jù)庫的基礎。在文件存取方面,HDFS用NameNode存放文件位置信息,用DataNode存放文件數(shù)據(jù)。[3]當HDFS中存入大量的數(shù)據(jù)后,需要借助MapReduce完成工作分析。之后再從統(tǒng)計維度列出角度對統(tǒng)計值列出的數(shù)據(jù)進行排序,最后通過聚合完成統(tǒng)計維度數(shù)據(jù)項的計算工作。

(二)大數(shù)據(jù)存儲技術

目前數(shù)據(jù)存儲技術主要包括以下兩種存儲技術:1.分布式集群存儲技術。分布式集群存儲技術通常以大數(shù)據(jù)塊為單位,將數(shù)據(jù)切割存儲在多個節(jié)點,為保證數(shù)據(jù)的可靠性,需要在不同的存儲節(jié)點中保存多個數(shù)據(jù)副本。在分布式數(shù)據(jù)庫設計時,可以根據(jù)應用的特點,采用分別處理增加、刪除、修改、查詢操作的方式進行架構(gòu)設計,既要保證事務操作的一致性,又要滿足海量數(shù)據(jù)存取的性能要求。2.關系型數(shù)據(jù)庫存儲技術。關系型數(shù)據(jù)庫的操作語言是結(jié)構(gòu)化的查詢語言,包括數(shù)據(jù)定義語言和數(shù)據(jù)操作語言兩部分。DDL完成了數(shù)據(jù)對象和操作過程的定義,包括數(shù)據(jù)表、視圖、存儲過程、觸發(fā)器、主鍵、外鍵、索引、區(qū)分等,DML則完成了數(shù)據(jù)的操作功能,包括增加、刪除、修改、查詢,也就是人們經(jīng)常聽到的數(shù)據(jù)。

(三)大數(shù)據(jù)分析技術

對大數(shù)據(jù)進行建模的目的是便于對數(shù)據(jù)進行分析和利用,即對數(shù)據(jù)進行多次ETL,經(jīng)過多次ETL之后的數(shù)據(jù)會變得越來越容易理解、使用和個性化,使得分析結(jié)果滿足特殊崗位甚至單個特定人的需求。

四、網(wǎng)絡傳播下的大數(shù)據(jù)應用

實踐是檢驗真理的唯一標準,大數(shù)據(jù)服務能否幫助企業(yè)取得成功,還需要在行業(yè)應用實踐中得到答案。

(一)大數(shù)據(jù)在社交網(wǎng)絡領域的應用

1.SNS業(yè)務應用介紹。SNS體現(xiàn)了Web對于人類社會需求的滿足,人們通過Web應用滿足了不同的心理需求。SNS不同于支持組織互動和業(yè)務流程的傳統(tǒng)應用,其主要實現(xiàn)了人與人以及由人創(chuàng)建內(nèi)容之間的協(xié)同與共享。2.大數(shù)據(jù)技術與SNS應用。不同的社交網(wǎng)絡應用的特點也是不同的,除了微博的熱點話題,商務人士在SNS上形成的社會關系以及留下的溝通、評論等記錄,用戶的通信行為也是反映擁護社會關系的重要數(shù)據(jù)基礎。

(二)大數(shù)據(jù)在電子商務領域的應用

大數(shù)據(jù)對電子商務的主要作用是發(fā)現(xiàn)用戶行為,然后有針對性地為用戶提供產(chǎn)品和服務。大數(shù)據(jù)可以反映世界萬事萬物之間的聯(lián)系,對于當今的網(wǎng)絡十分重要。但如何利用大數(shù)據(jù)?大數(shù)據(jù)如何管理網(wǎng)絡的業(yè)務活動?種種疑問到目前為止還只是簡單的分析描述,希望今后能夠有更多的仁人志士投身于大數(shù)據(jù),挖掘其更大更廣的價值,造福于人類和社會。

參考文獻:

[1]李金.快速充電站[J].人民公交,2016(3):108-109.

[2]王春研.大數(shù)據(jù)與計算機信息處理技術[J].黑龍江科技信息,2016(3):156.

[3]王魯俊,龍翔,吳興博,王雷.SFFS:低延遲的面向小文件的分布式文件系統(tǒng)[J].計算機科學與探索,2014(4):438-445..

作者:吳德勝 孫愷悅 單位:長春工業(yè)大學