公務員期刊網(wǎng) 精選范文 社交媒體文本分析范文

社交媒體文本分析精選(九篇)

前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的社交媒體文本分析主題范文,僅供參考,歡迎閱讀并收藏。

社交媒體文本分析

第1篇:社交媒體文本分析范文

挖掘社交媒體的商務價值

3月11日日本發(fā)生9.0級大地震以后,很多人通過微博及時得到親人、朋友安全的消息,也有很多人通過微博了解到震區(qū)的實時情況。社交媒體在此次地震中更加彰顯了其巨大的威力。國外Facebook、Twitter等社交媒體深受歡迎,國內(nèi)人人網(wǎng)、開心網(wǎng)、新浪微博等社交媒體也被廣泛應用。

在過去,社交媒體更多地被作為個人娛樂、休閑,以及獲取感興趣的信息的一個途徑。在商業(yè)領域,社交媒體也越來越被企業(yè)用來進行市場營銷等工作。比如說,新產(chǎn)品推出早期,可以借助社交媒體得到產(chǎn)品特性的優(yōu)劣評價,以及需要進行哪些改進。再比如說,可以在社交媒體的關系網(wǎng)絡里找到關鍵節(jié)點的關鍵人物,從而有針對性地對產(chǎn)品進行有效推廣。充分挖掘社交媒體中的信息,成為輔助企業(yè)進行正確決策的有效工具。

但是在過去,社交網(wǎng)絡中的這些非結(jié)構(gòu)化的數(shù)據(jù)很難被整理和挖掘。隨著社交媒體信息的商務價值的不斷提升,BI廠商開始考慮通過有效手段挖掘這些信息。

SAP中國區(qū)首席技術官張俠在接受記者采訪時指出,BusinessObjects 4.0中的深層文本分析能整合人們在社交媒體流、博客和電子郵件中所表達的想法和觀點,并輔助企業(yè)做出更加正確的商業(yè)決策。這樣,人們不僅可以準確地監(jiān)控、分析、搜索、報告和處理他們的交易數(shù)據(jù),而且還可以充分地了解博客、電子郵件和社交媒體流等非結(jié)構(gòu)化內(nèi)容中所表達的趨勢和觀點。這種新的多源、多維語義層及共同編程體驗,簡化了即時分析和內(nèi)容創(chuàng)建過程,能以更快的速度向用戶提供更全面的建議。

關注三大特性

BusinessObjects 4.0是BusinessObjects產(chǎn)品近三年以來最重要的一次更新。SAP于2008年收購了BusinessObjects公司后,以最快的速度將其產(chǎn)品轉(zhuǎn)化為自身的商業(yè)智能軟件平臺。

在此次的產(chǎn)品中,SAP將整合了BI和EIM(企業(yè)信息管理)的解決方案稱為商業(yè)分析軟件,并指出實時、移動和社交是商務分析軟件的發(fā)展趨勢:基于內(nèi)存計算,實現(xiàn)實時商務分析;用戶手中瞬間擁有強大的商業(yè)智能能力,并且能夠得到比以往任何時候都多的移動終端的支持;借助準確的企業(yè)和社交數(shù)據(jù),結(jié)合結(jié)構(gòu)化和非結(jié)構(gòu)化信息,提供信息管理工具。

在實時方面,BusinessObjects 4.0借助SAP內(nèi)存計算工具(SAP HANA)的優(yōu)化應用使客戶能夠借助內(nèi)存計算功能處理大數(shù)據(jù)量,從而使實時商務成為可能。內(nèi)存設備以閃電般的速度處理海量數(shù)據(jù)催生了一種新分析模式――這種分析可以立即將大規(guī)模、復雜的數(shù)據(jù)轉(zhuǎn)換成更加明智的商業(yè)決策。

第2篇:社交媒體文本分析范文

【摘 要】“周一見”娛樂事件以其喧鬧的微博文本成功吸引了線上、線下媒體以及千百萬網(wǎng)民的熱烈關注和討論,制造了一個由微博首發(fā)的全民消費現(xiàn)象,成為中國娛樂事件通過微博文本傳播消費產(chǎn)生聚集討論和強大影響力的典范。本文通過對“周一見”事件微博文本元文本的互文性的研究,力求解答為何以微博首發(fā)的“周一見”會產(chǎn)生如此喧鬧的微博文本。

關鍵詞 微博文本 文本消費 互文性

微博自誕生以來一直扮演著媒介事件升溫爐與加速器的角色,不論是近期火爆的“鋒菲戀”等娛樂新聞,還是早在4月份轟動一時的“周一見”事件都是微博傳播的典范。而作為引路石的“周一見”事件的微博傳播雖然事件已經(jīng)淡出了公眾視線,但由于明星的私生活報道產(chǎn)生微博轉(zhuǎn)發(fā)破百萬、登上傳統(tǒng)媒體頭版頭條,網(wǎng)民集體議論、網(wǎng)絡造句大批出現(xiàn)、國外媒體投入關注等現(xiàn)象在國內(nèi)還是首次,也是微博擔任娛樂事件文本傳播的典范,其事件本身的消費特點與傳播,對后來娛樂事件及社會熱點事件傳播的意義與影響是不可忽視的。本文通過互文性的文本分析研究,解釋產(chǎn)生于微博時代的“周一見”事件媒介文本的生產(chǎn)意圖與消費意義。

一、微博文本的交互呈現(xiàn)

一方面,微博等自媒體提供的平臺使得言論相對自由,轉(zhuǎn)發(fā)、評論等功能更是文本快速傳播的引擎,網(wǎng)絡刮起造句風潮,“咎由自取體”、“伊琍體”一時成為熱門句式。從馬伊琍回復文章致歉聲明的微博來看,“戀愛雖易,婚姻不易,且行且珍惜”被網(wǎng)友大量仿造,“畢業(yè)雖易,求職不易,且行且珍惜”、“駕駛雖易,安全不易,且開且珍惜”、“網(wǎng)站雖易,賺錢不易,且行且珍惜”等等造句既是在句式和意境上參照了馬伊琍微博原文,又是網(wǎng)友們結(jié)合求職難、駕駛事故多發(fā)、網(wǎng)站盈利機制不成熟等社會現(xiàn)實,對原信息進行的解碼又重新編碼的過程,互文性的文本生產(chǎn)方式貫穿始終。

另一方面,由于微博的加入,其實時性、開放性與交互性使得整個“周一見”事件文本的生產(chǎn)與消費方式越來越高明,每一個媒介文本的出現(xiàn)都恰如其分,整個事件的媒介文本邏輯嚴密,文本的交互性呈現(xiàn)無處不在。這兩個方面的傳播現(xiàn)象共同的介質(zhì)就是媒介文本,并且在微博的推波助瀾下,媒介文本的“互文性”生產(chǎn)愈加靈活多樣。

網(wǎng)絡造句的熱度反映著受眾對事件和文本的消費熱情,這種熱情也在推動著媒介文本連續(xù)劇式的呈現(xiàn)。從謝曉的“微博預告”開始,小道消息滿天飛,網(wǎng)友猜測,真實圖文報道,到文章的供認不諱和致歉聲明,馬伊琍的微博回應,文本的呈現(xiàn)至此將事件引入一個高峰。輿論的壓力讓文章微博繼續(xù)發(fā)聲“我賤命一條,陪你們到底!”直接叫板《南都娛樂》,讓網(wǎng)友們聯(lián)想是否是《南都娛樂》報私仇,《南都娛樂》官微回應否認“報私仇”傳聞,隨即署名為“馬伊琍爸爸”的微博號發(fā)文質(zhì)問《南都娛樂》,希望還家庭安靜,事情發(fā)展接近尾聲,喧鬧的文本現(xiàn)象也逐漸平息。但我們從主要媒介文本的呈現(xiàn)經(jīng)過可以看出,每一次媒介文本的生產(chǎn)及呈現(xiàn)都恰如其分,有嚴密的邏輯性和故事發(fā)展情節(jié)。事情的發(fā)展以《南都娛樂》發(fā)起,并于每次與當事人交鋒引起輿論,文章的反應和其岳父的發(fā)文以及網(wǎng)友一邊倒的譴責文章同時也暗示著《南都娛樂》的傳播目的成功實現(xiàn)。

二、互文性文本的兩個維度

互文性不僅體現(xiàn)在文本交互性呈現(xiàn)的表現(xiàn)形式上,通過互文性的文本呈現(xiàn)也深刻揭示著整個事件中媒介文本生產(chǎn)與消費的意義。著名媒介文化研究學者約翰·菲斯克在《電視文化》中從水平和垂直兩個維度分析電視文本的互文性,筆者借用菲斯克分析電視互文性的兩個維度的研究思路,并結(jié)合互文性的廣義(解構(gòu)主義)視角——發(fā)生性互文與接受性互文分析“周一見”事件涉及的媒介文本的互文性生產(chǎn),將文本按水平維度分為事件當事人文章、馬伊琍的言論;按垂直維度,將事件當事人文章、馬伊琍的文本分為一級文本,將媒體報道、網(wǎng)友評論分為二級文本(見下表)。

發(fā)生性互文和接受性互文是分別從文本的生產(chǎn)和接受兩個角度對媒介文本進行剖析的。而在利用互文性視角解析文本生產(chǎn)時,接受與生產(chǎn)是必不可少的兩個過程?!爸芤灰姟笔录亩壩谋净臼菍σ患壩谋镜幕貞?,是在對一級文本接受、解構(gòu)的前提下并結(jié)合歷史文本生產(chǎn)的結(jié)果。而一級文本的生產(chǎn)過程也是基于對先時文本的接受、解構(gòu)進而產(chǎn)生的回應與結(jié)合。正如大量網(wǎng)友指出的文章的致歉聲明有抄襲高曉松之前酒駕致歉聲明之嫌,說明文章的微博致歉聲明或多或少是對高曉松版致歉聲明有某種程度上的接受,而又因事件性質(zhì)的不同和身份的不同,存在具體內(nèi)容的差異,因而最終產(chǎn)生的文本是一個對先時文本的接受、解構(gòu)與再生產(chǎn)的過程。又如“伊琍挺住”、“伊琍不哭”等網(wǎng)友評論,首先是對一級文本文章致歉聲明的抗拒性解讀與對馬伊琍“且行且珍惜”微博的接受性解讀;其次,“挺住”“不哭”等句式初在2008年汶川地震時便已出現(xiàn),成為一種流行的固定的網(wǎng)絡文體,用以表示對汶川的支持,后來在玉樹地震、雅安地震中也大量出現(xiàn)。網(wǎng)友將這個文體用在這里,顯然是借對這個歷史文本的互文性生產(chǎn)表達對馬伊琍的同情與支持。因此,在互文性的文本分析視角下,不論是一級文本還是二級文本,都是在對先前文本的接受或解構(gòu)的前提下,或結(jié)合歷史文本,或結(jié)合現(xiàn)實環(huán)境生產(chǎn)的結(jié)果。

而這些文本生產(chǎn)與消費對于事件的內(nèi)涵意義的生產(chǎn)方面,也從水平和垂直維度的文本中得到體現(xiàn)。從水平維度來看,媒介文本是由事件的當事人文章所發(fā),代表了當事人的傳播意圖和立場。文章的致歉聲明與之后的微博因互文性相互關照,后文是對前文意義的強調(diào)。文章所發(fā)微博雖然言辭粗魯,但是很急切的表達了他不希望事情繼續(xù)發(fā)展,希望媒體息事寧人。但當事者生產(chǎn)文本的本意卻并沒能夠得到受眾的完全解讀。因為從垂直維度來看,媒體的報道和網(wǎng)友的評論呈現(xiàn)愈演愈烈的態(tài)勢,并且輿論的導向也偏離文章減輕形象傷害的意圖。在此事件中,二級文本的生產(chǎn)者站在一級文本生產(chǎn)者的對立面,例如謝曉接受騰訊訪談稱“馬伊琍給我發(fā)了一條感謝短信”,更加印證事件的真實性和文章出軌男的形象,以及《南都娛樂》所發(fā)表的言論始終堅持一個態(tài)度和立場,引導受眾按自己的傳播意圖去解讀這些文本。在這場對立文本生產(chǎn)與消費過程中,網(wǎng)民受眾是一群基礎性的存在,他們的評論和立場推動著一級文本和二級文本的生產(chǎn),他們的評論即構(gòu)成了對所有媒介文本的消費。

三、微博文本生產(chǎn)與消費的背后

“周一見”事件的發(fā)生、發(fā)展過程的報道表面上是一個新舊媒體爭相爆料、共同發(fā)聲、合理推進的過程。實際上,在新興媒體和移動互聯(lián)網(wǎng)的沖擊下,傳統(tǒng)媒體面臨激烈的競爭壓力,該事件某種程度上可以看做《南都娛樂》為提高自身公信力和影響力而制造的一次對自身傳統(tǒng)報業(yè)品牌的營銷活動。

微博具有傳播速度快、流傳廣的特點,同時它也是一個負面消息散布極快的平臺?!赌隙紛蕵贰纷钕冗x擇微博發(fā)聲是刻意為之,意在利用微博的傳播特點和強大用戶群體,使話題迅速擴散,產(chǎn)生社會影響。從對文本的分析以及事件的發(fā)展可以看出,《南都娛樂》一直掌控著報道的導向和受眾的導向,比如最先的微博預告中“我也理解當事人此時的焦灼,但請相信此報道絕無任何陰謀論,記者也拒絕了巨大的利益誘惑”表明信源的真實公正客觀,樹立傳統(tǒng)媒體的權威性。不論是“周一見”熱詞的火爆、網(wǎng)民的全體參與,還是文章的回應“我賤命一條,陪你們到底!”都在印證著《南都娛樂》的借勢營銷、傳播意圖取得成功。

通過對“周一見”事件的微博文本分析說明,一個熱點娛樂事件或熱點社會事件的產(chǎn)生和發(fā)展、其文本的生產(chǎn)與消費既有宏觀層面受眾、媒體和技術發(fā)展的因素,也有微觀層面文本生產(chǎn)的方式的影響,文本的互文性生產(chǎn)與呈現(xiàn)、文本生產(chǎn)者的立場與文本傳播的意圖都對整個事件的文本的產(chǎn)生與消費起著重要作用,特別是在新媒體技術的支持下,對社交軟件的精心駕馭能夠一定程度上促進事件的傳播。

參考文獻

①胡曉云、陸琪男,《“故宮星巴克”事件中的媒介文本研究》[J].《廣告大觀》,2007(5)

②約翰·菲斯克:《電視文化》[M].商務印書館,2005

③鮑海波,《喧鬧的文本——媒介文化文本視閾中的“李剛門”事件》[J].《山西大學學報》,2011(2)

④張穎,《網(wǎng)絡新聞話語建構(gòu)的互文性分析》[D].中央民族大學,2012

第3篇:社交媒體文本分析范文

關鍵詞:預測分析 大數(shù)據(jù)處理 大數(shù)據(jù)應用 數(shù)據(jù)挖掘

中圖分類號:TP393 文獻標識碼:A 文章編號:1672-3791(2017)06(c)-0053-03

隨著云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)等新一代信息技術的發(fā)展,傳統(tǒng)企業(yè)級IT架構(gòu)正在朝基于互聯(lián)網(wǎng)的分布式新架構(gòu)轉(zhuǎn)型。大數(shù)據(jù)作為新一代信息技術的核心,正在使各個領域變得越來越可感知,并走向智能化。大數(shù)據(jù)將會發(fā)揮自身獨特的優(yōu)勢,帶給我們更多的方便和便捷。大數(shù)據(jù)分析的方法理論有哪些、在行業(yè)、企業(yè)的活動中有哪些應用。

1 大數(shù)據(jù)分析的五個基本要素

1.1 大數(shù)據(jù)預測性分析

大數(shù)據(jù)技術的主要應用是預測性分析,如在線教學資源網(wǎng)站通過數(shù)據(jù)分析用戶會對推薦的教學模是否感興趣,保險公司通過數(shù)據(jù)預測被保險人是否會違規(guī),地震監(jiān)測部門通過對大數(shù)據(jù)的分析,預測某地點發(fā)生地震的大致時間,氣象部門利用數(shù)據(jù)預測天氣變化等。預測是人類本能的一部分,通過大數(shù)據(jù)預測人類才可以獲得有意義的、智能的信息。許許多多的行業(yè)應用都會涉及到大數(shù)據(jù),大數(shù)據(jù)的豐富特征表述了快速增長的存儲數(shù)據(jù)的復雜性。大數(shù)據(jù)預測分析打破了數(shù)據(jù)預測一直是象牙塔里數(shù)據(jù)科學家和統(tǒng)計學家的工作,伴隨著大數(shù)據(jù)的出現(xiàn),并融合到現(xiàn)有的MIS、MRPII、DSS 、CIMS和其他核心業(yè)務系統(tǒng),大數(shù)據(jù)預測分析將起到越來越重要的作用。

1.2 數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量

大數(shù)據(jù)分析跟數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理緊密相關,而質(zhì)量高的數(shù)據(jù)和有效的數(shù)據(jù)管理可以使分析結(jié)果有價值、真實并得到有力的保證。

1.3 可視化分析

普通用戶和大數(shù)據(jù)分析專家是大數(shù)據(jù)分析的直接使用者,因此他們對大數(shù)據(jù)分析的基本要求就是要可視化,因為他們想通過可視化分析獲得可觀的大數(shù)據(jù)特征,讓用戶直觀看到結(jié)果。

提高解釋信息的能力可以通過數(shù)據(jù)的可視化展示來實現(xiàn),而可視化展示主要由圖形和圖表來呈現(xiàn)。要從大量的數(shù)據(jù)和信息中找尋相關性非常的不容易,而圖形或圖表能夠在短時間內(nèi)展示數(shù)據(jù)之間的相關信息,并為用戶提供所需的信息。

1.4 語義引擎

語義引擎是把現(xiàn)有的數(shù)據(jù)標注語義,其實可以把它理解為結(jié)構(gòu)化或者非結(jié)構(gòu)化的數(shù)據(jù)集上的一個語義疊迭層。它是數(shù)據(jù)分析及語義技術最直接的應用,好的語義引擎能夠使大數(shù)據(jù)分析用戶快而準地獲得比較全面的數(shù)據(jù)。

數(shù)據(jù)分析的新挑戰(zhàn)及困難主要表現(xiàn)在非結(jié)構(gòu)化數(shù)據(jù)與異構(gòu)數(shù)據(jù)等的多樣性,必須配合大量的工具去分析、解析、提取數(shù)據(jù)。語義引擎的設計可以達到能夠從文檔中自動提取有用信息,使語義引擎能挖掘出大數(shù)據(jù)的特征,在此基礎上科學建模和輸入新的數(shù)據(jù),來預測未來的可用數(shù)據(jù)。

1.5 數(shù)據(jù)挖掘算法

大數(shù)據(jù)分析的理論核心就是數(shù)據(jù)挖掘。各種數(shù)據(jù)的算法基于不同的數(shù)據(jù)類型和格式,能更加科學地呈現(xiàn)出數(shù)據(jù)本身的特點,能更快速地處理大數(shù)據(jù)。如果采用一個算法需要花好幾年才能得出結(jié)論,那大數(shù)據(jù)價值也就無從f起了??梢暬墙o人看的,數(shù)據(jù)挖掘是給機器看的。集群、分割、孤立點分析還有其他的算法可以使我們深入挖掘數(shù)據(jù)內(nèi)部的價值,并且這些算法能夠處理大數(shù)據(jù)的數(shù)據(jù)量,也可以滿足處理大數(shù)據(jù)的效率要求。

2 大數(shù)據(jù)處理方法

大數(shù)據(jù)處理技術在社會的發(fā)展中占有重要的地位,現(xiàn)在有很多的研究者對大數(shù)據(jù)處理技術進行研究,將大數(shù)據(jù)處理技術與交互設計結(jié)合,讓交叉科學得到發(fā)展,計算機技術的進步,讓交叉技術被廣泛應用,并引起了很多人的重視,例如:計算機技術可以在藝術中被應用,進行色彩搭配,還可以將計算機技術應用到垃圾分類里,這些都是研究人員對計算機和交叉設計的結(jié)合。這種結(jié)合讓設計學與計算機技術緊急的結(jié)合在一起,將傳統(tǒng)的調(diào)研方式和測試方式應用到交叉科學領域,這種方法的研究可以為用戶調(diào)研和測試方法提供依據(jù),能夠減少人工的成本。大數(shù)據(jù)處理方法其實有很多,筆者根據(jù)長時間的實踐,總結(jié)了幾種基本的大數(shù)據(jù)處理方法,如非結(jié)構(gòu)數(shù)據(jù)處理法、自然語言處理法等,該文主要介紹非結(jié)構(gòu)數(shù)據(jù)處理流程涉及到的主要方法和技術。非結(jié)構(gòu)化數(shù)據(jù)處理流程主要以網(wǎng)頁處理為例來闡述,包括3個階段,分別是信息采集、網(wǎng)頁預處理和網(wǎng)頁分類。

2.1 信息采集

信息采集主要是根據(jù)相關主題由固定的專業(yè)人士來完成,其采集的數(shù)據(jù)只能用于所針對的主題和相關的模塊,出于對效率和成本的考慮完全不必對整個互聯(lián)網(wǎng)進行遍歷,因此,模塊信息采集時往往需要研究以哪種方式預測鏈接指向的頁面與主題的關聯(lián)性,并測算其是否值得訪問;然后研究以哪種相關策略訪問Web,以在采集到主題相關頁面的同時,盡可能地減少采集到主題無關的頁面。

預先設定好種子鏈接是信息采集的基本方法,充分使用HTTP協(xié)議下載被訪問的頁面,運用分析算法對頁面與主題的相關性進行分析,然后確定待訪問的相關鏈接,預測可能指向主題相關頁面的鏈接,最后循環(huán)迭代地運用不同的相關策略訪問網(wǎng)頁。

2.2 網(wǎng)頁預處理

網(wǎng)頁預處理最主要涉及到網(wǎng)頁去重處理,網(wǎng)頁去重可以歸為兩類:一類是基于URL的對比去重,它適用哈希算法;另一類是基于內(nèi)容的對比去重,它適用基于信息指紋的文本相似度算法。

網(wǎng)頁去重是先抽取文檔對象的特征,再對文檔內(nèi)容進行分解,將文檔的特征集合表示出來,然后有目的針對特征集合的壓縮編碼,通過將哈希編碼等文本轉(zhuǎn)為數(shù)字串映射方式,為后續(xù)的特征存儲以及特征比較提供方便,這樣可以起到減少存儲空間,提高比較速度的作用,最后就是計算文檔的相似度,此步需要根據(jù)文檔特征重復比例來確定文檔內(nèi)容是否重復。一般是提取網(wǎng)頁的某一個信息特征,通常是一組關鍵詞,或者是關鍵詞加權重的組合,調(diào)用相應的算法,轉(zhuǎn)換為一組關鍵代碼,也被稱為指紋,若兩個頁面有大數(shù)量的相似指紋,那么可以預測這兩個頁面內(nèi)容具有很高的重復性。

2.3 網(wǎng)頁分類

網(wǎng)絡時代,人類所面臨的一個非常重要且具有普遍意義的問題就是網(wǎng)頁分類。將網(wǎng)絡信息正確分類,方便人們更好地使用網(wǎng)絡資源,使雜亂無章的網(wǎng)絡環(huán)境變得有條理。而網(wǎng)頁分類一般是先對網(wǎng)頁中的文本素材進行分類,通常采用文本分類來完成。文本分類主要應用于電子郵件分類、信息過濾、文獻翻譯、數(shù)據(jù)檢索等任務,文本分類的一個關鍵問題是特征詞的選擇問題及其權重分配。

在搜索引擎中,文本分類主要有以下用途:相關性排序會根據(jù)不同的網(wǎng)頁類型做相應的排序規(guī)則;根據(jù)網(wǎng)頁是索引頁面還是信息頁面,下載調(diào)度時會做不同的調(diào)度策略;在做頁面信息抽取的時候,會根據(jù)頁面分類的結(jié)果做不同的抽取策略;在做檢索意圖識別的時候,會根據(jù)用戶所點擊的URL所屬的類別來推斷檢索串的類別等。

網(wǎng)頁分類方法有SVM分方法和樸素貝葉斯方法,其中比較推薦的是支持向量機分類方法(SVM),該算法主要基于統(tǒng)計學理論及線性分類器準則之上,從線性可分入手,再擴展到線性不可分的情況。甚至有時會擴展到使用非線性函數(shù)中去,這種分類器統(tǒng)稱為支持向量機。近年來,支持向量機分類方法越來越多的受到網(wǎng)頁分類技術人員的青睞。

3 大數(shù)據(jù)分析在行業(yè)活動中的應用

非結(jié)構(gòu)數(shù)據(jù)處理和數(shù)據(jù)挖掘的應用范圍較廣,它可能應用于運營商、銀行、傳統(tǒng)企業(yè)和電商,挑選幾個具有代表性的案例與大家分享。

3.1 電信行業(yè)

某城市電信運營商的上網(wǎng)日志分析系統(tǒng),該系統(tǒng)通過收集用戶上網(wǎng)日志歷史記錄數(shù)據(jù),分析出每個用戶的偏好。首先該系統(tǒng)通過并行統(tǒng)計出每個人有效歷史上網(wǎng)日志URL;然后從日志URL中抓取網(wǎng)頁內(nèi)容,提取正文,并通過文本分類算法計算分類;最后通過統(tǒng)計出每個用戶上網(wǎng)關注類別總數(shù),分析出每個用戶的偏好。

3.2 地產(chǎn)行業(yè)

某房地產(chǎn)企業(yè)的社會化品牌實時營銷系統(tǒng),該系統(tǒng)通過社交媒體數(shù)據(jù),進行網(wǎng)絡口碑監(jiān)測,負面情緒被及時地發(fā)現(xiàn)并制止;通過與客戶進行互動,爭取客戶忠誠度;通過監(jiān)控同行及競爭對手的各方面資訊,量化評估競爭態(tài)勢;快速提升品牌知曉度和美譽度,將媒體影響力轉(zhuǎn)換為客戶量,縮短人氣聚集周期。

3.3 證券行業(yè)

某證券商戰(zhàn)略信息監(jiān)測通過歷史回顧與信息摘要,提供題目、摘要、原文URL,今日輿情焦點,今日輿論,展示抓取的所有期貨產(chǎn)品相關信息的縮略,并提供全文鏈接。通過熱點事件列表可以看到歷史相似事件對趨勢的影響,通過天氣指數(shù)與趨勢對應曲線可以看到歷史相似天氣與歷史趨勢的對照。

3.4 金融行業(yè)

某大型股份制商業(yè)銀行供應商風險評估系統(tǒng),該系統(tǒng)通過抓取供應商內(nèi)部數(shù)據(jù),如企業(yè)年報、公司變動、領導情況、財務狀況等數(shù)據(jù),分析公司運營指數(shù);通過計算各供應商社交數(shù)據(jù),對其社會影響力做評估;通過同行之間的數(shù)據(jù)分析對比,對供應商進行實力評估,這些數(shù)據(jù)指數(shù)可以有效協(xié)助商業(yè)銀行進行供應商風險評估。

4 結(jié)語

大數(shù)據(jù)處理數(shù)據(jù)的基本理念是用全體代替抽樣,用效率代替絕對精確,用相關代替因果。證券、微商、地產(chǎn)等行業(yè)每天都會產(chǎn)生巨大的數(shù)據(jù)量,大數(shù)據(jù)分析與處理已成為大數(shù)據(jù)技術的最重要的應用,通過大數(shù)據(jù)技術從海量數(shù)據(jù)中提取、挖掘?qū)I(yè)務發(fā)展有價值的、潛在的信息,找出產(chǎn)品或服務未來發(fā)展趨勢,為決策者提供有力依據(jù),有益于推動企業(yè)內(nèi)部的科學化、信息化管理。

參考文獻

[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-149.

[2] 國際電子商情2013年大數(shù)據(jù)應用與趨勢調(diào)查[Z].

[3] 大數(shù)據(jù)時代來臨:國內(nèi)IT企業(yè)布局已然落后[EB/OL].新浪網(wǎng),2012-06-01.

[4] 大數(shù)據(jù)時代降臨[EB/OL].半月談網(wǎng),2012-09-22.

[5] 王惠.大數(shù)據(jù)時代下數(shù)據(jù)分析理念研究[J].中國市場,2015(22):74.

第4篇:社交媒體文本分析范文

關鍵詞:文本挖掘 新聞 支持向量機 貝葉斯分類 粗糙集 股票價格

注:2014年國家級創(chuàng)新基金項目(項目編號201410287046):基于文本挖掘技術的網(wǎng)絡新聞對中國股市影響的分析預測

隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,互聯(lián)網(wǎng)新聞中包含了越來越多的財經(jīng)資訊。財經(jīng)網(wǎng)站已經(jīng)演變成投資者用來交換想法與新聞媒體傳播的主流載體,行業(yè)新聞與個股新聞在證券市場上對投資者的投資決策起到關鍵性作用。但是,投資者從海量的財經(jīng)新聞中分離出有效的信息仍然存在著較大困難。因此,提供一種科學有效的方法來幫助投資者判斷新聞的影響力是至關重要的。

目前,探索互聯(lián)網(wǎng)媒體與股市關系的傳統(tǒng)研究較少,大多數(shù)學者在有限理性假說的基礎上,對投資者心理、投資行為、市場信息非對稱性、政府對新聞媒體的控制以及財經(jīng)新聞語義分析等方面進行研究,其研究結(jié)果偏理論性和概括性。而近幾年,隨著大數(shù)據(jù)的不斷成熟,數(shù)據(jù)挖掘技術在證券市場預測上的運用也逐漸增加。

互聯(lián)網(wǎng)財經(jīng)新聞所蘊含的數(shù)據(jù)是非結(jié)構(gòu)化的,所以將新聞量化成可視化的時間序列數(shù)據(jù)具有一定的挑戰(zhàn)性。國內(nèi)學者運用文本分類的基本方法對新聞標題或者板塊個股的新聞進行情感分類,構(gòu)建中文分詞詞典和情感詞典。分詞方面,羅海飛等在不斷改進貝葉斯算法的基礎上進一步提高文本分類的正確率。西南財經(jīng)大學趙麗麗等主要應用文本挖掘技術和多元線性回歸分析方法,結(jié)合股票主要技術主表就互聯(lián)網(wǎng)財經(jīng)新聞對股市影響進行了實證分析與定量研究。國外機器學習領域的學者以互聯(lián)網(wǎng)社交媒體為主要研究對象,根據(jù)用戶表達的投資意愿來分析其與股價之間的聯(lián)系,運用支持向量回歸模型、多核學習方法等建立股價預測模型。歷史研究表明,智能方法與傳統(tǒng)的CAPM和Fama四因素股價預測模型相比具有更高的準確性。

本文將運用數(shù)據(jù)挖掘技術分別預測個股新聞與行業(yè)新聞對股價的影響,建立智能方法模型,比較股價預測模型的準確性,在國內(nèi)研究中具有創(chuàng)新意義。

一、方法

(一)系統(tǒng)概述

圖一闡述了我們預測系統(tǒng)的全面流程。首先,我們需要搜集數(shù)據(jù)。在這過程中,我們運用文本挖掘技術抓爬財經(jīng)網(wǎng)站上的數(shù)據(jù),并建立相關股票新聞數(shù)據(jù)庫。其次,我們在這些無結(jié)構(gòu)數(shù)據(jù)中分離出有用的信息。我們?nèi)コ鼿TML的標簽,并且分離出有用的新聞特征,例如時間、新聞文本等,對新聞進行文本情感分類,將無結(jié)構(gòu)數(shù)據(jù)量化。最后,我們的系統(tǒng)能夠通過運用支持向量機(SVM)、貝葉斯算法、粗糙集模型對證券價值分別進行預測。

(二)數(shù)據(jù)搜集

我們選擇證券行業(yè)為主要研究對象,在新浪財經(jīng)網(wǎng)站(http://.cn/stock/)上搜集了證券行業(yè)18家股票的個股新聞和行業(yè)新聞。本研究抓取了2012年12月至2014年9月期間的行業(yè)新聞5063條,個股新聞10309 條。其中,將2012年12月至2014年7月作為訓練集時間段,選取2014年8月至9月作為預測集時間段,采用訓練好的模型預測2014年8至9月期間每一則新聞報道對股票收益所產(chǎn)生的影響。本文以前一天15點到次日15點為T日,建立2012年12月4日至2014年9月26日期間的新聞文本資料庫。

(三)情感分類

對于情感分類引入評價理論,通過從文本中提取形容詞及修飾語構(gòu)成的短語作為特征,進行語義傾向分析。本文將股票新聞的情感特征詞劃分為情感詞和行為詞兩類,并進一步分為5個維度(正、負、程度、否定詞、不確定詞),利用ICTCLAS程序接口以及C++對所有新聞文本進行了分詞,建立金融特征詞庫。

(四)文本結(jié)構(gòu)化處理

在處理數(shù)據(jù)的過程中,本文基于金融特征詞庫,進行特征選擇,利用向量空間模型(Vector Space Model,簡稱VSM)將無結(jié)構(gòu)數(shù)據(jù)的新聞文本轉(zhuǎn)換成計算機可以處理的結(jié)構(gòu)化向量。通過TFIDF方法評估每個特征詞在整個文檔集中的重要程度。

(五)學習模型

1、SVM模型

SVM模型由Vapnik首先提出,主要思想是建立一個超平面作為決策曲面,使得正例和反例之間的隔離邊緣被最大化。本文選用的是SVM模型中的C-SVC的分類器,其過程如下:

基于libsvm工具箱,本文選用多項式核函數(shù),以結(jié)構(gòu)化的文本向量及股票收益率為模型的輸入。其中,每日股票收益率采用的是新聞當天數(shù)據(jù),周末新聞算為下周一數(shù)據(jù),對應下周一股票收益率,以此類推。同時,將停牌股的股票收益與當日新聞予以去除。在進行預測時,由于特征歸一化對預測結(jié)果有影響,本文考慮分別保留未歸一化和歸一化的兩類預測數(shù)據(jù),模型分別用SVM1,SVM2表示。

2、樸素貝葉斯分類

貝葉斯分類原理是通過選取適當?shù)哪P偷南闰灧植迹秘惾~斯公式計算出其后驗概率。本文樸素貝葉斯分類器所選擇的訓練集和預測集與SVM的所選擇數(shù)據(jù)相同,模型用Bayes表示。

3、粗糙集預測

由于分類器與新聞因素的差異對預測的數(shù)據(jù)都有影響,本文構(gòu)建了一種基于粗糙集的組合預測方法,進而比較分類數(shù)據(jù)預測的準確性。

本文將SVM1,SVM2,Bayes三種模型求解的行業(yè)新聞與公司新聞的預測值作為條件屬性集C的元素,將預測真實值y視為決策屬性D{y}。論域為各公司預測集內(nèi)各日數(shù)據(jù)的集合,該論域中對象的屬性即為對應日的屬性集C??紤]粗糙集理論中屬性集等價類的概率分布[X;p]、[Y;p],引入信息論中信息熵,構(gòu)建如下公式:

<E:\123456\財經(jīng)界?學術版201513\6下-7.TIF>

經(jīng)過運算:

<E:\123456\財經(jīng)界?學術版201513\6下-8.TIF>

得出C各元素重要性,即各公司不同預測方法,不同新聞因素的重要性。在此基礎上,加權不同的預測方法的預測值,可以得出新的預測值;加權不同方法對新聞因素的影響,可以得出兩新聞因素影響的重要性。

二、實驗與結(jié)果

(一)組合預測與其他預測結(jié)果比較

本文分別研究了互聯(lián)網(wǎng)行業(yè)與個股新聞對證券行業(yè)股票影響強度,比較SVM、貝葉斯以及粗糙集三種模型的預測結(jié)果,得出結(jié)果如表1所示。

<E:\123456\財經(jīng)界?學術版201513\6下-5.TIF>表1組合預測與其他預測結(jié)果的比較

從表1中可以看出,基于粗糙集組合預測結(jié)果的準確率總體而言相對于其他兩種方法較高。由于粗糙集組合預測需要在預測期間內(nèi)相同時間段內(nèi)同時存在行業(yè)與個股新聞,其可采用的新聞數(shù)據(jù)數(shù)量比其他兩種預測方法會有所減少,影響了結(jié)果。所以在綜合考慮行業(yè)與個股新聞時,同時考慮公司新聞因素和行業(yè)因素準確性并不見得會比單獨考慮高,反而會出現(xiàn)更低的準確度,具體表現(xiàn)以中信、西南、招商、國金、光大、東吳為例。

但對于整個證券行業(yè)而言,粗糙集組合預測綜合了各個模型的優(yōu)缺點以及各新聞因素對各公司的影響程度大小,較大的提升了預測準確率。

(二)公司新聞和行業(yè)新聞對各公司影響結(jié)果分析

<E:\123456\財經(jīng)界?學術版201513\6下-6.TIF>

表2 行業(yè)新聞與公司新聞影響因素比較

根據(jù)表2可以得知,公司新聞因素為股票價格的主導因素。當我們?nèi)コA測率較低的個股后,這一現(xiàn)象表現(xiàn)的更為顯著,這是因為公司新聞中所含的有價值信息超過行業(yè)新聞中的有價值信息。

三、結(jié)束語

本文采用文本挖掘技術和向量空間模型,引入了機器學習方法,結(jié)合股票技術指標,就證券行業(yè)與個股新聞對股市的影響進行了分析研究。在研究過程中,本文發(fā)現(xiàn),互聯(lián)網(wǎng)新聞對股票收益率存在一定的影響,并且個股新聞對股票收益率的影響高于行業(yè)新聞?;ヂ?lián)網(wǎng)新聞的樣本數(shù)量和質(zhì)量也會影響預測的準確性,樣本新聞信息處理的越好,預測則更加精準。

由于股票新聞存在不完整、不確定的特性,考慮到這個因素,本文在運用SVM模型和貝葉斯分類方法的基礎上,創(chuàng)新運用粗糙集模型組合不同預測模型,得到了更加精確的預測結(jié)果。由此可以看出,運用數(shù)據(jù)挖掘預測股票收益具有較大的前景。

然而,互聯(lián)網(wǎng)財經(jīng)新聞不是一直可信賴的,投資決策還應該結(jié)合更多的技術指標和信息來進行分析。在未來的研究中,作者將進一步結(jié)合影響股票價格收益率的更多因素綜合預測價格的波動。

參考文獻:

[1]鄒亞寶.媒體對有限理性投資者投資行為的影響研究[J].金融教育研究.2012.第25卷第5期

[2]譚華.不確定時態(tài)數(shù)據(jù)挖掘方法及其在證券行情預測中的應用[D].長沙:湖南大學.2008

[3]高D,周莉,張勇,邢春曉,孫一鋼,朱先忠.面向股票新聞的情感分類方法[J].軟件學報.2010. Vol.21.P349-642

[4]陳華,梁循.互聯(lián)網(wǎng)股票新聞歸類和板塊分析的方法[J].電腦開發(fā)與應用,2006,11:2-3+6.

[5]李丹.基于樸素貝葉斯方法的中文文本分類研究[D].河北大學,2011

[6]趙麗麗. 互聯(lián)網(wǎng)財經(jīng)新聞對股市影響的定量分析[D].成都:西南財經(jīng)大學.2012:1-49

[7] Yang Yu,WenjingDuan,Qing Cao.The impact of social and conventional media on firm equity value: A sentiment analysis approach.Decision Support Systems 55 (2013) 919C926

第5篇:社交媒體文本分析范文

關鍵詞: 多模態(tài)語言 多元識讀能力 大學生

1.研究背景

隨著國際化進程的加快,傳播媒介新技術的發(fā)展及普及,人與人之間的多模態(tài)交流日益頻繁。傳統(tǒng)以語言為主符號單一的傳統(tǒng)識讀能力在當今社會已不夠用,因而由圖像、聲音、動作和顏色等表達意義的符號元素,正在與語言符號一起形成構(gòu)建意義的多模態(tài)系統(tǒng),并給識讀教育帶來重大變革(胡壯麟,2007)。如今,多模態(tài)構(gòu)建成為主流表達形式,使得傳統(tǒng)與現(xiàn)代化教學相互補充與滲透,有利于更好地發(fā)揮教學的整體功能。在外部學習環(huán)境和媒介發(fā)生變化的同時,多元識讀能力在一定程度上決定大學生獲取知識和資源的廣度和深度,因此,提高大學生的多元識讀能力是多模態(tài)輸入環(huán)境下應運而生的內(nèi)在需求。

關于多模態(tài)語言的輸入和多元識讀能力的培養(yǎng),目前已有許多學者作過相關研究和分析。Kress和van Leeuwen(2001)認為,模態(tài)可以定義為參與交際的所有渠道和媒介,除了傳統(tǒng)的語言符號外,還包括圖像、顏色、音樂、技術等符號系統(tǒng)。各種符號資源(如有聲語言、形象、聲音、設計、動作等)共同參與日常的人際交往活動,形成多模態(tài)交流。張德祿(2009)指出,在現(xiàn)代技術條件下,在多模態(tài)話語交際的框架下,對模態(tài)的選擇可以為外語教學提供盡可能的便利條件和輔助條件,提高教學效率,還可以為多模態(tài)話語交際提供多通道話語意義的表達方式。胡壯麟教授(2007)認為多元識讀能力既包含文化識讀又包含技術識讀,也就是說這種能力不僅包括傳統(tǒng)的讀寫識讀能力,還包括文化、視覺、聽覺、空間、姿態(tài)及現(xiàn)代信息網(wǎng)絡時代的技術識讀和信息識讀等多種識讀能力。顧曰國(2007)分析了利用多模態(tài)進行教學的重要性。此外,研究者還相繼探索了多元識讀的教學實踐(葛俊麗、羅曉燕,2010;張義君,2011)。

然而,在前人的研究范疇里,面向?qū)W習主體開展的實證類研究為數(shù)不多。本研究試圖回答以下四個問題:(1)大學教學中多模態(tài)語言的輸入現(xiàn)狀?(2)大學生進行多元識讀的具體學習表現(xiàn)?(3)大學生多元識讀能力提高的具體表現(xiàn)?(4)多模態(tài)語言輸入和識讀能力提高之間存在的問題?

2.調(diào)查對象與方法

2.1問卷調(diào)查對象

本實驗從某高校隨機選取150名大學生作為問卷調(diào)查對象,理工科學生為100人(67%),文科英語專業(yè)學生為50人(33%)。

2.2調(diào)查工具

2.2.1多元識讀能力調(diào)查問卷的設計

問卷共20題,涉及4個方面,每個方面設計5個選擇題。四個方面分別為:多模態(tài)語言的輸入現(xiàn)狀、多元識讀的學習表現(xiàn)、多元識讀能力提高的表現(xiàn)和目前多模態(tài)語言輸入和識讀能力提高之間還存在的問題。選項采用五級制,分別為完全同意、同意、基本同意、不同意、完全不同意。

2.2.2學生作業(yè)樣本

英語專業(yè)三年級的預習作業(yè)。形式是PPT,預習課文選自高級英語第二冊Lesson10 The Sad Young Man。

2.3數(shù)據(jù)收集

共計發(fā)放150份調(diào)查問卷,回收150份,全部有效,有效回收率100%。共計收取25份PPT作業(yè),每班各5份作業(yè)樣本。

3.結(jié)果與討論

3.1調(diào)查問卷數(shù)據(jù)及結(jié)果

3.1.1英語教學中多模態(tài)語言的輸入現(xiàn)狀

表1很明確地說明了一個事實:多媒體設備已基本完備(A組數(shù)據(jù)選擇基本同意以上總計為90.4%),多模態(tài)語言輸入的教學模式已基本在該所高校的課堂普及(B組數(shù)據(jù)選擇基本同意以上總計為100%),并且多數(shù)教師和學生都已積極接受多模態(tài)語言輸入的教學模式,教學過程中多數(shù)教師積極采用PPT等多模態(tài)輔助教學工具,而PPT形式多樣(C組數(shù)據(jù)選擇基本同意以上總計為94%),內(nèi)容生動有趣,使學生積極地采用此類學習模式。此外,除了以PPT為主要形式外,一些任課教師也開始使用其他類型的多媒體輔助教學工具,如CAD等(D組數(shù)據(jù)選擇基本同意以上總計為80%)。另外,網(wǎng)絡作為多模態(tài)的載體在教學和學習中的作用凸顯。該所高校已開通網(wǎng)絡學習平臺,凸顯了學習資源豐富,集各種語言輸入模式為一體的特色,但是課程覆蓋率還處于較低狀態(tài)(E組數(shù)據(jù)選擇基本同意以上總計為75.2%)。

3.1.2多元識讀的學習表現(xiàn)

從表2可以看出:多數(shù)學生具備上網(wǎng)獲取各類學習輔助資料的能力,包括網(wǎng)頁文本、網(wǎng)頁圖片、音頻、視頻等多種形式資料,同時也能夠在課外多渠道獲取各類信息和資料(A組和C組數(shù)據(jù)選擇基本同意以上總計分別為86.4%和82.4%)。以英語學習為例,學生經(jīng)常使用新聞報刊、影視劇集、論壇貼吧等開展自主聽說讀寫練習。該校部分課程已開通課程網(wǎng)絡學習平臺,在任課教師的要求和學生學習主動性的激發(fā)下,一般都會使用網(wǎng)絡平臺開展自主學習;但是許多課程暫時還處于網(wǎng)絡課程開放之前的建設過程中,因此從數(shù)據(jù)顯示來看(B組和E組數(shù)據(jù)選擇基本同意以上總計分別為64%和69.6%),大學生通過課程網(wǎng)絡平臺加強多元識讀的學習方式亟待開發(fā)和推進。此外,隨著課堂互動的日益增加,學生由主要知識接收者逐漸轉(zhuǎn)變?yōu)橹R輸出者,進行課堂講演的機會越來越多。目前PPT是學生進行講演時使用的主要工具(D組數(shù)據(jù)選擇基本同意以上總計為87.4%)。

3.1.3多元識讀能力提高的表現(xiàn)

隨著網(wǎng)絡的普及,學生對網(wǎng)絡技術日漸熟悉,大部分學生的多元識讀能力明顯得到提高,能夠主動獨立地發(fā)揮多元識讀能力開展學習和參與演講活動。多數(shù)學生能夠熟練使用信息技術檢索資料,包括論壇貼吧、各種新聞網(wǎng)站和電影網(wǎng)站等。根據(jù)表3數(shù)據(jù)顯示,該校學生自我評價相對較高,A組顯示88%以上基本同意熟練使用信息技術檢索資料;B組顯示92.8%正確刪選資料;C組顯示高達95.2%的學生利用PPT進行課堂講演;E組顯示89.6%的學生利用網(wǎng)絡合作解決學習問題;D組是唯一顯示學生多元識讀能力不足的方面,即在參加網(wǎng)絡學習討論并提出意見方面還有待提高。

3.1.4存在問題

根據(jù)表4,不難發(fā)現(xiàn)存在的問題:雖然學生在多模態(tài)語言輸入環(huán)境下有較好的聽覺、視覺、空間及網(wǎng)絡信息識讀能力,但學生對于搜索信息技術的掌握、刪選重組網(wǎng)絡信息的自學能力和轉(zhuǎn)化信息的能力仍然不足(C組、D組和E組認可該能力的總和分別是81.9%、73.3%和75.3%)。此外,學生普遍認為教學中的多模態(tài)形式不但局限于靜態(tài)PPT,而且大多數(shù)PPT畫面過于花哨,對學習者多元識讀的接受能力將會產(chǎn)生消極影響(A組和B組認為有以上兩組情況的數(shù)據(jù)分別為88%和92.8%)。

3.2學生作業(yè)樣本分析及結(jié)果

通過統(tǒng)計學生的作業(yè)樣本(見表5),主要有三項發(fā)現(xiàn):第一,文字和圖片模態(tài)是學生較喜歡的兩種呈現(xiàn)方式,只有9份作業(yè)選擇增加音頻視頻資料進行課堂演示,說明學生對多模態(tài)信息輸入的重要性和必要性已經(jīng)有所認識,少數(shù)學生會通過運用聲音模態(tài)的信息表達自己的觀點;第二,在資料收集方面,25組作業(yè)完成者都會運用網(wǎng)絡收集自己所需的資料,對大量資料也有一定的篩選能力,但是發(fā)現(xiàn)只有4組學生能運用網(wǎng)絡社交平臺進行討論和收集問卷資料,由此可以看出利用網(wǎng)絡社交平臺促進學習的優(yōu)勢還沒有得到充分的挖掘;第三,通過仔細對照在PPT作業(yè)中的圖片,筆者認為多數(shù)學生對圖片的選擇比較隨意,有些圖片的表現(xiàn)內(nèi)容并不與其想表達的主題相符,反而影響PPT的整體性和趣味性。這些都說明學生對資料的辨別篩選能力還有待提高。

3.3對策及建議

3.3.1多模態(tài)化學習資源的充分運用和輸入

首先,在多模態(tài)語言輸入條件下,學習內(nèi)容不應該只局限于紙質(zhì)的書本,可以多加入一些其他模態(tài)的信息。例如,在英語教學中,應該借助多種信息資源,如文化、語言、宗教、地域、歷史、語境等,融視、聽、觸等多感官刺激于一體,為學習者提供文、圖、聲、像交互并存的語言環(huán)境,激活學生知識體系中已有的相關經(jīng)驗,并借助多模態(tài)的互動效果,引導學生了解、探討、研究與語言相關的文化現(xiàn)象,從多維的角度理解語言、分析語言。其次,多模態(tài)PPT設計可以通過文本、音頻、視頻等引導,有選擇地對學習內(nèi)容的背景知識和傳達的價值觀念進行補充。特別值得引起重視的是,網(wǎng)絡課程平臺的建設和在教學中的運用將在未來起到舉足輕重的作用,教師應積極開設網(wǎng)絡課程,為學生提供全面豐富的學習資源,在課余搭建健康的學習交流平臺,幫助學生開拓更寬更廣的學習視角。

3.3.2多元識讀能力的有效培養(yǎng)和輸出

調(diào)查結(jié)果顯示大部分學生已擁有較好的多元識讀能力,且該能力不斷提高。雖然學生對自己的多元識讀能力評估較高,但是內(nèi)心深處還是期待有質(zhì)的改變。比如,在調(diào)查問卷中學生多選“同意”或“基本同意”,而不是“非常同意”可以看出學生的期待值。此外,從學生的作業(yè)樣本分析中可以看出,多數(shù)學生明顯將多模態(tài)語言輸入局限于一種單純的網(wǎng)絡資料堆積,而不是利用各種符號系統(tǒng)建構(gòu)意義,事實上,大多數(shù)學生并沒有從多模態(tài)的網(wǎng)絡資源中獲得充分合理的支持。早在2009年,研究者就已經(jīng)提出學生對電腦的網(wǎng)絡操作能力還有待提高,資料收集和利用網(wǎng)絡資源進行主動學習的能力較差(韋琴紅,2009)。時隔三年,盡管網(wǎng)絡資料和媒體模式日新月異地發(fā)展,大學生對于合理運用多模態(tài)語言輸入的觀念還不曾有明顯的改變。教師在當前多模態(tài)輸入的網(wǎng)絡環(huán)境下,有必要繼續(xù)提高學生對多模態(tài)語言輸入的認識及加強多元識讀能力的培養(yǎng)。在選擇多模態(tài)語言輸入信息時,要首先確保這種輸入是可理解性的輸入,同時,學生應該自主設定學習目標和進程,有意識地提高信息檢索能力和刪選能力,多參與在線作業(yè)和討論,多與老師同學開展以課程網(wǎng)絡為平臺的交流活動。

4.結(jié)語

隨著課堂上多媒體運用的日益普及,大學教學多模態(tài)化的迅速發(fā)展,學生多元識讀能力的培養(yǎng)和提高值得深入探討。當然,多元識讀能力的培養(yǎng)是一個漫長的過程,大學生從容應對經(jīng)濟全球化、信息技術多模態(tài)化和語言文化的多元融合,與多模態(tài)化和多元識讀能力的培養(yǎng)息息相關。

參考文獻:

[1]Kress,G.&van Leeuwen,T.Multimodal Discourse:The Modes and Media of Contemporary Communication[M].London:Arnold,2001.

[2]葛俊麗,羅曉燕.新媒介時代外語教學新視覺角[J].外語界,2010,(5).

[3]顧曰國.多媒體_多模態(tài)學習剖析[J].外語電化教學,2007,(4).

[4]胡壯麟.社會符號學研究中的多模態(tài)化[J].語言教學與研究,2007,(1).

[5]韋琴紅.多模態(tài)化與大學生多元識讀能力研究-韋琴紅[J].外語電化教學,2009.

[6]張德祿.多模態(tài)話語理論與媒體技術在外語教學中的應用[J].外語教學,2009,(7).

[7]張德祿.多模態(tài)外語教學的設計與模態(tài)調(diào)用初探[J].中國外語,2010(5).

第6篇:社交媒體文本分析范文

【關鍵詞】 互動易; 信息披露; 新媒體; 股票收益率; 交易量

【中圖分類號】 F830.9 【文獻標識碼】 A 【文章編號】 1004-5937(2017)08-0048-08

一、引言

隨著互聯(lián)網(wǎng)技術的快速發(fā)展,各種各樣的新媒體層出不窮,不少企業(yè)已經(jīng)擁有自己的微博、微信等交流平臺。新媒體已逐漸成為當今世界非常重要的信息集散樞紐,其開放性、及時性和互動性等特點契合資本市場的公平、公開和公正原則。

基于此,近年來新媒體對證券市場的作用逐漸引起了學者的重視[1-5]。作為傳媒手段之一,新媒體將公司信息及時、高效地傳遞給投資者。上市公司和投資者傳統(tǒng)的溝通方式主要包括年報、半年報、季報等定期報告的渠道,然而時效性差是其最大缺點。而新媒體的出現(xiàn)恰恰補了這一缺陷。

得益于網(wǎng)絡技術的加入,對傳統(tǒng)的信息披露制度進行改進是大勢所趨。近年來監(jiān)管機構(gòu)對待使用新媒體披露信息的態(tài)度也愈加開放。美國證券交易委員會(SEC)在2013年就曾發(fā)表聲明,允許上市公司使用Twitter、Facebook等社交媒體披露公司信息,只要上市公司提前告知投資者將要在何種社交平臺上信息即可。

本文的研究對象“互動易”平臺就是深交所為適應新形勢下信息披露的需求而設立的。它由深圳證券交易所于2010年1月1日推出,在2011年11月12日基于Web 2.0平臺(類微博模式)進行系統(tǒng)升級,并改名為“互動易”。投資者可通過該平臺直接向上市公司提問,上市公司在“互動易”平臺上答復。其成立的初衷在于提高上市公司和投資者之間的溝通效率,幫助投資者將市場信息化繁為簡,使投資者在信息獲取、信息鑒別、與上市公司之間的互動交流方面更加容易。從形式上來看,“互動易”平臺上的公司回復實質(zhì)上可以視為上市公司進行的自愿性信息披露①。深交所在《上市公司信息披露工作考核辦法》(2011年修訂)第十六條也增加了對“互動易”的監(jiān)管要求,以此引導上市公司充分重視,不斷提高投資者關系管理水平。

目前對信息披露經(jīng)濟后果的研究主要集中在定期報告中自愿性信息披露對股權資本成本的影響方面[6-7]。文獻研究表明,信息披露主要存在兩方面潛在的益處:(1)幫助糾正公司的錯誤估值;(2)提高股票的流動性,降低資本成本[8]。理論上說,及時的信息披露使財務信息得以迅速在資本市場中擴散,將信息的滯后性影響減少到最低水平,有效地解決信息披露的及時性問題,在短時間內(nèi)降低信息不對稱[3]。傳統(tǒng)渠道下信息披露的經(jīng)濟后果已取得較為豐富的研究成果,然而對于新媒體形式下的信息披露鮮有研究。

那么新媒體是否真的如上所述在資本市場中起到積極作用呢?本文采用“互動易”平臺上公司的回復作為研究對象,引入回復指數(shù)對公司回復質(zhì)量進行刻畫,嘗試探究新媒體平臺上的公司信息披露對于股票收益率和交易量的作用。

本文的創(chuàng)新點在于針對新媒體形式下信息披露的作用進行研究,以“互動易”平臺為例,首次對該平臺上的公司回復進行挖掘分析,證明了及時的公司回復是有效的。新媒體對于公司信息披露的重要性逐漸提升,在此背景下研究“互動易”這類平臺的公司回復將更具現(xiàn)實意義。此外,根據(jù)“互動易”這類新媒體平臺的特性,本文設計了可行且具有較強推廣性的新媒體披露質(zhì)量測度指標,對之后類似的研究具有積極的借鑒意義。

二、文獻回顧與假設提出

傳統(tǒng)的自愿性信息披露渠道以定期報告為主,其對資本市場的作用已有大量研究成果[9-12]。對公司來說,進行廣泛自愿性信息披露主要有三種資本市場效應:提高股票流動性、降低資本成本、提升公司價值。但是由于定期報告時間跨度過大,無法滿足普通投資者日益增長的信息需求,并且是以公司為主導對外披露,受到公司特質(zhì)等諸多因素的限制。隨著互聯(lián)網(wǎng)技術的不斷發(fā)展,各種新媒體層出不窮,微博、微信等社交媒體因其傳播速度快、時效性強、互動性強等特點發(fā)展迅速,開始在企業(yè)的投資者關系中扮演重要的角色。

國外學者較早開展新媒體對資本市場的作用研究。Wysocki[13]以發(fā)帖量度量論壇信息,考察其和公司基本面、股市表現(xiàn)之間的關系,發(fā)現(xiàn)發(fā)帖量的確能夠預測第二天股票的交易量與異常收益率。Antweiler et al.[14]通過分析Yahoo Finance和Raging Bull兩大金融論壇的帖子,構(gòu)建情緒指數(shù),結(jié)果發(fā)現(xiàn)論壇信息可以用來預測股票波動率。

國內(nèi)類似的研究起步稍晚。張永杰等[15]不局限于特定論壇,將社交媒體信息內(nèi)容的抓取范圍擴展至整個中文互聯(lián)網(wǎng),以此研究社交媒體信息在資產(chǎn)定價方面的影響,發(fā)現(xiàn)不斷發(fā)展的中文社交媒體蘊含著對股票收益率有著顯著解釋能力的信息內(nèi)容。金雪軍等[16]抓取了股吧在2012年10月至2013年9月期間共580萬條發(fā)帖數(shù)據(jù),借助文本分析技術研究發(fā)現(xiàn),看漲指數(shù)與股票收益率呈正向相關,論壇發(fā)帖量對股票成交量有著顯著的正向影響,證實了中小投資者在股票論壇的討論確實會對股票的收益率與成交量產(chǎn)生影響。

早期的研究對象主要集中于論壇信息。近年來隨著社交媒體的迅猛發(fā)展,信息的流動得到快速提高,其對資本市場的作用引起了大量學者的興趣。

因為單純的回復數(shù)還可能受到不同公司的被關注程度影響,為了消除由于關注度不同所造成的影響,對指標進行歸一化處理,最后得出回復指數(shù)的計算公式:

其中i為回答日期與提問日期之差,ni為第i天前的問題總數(shù)。相比較傳統(tǒng)的以絕對數(shù)量代替信息披露質(zhì)量的測度方式,該回復指數(shù)進一步考慮了信息的及時性特征,同時還能夠較好地衡量不同公司之間回復質(zhì)量的差異。

2.因變量

本文的交易量指標(Volume)采用日個股交易股數(shù),而收益率指標(Return)采用不考慮現(xiàn)金紅利的日個股回報率,上述數(shù)據(jù)均來源于國泰安數(shù)據(jù)庫。

3.控制變量

在控制變量選擇上,本文加入深圳A股每日市場回報率(Market Return)和公司回復的絕對數(shù)量(Reply Count),分別控制整體的市場效應和投資者關注度不同造成的影響。

具體變量的說明和計算方法見表1。

(三)模型設計

樣本數(shù)據(jù)既包含時間序列又包含截面數(shù)據(jù),為了更好地分析各變量間相互關系并預測其變化趨勢,本文采用面板回歸進行數(shù)據(jù)分析。同時由于投資者的反應可能存在滯后效應,因此本文參考Tetlock[19]的模型設計,引入了滯后5階的回復指數(shù),使用L5(Reply Index)表示(其中L5(xt)=[xt-1xt-2xt-3xt-4xt-5])。

為確定面板回歸模型,本了如下檢驗,即Hausman檢驗(用于確定選擇固定效應還是隨機效應)以及F檢驗(用于確定選擇混合效應還是固定效應)。根據(jù)表2的檢驗結(jié)果,F(xiàn)檢驗顯示固定效應模型優(yōu)于混合效應模型,Hausman檢驗顯示固定效應模型優(yōu)于隨機效應模型。所以,最終對模型統(tǒng)一選擇固定效應模型。

回歸模型如下:

其中,Reply Indexi,t表示i公司第t天的回復指數(shù),Market Equityi,t和Asseti,t分別表示對應時間公司的流通市值和資產(chǎn)規(guī)模,Reply Indexi,t表示對應時間的回復總數(shù),Market Returnt表示第t天不考慮現(xiàn)金紅利再投資的日市場回報率(流通市值加權平均法),在回歸方程中Market Equity、Asset和Reply Count均已進行對數(shù)化處理,以消除量綱的影響。

四、實證檢驗結(jié)果與分析

(一)描述性統(tǒng)計

針對本研究所選取的樣本,本文對上市公司披露情況以及其他解釋變量進行了描述性統(tǒng)計,結(jié)果如表3所示。從描述性統(tǒng)計結(jié)果來看,由于回復數(shù)據(jù)的稀疏性導致80%以上與回復相關的數(shù)據(jù)為0,因此整體回復指數(shù)均值較小,只有0.041,個股每日回復量也從0至262條不等,這與“互動易”平臺推出時間比較短,整個市場的參與度較小相關。市場日回報率比較穩(wěn)定,在-0.066至0.055之間波動,其均值也趨于0。相比較而言,個股回報率變化較大,最低為-0.263,最高則為16.773,但是兩者標準差比較接近。資產(chǎn)和市值的變化波動較大,最大和最小值之間相差103以上數(shù)量級,說明A股市場存在較大的分化現(xiàn)象,這也為下文對資產(chǎn)和市值分組進行穩(wěn)健性檢驗提供了依據(jù)。雖然參與互動的公司數(shù)在逐年增加(未列出),這表明我國上市公司日益認識到與投資者保持良好關系及信息披露的重要性,也說明越來越多的投資者開始關注“互動易”平臺,但是也應當看到,仍有眾多的上市公司并沒有參與到投資者的提問互動中來,說明“互動易”平臺建設和上市公司與投資者的互動還有很大的提升空間。

(二)面板回歸檢驗

公司回復指數(shù)對股票收益率和交易量影響的實證結(jié)果如表4所示,滯后一天的公司回復對于收益率的影響為負,公司回復指數(shù)每增加一個單位,將導致隔日收益率降低0.056%,而滯后2天和3天的回復對于收益率的影響顯著為正。通過對公司回復時間的深入分析,本文發(fā)現(xiàn)“互動易”平臺上的公司平均回復時間間隔為2.61天,因此本文認為上述現(xiàn)象可能是投資者對于公司回復不及時的“懲罰”所致,具體主要有兩種原因:(1)投資者看到公司的回復,但是由于公司回復過晚導致消息的價值(時效性)大大降低,雖然公司回復了投資者的提問,但投資者對此作出負面的評價,之后才逐漸修正之前有偏的評價,對公司回復價值的認識呈先降后升的變化。(2)由于公司回復得不及時,存在間隔數(shù)天登錄一次并集中回復的現(xiàn)象,長此以往造成投資者和公司的低效溝通,投資者也并未每天關注平臺更新,導致新的回復可能未被消化,此時投資者認為公司仍“未回復”,從而作出消極的評價。受限于數(shù)據(jù)及處理能力,本文并未對上述原因進行進一步的驗證和分析。

“互動易”平臺本是為投資者和公司提供高效互動的平臺,但是有很大一部分公司的回復并不及時,個別公司漠視投資者的心聲,如烯碳新材(000511)、中信國安(000839)、陜國投A(000563)等公司在樣本中的平均回復時間達16天以上,回復間隔時間過長已經(jīng)引起了投資者的強烈質(zhì)疑③。因此考慮到回復的滯后效應,本文將滯后5期的回復指數(shù)聯(lián)合考慮,發(fā)現(xiàn)公司回復的作用顯著為正,回復指數(shù)每增加1個單位,將導致股票收益率增加0.027%,這就說明,公司回復指數(shù)在以周為基本單位的時間軸上對股票收益率呈正向促進作用。然而作為控制變量的回復數(shù)量對個股回報率的作用為負,回復數(shù)量每變化1%將引起股票收益率變化0.006%,從量級上來看,其影響力低于公司回復指數(shù)。這說明公司的回復數(shù)量雖然起到了反向修正股票收益的作用,但其作用甚微,不足以抵消公司回橢甘對于股票收益的整體正向促進作用。

交易量對公司回復的回歸結(jié)果顯示,除滯后第3期外,滯后期的公司回復對于交易量的作用均顯著為正,在0.1%的水平拒絕了公司回復對于交易量無影響的原假設。聯(lián)合5期同時考慮,發(fā)現(xiàn)公司回復指數(shù)每增加1個單位,將導致股票成交量變化2.28%,有效地支持了假設2,說明“互動易”平臺上公司的披露確實大大降低了信息不對稱程度,降低了買賣價差,提升了交易量。

(三)穩(wěn)健性檢驗

為了驗證上述結(jié)果的穩(wěn)健性,本文分別采用了對每年分組回歸和按不同市值、資產(chǎn)分組回歸以及換用總市值及對應的收益率等方法,以檢驗公司回復對股市的作用。

如表5所示,公司回復對于股票收益率的作用除了2013年的系數(shù)在1%的水平顯著為正,其余年份均不顯著,這可能是因為2013年之前的年份公司回復的數(shù)據(jù)量過少。通過對“互動易”平臺上公司回復數(shù)的深入分析,發(fā)現(xiàn)平臺上每年的問題數(shù)量逐步上升,由2011年的36 249條猛增至2013年的239 194條,說明“互動易”逐漸得到了廣大投資者的認可,參與程度大大提高,其在股票市場的作用也隨之增強。雖然2014年平臺回復數(shù)依舊增長迅速,但本文并未發(fā)現(xiàn)該年度公司回復對于股票收益率有顯著影響的證據(jù),需要做進一步的研究和分析。

公司回復對于交易量的回歸結(jié)果顯示,除2011年外,2012年至2014年的系數(shù)均為正,1單位回復指數(shù)的變化將導致隔日交易量1.6%以上的波動,其預測作用依舊顯著。上述結(jié)果同時說明交易量對于公司回復的信號感知程度比收益率更高,也證明了公司回復在不同年份,確實起到了降低信息不對稱、提高股市的流動性的作用,從而促進了股市的成交量。

本文按照流通市值和總資產(chǎn)的大小分別劃分成高(約25%)、中(約50%)、低(約25%)三組,其中流通市值大于100萬元為中,大于400萬元為高,其余均為低;資產(chǎn)大于10億元為中,大于40億元為高,其余均為低。由表6和表7可以看出,公司回復對于股票收益率的影響主要在低市值和低資產(chǎn)的兩個分組中作用顯著,說明低市值和低資產(chǎn)的公司需要高度重視投資者關系管理。其余分組表現(xiàn)不顯著可能是上述公司由于其資產(chǎn)或市值規(guī)模大,本身就擁有較高的關注度和知名度,信息披露渠道相對公開,除“互動易”平臺外,還有其他的披露渠道,比如官網(wǎng)、新聞媒體報道等,因此“互動易”平臺上公司回復對于其收益率的變化影響并不顯著。

反觀交易量的回歸結(jié)果,發(fā)現(xiàn)公司的回復在低資產(chǎn)和中低市值的分組中作用顯著。和上述結(jié)果類似,說明以上公司需在平時多關注投資者的問題,及時進行回復和披露,以增強本公司在股票市場的競爭力。

另外,本文換用總市值和總市值加權平均法的日市場回報率作為股價效應的衡量指標,并對前文結(jié)論進行了重新檢驗。結(jié)果顯示,并未對前文結(jié)論的穩(wěn)健性產(chǎn)生影響。

整體來說,公司回復對于股票收益率和交易量的作用均通過了穩(wěn)健性檢驗,證明了“互動易”平臺確實在減少信息不對稱,提高投資者和公司互動效率方面起到了積極的作用。

五、結(jié)論

本文通過對“互動易”平臺上的公司回復進行分析,發(fā)現(xiàn)公司回復確實對股票收益率和交易量產(chǎn)生了正向影響,從而肯定了“互動易”平臺作為新媒體的披露方式在股票市場中所起的積極作用。對于投資者而言,“互動易”平臺提供了獲取上市公司一手信息的渠道,要善于利用這部分信息,但是利用其進行投資獲利,其實踐意義比較有限。對于公司而言,投資者的問題往往是關系公司發(fā)展的根本問題,如果一味漠視其心聲,將導致一些不必要的后果。公司需要增加自己的透明度,提高回復的效率,和投資者進行有效的溝通。對于監(jiān)管機構(gòu)而言,需要在日后加強對上市公司的監(jiān)管,特別是鼓勵資產(chǎn)和市值規(guī)模比較小的公司積極⒂牖ザ。雖然“互動易”平臺起到了維護證券市場公開公平公正的積極作用,但是其時效性和影響力有待加強,證券市場的參與方都應參與其中,共同致力于打造一個有效率、公平的證券市場。

本文的創(chuàng)新點在于首次對“互動易”平臺上的公司回復進行挖掘,分析其對股票市場的作用,證明了及時的公司回復是有效的,對于股票收益率和成交量呈正向促進作用。結(jié)合公司在“互動易”平臺上回復的特點,本文設計了一種適用于非定期報告的信息披露質(zhì)量指標,在類似的互動平臺均具有較好的推廣性。

當然本文還存在如下不足:首先,并未對公司回復的文本進行進一步的分析和挖掘,公司的回復可能包含了一些重要的信息,比如研發(fā)、發(fā)展戰(zhàn)略等,下一步的研究可以在文本理解這個角度進行深入挖掘。此外,本文只關注了公司回復這個角色,然而“互動易”這個平臺上不僅有公司的回復,更重要的還有投資者的參與,對于公司和投資者互動的作用也是日后研究的重點之一。

【參考文獻】

[1] BOLLEN J, MAO H, ZENG X. Twitter mood predicts the stock market[J]. Journal of Computational Science, 2011,2(1):1-8.

[2] SAXTON G D. New media and external accounting information: A critical review[J]. Australian Accounting Review, 2012,22(3):286-302.

[3] 文雄. 新媒體對財務信息披露的影響[J]. 會計師, 2014(12):15-17.

[4] LEE L F, et al. The role of social media in the capital market: evidence from consumer product recalls[J]. Journal of Accounting Research,2015,53(2):367-404.

[5] 譚松濤,闞鑠,崔小勇.互聯(lián)網(wǎng)溝通能夠改善市場信息效率嗎?――基于深交所“互動易”網(wǎng)絡平臺的研究[J].金融研究,2016(3):174-188.

[6] 曾穎,陸正飛.信息披露質(zhì)量與股權融資成本[J]. 經(jīng)濟研究,2006(2):69-79.

[7] 李明毅,惠曉峰.上市公司信息披露與資本成本:來自中國證券市場的經(jīng)驗證據(jù)[J].管理學報,2008,5(1): 88-127.

[8] HEALY P M, et al. Stock performance and intermediation changes surrounding sustained increases in disclosure[J]. Contemporary Accounting Research,1999,16(3):485-520.

[9] VERRECCHIA R E. Information quality and discretionary disclosure[J]. Journal of Accounting and Economics,1990,12(4):365-380.

[10] HEALY P M, PALEPU K G. Information asymmetry,corporate disclosure, and the capital markets: A review of the empirical disclosure literature[J]. Journal of Accounting and Economics,2001,31(1-3):405-440.

[11] 何玉,張?zhí)煳?信息披露,信息不對稱和資本成本:研究綜述[J].會計研究,2006(6):80-86.

[12] 孫光國,楊金鳳.財務報告質(zhì)量評價研究:文獻回顧、述評與未來展望[J].會計研究,2012(3):31-38.

[13] WYSOCKI P D. Cheap talk on the web: The determinants of postings on stock message boards[D]. University of Michigan Business School Working Paper,1998.

[14] ANTWEILER W, FRANK M Z. Is all that talk just noise? The information content of internet stock message boards[J]. The Journal of Finance,2004,59(3):1259-1294.

[15] 張永杰,張維,金曦,等.互聯(lián)網(wǎng)知道的更多么?――網(wǎng)絡開源信息對資產(chǎn)定價的影響[J]. 系統(tǒng)工程理論與實踐,2011,31(4):577-586.

[16] 金雪軍,祝宇,楊曉蘭.網(wǎng)絡媒體對股票市場的影響――以東方財富網(wǎng)股吧為例的實證研究[J].新聞與傳播研究,2013(12):36-51.

[17] 程琬|,林杰.社交媒體的投資者漲跌情緒與證券市場指數(shù)[J].管理科學,2013,26(5):111-119.

[18] CHEN H, et al. Wisdom of crowds: The value of stock opinions transmitted through social media[J]. Review of Financial Studies, 2014,27(5):1367-1403.

[19] TETLOCK P C. Giving content to investor sentiment: The role of media in the stock market[J]. The Journal of Finance, 2007,62(3):1139-1168.

[20] NADER J. A rose by any other name[J]. Bar news:The Journal of the NSW Bar Association,2013,Autumn:5-6.

[21] LEUZ C,VERRECCHIA R E. The Economic Consequences of Increased Disclosure (Digest Summary)[J]. Journal of Accounting Research,2000,38(5):91-124.

[22] FAMA E F, FRENCH K R. Common risk factors in the returns on stocks and bonds[J]. Journal of Financial Economics, 1993,33(1):3-56.

第7篇:社交媒體文本分析范文

與即時通訊類的網(wǎng)絡應用不同,博客、個人空間、微博都具有一定的公共性質(zhì),并被統(tǒng)稱為自媒體。自媒體的興盛,使其成為熱點輿情形成的重要推動者,而網(wǎng)絡輿情也成為社會輿情的重要組成部分。

自媒體幾乎沒有準入門檻,同時又具有匿名性,使用者的媒介素養(yǎng)良莠不齊,很容易產(chǎn)生各種失范現(xiàn)象;自媒體也不像傳統(tǒng)媒體那樣容易監(jiān)督,對于失范現(xiàn)象難以追溯源頭,同時給各方主體帶來影響輿論、把控輿論走向的機會,使得網(wǎng)絡輿情處于更加復雜的環(huán)境中。自媒體的網(wǎng)狀結(jié)構(gòu)又決定了網(wǎng)絡輿情可以快速發(fā)酵,甚至在短時間內(nèi)多次轉(zhuǎn)向,因此更加難以監(jiān)控和把握。

而對自媒體勃興之后網(wǎng)絡輿情的監(jiān)測,傳統(tǒng)的現(xiàn)場調(diào)查、訪問調(diào)查、問卷調(diào)查等方式收效不佳,早期曾經(jīng)廣泛使用的網(wǎng)絡輿情監(jiān)測手段也暴露出了越來越多的問題。早期的網(wǎng)絡輿情監(jiān)測,主要是針對Web1.0設計的?;ヂ?lián)網(wǎng)發(fā)展至今經(jīng)歷了兩個階段:Web1.0和Web2.0。兩者的主要區(qū)別并不在于技術規(guī)范或物理設備,而是用戶之間以及用戶和網(wǎng)絡應用之間的交互方式。

在Web1.0時代,互聯(lián)網(wǎng)內(nèi)容主要由各大網(wǎng)站生產(chǎn),用戶和網(wǎng)站的交互主要體現(xiàn)為尋找和接受相應的內(nèi)容,用戶之間也只能通過有限的方式進行散落聯(lián)系。早期的網(wǎng)絡輿情監(jiān)測,就是針對這樣層次的交互而設計。流程大致是:一、通過相關樣本庫,把需要監(jiān)測的網(wǎng)頁進行模板匹配,并設定為監(jiān)測數(shù)據(jù)源;二、應用爬蟲程序抓取數(shù)據(jù),存儲到本地,再進行數(shù)據(jù)的凈化和簡略的分析;三、利用簡單的圖表模板和文字描述,呈現(xiàn)監(jiān)測和分析的結(jié)果。

早期的網(wǎng)絡輿情監(jiān)測方式有一些原生的問題,譬如:一、由于處理能力有限,只能抽取部分樣本進行監(jiān)測,無法避免偶然誤差;二、文本分析算法的準確度、監(jiān)測對象和系統(tǒng)模板匹配的程度、對數(shù)據(jù)的凈化,以及分析的算法等因素對于最后監(jiān)測結(jié)果的準確度都有決定性的影響,無法避免系統(tǒng)誤差;三、將監(jiān)測的對象簡化為獨立的信息元,欠缺分析網(wǎng)絡內(nèi)容之間聯(lián)系的能力和預測能力。

早期的網(wǎng)絡輿情監(jiān)測方式,盡管有很多問題,對Web1.0時代的離散的網(wǎng)絡內(nèi)容和單向的交互方式來說還可以適用。隨著互聯(lián)網(wǎng)發(fā)展到了Web2.0時代,早期網(wǎng)絡輿情監(jiān)測方式的局限性表現(xiàn)得日漸明顯,其監(jiān)測功能已經(jīng)弱化而無法適應新的輿論環(huán)境。

二、大數(shù)據(jù)技術下的網(wǎng)絡輿情監(jiān)測

Web2.0時代最突出的特征就是更緊密的網(wǎng)狀結(jié)構(gòu)。用戶自主生成內(nèi)容使網(wǎng)絡內(nèi)容生產(chǎn)者數(shù)量呈幾何級增長,用戶與網(wǎng)站之間雙向交互,用戶與用戶之間也在進行多渠道、多層次的立體的交互。Web2.0的網(wǎng)絡內(nèi)容不再是離散的,具有強烈的“關系”屬性。這種基于各種強弱關系的網(wǎng)狀結(jié)構(gòu),也直接使網(wǎng)絡輿情能夠快速成型、發(fā)酵,短時間內(nèi)可以多次轉(zhuǎn)向。Web2.0時代的輿情監(jiān)測,更關注“關系”,能夠更快速、更準確地跟蹤輿情變化。這正是早期網(wǎng)絡輿情監(jiān)測的缺陷。

新的輿論環(huán)境,需要加強網(wǎng)絡輿情的監(jiān)測,而新的網(wǎng)絡輿情,需要新的監(jiān)測方式。大數(shù)據(jù)技術下的網(wǎng)絡輿情監(jiān)測,就是這樣一種新的方式。

自1980年以來,全球的數(shù)據(jù)存儲能力每40個月就翻一倍。不斷進行量級上的增加的龐大數(shù)據(jù)量和數(shù)據(jù)背后蘊藏的信息,帶來了大數(shù)據(jù)時代。

大數(shù)據(jù)通常指的是龐大、復雜,難以用傳統(tǒng)的軟件工具來分析處理的數(shù)據(jù)集。對大數(shù)據(jù)的處理,又牽涉到從數(shù)據(jù)抓取、整理、分析、共享、可視化到存儲、傳輸?shù)纫幌盗袉栴}。大數(shù)據(jù)集合常常來源于日常生活,與人的行動、交往有一定的同構(gòu)性,部分條目直接附加了時間、地理等信息??梢哉f,在大數(shù)據(jù)的數(shù)據(jù)集合中天然蘊含著各種關系。因此,大數(shù)據(jù)集合能提供同數(shù)據(jù)量的若干小數(shù)據(jù)集合無法帶來的新信息。人們可以通過數(shù)據(jù)挖掘?qū)ふ覕?shù)據(jù)之間的聯(lián)系,確立數(shù)據(jù)之間相關關系的規(guī)律,進而提供多方面的預測。

顯而易見,大數(shù)據(jù)處理技術的優(yōu)勢,正契合了Web2.0時代的特點。正因為大數(shù)據(jù)在挖掘數(shù)據(jù)之間的關系、進行發(fā)展趨勢預測方面的能力,已經(jīng)有很多機構(gòu)借助其進行輿情監(jiān)測和呈現(xiàn),并取得了不俗的成績。譬如在新聞業(yè),就有不少國際傳媒機構(gòu)已經(jīng)在各種項目中采用了大數(shù)據(jù)分析和數(shù)據(jù)可視化技術,如BBC以及《衛(wèi)報》《華盛頓郵報》《紐約時報》等。

三、大數(shù)據(jù)帶來輿情預測的新可能

“預測”本身就是大數(shù)據(jù)的一個重要應用。針對同一主題的海量數(shù)據(jù)進行分析,經(jīng)過數(shù)據(jù)挖掘和建模后,可以得到相應的預測模型,進而預測將來的發(fā)展趨勢。譬如奧巴馬競選團隊,就在2012年競選的多個環(huán)節(jié)運用了大數(shù)據(jù)技術,特別是在實時監(jiān)測選民意向、預測投票情況方面。競選團隊每晚都會使用特制的模擬大選的模型,根據(jù)實時監(jiān)測的選民意向模擬大選,并在第二天上午根據(jù)模擬結(jié)果對各州重新分配競選資源。這種對輿情的實時監(jiān)控和預測對奧巴馬2012年總統(tǒng)連任起到了重要作用。

麻省理工學院博士內(nèi)森·凱樂斯的一項以2013年埃及爆發(fā)的民眾抗議活動的大數(shù)據(jù)預測為主要案例的研究,獲取了全球范圍主流媒體新聞、政府出版物、社交媒體、博客等各種類型超過三百萬個數(shù)據(jù)源的目標數(shù)據(jù)。其證明可以通過大數(shù)據(jù)技術和特定模型來發(fā)掘公眾的情緒、態(tài)度變化,并最終預測以大型抗議活動為代表的大型公共事件的發(fā)生,包括事件即將發(fā)生的時間地點。

而這還僅僅是一個開始。大數(shù)據(jù)有不同的來源,互聯(lián)網(wǎng)中以自媒體為代表的各種原創(chuàng)內(nèi)容持續(xù)爆炸式增長,各種移動通訊設備、可穿戴設備也在不停地產(chǎn)生和存儲、傳遞各種數(shù)據(jù),除此之外的數(shù)據(jù)來源還有麥克風、攝像頭記錄的音頻、視頻數(shù)據(jù),運營數(shù)據(jù),遙感數(shù)據(jù)等等。

按照來源不同,數(shù)據(jù)大致可以分為三類,即以自媒體內(nèi)容為代表的用戶原創(chuàng)數(shù)據(jù)、各種經(jīng)營活動中產(chǎn)生的運營數(shù)據(jù)(如銷售記錄、醫(yī)療記錄等)、感知數(shù)據(jù)(如各種可穿戴設備獲取的數(shù)據(jù))。其中用戶原創(chuàng)數(shù)據(jù)對輿情監(jiān)測的重要性已經(jīng)顯現(xiàn),而對其他數(shù)據(jù)來源的大數(shù)據(jù)分析、不同數(shù)據(jù)來源的融合分析,也蘊含著巨大的輿情預測潛力。

第8篇:社交媒體文本分析范文

近年來, 一點資訊巧妙運用強迫癥的廣告形式,意圖目標明確,不彎不繞。在信息多元時代,用戶記憶每天反復被大量冗雜信息覆蓋,這種通俗式的廣告往往奪人眼球,令人記憶深刻繼而引發(fā)關注和討論,毫無疑問,一點資訊在此次文案上有效抓住了移動資訊時代趨勢的命脈,能夠有利于自身品牌知名度提升,有策略地引導用戶。

全球首創(chuàng)“興趣引擎”,新一代門戶誕生

一點資訊是融合關鍵字搜索、訂閱和個性化推薦的咨詢聚合產(chǎn)品,用獨創(chuàng)的興趣引擎技術,將搜索整合到資訊APP中,推薦與用戶搜索關鍵字、瀏覽軌跡相匹配的資訊,并在過程中幫助用戶更好地發(fā)現(xiàn)、表達、獲取和管理有價值的內(nèi)容。

“興趣引擎”是一點資訊獨創(chuàng)的專利技術,他是在底層技術架構(gòu)上把搜索引擎和推薦引擎有機交融,提取了搜索引擎的數(shù)據(jù)爬取、文本分析等技術優(yōu)勢,結(jié)合了推薦引擎利用個人畫像推送內(nèi)容的形式,可智能分析用戶興趣愛好,從而用戶精準推薦他們真正感興趣的內(nèi)容。一點資訊在全網(wǎng)內(nèi)容抓取,覆蓋圖文、視頻及音頻,日更新量50萬,收錄超過300萬個頻道,并有針對時尚、養(yǎng)生、科技等垂直領域的一點X系列資訊應用,滿足各種興趣,實現(xiàn)私人定制的精準分發(fā),

另外一項優(yōu)勢便是精準的算法,像現(xiàn)在傳統(tǒng)的APP根據(jù)點擊的情況來推送你感興趣的內(nèi)容,再加上一部分正常媒體的推廣,比如說我感興趣旅游的東西,傳統(tǒng)APP慢慢地就只會推送這些給我,這個范圍就會越來越窄,而一點的搜索引擎會對同興趣同年齡喜歡范圍內(nèi)的我們都會推送給你,這樣你的興趣圈子就擴大了,了解度也會更多。

以此為出發(fā)點,一點資訊不斷創(chuàng)新,近日先后推出“興趣夾”、“興趣身份”等創(chuàng)新功能,據(jù)了解,以后還將推出“興趣社交”,以興趣為引找到志同道合的朋友,以及“興趣廣告”,最大化商業(yè)價值。

多年沉淀后,引來厚積薄發(fā)的時代

一點資訊多年來一直只做自己的產(chǎn)品、完善自己的客戶端,直到2013年在中國正式開始運營APP,短短兩三年的時間就參與了兩屆廣告節(jié),并在業(yè)界有不小知名度。在嶄露頭角后,和以往的推廣不同,這次一點資訊在全國范圍內(nèi)統(tǒng)一時間投放,不論是地鐵公交還是線上,都進行了相應位置的宣傳,從近日線上多家媒體平臺的幾番預熱,到《新京報》、《重慶晨報》、《每日新報》、《今晚報》4家紙媒頭版醒目登場,至北、上、廣、深、武漢、海口等全國一二線主要城市全覆蓋的地鐵、公交站牌、機場、公交車身、戶外大屏等線下場所的集中“轟炸”,再到與杜蕾斯、IMAX、樂視、神州專車等80余家國內(nèi)外重量級企業(yè)的“魔性打碼”微博互動,“一點藍”打碼品牌投放可謂真正實現(xiàn)了“線上線下”營銷的有機打通。多家營銷界專業(yè)媒體紛紛對一點資訊此次品牌推廣贊譽有加,并稱贊其或許是近年來在移動資訊行業(yè)中最優(yōu)秀的內(nèi)容營銷案例。

而這一次在全國范圍內(nèi)大規(guī)模廣告投放,引發(fā)了公眾的強烈關注,??谝苍谄浞秶畠?nèi),一點資訊選擇在??谶M行宣傳也正是因為看中海南作為國際旅游島能帶來大量的人流量。通過這次廣告節(jié)一點資訊拿到了很多海南本地的廣告合作需求。

現(xiàn)代廣告宣傳的方式進入新時代

20世紀以來,世界上一些發(fā)達國家的消費者已逐步形成對廣告的依賴性。這是因為廣告可以不斷地向廣大消費者提供許多有關生活的信息,為消費者進行消費活動創(chuàng)造便利,從而豐富了消費者的生活,增長了消費者的知識,開闊了消費者的視野,尤其是借助技術,大數(shù)據(jù)驅(qū)動的創(chuàng)意廣告,再通^精準分發(fā)給需要的人群?,F(xiàn)在來說廣告不是打擾,而是有價值的信息。

近年來廣告業(yè)的發(fā)展,已經(jīng)由傳統(tǒng)的模式進入到科技新時代,互聯(lián)網(wǎng)移動也從一個簡單的信息推廣平臺,變成了人與人之間、人與物之間、人與品牌之間的鏈接載體,通過互聯(lián)網(wǎng),消費者可以迅速的、便捷的獲取全面廣泛的信息,現(xiàn)代廣告比以前更加精準,有效轉(zhuǎn)化率更高(您看到廣告以后是否能夠引起您對他的興趣,轉(zhuǎn)換成消費,這個就叫做有效轉(zhuǎn)化。)精準推廣,這個是傳統(tǒng)廣告做不到的。

未來產(chǎn)業(yè)鏈將繼續(xù)細分,媒體將集中創(chuàng)造內(nèi)容,因為媒體的真正價值是內(nèi)容的生產(chǎn),這個價值是技術、人工智能永遠無法取代的。而一點資訊可以以最高效地把內(nèi)容傳遞給用戶,讓他們最后能夠有所收獲。

一點資訊,實現(xiàn)人與資訊的高效連接

第23屆中國國際廣告節(jié)作為全球廣告行業(yè)的一大盛事,來自國內(nèi)外的多家知名廣告主、領軍企業(yè)、主流媒體和業(yè)內(nèi)專家匯集于此。在品牌營銷創(chuàng)意方面,一點資訊以“1.”進行打碼的方式引爆全國大中小城市,從而提高品牌與用戶的互動性?,F(xiàn)代青年記者對一點資訊商業(yè)化部經(jīng)理雷磊進行了采訪。

現(xiàn)代青年:近段時間在各大城市公交車站的打碼廣告引起了很大的關注,這個創(chuàng)意方式從何而來?

雷磊:首先說說公交站牌的廣告,因為大家在公交站停留的時間很短,由于廣告載體的限制,決定了這個廣告的載體只能做廣告推廣,為了加強大眾對我們的品牌印象,我們選擇了強迫癥的方式,旨在引起大眾的好奇心和興趣,這也是我們的本原。但總的來說,我們強項是在內(nèi)容策劃上。

現(xiàn)代青年:據(jù)了解此次是你們第二次參加廣告節(jié),本次廣告節(jié)有何收獲和感受?

雷磊:這屆廣告節(jié)一點資訊獲得了37個大獎,其中最有含金量的是長城獎。通過這次廣告節(jié)而言,收獲就是我們發(fā)現(xiàn)廣告的推廣,做內(nèi)容的話對品牌還是很有效果的,同時要做一些相關的活動,要全方位組合推廣。

現(xiàn)代青年:一點咨詢最大的優(yōu)勢在哪里?

雷磊:像現(xiàn)在傳統(tǒng)的APP根據(jù)您點擊的情況來推送你感興趣的內(nèi)容,再加上一部分正常媒體的推廣,比如說,我感興趣旅游的東西,傳統(tǒng)APP就限定的只推送旅游咨詢,而我們的搜索引擎,會將同興趣愛好的人還感興趣的事情,或同興趣同年齡喜歡的內(nèi)容也會推送給你,這樣你的興趣圈子就擴大了,了解度也會更多,不會越來越窄,我們還可以創(chuàng)建自己興趣愛好的關鍵詞,可以在APP里建立自己的文件夾,這個不限制專用的詞匯。

現(xiàn)代青年:傳統(tǒng)的廣告宣傳方式與現(xiàn)在的有何不同?

雷磊:現(xiàn)在比以前更精準,轉(zhuǎn)化率更高,當您看到廣告以后是否能夠引起您對他的興趣,轉(zhuǎn)換成消費,這個就叫做有效轉(zhuǎn)化??梢宰龅骄珳释茝V,這個是傳統(tǒng)廣告做不到的。

第9篇:社交媒體文本分析范文

[關鍵詞]目的論;廣告;廣告翻譯

經(jīng)濟全球化深深影響著翻譯界。隨著國際化經(jīng)濟交往的日益增加,廣告翻譯也以驚人的速度增長。傳播媒體越來越多樣化,如報紙、廣播、電視、國際互聯(lián)網(wǎng)等,而他們的生存都要依靠廣告。翻譯者發(fā)現(xiàn)自己無時無刻不在進行跨文化交際。

一、功能派翻譯理論的目的論

什么樣的譯文才是好譯文?大部分人都認為譯文應該準確清楚地表達原文的意思。確實,傳統(tǒng)上許多語言學家都認為譯文應該從文體以及其他語言學特征上與原文相同。然而20世紀60年代以來,在翻譯理論和實踐上出現(xiàn)了一種熱潮,人們認為應該讓譯文和原文在語言的功能上對等,而不是在語言的形式上對應,即看讀者是否能獲得和原文一樣的心理反應。

Nida認為功能對等就是要讓譯文和原文在語言的功能上對等,是讀者心理反應的對等,而不是在語言的形式上對應。對等不能只局限在文字本身,他把判斷對等與否的大權交給了讀者的心理反應[1]。在Nida看來,翻譯就是要在目的語中以最自然的方式重現(xiàn)原文中的信息,首先是重現(xiàn)意義,然后是風格。最好的譯文讀起來應該不像譯文。要讓原文和譯文對等就必須使譯文自然,使譯文在譯文讀者心中的反應和原文在原文讀者心中的反應相似。

Vermeer的目的性理論(skopostheories)就很好地解決了這個問題。目的論是功能翻譯理論中最重要的理論,最早是由德國學者費米爾(VemeerHansJ)于1978年在《普通翻譯理論框架》一書中首次提出的,是功能派翻譯理論中最重要的理論。德國的功能翻譯派理論始于20世紀70年代。其代表人物是卡塔琳娜萊斯(KatharinaReiss),費米爾(HansJ.Vermeer)和克里斯蒂安諾德(ChristianeNord)。諾德進一步完善了目的論。諾德給翻譯下的定義為:“翻譯是創(chuàng)作使其發(fā)揮某種功能的譯語文本。它與其原語文本保持的聯(lián)系將根據(jù)譯文預期或所要求的功能得以具體化。翻譯使由于客觀存在的語言文化障礙而無法進行的交際行為得以順利進行。”[2]諾德以譯文的目的為準則,為譯文的改譯和增刪提供了標準。根據(jù)目的論,翻譯遵循的首要法則就是目的,即一切翻譯行為所要達到的目的決定整個翻譯行為的過程(Theendjustifiesthemeans)(Nord,2001)。諾德將翻譯的目的分為三種:譯者的目的(如賺錢),譯文在譯語文化中的交際目的(如傳遞信息)以及使用特定的翻譯策略或手段所要達到的目的(如使用直譯以體現(xiàn)源語的語言結(jié)構(gòu))。通常情況下,“目的”是指譯文的交際目的。那么目的從何而來呢?目的論認為,翻譯過程的發(fā)起者(initiator)決定譯文的交際目的,但當發(fā)起者因?qū)I(yè)知識不足或其他原因?qū)ψg文目的不甚明了的時候,譯者可以與發(fā)起者協(xié)商,從特殊的翻譯情況中得出譯文目的[3]。目的性原則要求譯者在整個翻譯過程中的參照系不應是對等翻譯理論所強調(diào)的原文和功能,而應是譯文在譯語文化環(huán)境中所要達到的一種或幾種交際功能,即應以實現(xiàn)譯文在譯語文化中的預期功能為首要原則[4]。

功能派創(chuàng)造性地提出的目的性原則,突破了對等理論的限制,修正了傳統(tǒng)的“忠實”標準,擴展了可譯性范圍,并增加了翻譯策略,要求翻譯活動必須依據(jù)翻譯目的,以文本目的為翻譯過程的第一準則使得翻譯更貼近實際,對廣告翻譯工作具有重要的指導意義。

二、廣告翻譯的目的性和特征

目的論認為,譯文的預期目的和功能決定翻譯的方法。英國翻譯理論家紐馬克(PeterNewmark,1981)在他的《翻譯方法》(ApproachestoTranslation)一書中,根據(jù)文本不同的內(nèi)容、文體和功能,把文本分成三種類型:信息文本、表達文本、呼喚性文本。廣告被列入呼喚性文本[5]。不同類別的文體有不同的目的和功能,因而對翻譯的要求和翻譯策略的選擇也各有不同。要做好廣告翻譯,首先要弄清廣告文本的目的和功能。

著名的美國市場營銷協(xié)會(AmericanMarketingAssociationAMA)給廣告下了這樣的定義:Advertisingisthenonpersonalcommunicationofinformationusuallypaidforandusuallypersuasiveinnatureaboutproducts,servicesorideasbyidentifiedsponsorsthroughthevariousmedia.(廣告是由特定的廣告主通常以付費的方式,通過各種傳播媒體對產(chǎn)品、勞務或觀念等信息的非人員介紹及推廣)。另外有種說法是“廣告是個人或組織通過有償取得的媒介,向一定的社會群體宣傳其商品、服務或觀念,并勸說他們購買或采取相應行為的活動”。據(jù)此可知,廣告作為一種競爭性的商業(yè)行為,其目的是爭取消費者,因而必然是以消費者為中心,投消費者之所好,供消費者之所需,以打動他們的心弦,促成其購買活動。這是商業(yè)廣告的唯一目的,也是商業(yè)廣告翻譯的唯一目的。

一般來說,廣告須遵循KISS原則,即“Keepitshortandsweet”。廣告應力求簡潔,一方面為商家節(jié)約投資,另一方面利于消費者的接受。不同文化的消費者有不同的價值取向,因此,廣告文體風格也會因地域和文化背景而有所不同。在翻譯廣告時,譯者要特別注意去了解目的語文化的廣告規(guī)范,使譯文風格符合譯語讀者的品味。也就是說,廣告翻譯要遵循譯入語的廣告語體風格,要尊重譯語文化,注重譯文讀者的反映。只有這樣,才能確保廣告翻譯實現(xiàn)它的預期功能,有效地把產(chǎn)品介紹給譯入語消費者,并促其購買產(chǎn)品。

目的論在廣告翻譯中的運用

三、目的論在廣告翻譯中的應用

目的性法則決定了譯者在廣告翻譯中應考慮以下三個因素:譯文語體、讀者反映和譯語文化。廣告翻譯方法的選擇要由具體語篇的目的或功能來決定。也就是說,翻譯行為所要達到的目的決定整個翻譯行為的過程。

(一)廣告翻譯要符合譯語廣告文體的語言風格

由于地理環(huán)境、社會環(huán)境、生活方式的不同,中西民族形成了不同的審美習慣。中國美學強調(diào)中和之美、含蓄之美,重主觀印象。這種美學標準表現(xiàn)出注重平衡、協(xié)調(diào)、融和的審美特征。表現(xiàn)在語言上就是講求音韻和諧,形式對稱,用詞空泛含蓄,具有強烈的主觀色彩。西方哲學強調(diào)分析型抽象理性思維,重理性,重形式,強調(diào)主客體分明。這種審美觀表現(xiàn)在語言形式上就形成了用詞平實明快,句式結(jié)構(gòu)嚴謹,修辭重簡潔的特點。這種思維審美心理上的差別表現(xiàn)在廣告語言上就是英語廣告常使用一些簡單樸實的詞句,體現(xiàn)為一種簡潔明快的美;而漢語廣告常常辭藻華麗,成語迭用,體現(xiàn)出一種華麗的美[6]。如:

嶗山,林木蒼翠,繁花似錦,到處生機盎然,春天綠芽紅花,夏天濃蔭蔽日,秋天遍谷金黃,冬天玉樹瓊花。其中更不乏古樹名木。景區(qū)內(nèi),古樹名木有近300株,50%以上為國家一類保護植物,著名的有銀杏、檜柏等。

這則介紹嶗山的漢語廣告采用了中國人喜愛的四言八句式,形式對稱、辭藻華美,讀起來音韻和諧,迎合中國人的審美心理,很容易獲得預期的效果。但譯成英語時,就需要考慮社交語境的審美心理,刪去無意義的信息,再現(xiàn)原文的內(nèi)涵意義,突出信息傳遞的客觀性和可靠性。因此可譯如下:

LaoshanScenicAreaisthicklycoveredwithtreesofmanyspecies,whichaddcreditforitsscenery.Amongthemover300areconsideredrareandprecious,halfofwhichareunderStatetop-levelprotection.Themostfamousspeciesincludegingkoandcypress.

又如我們通常會碰到這樣的廣告:“XX已獲得國際和國內(nèi)大獎”、“省優(yōu)部優(yōu)”等等,這主要與中國人較相信權威有關,但在提倡“個性”的西方國家,人們可能更注重個人的品位,不大在意官方的評論,這樣的廣告對西方人來說是晦澀難懂。我們更多地應該以實驗數(shù)據(jù)、客觀事實來說話,以符合西方文化觀念和習用語言結(jié)構(gòu)模式,達到刺激購買欲望的目的。

(二)廣告翻譯應注重譯文讀者的感受

目的性法則決定了廣告翻譯應注重譯文讀者的感受,迎合消費者心理。由于宣傳對象在政治、經(jīng)濟、文化等方面的不同背景,為了投其所好、避其所忌,同一條廣告的翻譯,針對不同的宣傳對象會有不同的版本。為了達到商業(yè)目的,譯者甚至可以不顧原文而再造一條廣告。

例如Whisper衛(wèi)生巾漢語音譯為“護舒寶”?!癢hisper”的英文意思是耳語、密談,其意富含女性用品的形象性和女性味。而翻譯為中文時,則傳達給中國女性消費者該產(chǎn)品的功能和優(yōu)良品質(zhì)。寶潔公司的洗發(fā)用品Head&Shoulder漢譯為“海飛絲”也是一個佳例。如果僅根據(jù)原文直譯為頭和肩或像臺灣翻譯為“海倫仙杜絲”,消費者聽到或讀到都茫然不知所謂。而譯為“海飛絲”,詞義的高雅文體和語用特征很容易就使人們聯(lián)想起洗發(fā)類產(chǎn)品。電視廣告配以青春少女飄逸柔順的秀發(fā)隨風飛揚的畫面,在消費者中自然會激發(fā)強烈的購買欲望。又如舉世聞名的“CocaCola”的中文譯名“可口可樂”。Coca乃南美產(chǎn)的藥用植物,Cola則為非洲產(chǎn)的硬殼果樹木。這兩個詞除了表示兩種植物的名稱,似無其他的含義。它的中譯不僅雙聲(可、口)疊韻(可、樂以國語為準)順口,還可口,還可樂,符合中國的消費者的傳統(tǒng)觀念,也就是凡事圖喜慶,可以說這種譯名對此汽水在中國的風行有著巨大的影響。

(三)廣告翻譯應尊重譯語文化

從目的論上看,翻譯要求由目的語文化決定,原文只是起提供信息的作用,譯者只有綜合考慮了廣告的翻譯要求才能在翻譯中更好實現(xiàn)廣告目的,最有效的翻譯不一定是忠實地再現(xiàn)原文。因此在廣告翻譯中,必須避免由于過分強調(diào)忠實而忽略翻譯目的,忽略目的文化環(huán)境而導致的翻譯失敗。一種出口干電池的商標叫“白象”,英譯成“WhiteElephant”。象在中國是吉祥的象征,可是awhiteelephant在英語中意為“沉重的負擔”(aburdensomepossession)或“無用而累贅的東西”(useless)。這樣的翻譯顯然是失敗的。再如,“鴛鴦枕”在中國文化中象征夫妻恩愛,但如果譯成“MandarinDucksPillowcase”,其語用效果就會大打折扣,難以實現(xiàn)廣告翻譯的目的,不妨將其譯為“LovebirdsPillowacse”更符合西方消費者的審美心理,并促成其購買行動的實現(xiàn)。又如:

在四川西部,有一美妙去處,它背依岷山主峰雪寶頂,樹木蒼翠,花香襲人,鳥聲婉轉(zhuǎn),流水潺潺,它就是松潘縣的黃龍。

OneofSichuan''''sfinestspotsisHuanglong,whichliesinSongpanjustbeneathXuebao,themainpeakoftheMinshanMoutain.Ithaslushgreenforestsfilledwithfragrantflowers,bubblingstreamsandsingingbirds.

翻譯這段旅游廣告時,譯者注意到了中西方的文化差異,沒有把黃龍譯成“YellowDragon”,而是根據(jù)譯文的文化語境譯為“Huanglong”。在多元化的世界里,因各民族制度、信仰、道德觀和價值觀千差萬別,人們往往對同一事物有著不同的聯(lián)想、看法和理解。語言是文化的一部分,但語言像一面鏡子反映著民族的全部文化。語言禁忌反映了風俗的不同。文化差異影響著廣告譯文預期目的的實現(xiàn)。因此,一個成功的廣告翻譯需要譯者巧妙處理廣告所要傳達的信息及不同國家間的語言文化差異。譯者不能僅僅局限于原文,還必須注意原廣告中的文化意義,甚至還要根據(jù)受眾國的情況表現(xiàn)和豐富原文中沒有的文化內(nèi)涵,使廣告中的民族和傳統(tǒng)文化更好地表達出來,從而達到宣傳產(chǎn)品,促進銷售的目的。廣告翻譯中文化意義的有效轉(zhuǎn)換不僅能產(chǎn)生經(jīng)濟效益,還能產(chǎn)生良好的社會效益。

四、結(jié)語

翻譯是一項有目的的活動,應以實現(xiàn)譯文的預期功能為首要原則,即遵循譯文的目的性原則。廣告是一種功能性很強的實用文體,廣告翻譯也應遵循譯文的目的性原則,使廣告功能在譯語文化中順利再現(xiàn)。為此,廣告翻譯應從譯文語體、讀者反應以及譯語文化三個方面著手,采取各種靈活的譯法,最終確保譯文功能的順利實現(xiàn)。

[參考文獻]

[1]NidaEA.TowardaScienceofTranslating[M].Leiden:Brill,1964:23-25.

[2]NordChristiane.TextAnalysisinTranslation[M].Amsterdam-Atlanta:GA,1991:28.

[3]仲偉合,鐘鈺.德國的功能派翻譯理論[J].中國翻譯,1999(3):49.

[4]陳小慰.翻譯功能理論的啟示[J].中國翻譯,2000,(4):9-12.