前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘下的用戶行為分析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:伴隨我國網(wǎng)絡信息化技術不斷創(chuàng)新,“數(shù)據(jù)挖掘”作為數(shù)據(jù)分析、發(fā)展趨勢及創(chuàng)新手段,其重要性不言而喻。通過近年來研究發(fā)現(xiàn),“數(shù)據(jù)挖掘”應用的科學性與優(yōu)化性對數(shù)據(jù)質(zhì)量提升、應用效率提高、誤差減低等影響頗大。本次研究將基于數(shù)據(jù)挖掘的用戶行為進行分析研究,為下一步工作開展提供依據(jù)參考。
關鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;用戶行為
前言
“數(shù)據(jù)挖掘”應用是當下我國各行業(yè)重要應用技術之一,具有較大的意義影響。然而現(xiàn)階段有關我國基于數(shù)據(jù)挖掘的用戶行為分析研究相對較少,基于該問題現(xiàn)狀,要求行之有效的方法對其進行分析研究,如網(wǎng)絡用戶行為分析、建模與算法分析、大數(shù)據(jù)未來發(fā)展等,本次研究對基于數(shù)據(jù)挖掘的用戶行為進行分析,有十分重要的理論意義。
1、數(shù)據(jù)挖掘概述
隨著我國科學技術不斷提升及發(fā)展,計算機、網(wǎng)絡信息及大數(shù)據(jù)技術逐漸得以廣泛應用及研發(fā)。其中,最為重要的是大數(shù)據(jù)技術,數(shù)據(jù)技術不是單一片面的簡單流程,而是更為科學、合理的系統(tǒng)布局。從當下我國對數(shù)據(jù)技術及相關專業(yè)理論的研究中可以得出,如何利用與發(fā)揮好“數(shù)據(jù)挖掘”對其提升應用效果十分重要。數(shù)據(jù)挖掘是基于大數(shù)據(jù)技術下的一種核心應用手段,對大數(shù)據(jù)技術得以發(fā)揮起到重要的推動作用。數(shù)據(jù)挖掘是指對海量大數(shù)據(jù)內(nèi)容進行識別、尋找其規(guī)律的一種保障技術。主要包括:數(shù)據(jù)準備階段、規(guī)律尋找階段、規(guī)律表示階段?!皵?shù)據(jù)挖掘”不是簡單的基礎技術,而是一種較為復雜、繁瑣的科學流程,其目的主要是實現(xiàn)人類對海量數(shù)據(jù)的掌握、調(diào)取及利用,主要任務包括聚類分析、關聯(lián)分析、異常分析、演變分析、特異群組分析、關聯(lián)分析等,如圖1:數(shù)據(jù)挖掘具有以下特點:第一、發(fā)現(xiàn)性特點,發(fā)現(xiàn)性特點是數(shù)據(jù)挖掘主要特征之一。由于海量數(shù)據(jù)容量之大,在對其進行處理、利用過程中必然會受到諸多阻礙。通過數(shù)據(jù)挖掘可以對數(shù)據(jù)庫知識進行尋找、提取。在該過程中“發(fā)現(xiàn)”特點較為明顯,它規(guī)避了傳統(tǒng)數(shù)據(jù)挖掘的形式化與流程性,提升了其整體效果與綜合利用。第二、涉及性特點,涉及性特點主要是指數(shù)據(jù)挖掘的運行及工作方式種類較多??梢圆捎枚喾N不同方式及手段對數(shù)據(jù)知識進行尋找、發(fā)現(xiàn)。第三、穩(wěn)定性特點,數(shù)據(jù)挖掘最為基本的保障為“穩(wěn)定性”,在數(shù)據(jù)挖掘過程中不會受其他因素影響,對發(fā)現(xiàn)數(shù)據(jù)知識及關聯(lián)分析的精準、可靠起到一定的安全保障作用。這也是數(shù)據(jù)挖掘最為重要的基礎核心之一[1]。
2、基于網(wǎng)絡時代的用戶行為的作用分析
2.1用戶行為決定企業(yè)盈利
隨著現(xiàn)階段我國網(wǎng)絡信息技術不斷發(fā)展,諸多網(wǎng)絡平臺與網(wǎng)絡服務都將“用戶需求”作為重要發(fā)展目標。這也是相關網(wǎng)絡企業(yè)得以發(fā)展及規(guī)模壯大的重要基礎。企業(yè)的盈利性在于市場穩(wěn)定與滿足用戶。而用戶正是市場的重要根基。因此,基于上述情況科學、合理的對用戶行為進行分析研究十分重要。用戶行為是指用戶基于某種網(wǎng)絡服務或平臺所提供的服務、體驗,而發(fā)生的一種主動性消費訴求及實際行為,體現(xiàn)了用戶主觀思想與心理需求。企業(yè)只有對用戶行為進行有效分析,并根據(jù)其數(shù)據(jù)統(tǒng)計情況進行運營、發(fā)展戰(zhàn)略制定,才能成為提升企業(yè)盈利的重要推手[2]。
2.2用戶行為決定平臺良性發(fā)展
當下我國信息化建設正在快速發(fā)展,各領域、各行業(yè)都在融入大量信息化元素。如教育、醫(yī)療、電子商務、軍事、工業(yè)、科研等。這些行業(yè)領域都離不開對“用戶行為”的分析研究。通過對用戶行為進行及時、科學分析,可以對用戶需求與情況進行全面掌握。并對其行業(yè)平臺發(fā)展與網(wǎng)絡資源利用尤為關鍵。因此,從行業(yè)網(wǎng)絡平臺良性發(fā)展的角度來講,加強對用戶行為的分析研究,將重點問題與用戶需求進行尋找、發(fā)現(xiàn),可以快速提升該行業(yè)平臺的運行能力[3]。
3、用戶行為具體研究——基于數(shù)據(jù)挖掘技術
3.1網(wǎng)絡用戶行為分析
用戶行為分析主要是指對網(wǎng)絡用戶行為、上網(wǎng)規(guī)律及心理訴求的預測、判定。利用數(shù)據(jù)挖掘技術對網(wǎng)路用戶進行分析研究,主要采用算法或模型構建等方式完成。在該過程中通過對其進行數(shù)據(jù)發(fā)現(xiàn)、尋找及分析,可以將用戶興趣作為網(wǎng)絡平臺重要經(jīng)營發(fā)展策略,并為用戶分區(qū)提供關鍵理論依據(jù)。由于網(wǎng)路具有一定的虛擬性,其用戶行為也與實際用戶行為具有明顯差異。所以,在對其進行分析過程中一定要對網(wǎng)絡用戶特點進行了解掌握,具體特點如下:第一、技術性特點,網(wǎng)絡用戶多為具有一定的計算機、網(wǎng)絡知識,且信息化接受程度較高,通??梢元毩⑼瓿善渚W(wǎng)絡操作。第二、隱蔽性特點,網(wǎng)絡用戶基于虛擬世界與心理規(guī)避感,往往具有隱蔽性特點,如修改相關信息內(nèi)容、刪除痕跡等。第三、個性強特點,網(wǎng)絡世界是開放的,網(wǎng)絡用戶通常不必局限于現(xiàn)實生活中的束縛與規(guī)定,可以獨立進行意識及個性塑造、發(fā)揮[4]。
3.2建模與算法分析
第一、建模是利用數(shù)據(jù)挖掘進行網(wǎng)絡用戶行為分析的重要基礎,主要從用戶行為特征、用戶興趣入手對其進行模型構建,其目的是提升規(guī)范分析力度。以用戶興趣模型為案例,該模型主要包括關鍵字模型、主體模型、基本本體論模型、向量空間模型等。例如:關鍵字模型主要通過對用戶行為關鍵字的提取,如“咖啡”一詞可以代表喜歡喝咖啡的用戶。主題模型是采用用戶興趣歸納與分區(qū)的方式,將用戶行為及特點進行集中體現(xiàn)與合理分區(qū)。第二、算法主要采用K-Means算法。通過K-Means算法可以輕松完成其聚類。另外,一個科學、合理的用戶興趣模型順利構建,主要是需要對優(yōu)秀且高效率用戶興趣模型算法的選擇及應用。通過對相關數(shù)據(jù)信息整理后發(fā)現(xiàn),其用戶興趣模型算法主要包括:遺傳算法、聚類算法、決策樹算法、貝葉斯算法等。但其效果最為明顯,且采用率最高的為“聚類算法”。聚類算法是指通過建立不同群組的用戶的興趣簇來劃分各用戶,主要借助K-Means算法對用戶根據(jù)其興趣程度的權重進行聚類,從而達到對用戶進行興趣的劃分[5]。
4、“數(shù)據(jù)挖掘”技術的未來發(fā)展
4.1時展的必然產(chǎn)物
隨著網(wǎng)絡信息技術不斷普及應用,大數(shù)據(jù)時代已經(jīng)來臨。大數(shù)據(jù)時代是指通過數(shù)據(jù)共享、數(shù)據(jù)采集、數(shù)據(jù)海量存儲等實現(xiàn)資源互利、數(shù)據(jù)傳輸及應用發(fā)展時代。大數(shù)據(jù)時代下最為代表性的就是“數(shù)據(jù)挖掘技術”。數(shù)據(jù)挖掘技術通常是指網(wǎng)絡技術、計算機技術、通訊技術及相關衍生出來的傳感技術、自動電氣化及人工智能技術等[1]。數(shù)據(jù)挖掘技術范圍、范疇較寬。從其實用性及作用性角度來講,數(shù)據(jù)挖掘技術分為監(jiān)控、智能及保障三大方面。隨著我國科學技術水平不斷創(chuàng)新突破,數(shù)據(jù)挖掘技術也隨之日益更新,在諸多領域及行業(yè)中都較為常見,已經(jīng)滲入到人們?nèi)粘I罴吧a(chǎn)建設中去[6]。
4.2實現(xiàn)數(shù)據(jù)信息化呈現(xiàn)
數(shù)據(jù)挖掘用戶行為分析的最大作用是為網(wǎng)絡平臺提供更為精準的數(shù)據(jù)信息,并使其數(shù)據(jù)信息以立體性、數(shù)字化信息形式呈現(xiàn)出來,我國現(xiàn)階段數(shù)據(jù)挖掘技術主要以數(shù)據(jù)智能分析為主,結(jié)束了以往的傳統(tǒng)分析模式,通過對用戶信息樣本、特征采集,通過尋找后以信息化數(shù)據(jù)形式呈現(xiàn)出來,為網(wǎng)絡平臺戰(zhàn)略發(fā)展提供更為科學、準確的信息參考。這種參考性主要體現(xiàn)在應對經(jīng)營預案明確方面。而通過數(shù)據(jù)信息化呈現(xiàn),可以讓相關技術人員更為立體、鮮明的掌握其用戶需求,為下一步工作開展打下基礎[7]。其統(tǒng)計效率、統(tǒng)計質(zhì)量、統(tǒng)計速度之快、之準、之全較為完善,可以為日后相關工作開展及信息掌握起到積極參考作用,其價值性不言而喻。
結(jié)論
綜上所述,通過對基于數(shù)據(jù)挖掘的用戶行為進行分析研究,主要包括:數(shù)據(jù)挖掘概述、基于網(wǎng)絡時代的用戶行為的作用分析,其包括用戶行為決定企業(yè)盈利、用戶行為決定平臺良性發(fā)展、基于數(shù)據(jù)挖掘技術用戶行為具體研究,其包括網(wǎng)絡用戶行為分析、建模與算法分析、大數(shù)據(jù)未來發(fā)展等,從多方面、多角度對基于數(shù)據(jù)挖掘的用戶行為進行闡明,為下一步工作開展奠定堅實基礎。
參考文獻:
[1]張利利,馬艷琴.基于數(shù)據(jù)挖掘技術的航空客戶流失與細分研究及R語言程序?qū)崿F(xiàn)[J].數(shù)學的實踐與認識,2019(6).
[2]孫欣,李俊飚,張亞迪,等.基于數(shù)據(jù)挖掘技術的嘉定地區(qū)電動汽車個人用戶充電樁信息分析[J].電力與能源,2019,40(02):75-77+110.
[3]周浩,林波榮,張仲宸,等.基于數(shù)據(jù)挖掘技術的北方寒冷地區(qū)居民用水、用氣數(shù)據(jù)處理方法探討[J].暖通空調(diào),2019,49(02):64-72.
[4]韋建國,王玉瓊.基于網(wǎng)購平臺大數(shù)據(jù)的電子商務用戶行為分析與研究[J].湖北理工學院學報,2019(3).
[5]楊國勝,郭貝貝.機器學習增強的電子商務平臺用戶行為預測[J].科技與創(chuàng)新,2019,121(01):130-131.
[6]劉娜娜,張強.基于電商平臺的消費者需求及產(chǎn)品數(shù)據(jù)挖掘技術分析[J].內(nèi)蒙古統(tǒng)計,2019(01):42-45.
[7]楊奕,張毅,李梅,等.基于LDA模型的公眾反饋意見采納研究——共享單車政策修訂與數(shù)據(jù)挖掘的對比分析[J].情報科學,2019,37(01):88-95.
作者:金琳 單位:鹽城工學院