公務(wù)員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘下的用戶行為分析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘下的用戶行為分析范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘下的用戶行為分析

摘要:伴隨我國網(wǎng)絡(luò)信息化技術(shù)不斷創(chuàng)新,“數(shù)據(jù)挖掘”作為數(shù)據(jù)分析、發(fā)展趨勢及創(chuàng)新手段,其重要性不言而喻。通過近年來研究發(fā)現(xiàn),“數(shù)據(jù)挖掘”應(yīng)用的科學(xué)性與優(yōu)化性對數(shù)據(jù)質(zhì)量提升、應(yīng)用效率提高、誤差減低等影響頗大。本次研究將基于數(shù)據(jù)挖掘的用戶行為進行分析研究,為下一步工作開展提供依據(jù)參考。

關(guān)鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;用戶行為

前言

“數(shù)據(jù)挖掘”應(yīng)用是當下我國各行業(yè)重要應(yīng)用技術(shù)之一,具有較大的意義影響。然而現(xiàn)階段有關(guān)我國基于數(shù)據(jù)挖掘的用戶行為分析研究相對較少,基于該問題現(xiàn)狀,要求行之有效的方法對其進行分析研究,如網(wǎng)絡(luò)用戶行為分析、建模與算法分析、大數(shù)據(jù)未來發(fā)展等,本次研究對基于數(shù)據(jù)挖掘的用戶行為進行分析,有十分重要的理論意義。

1、數(shù)據(jù)挖掘概述

隨著我國科學(xué)技術(shù)不斷提升及發(fā)展,計算機、網(wǎng)絡(luò)信息及大數(shù)據(jù)技術(shù)逐漸得以廣泛應(yīng)用及研發(fā)。其中,最為重要的是大數(shù)據(jù)技術(shù),數(shù)據(jù)技術(shù)不是單一片面的簡單流程,而是更為科學(xué)、合理的系統(tǒng)布局。從當下我國對數(shù)據(jù)技術(shù)及相關(guān)專業(yè)理論的研究中可以得出,如何利用與發(fā)揮好“數(shù)據(jù)挖掘”對其提升應(yīng)用效果十分重要。數(shù)據(jù)挖掘是基于大數(shù)據(jù)技術(shù)下的一種核心應(yīng)用手段,對大數(shù)據(jù)技術(shù)得以發(fā)揮起到重要的推動作用。數(shù)據(jù)挖掘是指對海量大數(shù)據(jù)內(nèi)容進行識別、尋找其規(guī)律的一種保障技術(shù)。主要包括:數(shù)據(jù)準備階段、規(guī)律尋找階段、規(guī)律表示階段?!皵?shù)據(jù)挖掘”不是簡單的基礎(chǔ)技術(shù),而是一種較為復(fù)雜、繁瑣的科學(xué)流程,其目的主要是實現(xiàn)人類對海量數(shù)據(jù)的掌握、調(diào)取及利用,主要任務(wù)包括聚類分析、關(guān)聯(lián)分析、異常分析、演變分析、特異群組分析、關(guān)聯(lián)分析等,如圖1:數(shù)據(jù)挖掘具有以下特點:第一、發(fā)現(xiàn)性特點,發(fā)現(xiàn)性特點是數(shù)據(jù)挖掘主要特征之一。由于海量數(shù)據(jù)容量之大,在對其進行處理、利用過程中必然會受到諸多阻礙。通過數(shù)據(jù)挖掘可以對數(shù)據(jù)庫知識進行尋找、提取。在該過程中“發(fā)現(xiàn)”特點較為明顯,它規(guī)避了傳統(tǒng)數(shù)據(jù)挖掘的形式化與流程性,提升了其整體效果與綜合利用。第二、涉及性特點,涉及性特點主要是指數(shù)據(jù)挖掘的運行及工作方式種類較多??梢圆捎枚喾N不同方式及手段對數(shù)據(jù)知識進行尋找、發(fā)現(xiàn)。第三、穩(wěn)定性特點,數(shù)據(jù)挖掘最為基本的保障為“穩(wěn)定性”,在數(shù)據(jù)挖掘過程中不會受其他因素影響,對發(fā)現(xiàn)數(shù)據(jù)知識及關(guān)聯(lián)分析的精準、可靠起到一定的安全保障作用。這也是數(shù)據(jù)挖掘最為重要的基礎(chǔ)核心之一[1]。

2、基于網(wǎng)絡(luò)時代的用戶行為的作用分析

2.1用戶行為決定企業(yè)盈利

隨著現(xiàn)階段我國網(wǎng)絡(luò)信息技術(shù)不斷發(fā)展,諸多網(wǎng)絡(luò)平臺與網(wǎng)絡(luò)服務(wù)都將“用戶需求”作為重要發(fā)展目標。這也是相關(guān)網(wǎng)絡(luò)企業(yè)得以發(fā)展及規(guī)模壯大的重要基礎(chǔ)。企業(yè)的盈利性在于市場穩(wěn)定與滿足用戶。而用戶正是市場的重要根基。因此,基于上述情況科學(xué)、合理的對用戶行為進行分析研究十分重要。用戶行為是指用戶基于某種網(wǎng)絡(luò)服務(wù)或平臺所提供的服務(wù)、體驗,而發(fā)生的一種主動性消費訴求及實際行為,體現(xiàn)了用戶主觀思想與心理需求。企業(yè)只有對用戶行為進行有效分析,并根據(jù)其數(shù)據(jù)統(tǒng)計情況進行運營、發(fā)展戰(zhàn)略制定,才能成為提升企業(yè)盈利的重要推手[2]。

2.2用戶行為決定平臺良性發(fā)展

當下我國信息化建設(shè)正在快速發(fā)展,各領(lǐng)域、各行業(yè)都在融入大量信息化元素。如教育、醫(yī)療、電子商務(wù)、軍事、工業(yè)、科研等。這些行業(yè)領(lǐng)域都離不開對“用戶行為”的分析研究。通過對用戶行為進行及時、科學(xué)分析,可以對用戶需求與情況進行全面掌握。并對其行業(yè)平臺發(fā)展與網(wǎng)絡(luò)資源利用尤為關(guān)鍵。因此,從行業(yè)網(wǎng)絡(luò)平臺良性發(fā)展的角度來講,加強對用戶行為的分析研究,將重點問題與用戶需求進行尋找、發(fā)現(xiàn),可以快速提升該行業(yè)平臺的運行能力[3]。

3、用戶行為具體研究——基于數(shù)據(jù)挖掘技術(shù)

3.1網(wǎng)絡(luò)用戶行為分析

用戶行為分析主要是指對網(wǎng)絡(luò)用戶行為、上網(wǎng)規(guī)律及心理訴求的預(yù)測、判定。利用數(shù)據(jù)挖掘技術(shù)對網(wǎng)路用戶進行分析研究,主要采用算法或模型構(gòu)建等方式完成。在該過程中通過對其進行數(shù)據(jù)發(fā)現(xiàn)、尋找及分析,可以將用戶興趣作為網(wǎng)絡(luò)平臺重要經(jīng)營發(fā)展策略,并為用戶分區(qū)提供關(guān)鍵理論依據(jù)。由于網(wǎng)路具有一定的虛擬性,其用戶行為也與實際用戶行為具有明顯差異。所以,在對其進行分析過程中一定要對網(wǎng)絡(luò)用戶特點進行了解掌握,具體特點如下:第一、技術(shù)性特點,網(wǎng)絡(luò)用戶多為具有一定的計算機、網(wǎng)絡(luò)知識,且信息化接受程度較高,通??梢元毩⑼瓿善渚W(wǎng)絡(luò)操作。第二、隱蔽性特點,網(wǎng)絡(luò)用戶基于虛擬世界與心理規(guī)避感,往往具有隱蔽性特點,如修改相關(guān)信息內(nèi)容、刪除痕跡等。第三、個性強特點,網(wǎng)絡(luò)世界是開放的,網(wǎng)絡(luò)用戶通常不必局限于現(xiàn)實生活中的束縛與規(guī)定,可以獨立進行意識及個性塑造、發(fā)揮[4]。

3.2建模與算法分析

第一、建模是利用數(shù)據(jù)挖掘進行網(wǎng)絡(luò)用戶行為分析的重要基礎(chǔ),主要從用戶行為特征、用戶興趣入手對其進行模型構(gòu)建,其目的是提升規(guī)范分析力度。以用戶興趣模型為案例,該模型主要包括關(guān)鍵字模型、主體模型、基本本體論模型、向量空間模型等。例如:關(guān)鍵字模型主要通過對用戶行為關(guān)鍵字的提取,如“咖啡”一詞可以代表喜歡喝咖啡的用戶。主題模型是采用用戶興趣歸納與分區(qū)的方式,將用戶行為及特點進行集中體現(xiàn)與合理分區(qū)。第二、算法主要采用K-Means算法。通過K-Means算法可以輕松完成其聚類。另外,一個科學(xué)、合理的用戶興趣模型順利構(gòu)建,主要是需要對優(yōu)秀且高效率用戶興趣模型算法的選擇及應(yīng)用。通過對相關(guān)數(shù)據(jù)信息整理后發(fā)現(xiàn),其用戶興趣模型算法主要包括:遺傳算法、聚類算法、決策樹算法、貝葉斯算法等。但其效果最為明顯,且采用率最高的為“聚類算法”。聚類算法是指通過建立不同群組的用戶的興趣簇來劃分各用戶,主要借助K-Means算法對用戶根據(jù)其興趣程度的權(quán)重進行聚類,從而達到對用戶進行興趣的劃分[5]。

4、“數(shù)據(jù)挖掘”技術(shù)的未來發(fā)展

4.1時展的必然產(chǎn)物

隨著網(wǎng)絡(luò)信息技術(shù)不斷普及應(yīng)用,大數(shù)據(jù)時代已經(jīng)來臨。大數(shù)據(jù)時代是指通過數(shù)據(jù)共享、數(shù)據(jù)采集、數(shù)據(jù)海量存儲等實現(xiàn)資源互利、數(shù)據(jù)傳輸及應(yīng)用發(fā)展時代。大數(shù)據(jù)時代下最為代表性的就是“數(shù)據(jù)挖掘技術(shù)”。數(shù)據(jù)挖掘技術(shù)通常是指網(wǎng)絡(luò)技術(shù)、計算機技術(shù)、通訊技術(shù)及相關(guān)衍生出來的傳感技術(shù)、自動電氣化及人工智能技術(shù)等[1]。數(shù)據(jù)挖掘技術(shù)范圍、范疇較寬。從其實用性及作用性角度來講,數(shù)據(jù)挖掘技術(shù)分為監(jiān)控、智能及保障三大方面。隨著我國科學(xué)技術(shù)水平不斷創(chuàng)新突破,數(shù)據(jù)挖掘技術(shù)也隨之日益更新,在諸多領(lǐng)域及行業(yè)中都較為常見,已經(jīng)滲入到人們?nèi)粘I罴吧a(chǎn)建設(shè)中去[6]。

4.2實現(xiàn)數(shù)據(jù)信息化呈現(xiàn)

數(shù)據(jù)挖掘用戶行為分析的最大作用是為網(wǎng)絡(luò)平臺提供更為精準的數(shù)據(jù)信息,并使其數(shù)據(jù)信息以立體性、數(shù)字化信息形式呈現(xiàn)出來,我國現(xiàn)階段數(shù)據(jù)挖掘技術(shù)主要以數(shù)據(jù)智能分析為主,結(jié)束了以往的傳統(tǒng)分析模式,通過對用戶信息樣本、特征采集,通過尋找后以信息化數(shù)據(jù)形式呈現(xiàn)出來,為網(wǎng)絡(luò)平臺戰(zhàn)略發(fā)展提供更為科學(xué)、準確的信息參考。這種參考性主要體現(xiàn)在應(yīng)對經(jīng)營預(yù)案明確方面。而通過數(shù)據(jù)信息化呈現(xiàn),可以讓相關(guān)技術(shù)人員更為立體、鮮明的掌握其用戶需求,為下一步工作開展打下基礎(chǔ)[7]。其統(tǒng)計效率、統(tǒng)計質(zhì)量、統(tǒng)計速度之快、之準、之全較為完善,可以為日后相關(guān)工作開展及信息掌握起到積極參考作用,其價值性不言而喻。

結(jié)論

綜上所述,通過對基于數(shù)據(jù)挖掘的用戶行為進行分析研究,主要包括:數(shù)據(jù)挖掘概述、基于網(wǎng)絡(luò)時代的用戶行為的作用分析,其包括用戶行為決定企業(yè)盈利、用戶行為決定平臺良性發(fā)展、基于數(shù)據(jù)挖掘技術(shù)用戶行為具體研究,其包括網(wǎng)絡(luò)用戶行為分析、建模與算法分析、大數(shù)據(jù)未來發(fā)展等,從多方面、多角度對基于數(shù)據(jù)挖掘的用戶行為進行闡明,為下一步工作開展奠定堅實基礎(chǔ)。

參考文獻:

[1]張利利,馬艷琴.基于數(shù)據(jù)挖掘技術(shù)的航空客戶流失與細分研究及R語言程序?qū)崿F(xiàn)[J].數(shù)學(xué)的實踐與認識,2019(6).

[2]孫欣,李俊飚,張亞迪,等.基于數(shù)據(jù)挖掘技術(shù)的嘉定地區(qū)電動汽車個人用戶充電樁信息分析[J].電力與能源,2019,40(02):75-77+110.

[3]周浩,林波榮,張仲宸,等.基于數(shù)據(jù)挖掘技術(shù)的北方寒冷地區(qū)居民用水、用氣數(shù)據(jù)處理方法探討[J].暖通空調(diào),2019,49(02):64-72.

[4]韋建國,王玉瓊.基于網(wǎng)購平臺大數(shù)據(jù)的電子商務(wù)用戶行為分析與研究[J].湖北理工學(xué)院學(xué)報,2019(3).

[5]楊國勝,郭貝貝.機器學(xué)習(xí)增強的電子商務(wù)平臺用戶行為預(yù)測[J].科技與創(chuàng)新,2019,121(01):130-131.

[6]劉娜娜,張強.基于電商平臺的消費者需求及產(chǎn)品數(shù)據(jù)挖掘技術(shù)分析[J].內(nèi)蒙古統(tǒng)計,2019(01):42-45.

[7]楊奕,張毅,李梅,等.基于LDA模型的公眾反饋意見采納研究——共享單車政策修訂與數(shù)據(jù)挖掘的對比分析[J].情報科學(xué),2019,37(01):88-95.

作者:金琳 單位:鹽城工學(xué)院