公務員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘關鍵技術分析

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘關鍵技術分析范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘關鍵技術分析

摘要:本文主要探討將數(shù)據(jù)挖掘技術研究,對海量數(shù)據(jù)進行挖掘和分析,運用數(shù)據(jù)可視化將數(shù)據(jù)進行分類整理。運用數(shù)據(jù)挖掘的算法:C4.5、K-Means、Apriori、EM、PageRank等算法對數(shù)據(jù)進行整理。并將該算法運用到管理方面,充分利用數(shù)據(jù)挖掘技術在數(shù)據(jù)分析方面的強大功能來對管理系統(tǒng)中的海量數(shù)據(jù)進行分析,發(fā)現(xiàn)數(shù)據(jù)背后的問題和規(guī)律從而為管理服務,并不斷完善管理信息系統(tǒng)中的數(shù)據(jù)分析功能。以便對各類數(shù)據(jù)展開深入分析,從中獲取有價值的信息,為改革發(fā)展提供數(shù)據(jù)層面的決策分析支持。

關鍵詞:數(shù)據(jù)挖掘;大數(shù)據(jù);數(shù)據(jù)聚類;海量數(shù)據(jù)

一、引言

關于數(shù)據(jù)挖掘(datamining,DM)的具體定義常常取決定義者的觀點、背景以及定義的分析角度。本文主要探討將數(shù)據(jù)挖掘技術研究,對海量數(shù)據(jù)進行挖掘和分析,運用數(shù)據(jù)可視化將數(shù)據(jù)進行分類整理。運用數(shù)據(jù)挖掘的算法:C4.5、K-Means、Apriori、EM、PageRank等算法對數(shù)據(jù)進行整理。將C4.5、K-Means、Apriori、EM、PageRank等算法運用到管理方面,充分利用數(shù)據(jù)挖掘技術在數(shù)據(jù)分析方面的強大功能來對管理系統(tǒng)中的海量數(shù)據(jù)進行分析,發(fā)現(xiàn)數(shù)據(jù)背后的問題和規(guī)律從而為管理服務,并不斷完善管理信息系統(tǒng)中的數(shù)據(jù)分析功能。

二、數(shù)據(jù)挖掘基本過程

數(shù)據(jù)挖掘幾個階段如圖1所示。

三、數(shù)據(jù)挖掘的分類

特征加權支持向量機由核函數(shù)經(jīng)特征加權構造的支持向量機。并且特征加權核函數(shù)pK定義為:改進支持向量機SVM算法的詳細步驟如下:Step2.所得指標參數(shù)對其相應的特征屬性加權,構造加權的特征向量:()(1)()()(,,),(1,,)inRFGx=gxgxi=n來優(yōu)化核函數(shù)中的原始特征內積。Step3.以p建立特征加權的核函數(shù)pK,構造待輸入空間的線性變換矩陣()(())ip=diagRFGx。Step4.應用所構造的特征加權的核函數(shù)pK在程序設計中替換傳統(tǒng)的支持向量機SVM模型中的線性核函數(shù)。通常,利用的技術越多,得出的結果精確性就越高,這主要是因為對某種技術不適合的問題,其他方法卻可奏效。

四、結論

通過將數(shù)據(jù)挖掘技術研究,對海量數(shù)據(jù)進行挖掘和分析,運用數(shù)據(jù)可視化將數(shù)據(jù)進行分類整理。運用數(shù)據(jù)挖掘的算法:C4.5、K-Means、Apriori、EM、PageRank等算法對數(shù)據(jù)進行整理。并將該算法運用到管理方面,充分利用數(shù)據(jù)挖掘技術在數(shù)據(jù)分析方面的強大功能來對管理系統(tǒng)中的海量數(shù)據(jù)進行分析,發(fā)現(xiàn)數(shù)據(jù)背后的問題和規(guī)律從而為管理服務,并不斷完善管理信息系統(tǒng)中的數(shù)據(jù)分析功能。

參考文獻

[1]劉敏杰.教務管理系統(tǒng)安全維護策略[J].人力資源管理,2017(5):188-189.

[2]周瑩.教務管理系統(tǒng)信息化的對策研究[J].無線互聯(lián)科技,2017(9):124-125.

作者:李加慶 原士棟 單位:山東女子學院