公務(wù)員期刊網(wǎng) 論文中心 正文

基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)異常檢測(cè)技術(shù)

前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)異常檢測(cè)技術(shù)范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。

基于數(shù)據(jù)挖掘的網(wǎng)絡(luò)異常檢測(cè)技術(shù)

1網(wǎng)絡(luò)異常檢測(cè)技術(shù)概述

如今,我們已經(jīng)處于網(wǎng)絡(luò)時(shí)代,生活的方方面面都離不開(kāi)網(wǎng)絡(luò),而且網(wǎng)絡(luò)的穩(wěn)定與否直接影響著人們生活質(zhì)量的高低。在日常生活中,由于受到外界因素的影響以及網(wǎng)絡(luò)本身的問(wèn)題,常常會(huì)出現(xiàn)網(wǎng)絡(luò)異常的情況,為了解決這一問(wèn)題,保證用戶上網(wǎng)的流暢性,需要針對(duì)發(fā)生異常的網(wǎng)絡(luò)進(jìn)行檢測(cè),這種技術(shù)就是網(wǎng)絡(luò)異常檢測(cè)技術(shù)。網(wǎng)絡(luò)異常這種情況在生活中較為常見(jiàn),但是產(chǎn)生的原因卻十分復(fù)雜,一旦找不到問(wèn)題的原因,就會(huì)造成網(wǎng)絡(luò)大范圍的崩潰,進(jìn)而影響人們的工作和生活。

2基于數(shù)據(jù)挖掘網(wǎng)絡(luò)異常檢測(cè)技術(shù)

數(shù)據(jù)挖掘就是人們常說(shuō)的知識(shí)發(fā)現(xiàn),通過(guò)對(duì)海量的、雜亂無(wú)章的、不清晰的并且隨機(jī)性很大的數(shù)據(jù)進(jìn)行挖掘,找到其中蘊(yùn)含的有規(guī)律并且有價(jià)值和能夠理解應(yīng)用的知識(shí),這一過(guò)程就是數(shù)據(jù)挖掘。它主要是借助分析工具找到數(shù)據(jù)和模型之間的關(guān)心,之后進(jìn)行預(yù)測(cè),并將數(shù)據(jù)回歸到真實(shí)變量。在網(wǎng)絡(luò)異常檢測(cè)技術(shù)中應(yīng)用數(shù)據(jù)挖掘技術(shù),能夠從海量數(shù)據(jù)中找到需要的信息,并且根據(jù)數(shù)據(jù)信息建立模型,從而對(duì)入侵行為和正常操作進(jìn)行分類(lèi)了,數(shù)據(jù)挖掘的方法有兩種:一種是分類(lèi)分析,一種是聚分析。分類(lèi)分析需要找到數(shù)據(jù)之間的依賴關(guān)系,并且進(jìn)行預(yù)判斷,這一過(guò)程需要興趣度的介入,也就是對(duì)規(guī)則的可行性和適用性進(jìn)行衡量,確保滿足最小閾值,之后建立一個(gè)數(shù)據(jù)映射分類(lèi)模型,從而輸出離散類(lèi)別。分類(lèi)的效果與數(shù)據(jù)的特點(diǎn)息息相關(guān),有的數(shù)據(jù)噪聲較大,有的數(shù)據(jù)缺失不全,有的數(shù)據(jù)密集分布,有的數(shù)據(jù)字段離散,所以還需要具體情況具體分析。聚類(lèi)分析是通過(guò)反復(fù)的分區(qū)從而找到解決辦法,它的輸出是各個(gè)不同類(lèi)型的數(shù)據(jù),也就是先對(duì)數(shù)據(jù)進(jìn)行初始?xì)w類(lèi),之后去粗取精進(jìn)行合并,最后使得對(duì)象之間能夠彼此聯(lián)系,歸于一類(lèi)。值得一提的是,通過(guò)對(duì)數(shù)據(jù)和對(duì)象之間的距離進(jìn)行聚類(lèi),能夠消除數(shù)據(jù)的噪聲,完成不同形狀的聚類(lèi),也可以對(duì)數(shù)據(jù)的空間分布進(jìn)行劃分,形成網(wǎng)格單元,對(duì)數(shù)據(jù)分布情況進(jìn)行更直觀的判斷。

3基于機(jī)器學(xué)習(xí)方法的網(wǎng)絡(luò)異常檢測(cè)技術(shù)

機(jī)器學(xué)習(xí)指的是根據(jù)人類(lèi)學(xué)習(xí)的情況,對(duì)機(jī)器進(jìn)行研究,使得機(jī)器掌握學(xué)習(xí)的能力,從而獲取新的知識(shí),并通過(guò)一系列的模擬學(xué)習(xí),讓機(jī)器能夠自主解決問(wèn)題。機(jī)器學(xué)習(xí)是人工智能的最新成果,由環(huán)境、執(zhí)行和數(shù)據(jù)庫(kù)構(gòu)成,首先環(huán)境為機(jī)器學(xué)習(xí)系統(tǒng)提供信息,之后機(jī)器學(xué)習(xí)系統(tǒng)對(duì)這些信息進(jìn)行識(shí)別,和數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,最后加以執(zhí)行,網(wǎng)絡(luò)異常檢測(cè)技術(shù)應(yīng)用機(jī)器學(xué)習(xí)方法主要有兩種情況:監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)指的是通過(guò)之前的異常情況和數(shù)據(jù)分析進(jìn)行練習(xí)和研究,找到一個(gè)固定的模板,從而對(duì)輸入信息進(jìn)行檢測(cè),根據(jù)檢測(cè)結(jié)果進(jìn)行判斷,對(duì)異常情況進(jìn)行分類(lèi)。這種方法需要研究人員熟悉網(wǎng)絡(luò)異常的特征,并且能夠準(zhǔn)確區(qū)分?jǐn)?shù)據(jù),從而使得機(jī)器學(xué)習(xí)系統(tǒng)能夠檢測(cè)出不同類(lèi)型的異常,同時(shí),如果是新型的異常,系統(tǒng)也能夠檢測(cè)出來(lái)。下面介紹一些檢測(cè)的方法:第一種,KNN算法,這種算法是比較簡(jiǎn)單的機(jī)器學(xué)習(xí)方法,并且能夠?qū)Ξ惓P袨橹苯舆M(jìn)行計(jì)算,并根據(jù)最近的K個(gè)樣本找到相似的類(lèi)型,尤其是在動(dòng)態(tài)網(wǎng)絡(luò)中,應(yīng)用比較成熟。但是樣本需要均勻分布,如果測(cè)量不準(zhǔn)確就可能出現(xiàn)一定的誤差,所以也可以結(jié)合其他算法同時(shí)使用。第二種,決策樹(shù)法,這種方法和流程圖比較像,每個(gè)節(jié)點(diǎn)代表者檢測(cè)的屬性,每個(gè)分支則是檢測(cè)結(jié)果,每片葉子就是異常的類(lèi)型。在檢測(cè)過(guò)程中通過(guò)對(duì)沒(méi)有標(biāo)記的數(shù)據(jù)進(jìn)行分類(lèi),由上到下測(cè)試,之后選擇合理的分支和節(jié)點(diǎn),最后在葉片上判斷類(lèi)型。但是隨著網(wǎng)絡(luò)數(shù)據(jù)的不斷增多,需要對(duì)內(nèi)存資源進(jìn)行優(yōu)化,從而提高系統(tǒng)檢測(cè)的精準(zhǔn)性。無(wú)監(jiān)督學(xué)習(xí)不需要對(duì)異常情況做標(biāo)記,只需要根據(jù)目前的網(wǎng)絡(luò)進(jìn)行建模,這樣極大地減少了工作量,同時(shí)能夠?qū)?shù)據(jù)聚集情況進(jìn)行分類(lèi),之后由研究者進(jìn)行判斷,雖然準(zhǔn)確度不如監(jiān)督學(xué)習(xí)的高,但是操作便捷,簡(jiǎn)單易行,它的檢測(cè)方法如下:第一種,Apriori方法,這種算法能夠第一時(shí)間檢測(cè)到網(wǎng)絡(luò)的異常,并且直接鎖定攻擊來(lái)源,主要是找到滿足設(shè)定的頻集,之后根據(jù)頻集的相關(guān)規(guī)則,對(duì)數(shù)據(jù)進(jìn)行保留處理,之后生成動(dòng)態(tài)的檢測(cè)規(guī)則,提高系統(tǒng)的穩(wěn)定性。第二種,EM方法,在對(duì)網(wǎng)絡(luò)異常進(jìn)行檢測(cè)時(shí),數(shù)據(jù)可能會(huì)有缺失或者是處于隱性狀態(tài),所以需要根據(jù)檢測(cè)對(duì)象的屬性對(duì)其權(quán)重進(jìn)行分配,找到屬性期望,之后根據(jù)似然估計(jì)進(jìn)行計(jì)算,從而實(shí)現(xiàn)交替循環(huán)。

4結(jié)論

綜上所述,網(wǎng)絡(luò)異常直接影響著用戶的信息安全,所以需要認(rèn)真做好網(wǎng)絡(luò)異常的檢測(cè)工作,通過(guò)創(chuàng)新和應(yīng)用相關(guān)的檢測(cè)技術(shù),在最快的時(shí)間內(nèi)找到產(chǎn)生的問(wèn)題的原因,從而加以解決,滿足人們使用網(wǎng)絡(luò)的需求。

參考文獻(xiàn)

[1]黃煜坤.網(wǎng)絡(luò)安全異常檢測(cè)技術(shù)探究[J].電子測(cè)試,2015(05):40-42+45.

[2]廖國(guó)輝,劉嘉勇.基于數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的惡意代碼檢測(cè)方法[J].信息安全研究,2016,2(01):74-79.

作者:秦振凱 單位桂林電子科技大學(xué)海洋信息工程學(xué)院