公務(wù)員期刊網(wǎng) 論文中心 正文

大數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了大數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中應(yīng)用范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。

大數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中應(yīng)用

摘要:本文就大數(shù)據(jù)挖掘技術(shù)網(wǎng)絡(luò)安全中的應(yīng)用與研究進(jìn)行討論,在對(duì)大數(shù)據(jù)技術(shù)加以了解的同時(shí),明確網(wǎng)絡(luò)安全現(xiàn)狀,并對(duì)大數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用進(jìn)行深入的探討和描述,希望能夠?yàn)樵擁?xiàng)技術(shù)的有效應(yīng)用提供支持,進(jìn)一步提高網(wǎng)絡(luò)的安全水平。

關(guān)鍵詞:大數(shù)據(jù)挖掘技術(shù);網(wǎng)絡(luò)安全;應(yīng)用

隨著科技的進(jìn)步以及國(guó)民經(jīng)濟(jì)的發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)已經(jīng)實(shí)現(xiàn)了全面的普及和覆蓋,為人們的生產(chǎn)生活帶來了極大的便利,但網(wǎng)絡(luò)本身具有較強(qiáng)的開放性,在人們對(duì)其進(jìn)行全面應(yīng)用的情況下,隨之而來的還有各種各樣的安全問題,如果不能對(duì)這些問題進(jìn)行有效的防控,非常容易對(duì)用戶的切身利益造成損害。而大數(shù)據(jù)挖掘技術(shù)是提高網(wǎng)絡(luò)安全水平的重要手段之一,將其應(yīng)用在網(wǎng)絡(luò)安全當(dāng)中,能夠?yàn)槿藗儬I(yíng)造更為安全的用網(wǎng)環(huán)境,因此,針對(duì)該項(xiàng)技術(shù)的應(yīng)用加強(qiáng)研究是很有必要的。

1淺析大數(shù)據(jù)挖掘技術(shù)

所謂的大數(shù)據(jù)挖掘技術(shù),實(shí)際就是一種針對(duì)特定范圍內(nèi)各項(xiàng)數(shù)據(jù)進(jìn)行識(shí)別、檢測(cè)、分類和歸集,并實(shí)現(xiàn)數(shù)據(jù)規(guī)律以及內(nèi)在關(guān)聯(lián)有效分析的技術(shù)。其主要是由三部分內(nèi)容構(gòu)成,包括數(shù)據(jù)表達(dá)、數(shù)據(jù)規(guī)律以及數(shù)據(jù)準(zhǔn)備等。具體而言,該項(xiàng)技術(shù)對(duì)于數(shù)據(jù)的挖掘主要是通過數(shù)據(jù)挖掘模式以及數(shù)據(jù)挖掘引擎的設(shè)計(jì)與應(yīng)用來實(shí)現(xiàn)的,按照預(yù)設(shè)的挖掘模式促使數(shù)據(jù)挖掘引擎根據(jù)特定的要求對(duì)數(shù)據(jù)進(jìn)行分類和歸集,并對(duì)數(shù)據(jù)中的規(guī)律展開挖掘,進(jìn)而明確數(shù)據(jù)間的潛在關(guān)系,為數(shù)據(jù)的有效分析提供支持。雖然大數(shù)據(jù)挖掘技術(shù)具有諸多的優(yōu)勢(shì),但在對(duì)其進(jìn)行應(yīng)用的過程中,往往需要經(jīng)歷一個(gè)相對(duì)復(fù)雜的操作流程,所以,在對(duì)該項(xiàng)技術(shù)進(jìn)行應(yīng)用以前,必須要結(jié)合實(shí)際需求將相應(yīng)的規(guī)劃準(zhǔn)備工作做好。而對(duì)于數(shù)據(jù)挖掘技術(shù)來說,數(shù)據(jù)預(yù)處理是一項(xiàng)非常關(guān)鍵的內(nèi)容,能否保證預(yù)處理的質(zhì)量,將會(huì)對(duì)數(shù)據(jù)挖掘技術(shù)的效用發(fā)揮造成直接影響[1]。

2網(wǎng)絡(luò)安全現(xiàn)狀

2.1容易受到病毒的影響

對(duì)于網(wǎng)絡(luò)安全而言,網(wǎng)絡(luò)病毒有著巨大的威脅,其主要是由相關(guān)人員在軟件編程期間應(yīng)用了具有一定破壞力的代碼、數(shù)據(jù)或功能,一旦這種軟件或者是程序在計(jì)算機(jī)當(dāng)中使用,就可能會(huì)造成惡意下載、信息丟失,甚至是計(jì)算機(jī)癱瘓等情況。而由于大部分網(wǎng)絡(luò)用戶對(duì)于病毒的了解十分有限,再加上病毒本身具有較強(qiáng)的感染力和破壞力,導(dǎo)致很多用戶在不知不覺中就會(huì)受到病毒的侵害。

2.2容易受到黑客的入侵

隨著互聯(lián)網(wǎng)的全面覆蓋及普及應(yīng)用,黑客入侵也逐漸成為了影響網(wǎng)絡(luò)安全的重要因素之一,相比于其他形式的安全影響因素,黑客入侵的防控難度是最高的,其主要是由一些精通計(jì)算機(jī)網(wǎng)絡(luò)的不法分子利用計(jì)算機(jī)網(wǎng)絡(luò)的漏洞進(jìn)行惡意攻擊,攻擊范圍從單個(gè)計(jì)算機(jī)到整個(gè)局域網(wǎng),一旦受到黑客的入侵,黑客可能會(huì)對(duì)個(gè)人或者是單位的重要信息進(jìn)行竊取和篡改,從而為其帶來巨大的經(jīng)濟(jì)損失[2]。

3大數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)安全中的具體應(yīng)用

3.1數(shù)據(jù)挖掘技術(shù)的應(yīng)用流程

從某種程度上來講,不管是何種網(wǎng)絡(luò)安全問題,其對(duì)于網(wǎng)絡(luò)安全的侵害都是有跡可循的,尤其是對(duì)網(wǎng)絡(luò)病毒而言。借助數(shù)據(jù)挖掘技術(shù),能夠通過相應(yīng)的技術(shù)手段對(duì)用戶的各項(xiàng)數(shù)據(jù)進(jìn)行分類、歸集和評(píng)估,進(jìn)而達(dá)到動(dòng)態(tài)掃描系統(tǒng)數(shù)據(jù)的目的。在應(yīng)用大數(shù)據(jù)挖掘技術(shù)對(duì)網(wǎng)絡(luò)安全問題進(jìn)行防范的過程中,由于其應(yīng)用流程較為復(fù)雜,涉及到的數(shù)據(jù)量也相對(duì)較多,所以需要對(duì)各環(huán)節(jié)的特征進(jìn)行清晰的掌握,并對(duì)其進(jìn)行合理的規(guī)劃,構(gòu)建多個(gè)分析模塊,以此來保證網(wǎng)絡(luò)應(yīng)用的安全性。而具體模塊如下:第一,數(shù)據(jù)源模塊。這一模塊的作用在于,能夠?qū)⒕W(wǎng)絡(luò)發(fā)送或者是接收的數(shù)據(jù)進(jìn)行截獲、轉(zhuǎn)存、編輯以及重發(fā)等,在通過該模塊針對(duì)原始數(shù)據(jù)包實(shí)施處理和傳輸以后,才能將其傳輸至預(yù)處理模塊當(dāng)中進(jìn)行處理和發(fā)送。第二,預(yù)處理模塊,在該模塊當(dāng)中涉及到多種數(shù)據(jù)處理工具,能夠滿足多種數(shù)據(jù)類型的預(yù)處理需求,因此,該模塊也是數(shù)據(jù)挖掘技術(shù)的核心所在。該模塊的工作內(nèi)容包括特征標(biāo)準(zhǔn)化、變化數(shù)值映射以及原始數(shù)據(jù)規(guī)范化,通過該模塊能夠?qū)?shù)據(jù)挖掘效率有效提升,進(jìn)而達(dá)到降低挖掘成本的目的。第三,數(shù)據(jù)挖掘模塊。其涉及到多種信息處理方法,包括統(tǒng)計(jì)方法、事例推理、模糊集、遺傳算法以及決策樹等等,利用該模塊能夠?qū)?shù)據(jù)庫當(dāng)中的各項(xiàng)信息進(jìn)行有效的分析和處理,并將完成處理的信息發(fā)送至決策模塊當(dāng)中。第四,規(guī)則庫模塊,通過該模塊能夠有效記錄各種網(wǎng)絡(luò)安全問題的主要特征,如,對(duì)異常入侵、惡意攻擊以及網(wǎng)絡(luò)病毒等安全特征進(jìn)行記錄,并對(duì)其特征進(jìn)行總結(jié)和分類,從而為后續(xù)的網(wǎng)絡(luò)安全防護(hù)提供相應(yīng)的理論支持。第五,決策模塊,利用該模塊能夠推動(dòng)規(guī)則庫模塊和數(shù)據(jù)挖掘模塊的有效匹配,換言之,如果在兩個(gè)模塊當(dāng)中存在匹配度較高的數(shù)據(jù),說明網(wǎng)絡(luò)安全已經(jīng)受到了一定的威脅。例如,可能有網(wǎng)絡(luò)病毒隱藏在數(shù)據(jù)包當(dāng)中,需要通過相關(guān)措施的有效應(yīng)用對(duì)其進(jìn)行防控[3]。

3.2數(shù)據(jù)挖掘技術(shù)的應(yīng)用機(jī)制

第一,在數(shù)據(jù)收集方面的應(yīng)用。隨著大數(shù)據(jù)時(shí)代的來臨,網(wǎng)絡(luò)當(dāng)中信息呈現(xiàn)了爆發(fā)式的增長(zhǎng)趨勢(shì),在此過程中,個(gè)人隱私數(shù)據(jù)急劇增加,這種發(fā)展形勢(shì)也對(duì)網(wǎng)絡(luò)安全問題提出了較高的要求。要求在網(wǎng)絡(luò)安全當(dāng)中要針對(duì)個(gè)人隱私進(jìn)行有效的保護(hù),借助數(shù)據(jù)挖掘技術(shù)對(duì)相關(guān)數(shù)據(jù)信息當(dāng)中的網(wǎng)絡(luò)安全問題加以尋找,以網(wǎng)絡(luò)病毒為例。其通常是以代碼的形式出現(xiàn),能夠在計(jì)算機(jī)系統(tǒng)當(dāng)中進(jìn)行有效的滲透,在對(duì)系統(tǒng)造成破壞的同時(shí),對(duì)網(wǎng)絡(luò)數(shù)據(jù)信息造成泄漏和損壞。對(duì)其應(yīng)用大數(shù)據(jù)挖掘技術(shù),能夠?qū)?shù)據(jù)信息當(dāng)中隱藏的病毒程序挖掘出來,避免出現(xiàn)惡意攻擊以及異常入侵等情況。之所以能夠產(chǎn)生這種效果,主要是由于大數(shù)據(jù)挖掘技術(shù)能夠針對(duì)各種代碼程序展開分析,并對(duì)代碼程序中的關(guān)鍵點(diǎn)加以明確,從而將各程序當(dāng)中存在的問題及時(shí)的發(fā)現(xiàn),使用相關(guān)措施進(jìn)行有效的處理。通常網(wǎng)絡(luò)病毒程序和計(jì)算機(jī)當(dāng)中的部分軟件是十分相似的,且受到其隱蔽性的影響,非常容易被忽視,進(jìn)而引發(fā)網(wǎng)絡(luò)安全問題。針對(duì)這種情況,還需要通過大數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)病毒代碼程序信息的有效收集,結(jié)合其共性進(jìn)行分類,從而為網(wǎng)絡(luò)安全防護(hù)機(jī)制的構(gòu)建提供相應(yīng)的數(shù)據(jù)支持[4]。第二,在數(shù)據(jù)處理方面的應(yīng)用。在針對(duì)網(wǎng)絡(luò)安全問題進(jìn)行防護(hù)的過程中,借助數(shù)據(jù)挖掘技術(shù)能夠?qū)ο嚓P(guān)數(shù)據(jù)信息進(jìn)行深入的挖掘和分析,并且可以根據(jù)關(guān)鍵信息對(duì)各種網(wǎng)絡(luò)安全問題的源頭加以明確。而由于網(wǎng)絡(luò)安全問題并不是通過文字方式來攻擊計(jì)算機(jī)系統(tǒng)的,大多以程序代碼為主。所以,想要對(duì)網(wǎng)絡(luò)安全水平進(jìn)行有效的提升,就必須要針對(duì)各種網(wǎng)絡(luò)程序代碼實(shí)施轉(zhuǎn)換和破解操作,從而將其變成容易識(shí)別的內(nèi)容,以此來保證防護(hù)的及時(shí)性和有效性。而應(yīng)用大數(shù)據(jù)挖掘技術(shù),可以借助其數(shù)據(jù)處理模塊,來識(shí)別和轉(zhuǎn)化網(wǎng)絡(luò)安全問題,進(jìn)而明確數(shù)據(jù)源的所處位置、具體信息以及IP位置等,并通過深入的挖掘準(zhǔn)確定位IP目標(biāo),明確安全問題的源頭所在。在明確防護(hù)目標(biāo)以后,會(huì)快速完成傳播通道的封鎖工作,從而避免安全問題出現(xiàn)傳播、擴(kuò)散的情況。除此之外,通過大數(shù)據(jù)挖掘技術(shù),還能針對(duì)數(shù)據(jù)信息終端展開處理,通過對(duì)各項(xiàng)數(shù)據(jù)信息的歸類、整理和分析,能夠?qū)⒕W(wǎng)絡(luò)安全問題的分析時(shí)間和破解效率有效提升,使相關(guān)數(shù)據(jù)信息的應(yīng)用變得更為安全[5]。第三,在數(shù)據(jù)庫方面的應(yīng)用。借助關(guān)聯(lián)數(shù)據(jù)庫能夠使大數(shù)據(jù)挖掘技術(shù)獲得聚類分析功能,使其可以結(jié)合網(wǎng)絡(luò)安全問題的各項(xiàng)特征對(duì)存在隱患問題的數(shù)據(jù)信息進(jìn)行深入的分析與識(shí)別。例如,在計(jì)算機(jī)受到惡意行為攻擊時(shí),其基本特征、運(yùn)行軌跡以及執(zhí)行程序等情況都會(huì)被關(guān)聯(lián)數(shù)據(jù)庫記錄下來,而結(jié)合關(guān)聯(lián)數(shù)據(jù)庫匯總集合之后的數(shù)據(jù)信息,對(duì)聚類分析算法進(jìn)行應(yīng)用,能夠幫助大數(shù)據(jù)挖掘技術(shù)對(duì)各類安全問題的攻擊規(guī)則進(jìn)行充分的利用,從而實(shí)現(xiàn)網(wǎng)絡(luò)病毒等安全問題的有效識(shí)別,達(dá)到提高網(wǎng)絡(luò)安全水平的目的[6]。第四,對(duì)于網(wǎng)絡(luò)安全而言,大數(shù)據(jù)挖掘技術(shù)的作用是非常重要的,借助該技術(shù)的數(shù)據(jù)挖掘模塊以及規(guī)則庫模塊,對(duì)相關(guān)數(shù)據(jù)進(jìn)行匹配,一旦出現(xiàn)較高的匹配度,就能夠?qū)崿F(xiàn)網(wǎng)絡(luò)安全隱患的有效發(fā)掘。目前,人們?cè)谶M(jìn)行計(jì)算機(jī)系統(tǒng)應(yīng)用的過程中,都會(huì)設(shè)置相應(yīng)的安全防護(hù)軟件,例如,騰訊管家、360防火墻等等,對(duì)這些軟件功能進(jìn)行有效的應(yīng)用,能夠?yàn)橛脩籼峁┮欢ǖ谋憷?,但在?duì)這些防護(hù)軟件進(jìn)行實(shí)際應(yīng)用的過程中,還存在精度不高的情況,無法對(duì)網(wǎng)絡(luò)病毒屬性進(jìn)行準(zhǔn)確的判斷,之所以會(huì)如此,主要是由于其決策模塊在功能方面還有待完善,導(dǎo)致規(guī)則運(yùn)算條件缺乏約束力,而應(yīng)用大數(shù)據(jù)挖掘技術(shù)則可以將上述問題有效解決。但在實(shí)際應(yīng)用當(dāng)中需要注意,雖然大數(shù)據(jù)挖掘技術(shù)能夠根據(jù)數(shù)據(jù)規(guī)律特征完成病毒特征的有效歸納,但也需要有相應(yīng)的決策模塊作為支持,如此才能將各種網(wǎng)絡(luò)安全問題有針對(duì)性地解決。反之,如果缺乏與之匹配的決策模塊,則技術(shù)在應(yīng)用當(dāng)中也可能會(huì)出現(xiàn)誤判的情況,導(dǎo)致數(shù)據(jù)類型無法匹配,為網(wǎng)絡(luò)安全問題的侵入提供可乘之機(jī)[7]。第五,在數(shù)據(jù)預(yù)處理方面的應(yīng)用。一般數(shù)據(jù)預(yù)處理主要是以決策條件以及病毒特征信息為基礎(chǔ)進(jìn)行后續(xù)歸類、分析及審核操作的,針對(duì)數(shù)據(jù)預(yù)處理進(jìn)行相關(guān)方案的合理編制,能夠?qū)崿F(xiàn)各類網(wǎng)絡(luò)安全問題的信息驗(yàn)證工作,并通過關(guān)鍵數(shù)據(jù)參數(shù)的提取以及相關(guān)指標(biāo)的驗(yàn)證,為防御系統(tǒng)的有效構(gòu)建提供支持。因此,在應(yīng)用大數(shù)據(jù)挖掘技術(shù)的過程中,可以借助數(shù)據(jù)預(yù)處理進(jìn)行病毒類型以及系統(tǒng)漏洞的準(zhǔn)確判斷和分析,從而有效提高計(jì)算機(jī)系統(tǒng)對(duì)于網(wǎng)絡(luò)安全問題的防護(hù)能力[8]。

3.3大數(shù)據(jù)挖掘技術(shù)應(yīng)用的主要方向

對(duì)于網(wǎng)絡(luò)安全防護(hù)而言,入侵檢測(cè)是其主要的發(fā)展方向之一。而目前的入侵檢測(cè)主要涉及兩種形式,一種是正常入侵檢測(cè),另一種則是異常入侵檢測(cè),雖然兩者有所差異,但在實(shí)際當(dāng)中經(jīng)常會(huì)對(duì)其進(jìn)行聯(lián)合應(yīng)用,而在入侵檢測(cè)當(dāng)中應(yīng)用大數(shù)據(jù)挖掘技術(shù),則可以使入侵檢測(cè)的效果得到極大的提升,進(jìn)一步提高網(wǎng)絡(luò)安全維護(hù)工作的效果。首先,是正常入侵檢測(cè)。其主要是以正常網(wǎng)絡(luò)行為為檢測(cè)對(duì)象的,需要通過系統(tǒng)的分析建模,將正常模型特征篩選出來,通過正常模型特征和用戶行為特征的對(duì)比來進(jìn)行網(wǎng)絡(luò)行為的判斷,確認(rèn)其正常與否,如果用戶行為特征不符合正常模型特征,則會(huì)將其認(rèn)定為異常入侵。而這種判斷模式存在一定的誤判情況,因此,需要應(yīng)用大數(shù)據(jù)挖掘技術(shù),根據(jù)數(shù)據(jù)信息的類別進(jìn)行劃分,使數(shù)據(jù)精準(zhǔn)度能夠得到盡可能地提升,使入侵檢測(cè)質(zhì)量得到相應(yīng)的保證[9]。其次,是異常入侵檢測(cè)。顧名思義,該項(xiàng)檢測(cè)主要是針對(duì)異常行為進(jìn)行檢測(cè)的,其能夠通過異常數(shù)據(jù)的收集以及相關(guān)模型的構(gòu)建,根據(jù)已經(jīng)發(fā)生過的入侵行為做好特征匯總及分析工作,以此來提高異常數(shù)據(jù)模型的豐富性和全面性。這樣,一旦出現(xiàn)非法入侵行為,入侵檢測(cè)技術(shù)就能檢測(cè)到與之前相似的特征,并實(shí)現(xiàn)入侵行為的快速識(shí)別與控制。在異常入侵檢測(cè)方面,其數(shù)據(jù)信息較為簡(jiǎn)單,構(gòu)建數(shù)據(jù)模型也比較容易,但其只能對(duì)曾經(jīng)出現(xiàn)過的異常入侵行為進(jìn)行檢測(cè),對(duì)于之前沒有成功侵入系統(tǒng)或者是沒有發(fā)生的入侵特征,難以進(jìn)行準(zhǔn)確的識(shí)別,所以其漏洞還比較多。而借助大數(shù)據(jù)挖掘技術(shù),能夠提高入侵檢測(cè)對(duì)于未知入侵行為的檢測(cè)能力。這主要是應(yīng)用數(shù)據(jù)關(guān)聯(lián)技術(shù),提取歷史入侵行為的相關(guān)數(shù)據(jù),并通過數(shù)據(jù)分析、參數(shù)設(shè)定對(duì)入侵行為路徑進(jìn)行深入的挖掘,同時(shí)應(yīng)用相應(yīng)的算法對(duì)入侵行為進(jìn)行科學(xué)的預(yù)測(cè),使異常入侵檢測(cè)可以及時(shí)的預(yù)測(cè)和檢出未知入侵行為,提高其防護(hù)效果[10]。

4結(jié)語

綜上所述,在網(wǎng)絡(luò)安全當(dāng)中對(duì)大數(shù)據(jù)挖掘技術(shù)加強(qiáng)應(yīng)用,能夠使網(wǎng)絡(luò)安全水平得到極大的提升,這對(duì)于計(jì)算機(jī)網(wǎng)絡(luò)的安全應(yīng)用有著非常積極的作用。因此,相關(guān)領(lǐng)域應(yīng)該對(duì)該項(xiàng)技術(shù)保持高度的重視,應(yīng)結(jié)合實(shí)際對(duì)其進(jìn)行合理的應(yīng)用,使其能夠在網(wǎng)絡(luò)安全防護(hù)當(dāng)中發(fā)揮更大的作用。

作者:吳藝妮 單位:安徽綠海商務(wù)職業(yè)學(xué)院