前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘在計算機網(wǎng)絡病毒防范中應用范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:計算機網(wǎng)絡技術越先進,病毒就越難制預防。為了增強計算機網(wǎng)絡對于病毒防護效果,需要加強數(shù)據(jù)挖掘的利用。數(shù)據(jù)挖掘技術是打破傳統(tǒng)空間和時間限制的互聯(lián)網(wǎng)技術,利用數(shù)據(jù)挖掘技術可以有效的預防計算機網(wǎng)絡病毒的攻擊。對此,本文分析了數(shù)據(jù)挖掘技術原理,包括數(shù)據(jù)庫的數(shù)據(jù)采集、處理和分析等。在計算機中發(fā)揮防病毒作用,為構(gòu)建和諧的運行環(huán)境打下堅實的基礎。
關鍵詞:數(shù)據(jù)挖掘技術;計算機;網(wǎng)絡病毒防范
1計算機病毒與數(shù)據(jù)挖掘概述
計算機系統(tǒng)病毒在運行時隱藏在其他文件中,而不是單獨的文件。人們通過Word編輯一段文字,如果遭到病毒的破壞,整個文件就會從DOCX格式文件轉(zhuǎn)換為可執(zhí)行文件,代碼位置將相應更改。存儲空間會受到限制,隱藏在程序中的病毒轉(zhuǎn)換為病毒母體。一旦病毒母體被激活,病毒鏈接就會隨著被感染的文件傳播,目的是改變數(shù)據(jù)和破壞文件系統(tǒng)。不同的計算機病毒在運行時也表現(xiàn)出不同的特征。小病毒可以只有20條指令,對于計算機網(wǎng)絡大病毒可以有幾萬條指令。并且有些病毒入會迅速繁殖,有些病毒只有在傳播時報告,但有些病毒會攻擊硬盤以達到損壞的目的。信息挖掘技術的主要目的是從某些數(shù)據(jù)中提取數(shù)據(jù)中有價值的部分。使用信息挖掘技術往往涉及模糊識別和統(tǒng)計學,以此來完成數(shù)據(jù)的挖掘、分析和可視化的過程。一旦確定了數(shù)據(jù)輸出,就會為適當?shù)囊嫣峁﹦恿?,可以定期搜索必要的信息。基于?shù)據(jù)挖掘技術的使用,應用需要提前完成數(shù)據(jù)處理,然后鏈接數(shù)據(jù)表,并以此來處理數(shù)據(jù),并有效的完成變量整合工作。
2計算機網(wǎng)絡病毒的特點
計算機病毒是指安裝某些信息或軟件來運行計算機病毒,可以自行復制代碼和指令,使計算機而不能正常工作。計算機系統(tǒng)病毒包括系統(tǒng)病毒、木馬、黑客和腳本病毒等。它們都是隱藏在計算機網(wǎng)絡中,并且這些病毒具有高度的隱蔽性,甚至創(chuàng)建許多變種。病毒的潛伏期很長,破壞性也非常強。通過創(chuàng)建一個通道來傳輸數(shù)據(jù)。它們正在攻擊市場上普遍的計算機團隊,目前市面上的病毒檢測軟件和防火墻無法全面有效的檢測該病毒。傳染性病毒主要寄生在常規(guī)軟件或程序中。只要它在傳染病毒方面起著作用,就會對計算機系統(tǒng)產(chǎn)生毀滅性的影響。如果它不起作用,通常很難找到。病毒在進入計算機后,會通過不斷的繁殖或變化,具有破壞性且傳播速度快。由于病毒是病毒設計者創(chuàng)建的,普通人無法找到。當?shù)侥撤N觸發(fā)狀態(tài)時,會突然的發(fā)生損害。計算機病毒會感染硬件資源,使系統(tǒng)過載,導致計算機癱瘓。在數(shù)據(jù)傳輸中,會占用大量的空間來使軟件無法正常工作。
3挖掘數(shù)據(jù)的方法
在使用數(shù)據(jù)挖掘技術時,需要先收集相關數(shù)據(jù),對數(shù)據(jù)進行處理,以進行科學的挖掘數(shù)據(jù)和構(gòu)建模型等操作。同時,對數(shù)據(jù)進行評估和處理。數(shù)據(jù)挖掘的數(shù)據(jù)預處理,挖掘技術使用的準備過程可以有效地收集有價值的數(shù)據(jù),并處理編碼,為數(shù)據(jù)挖掘提供基礎。數(shù)據(jù)挖掘過程是通過機器學習和數(shù)據(jù)庫方法等算法獲得更準確的預測模型,使模型更有效來消除后一種模型及其有效性。一旦使用數(shù)據(jù)挖掘,就可以優(yōu)化數(shù)據(jù)處理,發(fā)現(xiàn)隱藏在數(shù)據(jù)中的信息,有效防治病毒。
4計算機系統(tǒng)病毒防控基礎技術
4.1靜態(tài)病毒檢測
特征碼是殺毒軟件從病毒中獲取的二進制值。根據(jù)該值可以確定文件是病毒文件還是感染了病毒。作為功能碼使用的信息是在計算機上顯示信息、病毒感染數(shù)或病毒文件中不包含的符號序列。病毒的搜索引擎匹配查文件和病毒的簽名。如果搜索中匹配成功,則該文件可能感染了病毒。常見的計算對象包括信息、文件屬性和文件內(nèi)容。常用的校驗算法包括MD5和CRC等。當文件被使用或系統(tǒng)啟動運行時,文件分支被認為被檢查并與存儲在數(shù)據(jù)庫檢查進行比較。如果比較結(jié)果不匹配,則文件或系統(tǒng)分支可能被感染。根據(jù)統(tǒng)計規(guī)律,準確判斷該文件是病毒文件還是感染文件,并給出解釋。在處理多態(tài)病毒時,可以結(jié)合虛擬機檢測技術,病毒識別采用虛擬檢測技術。
4.2動態(tài)病毒檢測技術
虛擬機技術從被感染的病毒程序中讀取病毒接入點的代碼,模擬病毒中加密軟件執(zhí)行,打開病毒的原型,使用檢測技術進行文件的測試。主動防御技術是對程序的行為進行控制,確定是否存在有害傾向。當程序敏感時,就會提醒用戶,如果對安全構(gòu)成重大威脅??梢粤⒓葱遁d該程序。云殺毒技術是利用云計算和數(shù)據(jù)源將可疑文件和數(shù)據(jù)上傳到云服務器,并將可疑文件處理到服務器上。方法提高了判別的準確性,更快地了解病毒的行為和傳播,并采取適當?shù)念A防措施。
5數(shù)據(jù)挖掘技術的構(gòu)成
5.1功能模塊
實現(xiàn)數(shù)據(jù)挖掘的目標是通過算法完成對數(shù)據(jù)分析,有效地分析數(shù)據(jù)關系??偟膩碚f,數(shù)據(jù)挖掘主要關注部署中計算機系統(tǒng)病毒的威脅,增加了技術應用的復雜性,保證了各種病毒級別的威脅被攻擊。數(shù)據(jù)采集模塊是引入數(shù)據(jù)挖掘技術的基礎,在數(shù)據(jù)收集成功完成后用于調(diào)查。注意定期整理重要信息,完成數(shù)據(jù)的處理。數(shù)據(jù)的預處理可以增加后續(xù)數(shù)據(jù)識別的可能性,并在短時間內(nèi)填寫信息訪問內(nèi)容。數(shù)據(jù)進行預處理下,可以提高數(shù)據(jù)采集的效率和轉(zhuǎn)換的效率,讓數(shù)據(jù)接收更準確。規(guī)則庫模塊成網(wǎng)絡病毒的檢測,并實現(xiàn)特征提取特定數(shù)據(jù)和信息的方法??梢詫炷K規(guī)則收集,然后分析計算機毒的特征,識別出特征并進行相應的分析,使相關信息與病毒的相同信息相匹配,和系統(tǒng)信息相互結(jié)合分析。隨著網(wǎng)絡出現(xiàn)類似信息,就意味著病毒的出現(xiàn)。規(guī)則庫模塊必須充分執(zhí)行并記憶,以滿足病毒防護的要求。模塊程序還可以檢測各種系統(tǒng)病毒,利用掃描功能對不同數(shù)據(jù)集進行處理。分析不同類型的數(shù)據(jù)集,分組完成數(shù)據(jù)集。每個數(shù)據(jù)集會有一定的差異,可以利用數(shù)據(jù)的差異來實現(xiàn)病毒定義,提供最終的效果。決策模塊結(jié)合與檢測病毒相關的信息。如果數(shù)據(jù)稍高,則網(wǎng)絡病毒的評估大體上成功。當水平略低時,新病毒應該在單獨的列表中。
5.2技術分類
數(shù)據(jù)挖掘技術不是單一的技術,挖掘功能通過決策樹、神經(jīng)系統(tǒng)和回歸技術來結(jié)合實現(xiàn)。決策技術是應用最為廣泛的挖掘技術,是從根源上采集數(shù)據(jù)樣本,分層分析得出結(jié)論。神經(jīng)系統(tǒng)主要來源于積累的經(jīng)驗知識和知識應用的能力?;貧w技術常用于擴展線性和邏輯回歸假設的信息處理[1]。
6數(shù)據(jù)挖掘技術在病毒防范中的應用
6.1數(shù)據(jù)收集
數(shù)據(jù)挖掘技術與計算機技術是一致的,數(shù)據(jù)挖掘的過程應以計算機為基礎。數(shù)據(jù)挖掘技術可以完成數(shù)據(jù)的采集、分析和處理,還有數(shù)據(jù)分類選擇等相關技術。計算機系統(tǒng)使用數(shù)據(jù)挖掘技術來選擇和使用數(shù)據(jù)挖掘技術的病毒預防過程,并且可以有效的收集數(shù)據(jù),為計算機病毒和傳輸路線進行收集和處理。因此,可以驗證病毒數(shù)據(jù)。該類型的代碼可以防止病毒從網(wǎng)絡進入整個計算機。當計算機系統(tǒng)受到威脅時,程序可以成為主要支持。對代碼程序進行分析可以防止病毒。利用數(shù)據(jù)挖掘技術直接采集大量數(shù)據(jù),找到與病毒相關的病毒代碼程序,對病毒代碼信息進行分析處理。需要澄清之間存在的安全問題才能感染病毒。以計算機代碼為主要載體的系統(tǒng)在病毒軟件程序的制作中較為復雜,且病毒代碼程序與常規(guī)軟件存在共性,因此在實際中,同樣的事情適用于軟件的生產(chǎn),相互之間如果適用,分為不同的模塊功能。使用數(shù)據(jù)挖掘技術,以小模塊的形式收集病毒數(shù)據(jù),在相關的收集中,會有大量的數(shù)據(jù)進行通信。將信息檢索到特定的網(wǎng)絡信息類型,借助網(wǎng)絡模塊對病毒進行分析和處理[2]。
6.2數(shù)據(jù)處理
利用計算機反病毒數(shù)據(jù)處理技術,使系統(tǒng)合理過濾和分析信息,帶上基礎信息,過濾與病毒有聯(lián)系的代碼,進行分類排序。與處理技術相結(jié)合,對收集到的數(shù)據(jù)進行格式化。一般情況下,病毒不會以數(shù)字或文本攻擊計算機。代碼格式必須改變后才能顯示,但病毒代碼轉(zhuǎn)換為可識別的格式后即可進行加密。數(shù)據(jù)挖掘技術中數(shù)據(jù)處理的主要任務是轉(zhuǎn)換病毒的代碼。病毒的種類要處理的內(nèi)容主要是信息來源和來源位置等信息,包括病毒的用途。通過額外的研究來實現(xiàn)傳播病毒的有效傳播方式,處理可以對收集到的數(shù)據(jù)進行處理,并轉(zhuǎn)化為數(shù)據(jù)。該技術還可以縮短數(shù)據(jù)分析的時間,提高數(shù)據(jù)挖掘的效率和準確性[3]。
6.3數(shù)據(jù)分析
在數(shù)據(jù)分析中,體現(xiàn)在對分析方法的有效運用,最常用的方法有序列分析、統(tǒng)一分析和分組分析等。序列分析是指在數(shù)據(jù)處理中,系統(tǒng)要對數(shù)據(jù)序列中的規(guī)則進行分析,并與現(xiàn)有病毒數(shù)據(jù)進行比較。異類分析是針對不同數(shù)據(jù)的可用性。分析是對特殊連接的檢測和分析。當打開特殊連接時,結(jié)果與一般概念不符。因此,在深入分析時,需要關注最有價值的信息,進而提高病毒檢測的效果。在進行分類分析前,將其劃分為不同的類別,根據(jù)個體的不同進行分類,并通過創(chuàng)建模型來映射數(shù)據(jù)庫中的信息,實現(xiàn)適當?shù)姆诸?。這種分析方法應該優(yōu)先創(chuàng)建不同的類別,根據(jù)實際類別進行分類,并使用統(tǒng)計方法和機器學習方法來創(chuàng)建模型,同時使用適當?shù)念悇e。類別映射數(shù)據(jù)庫中的信息,并遵循分類規(guī)則使數(shù)據(jù)基于分類。通過從網(wǎng)絡開發(fā)病毒防護,聚類分析可以有效地分解數(shù)據(jù)挖掘中存儲的數(shù)據(jù)包,整合各種標準,完成分類。在這種情況下,即使不同的劃分是完整的,每個組內(nèi)的信息也表現(xiàn)出不同的特征,對于不同組的數(shù)據(jù)也不同。使用聚類分析可以確定數(shù)據(jù)分布的密度,通過區(qū)域分布方法將數(shù)據(jù)之間的重要屬性聯(lián)系起來,可以提高數(shù)據(jù)檢測的效率。
6.4模型匹配
匹配模型是處理網(wǎng)絡安全的方法,掃描后在特定區(qū)域發(fā)現(xiàn)木馬病毒,并進行模型的匹配。可以對不同的計算機安全事件進行采集,對大部分病毒進行分析。大約70%的木馬是通過安全包傳播的,一些插件也有隱藏的病毒。注意具有相似特征的數(shù)據(jù)包,饋送到通常的管理軟件中以創(chuàng)建保護墻。在此基礎上,預防網(wǎng)絡病毒,并進行適當?shù)木S護,以確保計算機的安全。
6.5有監(jiān)督的數(shù)據(jù)挖掘技術應用
分類分析是有監(jiān)督的數(shù)據(jù)挖掘技術,預先設定類別,根據(jù)個體的特征歸入不同的類別。分類分析的目的是利用機器學習方法創(chuàng)建模型,將數(shù)據(jù)庫中的數(shù)據(jù)映射到特定的類,即xay映射,使用分類規(guī)則對數(shù)據(jù)進行分類。在靜態(tài)分析中,支持向量機算法,而在動態(tài)分析中,內(nèi)置算法效果更好。決策樹是由節(jié)點形成的層次結(jié)構(gòu),通過問題進行分類。在決策樹中,內(nèi)部節(jié)點代表測試條件,分支代表測試結(jié)果,葉子代表不同類別。決策樹最常用的算法是ID3和C4.5,屬于升序樹結(jié)構(gòu)。決策樹提取是基于將判斷項劃分,由從大到小和由大到細的順序,逐級判斷不同屬性。在計算機上安裝殺毒防御系統(tǒng)時,決策樹提取條件為:程序是否有破壞能力、是否有復制傳播能力、是否具有隱蔽性。
7結(jié)語
綜上所述,數(shù)據(jù)挖掘技術在網(wǎng)絡病毒防護發(fā)展中,在數(shù)據(jù)檢索和提高信息安全方面發(fā)揮了重要的作用,數(shù)據(jù)挖掘技術也成為了未來計算機安全管理信息安全的關鍵因素。因此,必須發(fā)揮數(shù)據(jù)挖掘技術的重要作用,不斷加強數(shù)據(jù)采集、處理與分析等可持續(xù)的技術支撐,確保計算機網(wǎng)絡運行的穩(wěn)定性。
參考文獻
[1]郭翰科.數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防御中的應用探討[J].中國新通信,2019,21(9):114.
[2]代鵬飛,吳明.數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防御中的應用分析[J].中國新通信,2019,21(6):89.
[3]胡曉東.數(shù)據(jù)挖掘技術在計算機網(wǎng)絡病毒防御中的應用分析[J].數(shù)碼世界,2017(11):31-32.
作者:周日輝 單位:廣東茂名幼兒師范??茖W校