前言:想要寫(xiě)出一篇引人入勝的文章?我們特意為您整理了談電信網(wǎng)絡(luò)實(shí)時(shí)數(shù)據(jù)挖掘智能技術(shù)范文,希望能給你帶來(lái)靈感和參考,敬請(qǐng)閱讀。
摘要:目前,很多網(wǎng)絡(luò)技術(shù)已經(jīng)應(yīng)用到了方方面面。在現(xiàn)在的網(wǎng)絡(luò)發(fā)展相對(duì)不穩(wěn)定的情況下,數(shù)據(jù)挖掘技術(shù)在電信方面廣為應(yīng)用,但是通過(guò)這種技術(shù)并不能獲得更加深層次的數(shù)據(jù)信息。因此,主要從數(shù)據(jù)挖掘技術(shù)導(dǎo)論、智能技術(shù)與數(shù)據(jù)挖掘技術(shù)的結(jié)合以及相關(guān)案例對(duì)數(shù)據(jù)挖掘的智能技術(shù)進(jìn)行剖析。
關(guān)鍵詞:電信網(wǎng)絡(luò);實(shí)時(shí)數(shù)據(jù)挖掘;智能技術(shù)
引言
近年來(lái),網(wǎng)絡(luò)技術(shù)的發(fā)展給通信技術(shù)的發(fā)展帶來(lái)了曙光,特別是電信行業(yè)的迅猛發(fā)展,更是推動(dòng)了數(shù)據(jù)挖掘技術(shù)的應(yīng)用。1數(shù)據(jù)挖掘的智能技術(shù)導(dǎo)論數(shù)據(jù)挖掘技術(shù)是一種對(duì)數(shù)據(jù)進(jìn)行處理的技術(shù),將所能獲得的數(shù)據(jù)進(jìn)行深層挖掘,挖掘出常人所不熟知的潛在的有用信息。數(shù)據(jù)挖掘技術(shù)需要根據(jù)所獲得的數(shù)據(jù)類(lèi)型選擇分析方法,如網(wǎng)絡(luò)結(jié)構(gòu)分析法、數(shù)據(jù)統(tǒng)計(jì)法等,該過(guò)程是一個(gè)動(dòng)態(tài)重復(fù)的過(guò)程,如果在數(shù)據(jù)挖掘的過(guò)程中沒(méi)有獲得預(yù)期的數(shù)值就要重新回到前面的步驟進(jìn)行重復(fù)操作[1]。該挖掘技術(shù)的主要方法是通過(guò)對(duì)所觀測(cè)到的數(shù)據(jù)進(jìn)行解析,以天為單位或以時(shí)、分為單位對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè),根據(jù)所要研究的對(duì)象設(shè)置自變量和因變量。例如,將t作為自變量,x作為因變量來(lái)推測(cè)所產(chǎn)生的數(shù)據(jù)關(guān)系。其中t代表的是同一天(時(shí)、分)時(shí)間內(nèi)的時(shí)間間隔,x代表的是所有可預(yù)測(cè)的變化量[2]。要對(duì)電信網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行分析,就要將這些數(shù)據(jù)進(jìn)行適當(dāng)?shù)男问睫D(zhuǎn)換。轉(zhuǎn)換以時(shí)間序列作為基礎(chǔ)。近年來(lái),通過(guò)學(xué)者們對(duì)數(shù)據(jù)挖掘技術(shù)的不斷研究出現(xiàn)了很多以時(shí)間序列為主的數(shù)據(jù)挖掘技術(shù)。但是在電信領(lǐng)域,網(wǎng)絡(luò)環(huán)境不穩(wěn)定,尤其是數(shù)據(jù)變換具有十分頻繁的波動(dòng),所以電信網(wǎng)的問(wèn)題不應(yīng)該只是數(shù)據(jù)統(tǒng)計(jì)、保管那么簡(jiǎn)單。因此,傳統(tǒng)的數(shù)字挖掘技術(shù)將不能廣范圍的應(yīng)用于電信行業(yè)的發(fā)展。
2數(shù)據(jù)挖掘的主要過(guò)程
數(shù)據(jù)挖掘主要從數(shù)據(jù)本身出發(fā)。一般數(shù)據(jù)挖掘包括信息采集、將數(shù)據(jù)進(jìn)行整合、對(duì)數(shù)據(jù)的規(guī)范化整理、數(shù)據(jù)排除和清理、數(shù)據(jù)之間進(jìn)行變換、實(shí)施數(shù)據(jù)挖掘過(guò)程、對(duì)數(shù)據(jù)挖掘過(guò)程進(jìn)行評(píng)估、用相關(guān)的知識(shí)進(jìn)行表達(dá)八個(gè)步驟。
2.1信息采集
首先確定研究對(duì)象,根據(jù)所要研究的對(duì)象確定數(shù)據(jù)特征,然后選擇出合適的信息采集方法,收集整理所要研究的數(shù)據(jù)。對(duì)于數(shù)據(jù)量大的數(shù)據(jù)庫(kù),選擇一個(gè)合適的保管途徑和數(shù)據(jù)存儲(chǔ)器是十分有必要的。
2.2將數(shù)據(jù)進(jìn)行整合
由于數(shù)據(jù)來(lái)源、格式特點(diǎn)、數(shù)據(jù)特征等性質(zhì)的不同,要有邏輯性的對(duì)所要數(shù)據(jù)進(jìn)行整理。電信行業(yè)不同于一般的商業(yè)化企業(yè),它作為世界通信過(guò)程中十分重要的一種介質(zhì),自然需要信息的共享,而這種信息數(shù)據(jù)的整合就方便了電信行業(yè)的各企業(yè)之間的資源共享[3]。
2.3對(duì)數(shù)據(jù)的規(guī)范化整理
數(shù)據(jù)挖掘技術(shù)雖然對(duì)數(shù)據(jù)匯總及分析十分方便,但是所用的時(shí)間很長(zhǎng),即使是對(duì)少量的數(shù)據(jù)進(jìn)行分析也需要很長(zhǎng)的時(shí)間,而企業(yè)運(yùn)營(yíng)和商業(yè)化管理往往包含的數(shù)據(jù)量是十分巨大的。所以對(duì)數(shù)據(jù)的規(guī)范化整理可以將數(shù)據(jù)庫(kù)進(jìn)行適當(dāng)程度的縮小,將大多數(shù)存在同一水平的數(shù)據(jù)進(jìn)行求平均值的處理。這樣不僅將數(shù)據(jù)挖掘技術(shù)的范圍縮小了不少,而且不會(huì)對(duì)最終數(shù)據(jù)的結(jié)果產(chǎn)生影響,甚至與原結(jié)果保持高度一致。2.4數(shù)據(jù)排除和清理在龐大的數(shù)據(jù)庫(kù)中,有的數(shù)據(jù)存在明顯的錯(cuò)誤、有的數(shù)據(jù)結(jié)構(gòu)不完整,并且這些數(shù)據(jù)面對(duì)不同的信息采集途徑時(shí)會(huì)有不同的表示方法,所以要對(duì)數(shù)據(jù)進(jìn)行排除和清理。將不完整的數(shù)據(jù)補(bǔ)充完整,存在明顯錯(cuò)誤和偶然性的數(shù)據(jù)就要舍棄,否則所得到的結(jié)果將會(huì)存在較大程度上的誤差,導(dǎo)致對(duì)整個(gè)電信行業(yè)的發(fā)展預(yù)期產(chǎn)生影響。
2.5數(shù)據(jù)之間進(jìn)行變換
數(shù)據(jù)變換的方法有很多種,如平滑聚集、數(shù)據(jù)規(guī)范化、數(shù)據(jù)概括等方式就是將數(shù)據(jù)轉(zhuǎn)化成有用的知識(shí)點(diǎn)進(jìn)行數(shù)據(jù)分析和挖掘。對(duì)于有實(shí)際作用,但是計(jì)算量大的一些數(shù)據(jù)可以采用概念分化、數(shù)據(jù)離散整合的方法進(jìn)行轉(zhuǎn)換。2.6實(shí)施數(shù)據(jù)挖掘過(guò)程根據(jù)所得數(shù)據(jù)的特征及所包含的數(shù)據(jù)信息的不同,要選擇正確的分析方法。常用的幾種分析方法有數(shù)據(jù)概括法、大規(guī)模的數(shù)據(jù)統(tǒng)計(jì)法、利用數(shù)據(jù)規(guī)則進(jìn)行推理的方法、模糊集、網(wǎng)絡(luò)結(jié)構(gòu)法(常見(jiàn)的為神經(jīng)網(wǎng)絡(luò))、遺傳算法、通過(guò)實(shí)例進(jìn)行推斷的方法等。通過(guò)這些方法可以將數(shù)據(jù)中存在的隱藏信息挖掘出來(lái),給整個(gè)電信行業(yè)的發(fā)展帶來(lái)極大的商業(yè)價(jià)值。
2.7對(duì)數(shù)據(jù)挖掘過(guò)程進(jìn)行評(píng)估
這些數(shù)據(jù)大多數(shù)都是從商業(yè)途徑獲得,所以避免不了具有一定的商業(yè)價(jià)值,尤其是對(duì)于電信這一特殊的行業(yè)。所以對(duì)最終的數(shù)據(jù)進(jìn)行評(píng)估也是數(shù)據(jù)商業(yè)化的一種體現(xiàn)方式[4]。
2.8用相關(guān)的知識(shí)進(jìn)行表達(dá)
將數(shù)據(jù)挖掘的最終結(jié)果通過(guò)透明公開(kāi)的方式展示給電信用戶(hù)是十分必要的。此外,將其作為商業(yè)數(shù)據(jù)密封起來(lái)以供其他方面的商業(yè)發(fā)展也是數(shù)據(jù)挖掘的另一種作用。
3數(shù)據(jù)挖掘的智能技術(shù)的預(yù)測(cè)方式
由導(dǎo)論可知,數(shù)據(jù)挖掘?yàn)楦鞣矫娴念A(yù)測(cè)做出了很大的貢獻(xiàn)。其預(yù)測(cè)方式主要包括時(shí)間序列基礎(chǔ)上的感知預(yù)測(cè)、協(xié)作組合預(yù)測(cè)以及利用網(wǎng)狀結(jié)構(gòu)模型進(jìn)行預(yù)測(cè)。
3.1時(shí)間序列基礎(chǔ)上的感知預(yù)測(cè)
將時(shí)間序列作為主要觀察量,通過(guò)觀察數(shù)據(jù)變化得出計(jì)算公式,將計(jì)算公式中的斜率值代入,取代時(shí)間序列的值。主要通過(guò)斜率值的變化來(lái)觀測(cè)最接近于實(shí)際的數(shù)值,進(jìn)而對(duì)全局模式進(jìn)行預(yù)測(cè)。但是,在此過(guò)程中需要注意考慮時(shí)間序列存在的隨機(jī)性和偶然性,要建立可靠的描述圖進(jìn)行觀察,對(duì)一些具有明顯誤差的數(shù)據(jù)和具有偶然性的數(shù)據(jù)進(jìn)行刪除,通過(guò)觀察平均數(shù)據(jù)得出結(jié)論。更需要注意的是,由于電信號(hào)的不穩(wěn)定性使得電信號(hào)會(huì)在短時(shí)間內(nèi)出現(xiàn)多次數(shù)據(jù)波動(dòng),所以,每隔一段時(shí)間就要對(duì)電信號(hào)根據(jù)脈沖進(jìn)行分類(lèi)。從最相似的數(shù)據(jù)中提取出符合實(shí)際和電信號(hào)波動(dòng)范圍的數(shù)值,并將該數(shù)值應(yīng)用到全局觀測(cè)的位置。
3.2協(xié)作組合預(yù)測(cè)
數(shù)據(jù)挖掘的智能技術(shù)的預(yù)測(cè)方式有很多種,但他們都有一個(gè)共同點(diǎn)就是預(yù)測(cè)的基礎(chǔ)都是時(shí)間序列。這些不同的預(yù)測(cè)方式之間必定存在不同的優(yōu)勢(shì)和劣勢(shì),所以就需要對(duì)不同的預(yù)測(cè)方式即進(jìn)行組合,協(xié)調(diào)出相對(duì)完善的預(yù)測(cè)方式。其中的協(xié)作主要是該過(guò)程中多方之間的協(xié)作,即當(dāng)存在多種時(shí),需要一種外在的具有沖擊性的策略對(duì)其進(jìn)行調(diào)整。對(duì)于這一問(wèn)題,很多學(xué)者的解決策略都只是側(cè)重于將數(shù)據(jù)進(jìn)行分類(lèi)整理,并沒(méi)有考慮到最佳數(shù)值的組合[5]。
3.3利用網(wǎng)狀結(jié)構(gòu)模型進(jìn)行預(yù)測(cè)(以神經(jīng)網(wǎng)絡(luò)為例)
由斜率等替代量觀測(cè)出各水平變量的等量變化。網(wǎng)狀模型結(jié)構(gòu)特別是神經(jīng)網(wǎng)絡(luò)相對(duì)于其他結(jié)構(gòu),預(yù)測(cè)性、準(zhǔn)確性要高。它可以準(zhǔn)確地計(jì)算出7個(gè)自變量和1個(gè)因變量之間的運(yùn)算關(guān)系。其主要計(jì)算方式為線(xiàn)性函數(shù)、激活函數(shù)等。在規(guī)定的區(qū)間、特定的節(jié)點(diǎn)內(nèi),將該輸入節(jié)點(diǎn)的輸入信號(hào)與對(duì)應(yīng)的加權(quán)數(shù)相乘,就可以將各輸入神經(jīng)之間連接起來(lái),由脈沖信號(hào)轉(zhuǎn)變?yōu)殡娦盘?hào)發(fā)出。
4數(shù)據(jù)挖掘的智能技術(shù)的框架模式
數(shù)據(jù)挖掘的智能技術(shù)常用的框架模式為多框架模式,即借助于多個(gè)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)信號(hào)及電信號(hào)的監(jiān)測(cè)和控制。該框架模式通過(guò)環(huán)球網(wǎng)的服務(wù)完成了不同的監(jiān)管任務(wù)。該框架模式的主要步驟具體如下。最初是通過(guò)各種途徑收集用戶(hù)的相關(guān)信息和電信號(hào)的網(wǎng)絡(luò)數(shù)據(jù)。將這些數(shù)據(jù)進(jìn)行整合、篩選后就會(huì)將這些數(shù)據(jù)發(fā)送給相關(guān)管理員,進(jìn)行保管。這樣的過(guò)程主要是為了將一些錯(cuò)誤的數(shù)據(jù)及具有偶然性的數(shù)據(jù)排除在外,保證預(yù)測(cè)結(jié)果的準(zhǔn)確性。主要預(yù)測(cè)的目標(biāo)為網(wǎng)絡(luò)延時(shí)狀態(tài)、鏈接程序的接受率、服務(wù)器所能承載的負(fù)荷等。其中,鏈接程序的接受率是預(yù)測(cè)的重點(diǎn),它直接關(guān)系到后面服務(wù)器所能承載的負(fù)荷的情況。然后是對(duì)變量之間的變化關(guān)系進(jìn)行推斷及相關(guān)運(yùn)算。運(yùn)用各感知系統(tǒng)對(duì)預(yù)測(cè)進(jìn)行感知預(yù)測(cè),但是由于數(shù)據(jù)是一直在變化的,所以在監(jiān)測(cè)時(shí)間內(nèi)每隔一段時(shí)間就要對(duì)數(shù)據(jù)進(jìn)行重新采取、計(jì)算和評(píng)估。在此過(guò)程中需要注意的是,有些時(shí)間段內(nèi)數(shù)據(jù)波動(dòng)范圍會(huì)比較大,有些時(shí)間段內(nèi)數(shù)據(jù)波動(dòng)范圍比較小,所謂對(duì)于時(shí)間段的選取也要有充分的考慮。
5各數(shù)據(jù)結(jié)構(gòu)所產(chǎn)生的實(shí)驗(yàn)結(jié)果分析
通過(guò)建立模型器和引用模型結(jié)構(gòu)建立模擬環(huán)境可以將各變量之間的數(shù)據(jù)關(guān)系展現(xiàn)出來(lái)。但是,同樣的數(shù)據(jù)關(guān)系通過(guò)智能技術(shù)也可以獲得。這些數(shù)據(jù)關(guān)系依然是建立在時(shí)間序列的基礎(chǔ)上,便于對(duì)后臺(tái)的各統(tǒng)計(jì)數(shù)據(jù)、服務(wù)器的負(fù)荷能力進(jìn)行統(tǒng)計(jì)[6]。例如,在一家工廠中設(shè)計(jì)出了一個(gè)網(wǎng)狀統(tǒng)計(jì)結(jié)構(gòu),在該結(jié)構(gòu)中可以看到該企業(yè)的信息獲取途徑和索取手段。這時(shí)可以將該企業(yè)的所有數(shù)據(jù)分為三個(gè)層面:全局統(tǒng)計(jì)數(shù)據(jù)、斷點(diǎn)(階段性)數(shù)據(jù)統(tǒng)計(jì)和鏈接程序數(shù)據(jù)統(tǒng)計(jì)。運(yùn)用這些不同層面的數(shù)據(jù)進(jìn)行計(jì)算,計(jì)算最后出現(xiàn)的數(shù)據(jù)代表著該事件中各變量之間的變化關(guān)系,這種關(guān)系同樣是建立在時(shí)間序列的基礎(chǔ)上的。例如,根據(jù)計(jì)算結(jié)果可以得到200個(gè)有效數(shù)據(jù)。這些數(shù)據(jù)中,每一個(gè)數(shù)據(jù)都可以代表一個(gè)變量。對(duì)于時(shí)間序列與這些變量之間的關(guān)系要進(jìn)行預(yù)處理。首先,對(duì)這些變量之間的變化關(guān)系進(jìn)行線(xiàn)性分析,得到一個(gè)新的數(shù)據(jù)組,然后利用這一新的數(shù)據(jù)組之間的變化量的變化關(guān)系來(lái)推測(cè)鏈接程序的接受率。當(dāng)然,并不是這組數(shù)據(jù)中的所有數(shù)值都可以拿來(lái)進(jìn)行數(shù)據(jù)推測(cè),我們可以將其中大部分?jǐn)?shù)值代入到計(jì)算公式中進(jìn)行計(jì)算,剩下的一小部分作為數(shù)據(jù)驗(yàn)證。因?yàn)檫@種數(shù)據(jù)分布具有一定的隨機(jī)性,所以這種數(shù)據(jù)計(jì)算并不適合建立在時(shí)間序列的基礎(chǔ)上。
6結(jié)論
為了研究電信行業(yè)中大規(guī)模數(shù)據(jù)如何處理的問(wèn)題,本文就數(shù)據(jù)挖掘的智能技術(shù)進(jìn)行了討論,看到了多框架模式的高效性、準(zhǔn)確性,體會(huì)到了數(shù)據(jù)挖掘技術(shù)的優(yōu)點(diǎn)及其不同的預(yù)測(cè)方法。
參考文獻(xiàn):
[1]戴勇,王詩(shī)卉.創(chuàng)新網(wǎng)絡(luò)守門(mén)人區(qū)域比較研究:以電信領(lǐng)域?yàn)槔齕J].科研管理,2019,40(7):106-118.
[2]汪明達(dá),周俏麗,蔡?hào)|風(fēng).采用混合模型的電信領(lǐng)域用戶(hù)流失預(yù)測(cè)[J/OL].計(jì)算機(jī)工程與應(yīng)用,2019,(9):1-15.
[3]侯全心,陳烈強(qiáng),張式娟,等.中國(guó)電信與中國(guó)聯(lián)通網(wǎng)絡(luò)建設(shè)領(lǐng)域深度合作思路探討[J].郵電設(shè)計(jì)技術(shù),2016,(9):74-77.
[4]魯義軒.聯(lián)想與瞻博網(wǎng)絡(luò)再合作借國(guó)際經(jīng)驗(yàn)進(jìn)軍電信領(lǐng)域DC市場(chǎng)[J].通信世界,2016,(24):49.
[5]陳曉.網(wǎng)絡(luò)安全建設(shè)在電信領(lǐng)域的應(yīng)用[J].科技經(jīng)濟(jì)市場(chǎng),2016,(7):63-65.
[6]莫建麟,廖建鋒.電信網(wǎng)絡(luò)領(lǐng)域?qū)崟r(shí)數(shù)據(jù)挖掘的智能技術(shù)[J].光通信研究,2013,(3):7-10,21.
作者:張英繼 單位:中國(guó)電信股份有限公司保定分公司
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)