公務(wù)員期刊網(wǎng) 論文中心 正文

談數(shù)據(jù)分析支持片區(qū)用戶服務(wù)

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談數(shù)據(jù)分析支持片區(qū)用戶服務(wù)范文,希望能給你帶來靈感和參考,敬請閱讀。

談數(shù)據(jù)分析支持片區(qū)用戶服務(wù)

摘要:數(shù)據(jù)建模是數(shù)據(jù)挖掘的重要步驟,而高品質(zhì)的數(shù)據(jù)是模型成立的堅實基礎(chǔ)。為了保持和保護原始數(shù)據(jù)的原貌不變,同時減少干擾因素對分析結(jié)果的影響,建立中間數(shù)據(jù)庫是有效、便捷的方案。特征寬表與關(guān)聯(lián)數(shù)據(jù)疊加形成多維度交織的關(guān)系凸顯特診數(shù)據(jù)是本文闡述的建模思路,中間數(shù)據(jù)庫的建設(shè)使得終端個體特征寬表、終端群體特征寬表成為可能,最終實現(xiàn)數(shù)據(jù)挖掘成果。

關(guān)鍵詞:中間數(shù)據(jù)庫終端個體特征寬表終端群體特征寬表

1前言

數(shù)據(jù)倉庫、網(wǎng)管系統(tǒng)、統(tǒng)計報表在廣電行業(yè)運營服務(wù)中的使用已非常成熟。為了更好發(fā)揮各個支撐系統(tǒng)的實際作用,支持片區(qū)用戶服務(wù)開展,全新的、符合需求的數(shù)據(jù)建模方式的研究試驗工作相繼展開。

2試驗環(huán)境

選取一個在網(wǎng)PON業(yè)務(wù)板卡下的覆蓋范圍為10000戶的區(qū)域作為試驗分析對象,該覆蓋范圍以PON+EoC的組網(wǎng),覆蓋小區(qū)有多層、高層等多種房屋類型(接入網(wǎng)設(shè)計風(fēng)格多樣),主要觀察對象為使用TVOS2.0交互機頂盒的用戶。

3試驗用數(shù)據(jù)平臺模型

該數(shù)據(jù)平臺用于建模試驗及驗證,為簡潔、高效,僅搭建了數(shù)據(jù)倉庫所必須需要使用的幾個部分。數(shù)據(jù)平臺模型示意圖如圖1所示。

4平臺基本情況

4.1數(shù)據(jù)源

(1)業(yè)務(wù)數(shù)據(jù)來自公司已建成的數(shù)據(jù)倉庫資源,該部分?jǐn)?shù)據(jù)已經(jīng)過清洗處理,數(shù)據(jù)品質(zhì)較高可直接使用(包括用戶基本信息、產(chǎn)品信息、業(yè)務(wù)變更、報修信息等)。(2)終端數(shù)據(jù)來自交互型機頂盒(STB)與寬帶終端(EoC)的網(wǎng)管采集數(shù)據(jù)。由于終端上線與開機的情況受到用戶使用習(xí)慣的影響,該部分?jǐn)?shù)據(jù)經(jīng)過去“空”、去“零”、異常去除等多種方式存入試驗用數(shù)據(jù)倉庫。(3)網(wǎng)絡(luò)拓?fù)浼熬W(wǎng)管數(shù)據(jù)該部分?jǐn)?shù)據(jù)描述了每組STB+EoC終端所在的廣播網(wǎng)和寬帶網(wǎng)絡(luò)關(guān)聯(lián)網(wǎng)元關(guān)系,與每個可管理網(wǎng)元的運行數(shù)據(jù)(性能采樣及告警等)。(4)其他關(guān)聯(lián)數(shù)據(jù)資源包括實驗覆蓋范圍內(nèi)可能使用的各種網(wǎng)元及終端的硬件、軟件版本、業(yè)務(wù)產(chǎn)品關(guān)聯(lián)的業(yè)務(wù)邏輯、網(wǎng)絡(luò)規(guī)劃策略等,網(wǎng)絡(luò)主動維護改擴建等。

4.2處理層

(1)數(shù)據(jù)倉庫用于存儲清洗后的數(shù)據(jù)源。(2)中間庫用于對數(shù)據(jù)倉庫的數(shù)據(jù)預(yù)處理。根據(jù)建模的需求將不同數(shù)據(jù)預(yù)先整合,既提升整個平臺的性能,也有效減少數(shù)據(jù)倉庫中的冗余數(shù)量,能有效保護源數(shù)據(jù)的原貌。(3)試驗?zāi)P捅敬卧囼灥年P(guān)鍵部分,下文詳述。

4.3展現(xiàn)層

根據(jù)片區(qū)服務(wù)的需求以三種形成展現(xiàn)方式使用。(1)可查詢定制清單。(2)定制報表。(3)可視化綜合分析。

5需要解決的問題和解決方案

最常見并實用的需求如單個用戶的歷史記錄分析。人工解讀單個用戶/終端數(shù)據(jù)非常簡單,但面對百萬級的用戶終端數(shù)量而言人工是不現(xiàn)實的,計算機面對單個用戶/終端的數(shù)據(jù)多樣性特點難度極大。綜合片區(qū)服務(wù)一些需求的特點和人工解讀單個用戶/終端數(shù)據(jù)方法。提出在中間庫建立終端個體特征寬表和終端群體特征寬表的設(shè)想,以這兩個寬表為基礎(chǔ),疊加關(guān)聯(lián)數(shù)據(jù)(如用戶報修、網(wǎng)絡(luò)報修,網(wǎng)絡(luò)改建、升級,系統(tǒng)告警、用戶行為等),將特征數(shù)據(jù)凸顯出來。終端個體特征寬表主要解決因用戶使用習(xí)慣造成的采樣記錄的數(shù)量問題。將在線的每個終端的日數(shù)據(jù)記錄收斂成一條,寬表的特征信息包含用戶基本信息、網(wǎng)絡(luò)拓?fù)潢P(guān)系、性能指標(biāo)等每項都設(shè)定收斂策略。終端群體特征寬表則主要解決指定/選定范圍群體數(shù)據(jù)集合問題。在指定/選定范圍內(nèi)終端硬件型號差異、關(guān)聯(lián)網(wǎng)絡(luò)、網(wǎng)元差異、產(chǎn)品差異等原因都會導(dǎo)致數(shù)據(jù)無法收斂、離散無序、偏差極大等多因素混雜的狀況,使得特征數(shù)據(jù)淹沒。采樣逐項進行閾值設(shè)定和偏差補償、校驗弱化混雜因素作用的方式解決集合問題。

6試驗成果

6.1網(wǎng)絡(luò)衰減特征

網(wǎng)絡(luò)衰減問題是接入網(wǎng)運行及維護中最基本的指標(biāo),也是試驗中最難處理的數(shù)據(jù)。該項數(shù)據(jù)存在記錄數(shù)量巨大,波動不明顯,偶發(fā)數(shù)據(jù)容易被淹沉等問題。試驗通過個性寬表與群體寬表的對比,網(wǎng)絡(luò)拓?fù)涞男切徒Y(jié)構(gòu)關(guān)聯(lián)關(guān)系,展現(xiàn)出某個群體(個體)與整體數(shù)據(jù)的偏差。以偏差量由大到小排列,提取用戶地址信息歸類。經(jīng)片區(qū)服務(wù)人員驗證。用戶網(wǎng)絡(luò)隱患基本能指向到戶內(nèi)、樓內(nèi)、PON口下、光節(jié)點下等幾個層級。該模型可初步定型。

6.2終端軟件版本管理

終端個人寬表中軟件版本與軟件版本升級關(guān)聯(lián)識別出未升級成功用戶。片區(qū)服務(wù)驗證發(fā)現(xiàn)存在。(1)機頂盒硬件故障(更換后經(jīng)廠商維修存儲器部分受損)。(2)網(wǎng)絡(luò)不穩(wěn)定導(dǎo)致反復(fù)升級,后期實驗中將加入寬帶穩(wěn)定性參數(shù)。(3)CPU負(fù)核過高。由于升級軟件BUG,導(dǎo)致升級后CPU負(fù)核過高,經(jīng)升級軟件修復(fù),現(xiàn)象消除。模型基本有效,可供軟件升級專項使用。

6.3寬帶用戶使用體驗

寬帶用戶反映網(wǎng)速慢、網(wǎng)卡是最常見的報障現(xiàn)象。從用戶群相寬表的寬帶數(shù)據(jù)與用戶業(yè)務(wù)數(shù)據(jù)比對發(fā)現(xiàn),其關(guān)聯(lián)性并不完全吻合。用戶體驗與同一EoC頭端共有用戶使用情況,與同一PON口共有用戶使用相關(guān)聯(lián),晚間高峰時間網(wǎng)絡(luò)資源不足的現(xiàn)象有特征數(shù)據(jù)出現(xiàn),但不明顯。由于試驗范圍與暴滿需擴容案例,該模型將擴大試驗進一步驗證。視擴大試驗驗證情況完善模型。

6.4交互應(yīng)用情況

交互應(yīng)用與用戶使用習(xí)慣關(guān)聯(lián)的試驗,試驗數(shù)據(jù)中表現(xiàn)出用戶交互使用時CPU負(fù)核的變化。但在與用戶產(chǎn)品等相關(guān)數(shù)據(jù)關(guān)聯(lián)時未發(fā)現(xiàn)特征數(shù)據(jù),也未發(fā)現(xiàn)其他特征,模型試驗失敗。試驗通過五個模型的試探,三個達到了預(yù)期的成果,一項可繼續(xù)擴展,一項失敗。經(jīng)過這五項的試驗,證明以網(wǎng)絡(luò)拓?fù)錇橹骶€,以個體特征、群體特征二個寬表為基礎(chǔ),疊加各種維度的數(shù)據(jù)可以顯現(xiàn)出運營服務(wù)所需要的特征數(shù)據(jù)。這些數(shù)據(jù)能夠給到服務(wù)具體的幫助。

7結(jié)束語

上述試驗只是建模思路的初步探索的第一階段,后期將向二個方向推進。方向一,將成功建模的實驗擴大范圍驗證,完善并推廣使用,對仍有問題和失敗的模型調(diào)整補充;疊加新的數(shù)據(jù)維度尋找新的特征數(shù)據(jù)。方向二,選取有特殊片區(qū)服務(wù)需求和資深專家給到的片區(qū)服務(wù)建議用數(shù)據(jù)模型顯示出來,供片區(qū)使用。

作者:徐沁 單位:東方有線網(wǎng)絡(luò)有限公司