公務員期刊網(wǎng) 論文中心 正文

用電信息大數(shù)據(jù)分析反竊智能識別技術

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了用電信息大數(shù)據(jù)分析反竊智能識別技術范文,希望能給你帶來靈感和參考,敬請閱讀。

用電信息大數(shù)據(jù)分析反竊智能識別技術

針對目前電力系統(tǒng)竊電趨勢不容樂觀的現(xiàn)象,急需提升大數(shù)據(jù)反竊電水準,構建反竊電的智能識別模型,進而實現(xiàn)對不同竊電事件的精準分類與預測。面對如此嚴峻的形勢,本文采用基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗方法對用戶日電量的變化特征進行提取分析,識別異常用電行為。將用戶用電信息導入訓練好的模型進行分析,實現(xiàn)基于用電信息采集大數(shù)據(jù)分析的反竊電智能識別。隨著科技的不斷發(fā)展,竊電手段愈發(fā)隱蔽,竊電量也越來越大,對我國電力行業(yè)造成了嚴重不利影響。根據(jù)相關調查數(shù)據(jù),每年我國由竊電而損失的經(jīng)濟已經(jīng)超過200億元人民幣,對我國經(jīng)濟的發(fā)展產(chǎn)生了難以估計的不良影響,急需相應有效的反竊電方法。本項目采用基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗方法對用戶日電量的變化特征進行提取分析,智能識別異常用電行為。只需將用戶用電信息導入訓練好的模型進行分析,電網(wǎng)工作人員就可以有針對性的對疑似竊電用戶進行排查,提高反竊電工作效率。

1基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗方法

1.1長短時記憶神經(jīng)網(wǎng)絡(LSTM)基本原理

長短時記憶網(wǎng)絡(LongShortTermMemoryNetwork,LSTM),是一種改進之后的循環(huán)神經(jīng)網(wǎng)絡(RNN),在解決和預測長時間序列的問題中都有很好的運用,如圖1、圖2所示。LSTM是一種類RNN結構,但與其又有些不同,LSTM有四個以非常特殊方式進行交互的網(wǎng)絡層。在每個記憶單元(圖中A)中包括細胞狀態(tài)(Ct),遺忘門,輸入門和輸出門。這些門結構能讓信息選擇性通過,用來去除或者增加信息到細胞狀態(tài)。遺忘門控制遺忘上一層細胞狀態(tài)的內容,根據(jù)上一序列的ht-1和本序列的Xt為輸入,通過Sigmoid激活函數(shù),得到上一層細胞狀態(tài)內容哪些需要去除,哪些需要保留;輸入門處理當前序列位置的輸入,確定需要更新的信息,去更新神經(jīng)元狀態(tài);輸出門要基于神經(jīng)元狀態(tài)保存的內容來確定輸出什么內容,即選擇性的輸出神經(jīng)元狀態(tài)保存的內容。

1.2基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗方法

若要判斷用戶某天的用電行為是否存在異常,對該日前后各一周的電量趨勢進行分析,得出的結果會更加準確。因此本項目采用雙向長短時記憶網(wǎng)絡作為反竊電判斷的基本分類模型,采用滑動窗口的方式輸入數(shù)據(jù),輸入的窗口長度設置為13(連續(xù)13天的日電量數(shù)據(jù)),網(wǎng)絡結構如圖3所示。可以看到前向層和反向層共同連接著輸出層,其中包含了6個共享權值w1-w6。使用神經(jīng)網(wǎng)絡訓練模型需要大量的帶標簽數(shù)據(jù),給數(shù)據(jù)添加準確的標簽是本項目的一個重點;另外神經(jīng)網(wǎng)絡的超參數(shù)對結果的影響較大,因此神經(jīng)網(wǎng)絡的搭建與超參數(shù)的設置是本項目的另一個重點。

2反竊電系統(tǒng)數(shù)學模型

2.1數(shù)據(jù)選取

從營銷系統(tǒng)和計量自動化系統(tǒng)中抽取以下數(shù)據(jù):(1)從營銷系統(tǒng)抽取用戶基本信息數(shù)據(jù);(2)從計量自動化系統(tǒng)采集實時負荷數(shù)據(jù)和終端報警信息。

2.2研究內容

(1)基于歷史竊電用戶相關信息,研究竊電識別模型的專家樣本數(shù)據(jù)集構建方法;(2)結合低壓用戶用電信息采集數(shù)據(jù)特征,研究基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗數(shù)據(jù)處理算法,研究竊電識別模型的參數(shù)優(yōu)化方法,構建低壓用戶竊電診斷分類模型。

2.3實施方案

(1)從系統(tǒng)中提取歷史竊電低壓用戶相關信息,對數(shù)據(jù)進行清洗,構建竊電識別模型的專家樣本數(shù)據(jù)集,提取數(shù)據(jù)特征。(2)結合低壓用戶用電信息采集數(shù)據(jù)特征,基于雙向長短時記憶神經(jīng)網(wǎng)絡與輸入數(shù)據(jù)窗口化提取方法,使用Matlab創(chuàng)建雙向長短時記憶網(wǎng)絡,網(wǎng)絡的隱含單元個數(shù)設置為100,求解器設置為adam,訓練輪數(shù)設置為250輪,梯度閾值設置為1,初始學習率設置為0.01,在訓練125輪后通過乘以因子0.2來降低學習率。(3)將竊電用戶原始用電數(shù)據(jù)導入Matlab中,提取用戶編號、數(shù)據(jù)日期與總電量信息,然后計算出用戶日電量,對于缺失值及采集的首日電量填充為0。數(shù)據(jù)預處理完成后對數(shù)據(jù)進行窗口劃分,將連續(xù)13天[T-6,T+6]的電量數(shù)據(jù)作為神經(jīng)網(wǎng)絡的一個輸入,第T天的竊電狀態(tài)(0或1)作為輸出。對于信息采集的首尾日,使用0對首尾日的窗口進行填充。(4)使用經(jīng)過預處理的數(shù)據(jù)對模型進行訓練并對模型超參數(shù)進行調整,以提高模型精度。(5)對模型進行測試,并采用采用貝葉斯優(yōu)化算法對超參數(shù)進行優(yōu)化,完善模型,提高識別精度。3實例分析本案例輸入文件為某中心城市某低壓用戶的用電數(shù)據(jù),時間為2018年1月1日-2019年7月16日,同時包含每天是否有竊電情況的標志。20180101天的數(shù)據(jù)形式如表1所示。首先對網(wǎng)絡樣本輸入數(shù)據(jù)進行數(shù)據(jù)處理,并將處理后的數(shù)據(jù)作為輸入數(shù)據(jù),其中選擇竊電嫌疑系數(shù)作為輸出數(shù)據(jù)?;贛atlb建立基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗模型,選定Sigmoid函數(shù)作為激活函數(shù)?;跀?shù)據(jù)變換,得到新的評價指標來表征竊電行為所具有的規(guī)律,經(jīng)過數(shù)據(jù)處理后的專家樣本數(shù)據(jù)如表2所示。對專家樣本隨機選取25%作為測試樣本,剩下的75%作為訓練樣本。結合低壓用戶用電信息采集數(shù)據(jù)特征,基于雙向長短時記憶神經(jīng)網(wǎng)絡與輸入數(shù)據(jù)窗口化提取方法,使用Matlab創(chuàng)建雙向長短時記憶網(wǎng)絡,網(wǎng)絡的隱含單元個數(shù)設置為100,求解器設置為adam,訓練輪數(shù)設置為250輪,梯度閾值設置為1,初始學習率設置為0.01,在訓練125輪后通過乘以因子0.2來降低學習率。訓練樣本建模的混淆矩陣,如圖4所示。分類準確率為97.9%,正常用電日被誤判為竊電日的占正常用電日的0.5%,竊電日被誤判為正常用電日的占竊電日的1.6%。

結束語:

本文基于用電信息采集系統(tǒng)的用戶用電數(shù)據(jù),采用基于雙向長短時記憶神經(jīng)網(wǎng)絡(BiLSTM)的滑動窗方法對用戶日電量的變化特征進行提取分析,實現(xiàn)反竊電的智能識別。通過實例分析,利用歷史用戶用電數(shù)據(jù),將用戶用電信息導入訓練好的模型進行分析,實現(xiàn)基于用電信息采集大數(shù)據(jù)分析的反竊電智能識別,驗證了本文反竊電模型的有效性,為解決大數(shù)據(jù)時代下的反竊電智能識別問題提供了參考。

作者:燕躍豪 鮑薇 單位:國網(wǎng)鄭州供電公司