公務員期刊網(wǎng) 論文中心 正文

數(shù)據(jù)挖掘技術在土壤肥力評價中應用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘技術在土壤肥力評價中應用范文,希望能給你帶來靈感和參考,敬請閱讀。

數(shù)據(jù)挖掘技術在土壤肥力評價中應用

摘要:土壤肥力狀況直接影響農(nóng)作物的產(chǎn)量,傳統(tǒng)的農(nóng)業(yè)生產(chǎn)自動化水平低,化肥和農(nóng)藥的施放無法做到精確把控,同時缺乏對土壤肥力的實時在線監(jiān)測和評價,不利于農(nóng)作物的生長,嚴重時會給農(nóng)田和生態(tài)環(huán)境帶來較大的污染,影響農(nóng)作物的生產(chǎn)質(zhì)量和產(chǎn)量,對人類和牲畜的人身安全構成了較大威脅。為此,深入研究分析了數(shù)據(jù)挖掘技術,并將其應用在土壤肥力評價系統(tǒng)中,針對具體的研究區(qū)域進行土壤圖設計和土壤狀態(tài)分析,建立了土壤肥力采樣數(shù)據(jù)庫,并利用數(shù)據(jù)挖掘技術中的關聯(lián)規(guī)則算法對土壤肥力和農(nóng)作物產(chǎn)量進行等級分類,計算分析得到土壤肥力與農(nóng)作物產(chǎn)量之間的關聯(lián)關系。結果表明:智能數(shù)據(jù)挖掘技術在土壤肥力評價系統(tǒng)中發(fā)揮了重要作用,在對土壤肥力進行準確監(jiān)控的同時能夠準確評價土壤肥力與農(nóng)作物產(chǎn)量之間的相關程度,對指導農(nóng)業(yè)生產(chǎn)、提高農(nóng)作物生產(chǎn)質(zhì)量和產(chǎn)量具有重要意義。

關鍵詞:土壤肥力評價;數(shù)據(jù)挖掘;數(shù)據(jù)庫;關聯(lián)規(guī)則算法

0引言

我國傳統(tǒng)的農(nóng)藥和化肥施放主要依靠作業(yè)人員的經(jīng)驗進行,施放效率低,農(nóng)藥利用率低,造成了農(nóng)藥和化肥的浪費,給生態(tài)環(huán)境帶來了一定的影響。農(nóng)藥和化肥的不合理利用會對農(nóng)作物的生長產(chǎn)生一定的制約,嚴重時會對消費者的健康造成威脅,因此對農(nóng)藥和化肥的合理利用、對土壤肥力的準確監(jiān)控越來越引起諸多學者的關注。隨著科學技術的發(fā)展,很多學者將神經(jīng)網(wǎng)絡算法、模糊理論及專家系統(tǒng)等先進理論應用于土壤肥力監(jiān)測和評價系統(tǒng)中,對土壤肥力的狀態(tài)和信息有了一定的掌握。各種智能算法和先進理論解決了土壤肥力評價指標的優(yōu)化問題,但是對土壤肥力評價系統(tǒng)的數(shù)據(jù)來源、數(shù)據(jù)實時性和數(shù)據(jù)可用性無法精準掌握,導致各類智能算法在土壤肥力評價系統(tǒng)中實時性和準確性不高,對土壤肥力評價的指導性不強。為此,筆者深入研究數(shù)據(jù)挖掘技術,通過比較其中的關聯(lián)規(guī)則法、聚類分析法和人工神經(jīng)網(wǎng)絡法等不同算法,選用關聯(lián)規(guī)則法完成對所選研究區(qū)域土壤肥力狀況的分析,繪制了土壤肥力的空間變異圖,實現(xiàn)了對土壤肥力監(jiān)測的可視化,并應用關聯(lián)規(guī)則法得到土壤肥力和農(nóng)作物產(chǎn)量的關聯(lián)關系,對指導農(nóng)業(yè)生產(chǎn)作業(yè)、提高農(nóng)業(yè)生產(chǎn)效益具有重要的借鑒意義。

1數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘是一個信息探索的過程,是從大量的隨機數(shù)據(jù)中提取有用的潛在信息和數(shù)據(jù),并轉換為可以理解的數(shù)據(jù)。此類隨機數(shù)據(jù)多為不完全數(shù)據(jù),并伴隨有噪音、干擾信號等隨機信息。數(shù)據(jù)挖掘的對象既包括數(shù)據(jù)庫,還可以包含各類文本、視頻、圖像和Web數(shù)據(jù)等,解決了傳統(tǒng)數(shù)據(jù)庫無法預測未來發(fā)展趨勢的難題。數(shù)據(jù)挖掘的分析方法較多,主要包括決策樹、聚類分析法、關聯(lián)規(guī)則法、人工神經(jīng)網(wǎng)絡法和時序算法。具體功能如下:1)數(shù)據(jù)總結。運用統(tǒng)計分析法(求平均值、加權處理、直方圖)對數(shù)據(jù)源信息進行統(tǒng)計分析,便于數(shù)據(jù)分類。2)數(shù)據(jù)分類。利用分類函數(shù)將待數(shù)據(jù)挖掘的數(shù)據(jù)按不同類型、不同標識進行分類。3)聚類。將數(shù)據(jù)庫信息按集群進行劃分,利用聚類分析法找出集群中特性相似的集群進行區(qū)分。4)關聯(lián)分析。通過關聯(lián)規(guī)則法計算分析數(shù)據(jù)庫中同一事件的不同項的關聯(lián)性,根據(jù)關聯(lián)性預測結果。5)預測。根據(jù)數(shù)據(jù)挖掘的結果對研究對象的發(fā)展規(guī)律進行預測,分析后續(xù)變化趨勢。

2研究區(qū)域概況

選取的研究區(qū)域為吉林省農(nóng)安縣開安鎮(zhèn),坐標東經(jīng)121°10'、北緯44°10',大陸性季風氣候,地下水源豐富,年平均降水量535㎜,為國家農(nóng)業(yè)示范基地。

2.1土壤圖設計通過查閱資料、查找相關部門網(wǎng)站信息,得到第2次土壤普查圖(比例1:5)。以此為基礎,完成該研究區(qū)域土壤矢量圖的繪制,如圖1所示。

2.2土壤狀態(tài)分析

由圖1可知,農(nóng)安縣土壤的類型較多。按土壤的類型和狀態(tài)可將農(nóng)安縣土壤進行分類,如表1所示。

2.3土壤狀態(tài)采樣

將農(nóng)安縣土壤矢量圖和土壤狀態(tài)等數(shù)據(jù)進行分析處理,構建土壤狀態(tài)數(shù)據(jù)庫,重點監(jiān)測土壤養(yǎng)分值和采樣點的經(jīng)緯度。土壤養(yǎng)分值主要包括3個指標,即堿解氮、有效磷和速效鉀。農(nóng)安縣土壤狀態(tài)采樣數(shù)據(jù)如表2所示。

3土壤肥力分布變化

通過對不同采樣點的土壤肥力狀態(tài)的監(jiān)測,完成了對土壤不同養(yǎng)分堿解氮、有效磷和速效鉀的含量分析和研究,得到土壤中堿解氮、有效磷和速效鉀的空間分布圖,如圖2、圖3所示。為確保數(shù)據(jù)的可靠性,對不同年份的土壤養(yǎng)分值進行匯總和分析,最后得到連續(xù)2年的堿解氮和速效鉀的空間分布變化圖。由圖2和圖3可知:土壤堿解氮含量呈下降趨勢。其中,第1年最小值為108mg/kg,最大值為216mg/kg,差值為108mg/kg;第2年最小值為86mg/kg,最大值為173mg/kg,差值為87mg/kg。這表明,經(jīng)過連續(xù)2年的精準施肥后,土壤肥力的差異逐漸變小。

4數(shù)據(jù)挖掘分析

4.1關聯(lián)規(guī)則算法

應用關聯(lián)規(guī)則算法進行數(shù)據(jù)挖掘時,主要解決兩個問題,即頻繁項集和關聯(lián)規(guī)則。關聯(lián)規(guī)則算法的作業(yè)步驟為:①挖掘頻繁項集;②生成關聯(lián)規(guī)則。關聯(lián)規(guī)則的頻繁項集與支持度相關,即數(shù)據(jù)庫中支持度大于規(guī)定支持度的項目。關聯(lián)規(guī)則與支持度和可信度相關,即支持度和可信度均大于規(guī)定支持度和可信度的關聯(lián)規(guī)則。支持度sup的計算公式為sup(A=>B)=sup(a∪b)={T|T∈Dand(a∪b)}D其中:支持度sup表示事件A和事件B同時出現(xiàn)的概率。可信度conf的計算公式為conf(a=>b)=sup(a∪b)sup(a)其中,可信度conf表示條件概率。提升度lift的計算公式為lift=P(B|A)P(B)其中:提升度lift表示事件A對事件B的提升度。lift=1,說明事件A與事件B沒有關聯(lián);lift>1,說明事件A與事件B相關聯(lián),且關聯(lián)規(guī)則較好,關聯(lián)性好;lift<1,說明事件A與事件B相排斥,得到的關聯(lián)規(guī)則沒有意義,關聯(lián)性差。

4.2關聯(lián)規(guī)則分析

關聯(lián)規(guī)則算法是基于數(shù)據(jù)挖掘工具Weka軟件完成的。通過對采樣數(shù)據(jù)的分析計算,并將數(shù)據(jù)導入Weka軟件中,建立新的數(shù)據(jù)源,利用軟件自帶的算法庫,篩選頻繁項集,根據(jù)專家經(jīng)驗將數(shù)據(jù)分為6組,進行土壤肥力和農(nóng)作物產(chǎn)量的關聯(lián)規(guī)則計算,得到土壤肥力和產(chǎn)量數(shù)據(jù)的等級分類,如表3所示。由表3可知:根據(jù)專家經(jīng)驗,土壤養(yǎng)分值劃分為6個等級,農(nóng)作物產(chǎn)量劃分為3個等級。根據(jù)關聯(lián)規(guī)則,計算分析土壤肥力與農(nóng)作物產(chǎn)量之間的關聯(lián)性。

4.3關聯(lián)結果

運行Weka軟件,選取Apriori算法,設定支持度sup范圍為10%~100%,提升度lift大于1.0,計算關聯(lián)規(guī)則,得到關聯(lián)規(guī)則結果,如圖4所示。由圖4可知:當速效磷等級為D時,農(nóng)作物產(chǎn)量為A的概率為95%;當速效鉀為等級D的時候,農(nóng)作物產(chǎn)量為A的概率為63%;當速效鉀等級為E時,農(nóng)作物產(chǎn)量為B的概率為46%;當農(nóng)作物產(chǎn)量為A時,速效磷等級為D的概率為38%;當速效磷等級為D時,農(nóng)作物產(chǎn)量為C的概率為45%。

5結論

為解決傳統(tǒng)土壤肥力監(jiān)測不及時、肥力評價不準確等問題,深入分析了數(shù)據(jù)挖掘技術,對數(shù)據(jù)挖掘的主要算法和功能進行分析,完成了研究區(qū)域的土壤圖繪制和土壤狀態(tài)分析。同時,對不同采樣點的土壤肥力和經(jīng)緯度進行監(jiān)測,完成了土壤不同養(yǎng)分堿解氮、有效磷和速效鉀的空間分布變化趨勢的分析。應用關聯(lián)規(guī)則算法,利用數(shù)據(jù)挖掘工具Weka,完成土壤肥力與產(chǎn)量的等級分類,得到土壤肥力與農(nóng)作物產(chǎn)量的關聯(lián)關系。結果表明:智能數(shù)據(jù)挖掘技術在土壤肥力評價系統(tǒng)中發(fā)揮了重要作用,既可以對土壤肥力的空間分布進行準確監(jiān)測,又能夠對農(nóng)作物產(chǎn)量進行準確預測,在提高農(nóng)藥和化肥利用率的同時減小對生態(tài)環(huán)境的危害,對提高農(nóng)業(yè)生產(chǎn)質(zhì)量具有顯著效果。

作者:徐霖 單位:無錫工藝職業(yè)技術學院