前言:想要寫出一篇引人入勝的文章?我們特意為您整理了決策樹對構(gòu)造領(lǐng)域本體的作用范文,希望能給你帶來靈感和參考,敬請閱讀。
本文作者:王夙娟 單位:菏澤學(xué)院計算機與信息工程系
領(lǐng)域本體是專業(yè)性的本體,提供了某個專業(yè)學(xué)科領(lǐng)域中概念的詞表以及概念間的關(guān)系,或在該領(lǐng)域里占主導(dǎo)地位的理論。領(lǐng)域本體構(gòu)建的方法:知識工程方法、企業(yè)建模法、循環(huán)獲取法、methontology、IDEF-5、Bemerasetal等。然而,要了解本體構(gòu)建完整的過程,骨架法在所有方法中最具有參考性,它提供一個本體構(gòu)建的方法學(xué)框架,所以本文使用數(shù)據(jù)倉庫中的一些相關(guān)技術(shù)、數(shù)據(jù)挖掘中決策樹的分類與預(yù)測的技術(shù),以骨架法的中心思想作為參考和指導(dǎo)方針來構(gòu)建領(lǐng)域本體,最后對構(gòu)建好的本體模型進行文檔化。以下提到的本體均指領(lǐng)域本體。
1決策樹的相關(guān)知識
決策樹是一種類似于流程圖的樹結(jié)構(gòu);其中,每個內(nèi)部節(jié)點(非樹葉節(jié)點)表示在一個屬性上的測試,每個分枝代表一個測試輸出,而每個樹葉節(jié)點(終點)存放一個類標(biāo)號,樹的最頂層節(jié)點是根節(jié)點。在本體的構(gòu)建過程中樹節(jié)點代表類或者屬性,節(jié)點間的連接線代表類與類或者類與屬性或者屬性與屬性之間的關(guān)系,即可傳遞性、單繼承性。決策樹的構(gòu)造不需要任何領(lǐng)域知識或參數(shù)設(shè)置,因此適合于探測知識發(fā)現(xiàn);獲取的知識用樹的形式表示是直觀的,并且容易被人理解;決策樹歸納的學(xué)習(xí)和分類步驟是簡單和快速的;一般情況下,決策樹分類器具有很好的準(zhǔn)確率。
1.1骨架法方法的研究
骨架法(MikeUsholddede&KingUsc95)又稱ENTERISE法,是英國愛丁堡大學(xué)人工智能應(yīng)用研究所根據(jù)用于企業(yè)建摸的Enter-priseOntology所得出來的。
1.2骨架法的步驟:
a.確定構(gòu)建本體的目的和范圍;b.構(gòu)建本體;c.本體評估;d.文檔化本文使用數(shù)據(jù)倉庫中的一些相關(guān)技術(shù)、數(shù)據(jù)挖掘中分類與預(yù)測的決策樹技術(shù),以骨架法的中心思想作為參考和指導(dǎo)方針來構(gòu)建領(lǐng)域本體,最后對構(gòu)建好的本體根據(jù)決策數(shù)提取規(guī)則的特點進行文檔化。
2構(gòu)建本體的過程———以構(gòu)建現(xiàn)代交通工具本體為例
2.1領(lǐng)域需求分析
領(lǐng)域需求分析是構(gòu)建本體的重要階段,沒有充足的領(lǐng)域分析就不可能構(gòu)建出好的本體.交通工具是為了滿足人們出行的需求而研制的,并且在不段的發(fā)展變化。所以在進行領(lǐng)域分析的時候要以發(fā)展創(chuàng)造的觀點來進行領(lǐng)域需求分析,即進行領(lǐng)域分析的同時要進行趨勢的預(yù)測。層次一:客觀描述與記錄(objectivedescriptionandrecord)———對領(lǐng)域需求進行精確、全面地搜集與記錄客戶的需求或相關(guān)的業(yè)務(wù)、數(shù)據(jù)。層次二:模式歸納與發(fā)現(xiàn)(patternsinductionanddiscovery)———按照一定的建模方法論及框架進行歸納\建模,并盡量揭示在包含在快照的客觀記述中并非顯而易見的模式或規(guī)律;層次三:模式分析與預(yù)測(patternsanalysisandinnovation)———在現(xiàn)存模式的基礎(chǔ)上總結(jié)不同模式背后隱含的規(guī)律,研究應(yīng)用對需求的異化作用,發(fā)覺深層次規(guī)律,預(yù)測需求變化,揭示新的工作方式,創(chuàng)建新的、有價值的模式。
2.2利用決策樹算法創(chuàng)建本體
本體模型的表示形式有多種,這里采用分類決策樹來表示;本體的生成方法有三種,這里采用自頂向下的生成方法。根據(jù)領(lǐng)域需求分析,經(jīng)過屬性的不斷疊加、迭代,得到本體的決策樹。
2.2.1領(lǐng)域本體集成。領(lǐng)域本體集成的關(guān)鍵技術(shù)是本體映射,而本體映射定義一套規(guī)則,指明一個本體中的術(shù)語在另一個本體中的相關(guān)含義,由中介(mediator)在應(yīng)用程序運行時執(zhí)行。本體決策樹所提取的規(guī)則之間都是互斥的,每個樹葉都有一個規(guī)則,并且任何一個屬性都只能映射到一個樹葉。
2.2.2本體構(gòu)建工具。在這里使用Protégé,它是由斯坦福大學(xué)研制開發(fā)的、基于Java環(huán)境的本體開發(fā)工具,它允許用戶自己定制知識獲取界面的特點來構(gòu)建本體。
2.3本體評估
本體構(gòu)建過程中使用決策樹構(gòu)建的原理,使用分類決策樹所構(gòu)建的本體具有很多優(yōu)點,如下;利用分類決策樹所構(gòu)建本體的學(xué)習(xí)和分類步驟是簡單和快速的,而且本體類中屬性的分類具有很好的準(zhǔn)確率;這種本體的構(gòu)建適合于探測知識發(fā)現(xiàn);本體分類決策樹模型表示是直觀的,并且容易被人理解。
2.4文檔化
對上面本體的分類決策樹模型使用IF-THEN規(guī)則分類。使用IF-THEN規(guī)則得到文檔圖,每一條分支為一個元組,所有的分支數(shù)為數(shù)據(jù)集|D|,設(shè)ncovers為乘坐R交通工具的元組數(shù),ncorrect為正確分類的元組數(shù),則我們可以得到乘坐這種交通工具的覆蓋率和準(zhǔn)確率,公式:Coverage(R)=ncovers/|D|,Accuracy(R)=ncorrect/ncovers,結(jié)果如表1所示。
結(jié)束語
領(lǐng)域本體的構(gòu)建是一個增量迭代的開發(fā)過程,也是一個創(chuàng)造性的過程,對任何專業(yè)領(lǐng)域來說,由于應(yīng)用平臺不同,設(shè)計者對專業(yè)領(lǐng)域的理解不同,構(gòu)建出來的本體也不同。本文提出的是以骨架法作為參考,運用數(shù)據(jù)挖掘中有關(guān)分類與預(yù)測的決策樹技術(shù)來實現(xiàn)一種具體的領(lǐng)域本體構(gòu)建方法,希望對大家在本體開發(fā)方面有些參考性。