公務(wù)員期刊網(wǎng) 論文中心 正文

知識服務(wù)下的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了知識服務(wù)下的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式范文,希望能給你帶來靈感和參考,敬請閱讀。

知識服務(wù)下的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式

摘要:隨著技術(shù)的發(fā)展,海量地質(zhì)資料數(shù)字資源中蘊含的地學知識與日俱增,地質(zhì)資料知識服務(wù)的時代來臨。傳統(tǒng)的地學數(shù)據(jù)庫產(chǎn)品的開發(fā)模式難以滿足用戶的需求,地學數(shù)據(jù)庫產(chǎn)品的開發(fā)向以知識服務(wù)核心,利用地質(zhì)資料開發(fā)數(shù)據(jù)庫產(chǎn)品的模式升級轉(zhuǎn)型。本文分析了基于知識服務(wù)的地學數(shù)據(jù)庫產(chǎn)品開發(fā)的理念與模式,提出了基于知識服務(wù)的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式,列舉了開發(fā)應(yīng)用實例,從多個角度對利用地質(zhì)資料知識服務(wù)開發(fā)地學數(shù)據(jù)庫產(chǎn)品提出了建議。

關(guān)鍵詞:知識服務(wù);地質(zhì)資料;地學數(shù)據(jù)庫;產(chǎn)品開發(fā)

地質(zhì)資料的本質(zhì)屬性是提供社會化服務(wù),為國家重大工程、基礎(chǔ)設(shè)施規(guī)劃與建設(shè)和地質(zhì)調(diào)查工作等提供精準化的地質(zhì)信息產(chǎn)品服務(wù)[1]。近些年,社會各界對地學數(shù)據(jù)庫產(chǎn)品的需求持續(xù)上漲,傳統(tǒng)以項目建設(shè)地學數(shù)據(jù)庫的方式很難滿足社會發(fā)展的需求,利用地質(zhì)資料數(shù)字資源,從中挖掘出地學知識匯聚并形成數(shù)據(jù)庫產(chǎn)品成為現(xiàn)今地質(zhì)資料精準化服務(wù)的研究熱點之一。地質(zhì)資料作為一種專業(yè)類科技檔案,同時也是地學知識的集合體,其中蘊含著海量的地學知識信息,易于開展地質(zhì)資料的深入分析和知識的提煉聚合,具有利用知識服務(wù)開展地學知識匯聚并建庫的良好基礎(chǔ)[2]。本研究基于地質(zhì)資料數(shù)字資源,以提升地質(zhì)資料精準服務(wù)質(zhì)量為目標,貫徹社會各界用戶對地學數(shù)據(jù)庫產(chǎn)品的切實需求,融入知識建庫核心過程,提出基于知識服務(wù)的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式及發(fā)展建議,帶動地學數(shù)據(jù)庫產(chǎn)品開發(fā)與建設(shè)的發(fā)展。

1基于知識服務(wù)的地學數(shù)據(jù)庫產(chǎn)品開發(fā)理念與意義

1.1理念

以往利用地質(zhì)資料建設(shè)地學數(shù)據(jù)庫,往往是利用分散在各個地質(zhì)資料中一件資料,提取并集成整合建設(shè)地學數(shù)據(jù)庫。例如國家地質(zhì)圖數(shù)據(jù)庫,是從區(qū)域調(diào)查地質(zhì)資料中提取出標準分幅的地質(zhì)圖,集成整合并匯聚,形成國家地質(zhì)圖數(shù)據(jù)庫。隨著大數(shù)據(jù)時代的來臨,提取出地質(zhì)資料中蘊含的地學知識,開發(fā)利用并建設(shè)地學數(shù)據(jù)庫產(chǎn)品成為當今地質(zhì)資料發(fā)展的重要方向。地質(zhì)資料是地學知識的集合體,地學知識往往蘊含在各種地質(zhì)報告、附圖、附表和附件中。目前,各級地質(zhì)資料館藏機構(gòu)管理的基本單位是“件”,而一件地質(zhì)資料中蘊含的地學知識很難被用戶發(fā)現(xiàn)并利用[3],而用戶需求的往往是地質(zhì)資料中蘊含的這些地學知識。將海量地質(zhì)資料作為數(shù)據(jù)源,從中提取相關(guān)地學知識,集成整合后匯聚形成地學數(shù)據(jù)庫產(chǎn)品是當今地質(zhì)資料重要的發(fā)展趨勢。

1.2意義

1)提升地質(zhì)資料開發(fā)利用價值。地質(zhì)資料具有深度的開發(fā)利用價值,目前有大量利用地質(zhì)資料深層開發(fā)找礦的成功案例[4-6]。從地質(zhì)資料中提取地學知識,形成地學數(shù)據(jù)庫產(chǎn)品是對地質(zhì)資料的深層開發(fā)利用,可以提升地質(zhì)資料開發(fā)利用價值。2)提升地質(zhì)資料精準服務(wù)水平。地質(zhì)資料的本質(zhì)屬性是服務(wù)利用,而大量用戶的需求是賦存在地質(zhì)資料中的地學知識。從地質(zhì)資料中挖掘地學知識并建庫,是地質(zhì)資料產(chǎn)品開發(fā)的新形式,有助于提升地質(zhì)資料精準服務(wù)的水平。3)有助于數(shù)據(jù)庫持續(xù)更新維護。傳統(tǒng)的地學數(shù)據(jù)庫建設(shè)工作需要以項目的形式,項目結(jié)束后,不再有經(jīng)費的支持下,地學數(shù)據(jù)庫的更新維護面臨極大的挑戰(zhàn)。而地質(zhì)資料具有持續(xù)匯交性,每年均有大量的地質(zhì)資料匯交至館藏機構(gòu),以全國地質(zhì)資料館為例,每年要接收地質(zhì)資料近5000檔,30萬件。這些新匯交的地質(zhì)資料是地學數(shù)據(jù)庫的重要更新數(shù)據(jù)源,因此利用地質(zhì)資料建設(shè)地學數(shù)據(jù)庫產(chǎn)品,有助于對地學數(shù)據(jù)庫的持續(xù)更新與維護。4)縮短建庫時間,節(jié)約建庫成本。以往項目建設(shè)地學數(shù)據(jù)庫的形式,投入大量的人力、物力和財力,匯集形成地學數(shù)據(jù)庫。隨著信息技術(shù)的發(fā)展,大量的地學數(shù)據(jù)庫所需地學知識蘊含在地質(zhì)資料中,通過技術(shù)手段提取地學知識,集成整合后匯聚并建庫,將大大縮短地學數(shù)據(jù)庫產(chǎn)品建設(shè)時間,節(jié)約建庫成本。

2基于知識服務(wù)的地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式

2.1地學數(shù)據(jù)庫產(chǎn)品開發(fā)策略

1)以需求為導向的地學數(shù)據(jù)庫產(chǎn)品構(gòu)建。地學數(shù)據(jù)庫產(chǎn)品建設(shè)的目的是開展精準化的地學知識服務(wù),提升地質(zhì)資料深層開發(fā)利用價值。因此,地學數(shù)據(jù)庫產(chǎn)品開發(fā)時,需要結(jié)合社會各界用戶需求,針對用戶需求來設(shè)計地學數(shù)據(jù)庫產(chǎn)品。2)注重前期數(shù)據(jù)源摸底與數(shù)據(jù)庫試點建設(shè)工作。和地質(zhì)資料一樣,地學數(shù)據(jù)庫涉及地質(zhì)、水文、地球化學、地球物理等多個專業(yè),每個專業(yè)形成的地質(zhì)報告具有不同的特點,其蘊含的地學知識也不盡相同,因此,地學數(shù)據(jù)庫產(chǎn)品研發(fā)前期需要對數(shù)據(jù)源進行詳細的摸底調(diào)研。經(jīng)過數(shù)據(jù)源摸底后需要開展數(shù)據(jù)庫試點建設(shè)工作,根據(jù)試點建設(shè)過程中遇到的問題,及時修正技術(shù)路線。3)擅用技術(shù)手段,提升數(shù)據(jù)庫建庫效率。地質(zhì)資料具有海量性[7-8],海量的地質(zhì)資料數(shù)字資源蘊含著極為豐富的地學知識,這也導致了地學數(shù)據(jù)庫建設(shè)的工作量巨大。擅用自動化手段,提升地學知識提取、匯聚等工作效率,是解決海量地學知識建庫的重要手段方法。

2.2地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式

1)知識來源。地學數(shù)據(jù)庫產(chǎn)品利用全國地質(zhì)資料館館藏作為知識來源,其中包括有結(jié)構(gòu)化地質(zhì)資料數(shù)據(jù)、半結(jié)構(gòu)化地質(zhì)資料數(shù)據(jù)和非結(jié)構(gòu)化地質(zhì)資料數(shù)據(jù)。館藏地質(zhì)資料包含有矢量化的數(shù)據(jù),柵格數(shù)據(jù)等,種類豐富,數(shù)據(jù)量大。地學數(shù)據(jù)庫產(chǎn)品開發(fā)前需要對知識來源做充分的數(shù)據(jù)調(diào)研,才能保障后續(xù)工作。2)技術(shù)要素。從地質(zhì)資料數(shù)據(jù)中心利用技術(shù)要素建設(shè)地學數(shù)據(jù)庫產(chǎn)品,主要流程包括有知識提取、知識集成、知識匯聚、知識建庫、知識分析和知識獲取等,具體主要有智能提取、符號表示、規(guī)則抽取、統(tǒng)一編碼、數(shù)據(jù)可視化等相關(guān)技術(shù)(圖1)。3)領(lǐng)域應(yīng)用。利用技術(shù)手段從地質(zhì)資料數(shù)據(jù)中提取出地學知識并建庫,從而達到地學數(shù)據(jù)庫產(chǎn)品建設(shè)與服務(wù)的目的。地學數(shù)據(jù)庫服務(wù)領(lǐng)域廣泛,從國家重大工程規(guī)劃部署、基礎(chǔ)設(shè)施建設(shè)到礦產(chǎn)地質(zhì)調(diào)查、水工環(huán)勘查等。

3開發(fā)實例

3.1全國礦產(chǎn)地數(shù)據(jù)庫

全國礦產(chǎn)地數(shù)據(jù)庫完成于2003年,在礦產(chǎn)資源規(guī)劃、管理、開發(fā)、評價工作中有著重要的意義[9-10],但卻多年未進行系統(tǒng)的數(shù)據(jù)更新維護,致使庫中礦產(chǎn)地數(shù)據(jù)現(xiàn)勢性不足。2018年起,全國地質(zhì)資料館組織人員力量,從館藏涉及礦產(chǎn)資源地質(zhì)資料中的報告、附件和附表中挖掘礦產(chǎn)地數(shù)據(jù),并經(jīng)過集成整合后匯聚進新的全國礦產(chǎn)地數(shù)據(jù)庫,形成了全國礦產(chǎn)地數(shù)據(jù)庫2019版。全國地質(zhì)資料館作為國家級地質(zhì)資料館藏機構(gòu),每年約接收5000檔(約30萬件)的地質(zhì)資料匯交,其中60%左右是涉及礦產(chǎn)資源的地質(zhì)資料,具有充足的礦產(chǎn)地數(shù)據(jù)更新數(shù)據(jù)源。全國礦產(chǎn)地數(shù)據(jù)庫利用地質(zhì)資料中蘊含的礦產(chǎn)地知識聚合形成,不僅包含近些年新發(fā)現(xiàn)的礦產(chǎn)地數(shù)據(jù),還包括有已閉坑的礦產(chǎn)地數(shù)據(jù),數(shù)據(jù)全面?;谥R服務(wù)的全國礦產(chǎn)地數(shù)據(jù)庫的建設(shè)大大降低了建庫成本,提升了礦產(chǎn)地數(shù)據(jù)庫更新效率,全面提高礦產(chǎn)地數(shù)據(jù)的服務(wù)水平。

3.2全國礦床巖石地球化學數(shù)據(jù)庫

經(jīng)過幾十年的地質(zhì)工作,對全國礦床巖石積累了大量的巖石地球化學數(shù)據(jù),包括有巖石常量元素、微量元素和稀土元素數(shù)據(jù)等。目前,這些數(shù)據(jù)分散在地質(zhì)資料成果報告、附件、附表和原始地質(zhì)資料中,其數(shù)據(jù)量與日俱增,對這些數(shù)據(jù)進行提取、集成整合并建設(shè)全國礦床巖石地球化學數(shù)據(jù)庫,可提升我國科研人員對礦床巖石進行系統(tǒng)研究,是一項十分重要的基礎(chǔ)地質(zhì)工作。以往,每個項目組進行礦床學研究時均會采集大量的礦床巖石樣品進行測試分析,所獲得的巖石地球化學數(shù)據(jù)會以知識形式賦存于地質(zhì)成果報告、附表、附件中。近些年,隨著原始地質(zhì)資料的匯交,越來越多的礦床巖石地球化學數(shù)據(jù)匯交至全國地質(zhì)資料館,為全國礦床巖石地球化學數(shù)據(jù)庫的建設(shè)奠定數(shù)據(jù)基礎(chǔ)。全國礦產(chǎn)地數(shù)據(jù)庫和全國礦床巖石地球化學數(shù)據(jù)庫的建設(shè)是基于知識服務(wù)的地學數(shù)據(jù)庫產(chǎn)品開發(fā)的典范,不僅節(jié)約了地學數(shù)據(jù)庫建庫成本,縮短了建庫時間,提升了數(shù)據(jù)更新維護效率,還為其他地學數(shù)據(jù)庫的建設(shè)提供了思路和方法。

4建議

4.1強化用戶需求調(diào)研,提升地質(zhì)資料精準化服務(wù)

傳統(tǒng)的地學數(shù)據(jù)庫建庫方式以項目為單位,往往是“自建自用”或“自建他用”的服務(wù)形式。利用地質(zhì)資料開發(fā)地學數(shù)據(jù)庫產(chǎn)品則是館藏機構(gòu)負責建設(shè),用戶使用的方式。因此只有不斷強化用戶的需求調(diào)研,才能更加精準的了解用戶需求,設(shè)計出適用用戶需求的地學數(shù)據(jù)庫產(chǎn)品。

4.2建立開放式建庫與維護的新機制

在強化用戶需求調(diào)研的基礎(chǔ)上,建議開展和用戶聯(lián)合建庫與維護的地學數(shù)據(jù)庫建設(shè)新機制,不僅可以更加精準的根據(jù)用戶需求開發(fā)產(chǎn)品,還可以以用戶專業(yè)的角度更加完善產(chǎn)品建設(shè)。

4.3豐富地學數(shù)據(jù)庫產(chǎn)品體系

加緊基于地質(zhì)資料的地學數(shù)據(jù)庫產(chǎn)品規(guī)劃設(shè)計,拓寬地學數(shù)據(jù)庫產(chǎn)品范圍是地質(zhì)資料服務(wù)所必經(jīng)之路。傳統(tǒng)方式建設(shè)的地學數(shù)據(jù)庫產(chǎn)品更新速度已很難滿足現(xiàn)代社會對地學數(shù)據(jù)庫產(chǎn)品的需求,豐富地學數(shù)據(jù)庫產(chǎn)品體系,加強地學數(shù)據(jù)庫產(chǎn)品的研發(fā)是地質(zhì)資料需求者共同的夙愿。增加地學數(shù)據(jù)庫產(chǎn)品建設(shè)能力,完善地學數(shù)據(jù)庫產(chǎn)品體系,努力提升我國地質(zhì)資料深層開發(fā)利用的水平。

4.4加強數(shù)據(jù)庫建庫技術(shù)研究,提升地學數(shù)據(jù)庫之間的關(guān)聯(lián)性

地學數(shù)據(jù)之間的關(guān)聯(lián)性很強,例如礦產(chǎn)地質(zhì)調(diào)查工作,對以往地質(zhì)調(diào)查、已有礦產(chǎn)地信息、測試分析數(shù)據(jù)、區(qū)域地質(zhì)圖件等等具有很強的需求性。將這些地學數(shù)據(jù),甚至地學數(shù)據(jù)庫相關(guān)聯(lián),利用先進的數(shù)據(jù)庫建庫技術(shù),將這些數(shù)據(jù)(庫)相關(guān)聯(lián),是地學數(shù)據(jù)庫更新?lián)Q代的發(fā)展趨勢。將關(guān)聯(lián)數(shù)據(jù)、知識圖譜和數(shù)據(jù)倉庫等數(shù)據(jù)庫建庫技術(shù)融入進地學數(shù)據(jù)庫產(chǎn)品建設(shè)中,提升地學數(shù)據(jù)庫間的關(guān)聯(lián)關(guān)系,是下一代地學數(shù)據(jù)庫的發(fā)展趨勢。

5結(jié)語

隨著技術(shù)的發(fā)展,地質(zhì)資料開發(fā)利用面臨重大變革。面對海量地質(zhì)資料數(shù)字資源,通過對數(shù)據(jù)的摸底調(diào)研,基于用戶需求,利用地質(zhì)資料知識挖掘?qū)Y(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的地質(zhì)資料數(shù)據(jù)進行知識挖掘、提取、集成、整合并匯聚建庫,可以有效推動地學數(shù)據(jù)庫的建設(shè),縮短建庫周期,提升數(shù)據(jù)更新維護效率,提供更加高效的地學數(shù)據(jù)庫產(chǎn)品服務(wù)。知識服務(wù)時代的來臨,地學數(shù)據(jù)庫產(chǎn)品開發(fā)模式轉(zhuǎn)型勢在必行,提高地學數(shù)據(jù)庫產(chǎn)品的建設(shè)效率與數(shù)據(jù)的現(xiàn)勢性,針對用戶需求實現(xiàn)知識化管理與建庫,成為新時期地質(zhì)資料開發(fā)利用重要的發(fā)展趨勢。

作者:齊釩宇 李曉蕾 孔昭煜 閻海飛 張仲 單位:中國地質(zhì)調(diào)查局發(fā)展研究中心