公務(wù)員期刊網(wǎng) 論文中心 正文

圖書館信息管理可視化技術(shù)研究

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了圖書館信息管理可視化技術(shù)研究范文,希望能給你帶來靈感和參考,敬請閱讀。

圖書館信息管理可視化技術(shù)研究

隨著社會(huì)不斷發(fā)展,新的知識(shí)不斷涌現(xiàn),圖書館作為知識(shí)和信息集散的重要場所,為人們提供便利的同時(shí),也面臨著資源積累逐漸龐大的壓力,給數(shù)據(jù)的存儲(chǔ)、分類和檢索帶來了巨大的挑戰(zhàn)?;诂F(xiàn)代化信息技術(shù)的飛速發(fā)展,不僅實(shí)現(xiàn)了圖書館海量知識(shí)的電子格式存儲(chǔ),而且提供了相應(yīng)的檢索、添加、修改、刪除和保存功能,特別是信息檢索功能,為用戶進(jìn)行數(shù)據(jù)信息的查找和使用帶來了很大的便利。

1信息檢索可視化技術(shù)的特點(diǎn)

信息檢索可視化技術(shù)是數(shù)據(jù)可視化技術(shù)在信息檢索領(lǐng)域的應(yīng)用,信息使用者通過圖形界面和網(wǎng)絡(luò)信息檢索系統(tǒng)的相互作用,評(píng)價(jià)和優(yōu)化檢索結(jié)果,從而提高信息的查全率和查準(zhǔn)率,達(dá)到滿足信息使用者需求的目的[1]。信息檢索可視化技術(shù),不僅可以實(shí)現(xiàn)空間數(shù)據(jù)以圖形或者圖像的方式直觀地顯示出來,讓用戶明確數(shù)據(jù)之間的聯(lián)系與規(guī)律,有利于用于對數(shù)據(jù)進(jìn)行分析和理解,而且還使用戶信息檢索操作更加簡便,有效地提高了檢索效率。信息檢索可視化技術(shù)實(shí)現(xiàn)了過程—結(jié)果的全程直觀展示,受到廣大用戶的一致好評(píng)。

2圖書館信息檢索可視化技術(shù)的發(fā)展及其存在的問題

2.1圖書館信息檢索技術(shù)的發(fā)展

圖書館傳統(tǒng)的檢索方式主要是檢索者利用館藏期刊、書目索引和各館自行編排的館藏目錄卡片實(shí)現(xiàn)相關(guān)信息的查找和翻閱。進(jìn)入20世紀(jì)70年代,隨著計(jì)算機(jī)通信技術(shù)的飛速發(fā)展,圖書館信息檢索也開始利用通信設(shè)備和存儲(chǔ)信息的計(jì)算相連,實(shí)現(xiàn)聯(lián)機(jī)檢索。各大型圖書館依托因特網(wǎng)成功地開發(fā)和應(yīng)用了多種服務(wù)項(xiàng)目,其中最具優(yōu)勢的服務(wù)項(xiàng)目之一當(dāng)屬網(wǎng)絡(luò)信息檢索技術(shù)。迄今為止,在Internet上功能完善的信息檢索工具主要有分布式信息服務(wù)系統(tǒng)、廣域信息網(wǎng)和萬維網(wǎng)等。Internet技術(shù)將海量服務(wù)器連成一體,實(shí)現(xiàn)了分散信息系統(tǒng)向整體化集成的重要轉(zhuǎn)化,通過在館內(nèi)建立Web網(wǎng)站OPAC,實(shí)現(xiàn)了信息使用者快速檢索各學(xué)科信息的目的。

2.2圖書館檢索技術(shù)存在的問題

現(xiàn)有數(shù)字圖書館的檢索系統(tǒng)主要是運(yùn)用主題目錄分類和搜索關(guān)鍵字來進(jìn)行信息資源的檢索,相較于傳統(tǒng)檢索方法,新的信息檢索方法為信息導(dǎo)航帶來了巨大的變革,同時(shí)也存在較多的問題。第一,信息歸類和維護(hù)過程需要投入大量的人力資源,信息更新也很不及時(shí)。第二,關(guān)鍵字檢索使得搜索結(jié)果涵蓋大量無用信息,用戶很難直接查找到與自己意圖相吻合的信息。第三,大部分圖書館Web站點(diǎn)缺乏明確的定位,不具備自己的特色,提供的服務(wù)主要是館藏書目查詢,很難直接檢索文獻(xiàn),用戶難以快速、正確地找到所需信息[2]。第四,文獻(xiàn)數(shù)據(jù)庫著錄未能統(tǒng)一,規(guī)范性差,資源共享不完全,缺乏統(tǒng)一的組織與協(xié)調(diào)。第五,檢索工具缺乏檢索詞控制,大多數(shù)采用自然語言標(biāo)引,無法實(shí)現(xiàn)人工標(biāo)引的甄選。第六,站點(diǎn)管理水平有限,系統(tǒng)運(yùn)行穩(wěn)定性不高,加上信息工作人員普遍水平不高,英語水平較差,難以達(dá)到網(wǎng)上瀏覽器查新的水平,使信息服務(wù)質(zhì)量大打折扣。

3可視化技術(shù)在信息檢索方面的具體運(yùn)用

3.1本體概念和應(yīng)用

3.1.1本體的定義和作用本體涵蓋了概念模型、形式化、共享等含義,通過抽出客觀世界中的一些現(xiàn)象的相關(guān)概念而得出的模型,所體現(xiàn)的是相關(guān)領(lǐng)域共同認(rèn)可的知識(shí),應(yīng)用計(jì)算機(jī)進(jìn)行處理。本體的建立就是為了捕獲相關(guān)領(lǐng)域的知識(shí),提供對該領(lǐng)域相關(guān)知識(shí)的共同理解。具體來說,就是本體為人們提供了相互交流的通用語言,使領(lǐng)域在不同的系統(tǒng)和模型之間實(shí)現(xiàn)相互集成和轉(zhuǎn)化。

3.1.2基于信息檢索的本體應(yīng)用多信息的檢索和集成是本體的重要運(yùn)用領(lǐng)域,信息多就容易出現(xiàn)不同信息源在表達(dá)上存在差異,所以就必須建立一套共用的信息語言,不僅可以減少信息轉(zhuǎn)換的難度,還能建立統(tǒng)一的信息集成模式,幫助信息使用者搜索到期望的知識(shí)點(diǎn),并將所搜索的知識(shí)點(diǎn)進(jìn)行相應(yīng)的概念補(bǔ)充,從而在數(shù)據(jù)集成里面查詢到最終需要的資源。由于本體具有通過概念之間的關(guān)系來表達(dá)語言的能力,所以能夠大幅度地提高檢索的準(zhǔn)確性和全面性。

3.2內(nèi)容檢索

互聯(lián)網(wǎng)不斷發(fā)展,信息載體和形式也在不斷變化,互聯(lián)網(wǎng)信息多樣化不斷深入,圖形、圖片、視頻和動(dòng)畫等多媒體技術(shù)不斷涌現(xiàn),致使以文本方式進(jìn)行檢索的技術(shù)弊端日漸凸顯。為此,內(nèi)容檢索技術(shù)隨著網(wǎng)絡(luò)技術(shù)的發(fā)展在文本檢索技術(shù)的基礎(chǔ)上應(yīng)運(yùn)而生。該檢索主要是利用融合了圖像處理技術(shù)、模式識(shí)別技術(shù),從而極大地提高了檢索的效率,為信息使用者提供了更加直觀有效的檢索手段。

3.3可視化信息檢索

3.3.1可視化信息檢索的內(nèi)容和優(yōu)勢可視化信息檢索包含兩方面內(nèi)容:檢索過程可視化和檢索結(jié)果可視化。相對于其他信息檢索技術(shù),可視化信息檢索技術(shù)具有顯著的優(yōu)勢,具體表現(xiàn)如下:第一,增強(qiáng)用戶的認(rèn)知能力??梢暬瘷z索通過人類對圖片處理的較強(qiáng)能力,將文本內(nèi)容轉(zhuǎn)化為空間的、圖形的形式后,以直觀的方式供用戶瀏覽與分析,不再需要進(jìn)行語言處理,從而減少人的認(rèn)知負(fù)擔(dān)。與此同時(shí),檢索結(jié)果的可視化,可以揭示文檔中看不見的語義關(guān)系,通過一些空間屬性如距離、長短、大小等來表示文檔的相似性,可以便于用戶快速地找到相關(guān)的文檔,也方便用戶理解檢索到的信息之間的關(guān)聯(lián)性,從而提高用戶的認(rèn)知能力。第二,信息檢索過程透明化。傳統(tǒng)的信息檢索系統(tǒng)對用戶而言是一個(gè)不透明的黑箱,用戶提交了提問式后,系統(tǒng)怎樣分解用戶提問式、怎么匹配提問詞和標(biāo)引詞、怎樣得出結(jié)果等過程對用戶而言都是不透明的,因此用戶也無法對系統(tǒng)內(nèi)部處理過程進(jìn)行控制。一個(gè)可視化的信息檢索環(huán)境使檢索過程變得透明了,包括文獻(xiàn)與提問的語義關(guān)聯(lián)關(guān)系、文獻(xiàn)與文獻(xiàn)語義關(guān)聯(lián)關(guān)系、信息發(fā)現(xiàn)過程、檢索的顯示等。這使得用戶的檢索更加容易、有趣,也大大增加了用戶對信息檢索過程的控制能力。第三,方便用戶進(jìn)行信息瀏覽。在可視化的檢索環(huán)境中,用戶檢索信息如魚得水,各種各樣的可視化檢索技術(shù)充分利用了人們對圖像處理的能力,既可以顯示檢索的核心信息,又以各種方式忽略或隱藏周圍的細(xì)節(jié)信息[4]。當(dāng)用戶點(diǎn)擊檢索結(jié)果時(shí),可以很快發(fā)現(xiàn)感興趣的領(lǐng)域,并且根據(jù)檢索結(jié)果的語義關(guān)聯(lián)性研究相關(guān)興趣領(lǐng)域,從一個(gè)興趣領(lǐng)域里自然地過渡到另一個(gè)興趣領(lǐng)域,同時(shí)還可以來回自由地在相關(guān)的興趣領(lǐng)域?qū)ふ蚁嚓P(guān)信息,這是傳統(tǒng)的信息檢索所不能實(shí)現(xiàn)的。第四,提供良好的人機(jī)對話和交流環(huán)境。信息檢索過程應(yīng)該是一個(gè)多回合的人機(jī)對話和交流過程??梢暬男畔z索將人的因素引進(jìn)系統(tǒng)內(nèi),在檢索中可以發(fā)現(xiàn)檢索結(jié)果之間的關(guān)聯(lián)性,用戶可以根據(jù)自己感興趣的內(nèi)容進(jìn)行檢索,不斷獲取所需的信息,也可以獲取到相關(guān)領(lǐng)域的信息,這將會(huì)鼓勵(lì)人的參與,促進(jìn)人機(jī)對話,改善人機(jī)交流。第五,提高檢查率和查準(zhǔn)率。信息檢索可視化是數(shù)據(jù)可視化技術(shù)在信息檢索領(lǐng)域的應(yīng)用,可視化提高了信息相關(guān)性判別的效率,擴(kuò)展了信息相關(guān)性判別的手段。信息用戶可以通過圖形界面與網(wǎng)絡(luò)信息檢索系統(tǒng)進(jìn)行交互,評(píng)價(jià)檢索過程中每次檢索的結(jié)果,優(yōu)化提問或查詢,從而提高查全率和查準(zhǔn)率。

3.3.2信息檢索可視化的相關(guān)技術(shù)信息檢索的可視化涉及信息檢索技術(shù)和可視化技術(shù)。其中可視化技術(shù)的實(shí)現(xiàn)以映射技術(shù)和顯示技術(shù)最為關(guān)鍵。

(1)映射技術(shù)主要就是把數(shù)據(jù)從多維空間映射到2維和3維空間,以便成為計(jì)算機(jī)可以處理的數(shù)據(jù)。在此主要介紹自組織映射和潛在語義標(biāo)引兩種映射技術(shù):自組織映射是通過模擬人腦對信號(hào)的處理特點(diǎn)而發(fā)展起來的人工神經(jīng)網(wǎng)絡(luò),目的就是把錄入數(shù)據(jù)或信號(hào)的各種特點(diǎn)加以抽象和歸類,使其保持拓?fù)浣Y(jié)構(gòu)的有序性,當(dāng)類似信號(hào)輸入時(shí)就會(huì)通過映射反映到相應(yīng)維度空間;潛在語義標(biāo)引就是通過統(tǒng)計(jì)方法尋找詞與詞之間的語義結(jié)構(gòu),通過奇異值分解,將文檔向量投影到較低的維度空間,實(shí)現(xiàn)數(shù)據(jù)的有效轉(zhuǎn)化。

(2)顯示技術(shù)是指將經(jīng)過處理的文字和信號(hào)以圖形的形式顯示出來的技術(shù)。目前常用的顯示技術(shù)主要有Focus+Contex(t聚焦+上下文技術(shù))、Cone-Tree(錐形樹技術(shù))、Tree-map(樹圖技術(shù))、HyperbolicTree(雙曲線樹技術(shù))等技術(shù)。不同的顯示技術(shù)各有優(yōu)缺點(diǎn),在信息檢索可視化應(yīng)用過程中,需要依據(jù)實(shí)際情況加以選擇或整合。

4完善圖書館信息管理可視化技術(shù)的對策

想要不斷完善圖書館信息管理可視化技術(shù),就必須從以下幾方面做好工作:第一,根據(jù)本館的館藏資料格局、人力和經(jīng)費(fèi)等條件,結(jié)合區(qū)域內(nèi)社會(huì)發(fā)展對信息的需求,對館藏信息進(jìn)行重組,建立各種與教學(xué)、科研及人們?nèi)粘I钕⑾⑾嚓P(guān)的特色數(shù)據(jù)庫,使讀者可以快速檢索到所需信息。第二,建立信息數(shù)據(jù)指引庫,通過對指引庫的訪問檢索到相關(guān)信息的具體館藏路徑,方便檢索信息。第三,實(shí)施標(biāo)準(zhǔn)化、規(guī)范化的數(shù)據(jù)庫信息,采用統(tǒng)一高效的網(wǎng)絡(luò)檢索工具,做到人機(jī)檢索有效互換,提高檢索的準(zhǔn)確性,為后期各圖書館的聯(lián)網(wǎng)打好基礎(chǔ)。第四,對各館的館藏資料實(shí)施資源整合,形成新的資源體系,讓用戶能夠通過統(tǒng)一的檢索平臺(tái)查找各個(gè)圖書館的館藏信息,從而實(shí)現(xiàn)信息資源的高效利用。第五,對新一代的電子用戶進(jìn)行相關(guān)基礎(chǔ)教育,比如優(yōu)化本館網(wǎng)上資源的配置及檢索途徑,Internet相關(guān)服務(wù)項(xiàng)目、使用方法和技巧,從而吸引更多的讀者進(jìn)行檢索閱讀。第六,提高館藏工作人員的整體業(yè)務(wù)水平,要求館藏人員具備相應(yīng)的計(jì)算機(jī)應(yīng)用等級(jí)水平和英語等級(jí)水平,能夠熟練運(yùn)用互聯(lián)網(wǎng)搜索相關(guān)資料,熟練運(yùn)用英語進(jìn)行人機(jī)互動(dòng),招聘適應(yīng)新時(shí)代需求的數(shù)字圖書管理人員。第七,建立健全網(wǎng)絡(luò)技術(shù)人員考核制度,加強(qiáng)服務(wù)意識(shí)和事故應(yīng)變處理能力,保證網(wǎng)絡(luò)系統(tǒng)穩(wěn)定有效運(yùn)行。第八,完善數(shù)字化圖書館信息系統(tǒng)的語義表達(dá)。所謂語義就是數(shù)據(jù)和符號(hào)所代表的含義及含義之間的關(guān)系,是對數(shù)據(jù)的抽象和組織的更高層次的邏輯表達(dá)。信息檢索的難點(diǎn)就是簡短、模糊的用戶查詢與存在的海量文檔之間不匹配的問題,解決該問題就要增加文檔和用戶查詢的語義表達(dá),隨著互聯(lián)網(wǎng)向語義網(wǎng)絡(luò)不斷深化發(fā)展,網(wǎng)絡(luò)平臺(tái)不僅僅只提供簡單的通信服務(wù),而是要達(dá)到人機(jī)之間智能的交互理解,從而為人們共享知識(shí)、交流思想提供更好的服務(wù)。

5結(jié)語

現(xiàn)代信息可視化技術(shù)不斷發(fā)展,使抽象的信息以圖像、聲音等形式直觀地展示出來,可視化檢索技術(shù)作為信息可視化發(fā)展的重要內(nèi)容,縮短了用戶理解信息的時(shí)間,實(shí)現(xiàn)了用戶感覺與思考之間的有效反饋,隨著新型檢索技術(shù)的不斷開發(fā),還能有效將人的認(rèn)知能力融入信息檢索過程中,為信息檢索開拓新的領(lǐng)域,提升信息檢索的層次和水平。信息檢索的可視化發(fā)展作為圖書館信息管理可視化的重要組成部分,充分發(fā)掘了人類對圖像的處理能力,提高了人們的認(rèn)知能力,符合當(dāng)今社會(huì)“讀圖”的趨勢需求;同時(shí),使檢索過程更具透明化,提高了用戶的檢索興趣,實(shí)現(xiàn)了良好的人機(jī)對話環(huán)境和高效的信息檢索過程。雖然我國信息檢索可視化尚處于初級(jí)階段,面臨著許多待解決的問題,但是我們堅(jiān)信,信息檢索可視化的普及應(yīng)用即將到來。

作者:顏培亮 單位:廣西民族師范學(xué)院圖書館