公務(wù)員期刊網(wǎng) 論文中心 正文

檔案信息管理計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了檔案信息管理計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用范文,希望能給你帶來靈感和參考,敬請閱讀。

檔案信息管理計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用

摘要:隨著現(xiàn)代科技的發(fā)展與進(jìn)步,計算機(jī)數(shù)據(jù)挖掘技術(shù)在不斷創(chuàng)新與完善的基礎(chǔ)上,不僅強(qiáng)化了檔案信息管理的綜合水平,還提高了工作質(zhì)量與效率,為有關(guān)數(shù)據(jù)收集、分析、整理提供了技術(shù)保障。本文分析了數(shù)據(jù)挖掘技術(shù)的概念與用途,并從提煉有效信息、提高檔案服務(wù)水平、降低鑒定工作成本等幾方面分析了數(shù)據(jù)挖掘技術(shù)實(shí)際應(yīng)用情況,以為社會的進(jìn)步和發(fā)展提供一定的理論指導(dǎo)依據(jù)。

關(guān)鍵詞:檔案信息管理系統(tǒng);計算機(jī);數(shù)據(jù)挖掘技術(shù);應(yīng)用

數(shù)據(jù)挖掘技術(shù)是指以計算機(jī)系統(tǒng)為平臺,對系統(tǒng)中的大量隨機(jī)數(shù)據(jù)進(jìn)行分析、整理,從而提取出對商業(yè)發(fā)展有用的數(shù)據(jù)。既提高了企業(yè)檔案信息管理工作的質(zhì)量與效率,又完善了信息化整合機(jī)制,對基本數(shù)據(jù)進(jìn)行深入、差異化分析,為下一步工作奠定了堅實(shí)的基礎(chǔ)。

1數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用

當(dāng)前社會,計算機(jī)信息技術(shù)在各行各業(yè)應(yīng)用十分廣泛,并且受到了社會各界的高度肯定和認(rèn)可。以數(shù)據(jù)挖掘技術(shù)為例,在檔案信息管理工作中該技術(shù)發(fā)揮了較大的優(yōu)勢,較好的完善了現(xiàn)有檔案工作中的不足與問題,應(yīng)用計算機(jī)平臺可以在保證信息安全的基礎(chǔ)上,做到了資源信息優(yōu)化管理,提煉出有意義的數(shù)據(jù);在醫(yī)療檔案管理上,計算機(jī)平臺可以自主分析檔案的基本情況,醫(yī)生在就診時需,要利用計算機(jī)平臺對患者進(jìn)行檔案記錄,以建立完善的檔案管理系統(tǒng);對檔案信息管理而言,數(shù)據(jù)循環(huán)需要通過計算機(jī)對目標(biāo)進(jìn)行不斷的循環(huán)處理,以達(dá)到信息、篩選提取的目的。計算機(jī)數(shù)據(jù)挖掘技術(shù)以數(shù)學(xué)方法為主,在一定條件下,工作人員通過計算機(jī)用一種具有高度概括性和邏輯性的語言,將事物的狀態(tài)過程關(guān)系表達(dá)出來。同時,在實(shí)際運(yùn)算過程中,還會涉及演繹法和歸納法,以保證所收集數(shù)據(jù)的準(zhǔn)確性,并且符合信息管理領(lǐng)域的基本原則。

2數(shù)據(jù)挖掘技術(shù)的形式

數(shù)據(jù)挖掘技術(shù)所包含的知識十分廣闊,包括機(jī)器學(xué)知識、統(tǒng)計學(xué)知識、人工智能等相關(guān)技能,進(jìn)一步通過計算機(jī)平臺對企業(yè)數(shù)據(jù)庫內(nèi)的數(shù)據(jù)進(jìn)行自動化分析,并且總結(jié)出潛在規(guī)律,以輔助工作人員做出合理的決策。針對計算機(jī)數(shù)據(jù)挖掘技術(shù)的類型,本文做了以下三點(diǎn)分析:

2.1過程與分類

2.1.1基本過程系統(tǒng)在運(yùn)行之前需要根據(jù)實(shí)際解決的問題,合理安排任務(wù),以明確挖掘目標(biāo)和基本程序,基本分為三個階段:準(zhǔn)備階段、挖掘階段、解釋和評價篩選階段。首先,企業(yè)所提供的無序數(shù)據(jù)庫具有隨機(jī)性、模糊性,系統(tǒng)需要自主篩選并刪除其中重復(fù)的數(shù)據(jù),根據(jù)得到的規(guī)律與異常原因做進(jìn)一步篩選,最終選擇對應(yīng)的方法清理數(shù)據(jù)。其次,對于所收集的數(shù)據(jù)系統(tǒng),可以通過物理或者邏輯的方法分析其特點(diǎn),并根據(jù)系統(tǒng)、軟件等差異性完成數(shù)據(jù)收集工作。最后,根據(jù)數(shù)據(jù)源自身的特點(diǎn),系統(tǒng)篩選數(shù)據(jù)的方法是多種多樣的,包括線性分析、非線性分析、聚類分析等方法,再利用數(shù)學(xué)知識與統(tǒng)計學(xué)對其進(jìn)行分析,挖掘內(nèi)在聯(lián)系,找出隱藏的規(guī)律。數(shù)據(jù)處理的最終目的是幫助企業(yè)找到有價值的數(shù)據(jù)信息,并且應(yīng)用到實(shí)際生產(chǎn)中,每次技術(shù)分析所得到的數(shù)據(jù)結(jié)果,不一定一四到位,需要工作人員對數(shù)據(jù)源進(jìn)行反復(fù)甄別、提取,直到得到滿意的結(jié)果為止。并且數(shù)據(jù)處理的過程是十分復(fù)雜的,工作人員需保證每一步操作的結(jié)果,滿足預(yù)期要求,在此基礎(chǔ)上進(jìn)行下一步操作,以獲得有價值的檔案信息資源。

2.1.2分類傳統(tǒng)的數(shù)據(jù)挖掘技術(shù),在操作過程中存在一定的不足與問題,因此需要不斷發(fā)展融合新的知識和元素,以為用戶提供最實(shí)用簡單的數(shù)據(jù)歸類方法。首先,計算機(jī)系統(tǒng)需要對數(shù)據(jù)庫內(nèi)龐大的信息源進(jìn)行甄別、分析,并將其按不同的屬性進(jìn)行分類、處理、劃分。在此基礎(chǔ)上,對所得數(shù)據(jù)進(jìn)行處理、劃分、測試,對滿足要求達(dá)到指定目標(biāo)的數(shù)據(jù)進(jìn)行下一步分類。

2.2相關(guān)規(guī)則

相關(guān)規(guī)則是計算機(jī)數(shù)據(jù)挖掘技術(shù)運(yùn)行的基本原則,不僅要準(zhǔn)確描述出系統(tǒng)中相關(guān)數(shù)據(jù),而且要利用數(shù)學(xué)歸納法對所得的信息進(jìn)行針對性分析,以用數(shù)學(xué)的語言描述出相同屬性的事物狀態(tài)、過程與關(guān)系。相關(guān)規(guī)則可以加大系統(tǒng)處理龐大數(shù)據(jù)庫的效率,利用有效的記錄方式,降低數(shù)據(jù)占用空間,進(jìn)而分析總結(jié)出對企業(yè)發(fā)展有益的規(guī)律與信息。

2.3粗糙集

在數(shù)據(jù)挖掘技術(shù)中,粗糙集具有重要的意義和作用,是數(shù)據(jù)挖掘的最實(shí)用方法,是用來專門研究不具有穩(wěn)定性的數(shù)據(jù)源的基本工具,不僅運(yùn)算方法簡潔,而且無須知曉額外信息,可操作性強(qiáng)。

3數(shù)據(jù)挖掘技術(shù)在檔案管理中應(yīng)用的可行性

傳統(tǒng)的檔案管理水平已經(jīng)不能滿足時展的需求,需在技術(shù)上不斷創(chuàng)新,以提高檔案服務(wù)水平、效率與質(zhì)量。因此,現(xiàn)代檔案管理系統(tǒng)結(jié)合計算機(jī)挖掘技術(shù),既節(jié)省了人力資源,又提取了海量數(shù)據(jù)源中的實(shí)質(zhì)信息,實(shí)現(xiàn)了網(wǎng)絡(luò)化、數(shù)字化的無縫對接。數(shù)據(jù)挖掘技術(shù)并不僅僅是一種信息處理技術(shù),還可以使檔案信息更加科學(xué)化、合理化,提高了在檔案應(yīng)用中的可行性。

4計算機(jī)挖掘技術(shù)在檔案信息管理系統(tǒng)中的應(yīng)用意義

檔案信息資源在我們的生活中具有重要的地位,不僅涉及個人信息,還包括了歷史獎勵問題、處罰問題,根據(jù)內(nèi)容不同,密級等級也不同。當(dāng)前檔案信息管理系統(tǒng)充分發(fā)揮計算機(jī)挖掘技術(shù)的優(yōu)勢,從根本上提高了服務(wù)管理水平,優(yōu)化了檔案管理模式,為檔案的收集、整理、歸納提供了一定的便利。本文就挖掘技術(shù)在檔案信息管理系統(tǒng)中的應(yīng)用做了以下四點(diǎn)分析:

4.1提高了檔案信息的安全性

檔案信息所包含的信息源不僅復(fù)雜,而且內(nèi)容含量大,是對過去信息的分類、總結(jié)性記錄,是十分珍貴的文字資源。一方面這些資源為人們的工作、學(xué)習(xí)提供了專業(yè)的信息,需要盡可能長久保存,然而在實(shí)際使用儲存過程中,由于計算機(jī)系統(tǒng)或者人為因素造成了一定的信息損失。另一方面,檔案信息的資源牽涉廣泛,包括人員的教育背景、生活背景、工作背景,所接受獎勵情況、懲罰情況等等,是需要機(jī)密保存的,如果在檔案借閱過程中監(jiān)督不到位,會造成信息泄露,而數(shù)據(jù)挖掘技術(shù)可以協(xié)助檔案信息管理系統(tǒng)統(tǒng)計檔案的借閱次數(shù)與內(nèi)容,從而監(jiān)督不恰當(dāng)?shù)慕栝喰袨?,并且統(tǒng)計分析惡意損害、利用檔案的情況,提高檔案的保密程度與安全性。

4.2提高了檔案信息的使用效率

檔案內(nèi)容不僅信息量大,而且所涉及的領(lǐng)域也十分復(fù)雜,大多帶有一定密級的,在借閱過程中需要嚴(yán)格遵守相關(guān)規(guī)定,以保障檔案信息的安全。隨著時代的發(fā)展,國家也在一定程度上降低了檔案借閱的標(biāo)準(zhǔn),提高了檔案信息的可利用性。但是在實(shí)際操作過程中,檔案借閱行為依然在法律法規(guī)的調(diào)控范圍內(nèi),實(shí)際借閱效率并不是很高。利用數(shù)據(jù)挖掘技術(shù),檔案信息管理系統(tǒng)可以通過計算機(jī)平臺與借閱者進(jìn)行溝通,了解其需求的基礎(chǔ)上,建立雙向檔案供需渠道,既提高了檔案部門的服務(wù)水平,提升了檔案信息利用效率,又保證了檔案信息在就業(yè)過程中的安全性,從而發(fā)揮了答案信息的最寶貴價值。

4.3為檔案鑒定工作提供了便利

檔案鑒定工作是檔案管理系統(tǒng)中難度系數(shù)最高的一道流程。在傳統(tǒng)的檔案管理系統(tǒng)中,檔案鑒定需要人為操作,受有個人能力與客觀因素的影響,容易受到人為失誤的影響,造成檔案資源的浪費(fèi),甚至某些有價值的檔案信息,也會由于人為偷的失誤未被保存下來。此時利用計算機(jī)數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,可以從龐大的數(shù)據(jù)源中篩選、分析、比對出完整、清晰、有潛在價值的信息,已被系統(tǒng)提供有力的支撐依據(jù),防止檔案信息丟失。其次,計算機(jī)系統(tǒng)可以彌補(bǔ)人為失誤與疏忽,在廣泛模糊的信息數(shù)據(jù)源中,挖掘出有一定規(guī)律的實(shí)質(zhì)信息,從而保護(hù)有關(guān)人員的隱私,對借閱者提供有針對性的幫助。

4.4降低檔案鑒定工作成本

檔案鑒定是檔案工作中的一項(xiàng)重要內(nèi)容,貫穿檔案工作的每一個環(huán)節(jié),通過檔案鑒定對已知內(nèi)容信息的作用與用途進(jìn)行研究,有價值的會交給檔案館永久保存,沒有價值的會被送進(jìn)銷毀爐進(jìn)行檔案的銷毀。因此,相關(guān)部門應(yīng)加強(qiáng)工作人員的責(zé)任心,通過行政監(jiān)督指導(dǎo),引導(dǎo)檔案鑒定人員高效、高質(zhì)地開展歸檔、保管、利用、統(tǒng)計等工作。通過計算機(jī)數(shù)據(jù)挖掘技術(shù),可以有效降低檔案鑒定的工作成本,通過科學(xué)合理的篩選,保證答案的真實(shí)程度。利用計算機(jī)系統(tǒng)的信息分析能力,對海量信息資源進(jìn)行量化處理,從而為鑒定、歸納等環(huán)節(jié)提供基本依據(jù)。除此之外,計算機(jī)系統(tǒng)在實(shí)際運(yùn)行過程中,可以針對信息資源進(jìn)行管理維護(hù),保障篩選工作的有效進(jìn)行,避免出現(xiàn)檔案信息丟失等人為失誤。

5數(shù)據(jù)挖掘技術(shù)在檔案管理中的詳細(xì)運(yùn)用

數(shù)據(jù)挖掘技術(shù)在20世紀(jì)80年代就已經(jīng)被開發(fā)利用,并逐漸應(yīng)用于各個領(lǐng)域,但在檔案信息管理中還處于實(shí)驗(yàn)階段,實(shí)際運(yùn)用主要體現(xiàn)在以下三點(diǎn):

5.1檔案信息的收集

檔案管理工作的第一步是對信息資源的收集,進(jìn)而利用數(shù)據(jù)挖掘技術(shù)以數(shù)學(xué)角度分析數(shù)據(jù)的類型、屬性,最終獲得準(zhǔn)確的模型。對海量數(shù)據(jù)資源進(jìn)行分類是信息收集的第一步,也是檔案管理工作的基礎(chǔ)。比如,檔案管理員利用計算機(jī)平臺向借閱者問卷調(diào)查,并將所得結(jié)果整理、歸納,錄入數(shù)據(jù)庫中。檔案管理平臺通過借閱者提供的數(shù)據(jù)信息對其檔案需求進(jìn)行分析,提供針對性較強(qiáng)的信息,提高數(shù)據(jù)管理的個性化服務(wù)性能。

5.2檔案的分類與預(yù)測

數(shù)據(jù)挖掘技術(shù),將整個區(qū)域劃分為不同的工作流程類別,進(jìn)而按照挖掘系數(shù)與信息屬性進(jìn)行分類和分析。提供一組不同屬性的數(shù)據(jù),通過篩選將其分成良好的訓(xùn)練集,建立模型,幫助用戶利用計算機(jī)系統(tǒng)提取最原始的查詢信息,從而總結(jié)出用戶的特征。比如,借閱者利用網(wǎng)絡(luò)平臺對檔案類別進(jìn)行查詢,檔案信息管理系統(tǒng)可以通過用戶訪問網(wǎng)頁的情況,了解用戶的需求,進(jìn)而推測出用戶的特征和喜好,包括搜索內(nèi)容、停留時間、訪問次數(shù)等。

5.3檔案信息的整合

檔案館內(nèi)儲存了海量的信息,但是部分檔案內(nèi)容屬于此檔案,雖然占用了一定的信息資源,卻并未被開發(fā)利用,游離在中心工作以外。因此檔案工作人員利用數(shù)據(jù)挖掘技術(shù)處理“死檔案”,提取其中有用的信息,開發(fā)成新的檔案資源,以為借閱者服務(wù)。比如,未被利用的信息資源是靜態(tài)的,已經(jīng)被開發(fā)、歸納的信息資源是動態(tài)的,具有可傳播和被利用性。然而傳統(tǒng)的紙質(zhì)檔案資源利用率較低,通過數(shù)據(jù)挖掘技術(shù)開發(fā)成數(shù)字化檔案資源后,可以利用網(wǎng)絡(luò)平臺和信息檢索系統(tǒng),為借閱者提供高質(zhì)高效的服務(wù),發(fā)揮了資源整合優(yōu)勢。

6結(jié)束語

綜上所述,隨著科學(xué)技術(shù)的發(fā)展,計算機(jī)科學(xué)技術(shù)不僅為我們的生活帶來了便利,還為檔案信息管理提供了一定的技術(shù)保障,節(jié)省了人力投入,提高了工作效率和服務(wù)水平。另外,提高檔案人員的信息意識,還可以延長資源信息的保留時長,避免相關(guān)檔案信息的流失,優(yōu)化了查詢方式,信息學(xué)的發(fā)展奠定了一定的基礎(chǔ)。

參考文獻(xiàn):

[1]趙輝.數(shù)據(jù)挖掘技術(shù)在檔案管理中的應(yīng)用研究[J].南國博覽,2019(8):61.

[2]伍永鋒.基于大數(shù)據(jù)的計算機(jī)數(shù)據(jù)挖掘技術(shù)在檔案管理系統(tǒng)中的應(yīng)用[J].信息與電腦(理論版),2019(11):166-167.

[3]賈冬東.計算機(jī)數(shù)據(jù)在檔案管理系統(tǒng)中的運(yùn)用探究[J].計算機(jī)產(chǎn)品與流通,2019(3):242,276.

[4]李亞梅.計算機(jī)數(shù)據(jù)挖掘技術(shù)開發(fā)及其在檔案信息管理中的運(yùn)用研究[J].中國新通信,2018,20(24):41.

作者:魯馨月 單位:天津電子信息職業(yè)技術(shù)學(xué)院