董彥卓
【摘要】本篇文章主要是思考了在數字檔案中如何做到在檔案中發現知識而且利用知識服務社會,眾所周知,檔案是信息資源,無論是傳統的檔案還是數字化檔案,都有著豐富的信息資源,而人們要做的就是能夠充分的利用檔案中的資源,為自己或者是為社會服務。但是人們利用檔案信息的現狀是,還不能發現檔案信息現存的知識,也不能做好知識服務。下面我國就檔案中的知識發現以及知識服務進行探討。
【關鍵詞】數字化檔案;知識發現;知識服務
現階段,我國正在開展檔案信息化建設,而建設是在我國現有的檔案基礎上進行的,其特點是擁有大量的信息資源。因為國家進行檔案信息建設,因此人們對于檔案的管理以及服務的方式都增多。整個社會在建設檔案的時候,都是為了能夠實現信息資源共享這個目標,而在這個目標的指引下,建設進程一直在進行,并且不斷的在實現目標。
一、知識服務是數字檔案信息服務的瓶頸
檔案信息化建設對檔案信息的廣泛利用提供了強有力的管理和服務手段,用戶利用網絡信息查詢技術可以比較快速和準確的得到所需要的有價值的檔案信息,數字檔案信息資源的海量性和用戶利用檔案的專題性的矛盾得到一定程度的緩解。但是,用戶若要根據自身的工作性質和信息需求,從浩如煙海的數字檔案信息資源中,獲取所需要的基于內容和解決方案的知識服務則缺乏相應的技術支持。用戶得到的信息還存在冗余性和離散性,數字檔案信息利用結果并不能完全滿足用戶的最終需求。換句話說,面對不斷增加如潮水般的數字信息,人們將不再滿足于數據庫的查詢功能,而是需要的是從數字檔案中得到有用的信息或者知識為決策服務。
二、知識發現與知識服務的相關概念分析
(一)知識發現 最早出現信息發信這一詞是在1989年,那年在美國底特律有一個國際學術,而知識發現就是在這個會議上提出的。六年后,在加拿大也有個相同的會議,對這個概念做出進一步的闡釋。但是人們普遍認為知識發現這個概念是由學者Fayyad提出的,提出時間是1996年。很多人都覺得知識發現就是從檔案中找到可利用的知識,而檔案中的知識有基本都是數據,因此要將數據轉化成知識,然后從中找到有價值的,可以被人們利用的知識。其實知識發信就是一個轉化的過程,就是將數據變為人們需要的知識,然后利用知識為人們提供決策。現在知識發現以及數據挖掘共有三種關系可以供人參考,一種是挖掘是發現的前提,只是一個步驟,而這一過程還有七個小步驟,包括對數據的清理、綜合、挑選以及轉換等等,這種觀點完全的將知識發現以及服務分開,而且認為挖掘只是發現過程中的一部分。第二種認為兩者的關系的相同的,任何時間都可以將兩者混為一體。第三種關系是說,發現知識是挖掘數據的延續。
(二)知識服務 知識服務這一觀念的提出要比發現知識要晚,是在1999年一篇論文中提出的,論文的作者是任俊為。知識服務的重點是服務,而且是利用信息服務,在開展服務的前提就是能夠豐富的信息資源去支持服務,而且在服務的時候,也要使用一定的技術,包括智能技術,這樣可以幫助人們在眾多的信息資源中,找到有效的信息。從這種觀念中,我們可以看出來,知識服務是信息服務的發展。但是,現階段,人們對知識服務的觀念有不同的看法,一部分人認為,知識服務是為需要的人提供有用的信息資源,將信息提取、重組任何開發服務。就是按照知識的內容而服務。而另外一部分人認為,知識服務是利用知識應用,然后創新的過程。
三、數字檔案管理中的知識發現與知識服務的一般模式
(一)數字檔案信息空間 開展數字檔案管理中的知識服務,首先要明確數字檔案信息空間的概念。數字檔案信息空間是宏觀信息空間中的子空間,是由數字檔案數據空間、軟件空間、硬件空間、時間空間、技術空間、網絡空間和服務空間等構成的空間集合。信息空間概念的運用始于對計算機應用系統的描述。對計算機應用系統而言,信息是對客觀事物運動過程的描述,數據則是對信息的編碼。應用系統運行過程中,系統的功能和信息管理是通過對數據的加工和處理來完成的。這時,包括硬件、軟件和數據在內的計算機系統構成一個完整的信息空間。
(二)數字檔案信息空間組織模式 數字檔案信息空間的組織模式是指系統的運行環境、內部結構以及相互間的關系模式。數字檔案信息空間的構建應當結合數字檔案與知識服務的特點,構建網絡體系、數據管理體系、應用和服務體系、標準體系和安全體系等,從而構成一個高效運行的有機整體。一般說來,數字檔案信息空間應當包括數據管理空間、網絡應用空間、知識服務空間三個組成部分。
(三)基于數字檔案信息空間的知識服務系統 ⒈數字化管理。數字信息轉換的主要功能是將經過加工處理的各類非結構化數字信息轉換成能被數據庫管理系統進行處理的結構化數字信息。這個功能主要是由數字檔案管理系統的數字檔案信息導入功能加以實現的。數字信息存取的主要功能是建立數字檔案信息數據庫、數據倉庫和相關鏈接,建立檔案信息資源組織體系,實現檔案信息資源的集成、組織、存儲、更新與管理。⒉知識服務。知識服務需要在數字管理上進行,而且數字檔案可以按照自身的種類該分類,并且知道用戶需要的信息,在分類的時候,為用戶提供服務。數字化檔案的體系可以有以下4種分類,一種是資源分類;第二種是為用戶建立模型;第三種是處理反饋信息;第四種是知識推薦。資源分類是將整體的信息資源分成若干個部分,每個部分要有順序以保證能夠提供更多的信息,使其成為信息建設的基礎。建立模型,主要是以用戶的喜好為主,這樣可以保證能夠方便開展知識服務。反饋處理,主要是處理用戶在接受服務所反饋的信息,包括評價等等。然后根據反饋信息重新改正,以保證為用戶推送的信息都能夠滿足用戶需要。知識服務中需要包括三個部分,一個是系統管理;一個是對信息的數字化管理;還有一個就是知識服務。這三個部分是相互支撐的,共同發展的關系。
四、結束語
本篇文章主要是研究了數字檔案中的知識發現與服務,是眾多同類型研究的一部分,由于資料有限,本次的研究還有不足,而且還有一些問題沒有解決,例如技術方面的缺陷等。但是我國的計算機技術水平在不斷的進步,而對數字檔案的研究也會加深。檔案中有著豐富的資源對其進行研究,可以使一些隱藏的資源被發現,而且還能成為促進社會發展的動力,因此為了能夠挖掘更多的資源,希望大家重視數字檔案的研究,提高知識服務水平,開創新的服務模式。
參考文獻
[1]沈雙潔.數字檔案館項目風險識別和分析研究[D].南京大學,2013年
[2]溫獻英.數字檔案館信息資源國家控制力研究[D].湘潭大學,2011年
[3]張佳麗.數字檔案館建設對檔案工作的影響及其調試對策研究[D].黑龍江大學,2011年
[4]姚紅葉.信息生態視閾下數字檔案館信息服務研究[D].南昌大學,2012年