孫 遜
摘要:文章首先對檔案專題數據庫的內涵作一界定,然后分析檔案數據庫的特點,重點提出有關檔案專題數據庫建設的宏觀政策、開發程序及安全問題等方面的幾點思考,以期能夠更好地服務于檔案專題數據庫建設的良好前景。
關鍵詞:檔案專題數據庫信息化政策問題開發程序需求分析
欄案專題數據庫建設是信息化時代下檔案信息資源開發與利用的一項創新手段與重要途徑,也是檔案數字化建設的目標和任務之一。研究信息化時代下的檔案專題數據庫建設,對其內涵與特點加以歸納,有針對性地對其建設現狀及問題作以思考,有利于實現檔案信息資源社會共享的目標。
1檔案專題數據庫的內涵界定
關于檔案數據庫的概念,早在1987年孫淑揚就指出:“檔案數據庫屬于文獻數據庫,是檔案自動化的重要內容,它是經過整理組織以機讀形式出現的檔案信息集合。”而檔案專題數據庫作為檔案數據庫的一個重要形式,它是以各類檔案基礎數據庫為主要數據來源,通過檔案信息管理系統,按照某一專門題材內容編制而成的各類檔案數據集合。檔案專題數據庫是跨全宗、多類別的檔案數據鏈接組合,是系統性的檔案數字化綜合開發成果,在提供利用方面具有較強的針對性、實用性。作為互聯互通、共建共享的檔案資源網絡與服務平臺,建立檔案專題數據庫可以確保檔案的完整收集、長期保存與充分開發。
檔案專題數據庫的分類方法有多種。從開發層次上,檔案專題數據庫包括專題目錄數據庫和全文數據庫兩種類型:就目前的技術手段而言,檔案專題數據庫可以分為四種類型:一是文獻數據庫,二是多媒體數據庫,三是數值型數據庫,四是事實型數據庫。這四種類型的數據庫都是基于檔案內容信息,通過對檔案信息內容的分析、過濾、加工、編排而產生的。
2檔案專題數據庫的特點分析
與傳統館藏數據庫相比,檔案專題數據庫主要涉及的是檔案信息資源開發方面,具有多元性、系統性、針對性等特點。兩者在數據信息、產生過程、目的作用及使用范圍等方面均存在著差異。
①多元性。檔案專題數據庫是跨全宗、多類別的檔案數據鏈接組合。它包括目錄數據、圖像數據、視音頻數據等不同數據形式,有著豐富多彩的數字復合視聽效果。檔案專題數據庫能夠更為全面、直觀地向利用者揭示編纂主題相關的內容,打破了傳統紙質編纂成果只有文字和圖片的限制。同時,在來源上,檔案專題數據庫不僅局限于館(室)藏檔案,還可以補充采集、鏈接相關的數字化材料。
②系統性。傳統檔案管理中,根據檔案的專題屬性,按照用戶的需求來編制檔案目錄或報道性檢索工具,其目的在于系統地揭示館(室)藏的某一專門題材檔案的內容。但檔案專題數據庫不僅是數據庫形式的檢索工具,而且是檔案目錄和內容數據——對應鏈接、反映某一專題內容的檔案數據集合。無論是形式上還是內容上,檔案專題數據庫都具有相對系統性,能夠比較完整地揭示和反映某一專題檔案的內容。
③針對性。與檔案館藏數據庫相比,檔案專題數據庫注重將館藏中與專題相關的檔案信息提取并揭示出來,為了說明問題,通常需要對檔案館藏數據庫中的相關數據信息進行整合,更為強調的是“精”和“準”。這樣有針對性的開發不但有利于揭示紛繁復雜的館(室)藏內容,也有利于利用者系統、完整地了解和利用某方面的檔案信息,對于有效地開發利用檔案信息資源也具有重要的意義。
3關于檔案專題數據庫建設的幾點思考
3.1加強建立檔案專題數據庫的宏觀政策。檔案專題數據庫建設是新時期檔案事業實現跨越式創新發展的關鍵所在。國家檔案局站在戰略的高度,認真規劃檔案專題數據庫建設是很有必要的舉措。通過統一規劃、統一組織,統一領導全國檔案專題數據庫建設,將其納入檔案數據庫建設范疇,制訂出更多完善的檔案專題數據庫建設綱要及細則,以指導全國檔案專題數據庫的開發與建設。
目前,檔案專題數據庫主要集中在沿海發達地區且發展較快,如福建、浙江等地,內地多數尚未建成檔案專題數據資源庫。可以說,檔案專題數據庫建設存在著區域發展不平衡的現象。國家及地方應積極推進檔案專題數據庫建設,將其納入到檔案信息化建設規劃當中,全面統籌,規范標準建設,在已取得試點突破的基礎上,總結可行性及發展規律,為早日建成國家檔案信息資源專題數據庫創造良好的條件與堅厚的基礎。
檔案專題數據庫建設是信息化時代檔案信息資源開發利用的新途徑,通過對檔案專題數據庫進行開發,從人們最關心、最直接的問題出發,有效整合相關的檔案數據庫資源,特別是在民生檔案建設的熱潮時期,加強對民生方面的檔案專題的關注,將會很大程度上有利于以后檔案事業的長效可持續發展。如福建省檔案局建設的知青檔案專題數據庫,其規模及效應在全國范圍內仍不多見。
3.2注重開發檔案專題數據庫的科學程序。檔案專題數據庫開發程序的科學與否,直接關系到檔案信息資源開發利用成果質量的高低,建立良好的檔案專題數據庫開發程序,將有助于檔案信息資源的獲取,最終實現檔案信息資源的社會共享。
一般而言,檔案專題數據庫開發需要經過分析主題、研究專題、收集數據和整合編排等環節。所謂分析主題,即通過了解各級黨政機關和人民大眾所關心的熱點問題,圍繞服務大局,結合館(室)藏檔案內容,遴選出有現實利用價值和潛在利用價值的檔案主題。在遴選出的檔案主題中,結合時事宣傳和檔案利用的工作需要,確定專題內容,即所謂的研究專題環節。然后,在圍繞某一專題的基礎上,首先設立項目,通過查找本館的檔案資料,也包括館外的其他文獻資料,集中相關檔案信息數據,再經過加工編排而產生檔案專題信息資源。這里有必要提出的是,關于采集數據的過程,不妨通過關鍵詞檢索、全文內容檢索等手段,在海量的檔案基礎數據庫中查找所需的專題數據材料。有時也可通過補充采集一些數據資料,進一步充實和完善檔案專題數據庫的內容。在選題時:需要注意的是要求盡量使得體系完備、分類合理,力求使整個目錄收集的內容涵蓋整個專題的范圍。
對數據的加工整合也是檔案專題數據庫科學程序必不可少的環節,要針對不同的專題數據形式制定統一的數據庫字段和數據格式,確保整個專題數據庫的規范性、標準性和可共享性,有必要時統一開發相應的建庫軟件。最后,要對采集到的專題數據進行編排處理,特別是有不同數據形式的,要歸類排序,形成一個內容介紹,用以概述該專題數據庫的簡要內容。
盡管以上幾個環節均必不可
少,但我們必須分清輕重緩急,適當地分配工作的重點,要始終以利用者需求為導向,實現科學的檔案專題數據庫開發程序的目標。適時地進行利用者需求的調研,將其作為檔案專題數據庫建設的環節也不是不可以考慮的,這對于檔案專題數據庫開發的效果將起到十分關鍵的作用。
3.3重視研究檔案專題數據庫的安全問題。在諸多關于檔案數據庫的文章中,有不少談及到檔案數據庫的安全問題。對于檔案專題數據庫也不例外,同樣需要重視其安全問題,這樣才能保證檔案專題數據庫更加穩健地發展。
檔案專題數據庫的安全問題主要涉及介質安全與數據安全兩方面。介質安全是指檔案專題數據庫的存儲介質,因為這些介質可能隨著時間流逝,出現老化、失效等問題,繼而導致數據庫的數據缺失,這對檔案專題數據庫來說是一個致命的問題。另外,檔案專題數據庫經常通過網絡發布,很容易受到網絡黑客的攻擊,這就面臨數據被篡改,甚至數據異常等問題。在這樣的情況下,研究檔案專題數據庫的安全問題顯得十分必要。
因此,首先要改良檔案專題數據庫的存儲介質,發展更優良的存儲形式,從硬件上保護檔案專題數據庫的安全。在系統設計階段,應加強權限設置,一方面要對系統中各個功能模塊的操作權限進行定義,另一方面是對系統數據的分層管理和操作權限的定義。比如,數據庫的管理人員可以看到后臺的數據,可以對數據庫進行編輯和管理,高級用戶可以看到編纂完成之后的所有檔案信息,普通用戶則只能看到一部分信息等。就目前檔案專題數據庫網絡化的趨勢而言,還要加強數據庫的反黑客能力。檔案專題數據庫的安全問題能否順利解決與否,關系到檔案專題數據庫運行與發展的水平與趨勢,我們必須對其高度重視,在實現其物理安全的同時,更加注重研究其網絡環境下的安全隱患,如對于著作權的研究也應該是檔案專題數據庫建設中值得深思的問題。
在信息化時代下,要以滿足人民群眾日益增長的檔案信息需求為導向,對檔案專題數據庫的開發與應用是檔案信息資源開發利用的重要形式與創新手段,因此,立足于地方特色、館藏特色及本館特色的基礎上,對利用者的需求分析成了檔案專題數據庫建設的新任務。這就需要對利用者的需求進行分析,提煉出人們所關心的檔案資源,經過對其進行分類,開發出各類利用價值高、有針對性的檔案專題數據庫,以滿足不同利用者對檔案信息資源的需求。