

摘 要 數據庫管理針對的是檔案的目錄、掃描件以及照片、電子文檔等數據,這些數據普遍具有的特點有結構化也有非結構化的,新一代的檔案管理系統從設計和實現的角度,對于數據管理系統的開發和利用已經進入了完整有效的管理階段。本文結合混合型數據庫檔案管理系統的開發理念,對于這一數據庫管理特性以及在檔案管理中的運用情況進行分析,如檔案的全文檢索等,旨在研究如何提高檔案的利用率,將檔案的利用價值予以提升。
關鍵詞 檔案管理系統;數據庫;結構化數據
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2017)188-0070-02
隨著我國信息化建設的不斷深入,信息資源在檔案的行政事業管理中不斷需要加強,以保證檔案的管理和利用能夠健康快速地發展。由于檔案工作牽扯到的社會信息以及業務工作非常多,因此對于檔案信息資源的開發和利用已經成為國企檔案工作發展的基本目標,是適應國企改革發展需要進行的時代性的創新和變革。新時期檔案實業要達到健康持續的發展,需要對各類文件、會議資料、電傳等等加以管理,還有與企業發展有關的技術資料、科研報告、論文資料等,以及企業的立式檔案,線性文件等都要加強管理。不同的應用領域,其側重點也不盡相同。檔案的管理系統涉及到的內容眾多,當前運用計算機輔助管理系統,對檔案的信息和實體進行管理,是非常有必要的。
1 數據庫類型
數據庫的管理平臺包含了檔案的管理系統的全部內容,從當前檔案管理的數據庫的發展里程來進行數據庫的類型分類,可以看到:
從檔案的發展初期,采用手工錄入的方式,建立檔案目錄表,要求檔案管理人員參照檔案的放歸規定,將各類紙質實體檔案加以收集、整理、立卷和歸檔。進入計算機輔助檔案目錄管理之后,采用獨立的計算機管理的方式,將檔案的目錄加以整理,形成了桌面式的數據庫檔案目錄管理平臺。到了互聯網時代,依托網絡建立大中型關系數據庫,將數據平臺中的掃描功能加以利用,形成了檔案實體的掃描管理體系。
如今,數據庫的全文檢索功能,能夠對檔案的目錄以及全文等加以掃描和管理,電子文件、多媒體文件等等,都可以進入非結構化數據管理體系中,而且通過管理結構的不斷調整和優化,數據庫管理已經達到了全文數據管理和數字檢索的發展階段[1]。
當前,國企的檔案掛歷I軟件已經實現了數字化的接收、整理和編目的技術。通過計算機管理將檔案的利用和移交全程加以運行,網絡的查詢以及調檔等,通過服務,實現了管理系統的運行,即便是海量的信息,全文數據庫技術通過OCR檔案管理識別技術、電子文件全文內容索引和存儲技術等,都能達到高效快捷的檔案的索引和存儲,提高了檔案的查全率和查準率,能夠將全文檢索手段予以提高,對于檔案的利用水平來說是十分高效和便捷的。但是,由于后臺數據平臺的數據庫的類型的不同,在物理原理上,檔案的數據物理儲存的功能不盡相同,因此也不能保證數據段的一致性以及完整程度。這兩類數據庫的開發結構不同,因此在系統開發的難度上有所增加,增加了數據庫維護的成本。
兩類數據庫的類型,分為傳統的關系型數據庫管理系統以及現代信息檢索系統,前者的缺點在于不具備數據處理效率,靈活性一般,后者需要結構化數據以及元數據的支持。因此,在集成傳統數據庫管理系統的基礎上建立新的數據庫管理平臺,體現數據存儲的管理非結構化,將數據的關系特性和全文特性予以表現,構成檔案管理的新課題?;旌闲蛿祿炀蛻\而生,在當前國企檔案管理系統中發揮著重要的作用。
2 數據庫應用以及技術特點
1)數據庫采用的是擁有自主知識產權的數據管理系統,支持關系數據模型以及強大的多語種核心語法集,能夠進行高擴展性和穩定性的多語種檢索全文,遵照標準化和開放性的原則,在數據訪問中能夠做到跨平臺和標準化,為企業服務接口服務。
2)該系統的特點首先是能夠對數據進行半結構化和非結構化的混合統一管理,對于海量的數據,從檢索技術和數據庫管理技術的角度出發,保證數據庫管理技術中的事務性和完整性,對全文進行檢索的數據查詢功能利用的是非結構化索引融合,采用的是多種查詢方式和相互操作的
實現[2]。
3)OCR識別技術,通過對暗、亮的模式的掃描,采用掃描儀等設備對字符進行識別,然后將形狀識別為計算機文字,形成文本資料和圖像文件進行分析處理。
4)PDF技術是通過設備的分辨,將文字、字型等封裝在一個文件中,設置超文本連接或者動態影像等電子信息,提高集成度和安全可靠性。
5)全文信息自動抽取技術,是將文件的無關信息進行過濾,然后得到全文數據庫的索引等的自動加載,將電子文件以附件的形式入庫,提供原版的瀏覽。
3 系統架構
由數字化掃描將檔案生成目錄數據或者是電子文件,通過OCR識別技術生成檔案,加載到檔案資源庫中,生成數據導入數據表,自動掛接電子文件,通過全文信息技術的抽取,建立全文索引。
用C/S和B/S相結合的模式提供檔案信息的管理和利用,其中以C/S方式提供檔案信息管理和維護功能,以B/S方式提供檔案信息的檢索和利用功能。
應用平臺調用業務層數據訪問接口,在不影響其他功能模塊的前提下,構建五大業務功能模塊客戶端,各業務功能模塊再通過數據層數據訪問接口,采用混合型數據庫管理系統,提供訪問接口的服務:檔案維護、檔案管理、檔案利用、系統檢索利用和Web管理,只需更各業務功能模塊和檔案系統利用平臺(Browser)相應的模塊,就能通過檔案系統管理平臺(Client)問業務功能模塊統一訪問和操作數據庫。整個系統可存放檔案目錄,可在支撐平臺和安全保障的支持下對用戶信息、日志信息、系統設置等系統數據進行維護,確保全文、電子文件等檔案信息能夠被安全、訪問和利用,并在數據庫平臺中加以封裝,并穩定、可靠地運行。
4 結論
新一代的檔案管理系統,運用信息技術和網絡技術予以輔助,不斷提高檔案信息化管理水平,也為檔案調用等服務提供了技術和資源優勢,能夠讓檔案信息資源更好地服務于社會。
參考文獻
[1]彭飛.基于格局理論的多模態語言檔案數據庫建設研究[J].北京檔案,2017(3):26-28.
[2]賀建英.大數據下MongoDB數據庫檔案文檔存儲去重研究[J].現代電子技術,2015,38(16):51-55.
作者簡介:李麗茹,航天四院四零一所。