曾裕涵 楊立敏 劉小西



摘? 要: 從湖南涉外經濟學院檔案管理實際出發(fā),采用B/S架構,使用Hadoop分布式技術以及web service技術,結合Sql Server數(shù)據(jù)庫,設計并實現(xiàn)了數(shù)字檔案信息管理系統(tǒng),實現(xiàn)了學生信息采集、管理、電子檔案管理等功能,保證了數(shù)據(jù)的高效存取,大大提高了檔案管理的效率。
關鍵詞: 檔案管理; 信息系統(tǒng); B/S架構; Hadoop分布式技術
中圖分類號:TP392? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2020)04-58-03
Design of digital archives information management system using distributed technology
Zeng Yuhan1, Yang Limin2, Liu Xiaoxi1
(1. Hunan International Economics University, Changsha, Hunan 410205, China; 2. Hunan Vocational College of Foreign Languages)
Abstract: Based on the reality of the archives management of Hunan International Economics University, using B/S architecture, Hadoop distributed technology and Web service technology, combined with SQL Server database, a digital archives information management system is designed and implemented, which realizes the functions such as student information collection and management, electronic archives management etc., to ensure the effectiveness of data access, and greatly improve the efficiency of archives management.
Key words: archives management; information system; B/S architecture; Hadoop distributed technology
0 引言
高校數(shù)字檔案信息資源建設,對于高校檔案信息資源的利用、開發(fā)具有重要意義[1-2]。湖南涉外經濟學院作為全國最早的民辦本科院校之一,現(xiàn)有全日制本/專科學生29000余人,累計為社會培養(yǎng)應用型人才10萬余人,檔案管理任務繁重,如何結合學校實際提高檔案管理信息化水平十分重要。論文采用采用B/S架構,使用Hadoop分布式技術以及Web service技術以及Sql Server數(shù)據(jù)庫,設計并實現(xiàn)了數(shù)字檔案信息管理系統(tǒng),對提高學校檔案管理效率具有重要的現(xiàn)實意義[3-5]。
1 需求分析
以現(xiàn)代信息技術為基礎,通過利用數(shù)字化手段,將紙質檔案數(shù)字化,同時將電子檔案歸檔,管理數(shù)字檔案信息資源,并結合高速帶寬網絡等設施,實現(xiàn)信息的連接和利用,設計資源共享的分布式、規(guī)模相對較大的數(shù)字檔案管理信息系統(tǒng)。紙質檔案工作流程主要包括檔案收集、分類、交接、拆分、掃描、圖像處理、質量檢測和案卷整理等流程,電子檔案工作流程主要包括檔案捕獲、遷移、歸檔、鑒定和索引著錄等流程。系統(tǒng)用戶大致可劃分為檔案管理員、系統(tǒng)管理員和普通用戶三種。
2 數(shù)字檔案信息系統(tǒng)設計
2.1 系統(tǒng)體系架構設計
該系統(tǒng)體系結構圖如圖1所示。系統(tǒng)主要包括檔案采集、檔案管理、檔案利用和系統(tǒng)管理四個部分。
檔案采集主要是在本系統(tǒng)中實現(xiàn)對不同渠道文件的導入,并自動對上述文件進行編目操作。結合數(shù)據(jù)接口,按照相應的采集流程,采用數(shù)據(jù)交換平臺,實現(xiàn)OA等信息系統(tǒng)文件向統(tǒng)一格式轉換,并最終導入到系統(tǒng)內。當對統(tǒng)一格式檔案進行獲取以后,需要自動對檔案進行編目,在完成編目操作以后,最終在數(shù)據(jù)庫內存放。
檔案管理對實現(xiàn)檔案統(tǒng)計、銷毀及鑒定。其中,統(tǒng)計是統(tǒng)計檔案以及分析和整理數(shù)據(jù);鑒定則是結合相應規(guī)范,針對檔案開展歸檔、技術、內容鑒定等相關操作;檔案銷毀,則是結合相關規(guī)定,銷毀已超過期限、或者是無效的檔案。
檔案利用主要包括檔案的檢索以及借閱管理。檢索是能夠讓不同系統(tǒng)均可便捷的對檔案信息進行提取并可結合相應要求展現(xiàn)。借閱管理具體包括借閱檔案、催還等功能;
系統(tǒng)管理主要是對系統(tǒng)相關的權限、角色等進行增加、刪除、查看和修改等功能。
2.2 總體功能結構設計
圖2是系統(tǒng)功能結構圖,總體功能主要包括后端檔案業(yè)務管理和前端信息服務網站兩個部分。檔案業(yè)務管理部分主要涵蓋檔案采集、檔案管理以及系統(tǒng)管理三個部分,主要涉及到一些基礎數(shù)據(jù)的維護以及系統(tǒng)維護等內容。信息服務網站主要涉及到檔案利用方面的內容。圖3是系統(tǒng)存儲功能結構圖。高校檔案數(shù)字化管理信息系統(tǒng)對數(shù)據(jù)的存儲運用的體系結構為目錄—文件,采取目錄數(shù)據(jù)的形式,對檔案屬性信息進行存儲,而與之對應的原文件,則在相應的服務器內存儲。二者一一對應。結合如上的存儲體系結構,各類型的信息,可在相應的存儲位置中存放。結合這一方式,看實現(xiàn)對日漸增長的檔案信息的擴充要求的滿足。
圖4是檔案管理系統(tǒng)數(shù)據(jù)E-R模型,在開發(fā)過程中,對檔案信息表、用戶信息表、檔案管理制度信息表等在內的多種表進行了設計。數(shù)據(jù)庫邏輯設計選用的邏輯結構,和DBMS產品支持的模型相符,以此實現(xiàn)對數(shù)據(jù)冗余的去除、數(shù)據(jù)需求等,以便于實現(xiàn)高效、便捷的存取。結合需求分析,系統(tǒng)中涉及的數(shù)據(jù)庫表包括如下,用于在線借閱、查詢檔案、存儲數(shù)字檔案光盤的查詢、歸檔上架等諸多功能。實體表包括角色表、用戶查看檔案權限表、用戶表、角色—用戶關系表、日志表、檔案分類表、文件信息表、檔案狀態(tài)表、館藏地表、檔案信息表、借閱信息表、檔案銷毀表、借閱狀態(tài)表和檔案鑒定表。
3 系統(tǒng)測試
圖5是所設計的數(shù)字檔案管理信息系統(tǒng)學生信息查詢界面圖,我們對所設計的數(shù)字檔案管理系統(tǒng)進行了功能測試和性能測試。功能測試主要是測試系統(tǒng)前臺頁面的數(shù)據(jù)展示,以及后臺文件管理模塊、檔案管理模塊、查詢統(tǒng)計模塊和系統(tǒng)圖管理模塊的核心功能是否實現(xiàn)。性能測試主要測試系統(tǒng)并發(fā)用戶數(shù)量較大對系統(tǒng)CPU占用率、響應時間等性能指標的壓力測試。對50名用戶的并發(fā)操作進行模擬,最終通過的項目達到1萬多,僅有1項事務失敗,響應的平均時間為3秒,最長的為9秒,CPU的使用率達到16%;在對100名用戶的并發(fā)操作進行模擬時,通過的事項達到1.2萬多項,僅有4項失敗;響應的平均時間是7秒,最長需要14秒,CPU使用率達到68%。結合性能測試結果,系統(tǒng)具有較好的事務成功執(zhí)行率,響應時間約為5秒到10秒,最大響應時間超過20秒,CPU可正常運行,達到了預期。
4 結論
本文對高校數(shù)字檔案管理體系結構進行了深入研究,采用B/S架構,使用Hadoop分布式技術以及Web service技術以及Sql Server數(shù)據(jù)庫技術,設計并實現(xiàn)了數(shù)字檔案信息管理系統(tǒng),并通過了功能測試和性能測試。本文僅以分布式架構為基礎提出了信息交互協(xié)議,若能將區(qū)塊鏈技術等新技術應用到數(shù)字檔案管理系統(tǒng)中來,實現(xiàn)真正的分布式信息交互,必將極大地推動高校檔案數(shù)字化工作的發(fā)展。
參考文獻(References):
[1] 張慎武,高艷霞,王玉霞.電子公文檔案管理系統(tǒng)方案設計[J].蘭臺世界,2013.20:48-59
[2] 劉英俊.我國數(shù)字檔案室建設研究[D]安徽大學,2017.
[3] 譚培勇,王晶,史蓓蕾,郭晶晶.基于.NET平臺的通信器材檔案管理系統(tǒng)的設計與實現(xiàn)[J].計算機與數(shù)字工程,2012.12:42-57
[4] 陳卸女,屠友軍.基于ASP.NET平臺的新警檔案管理系統(tǒng)的設計[J].計算機光盤軟件與應用,2012.20:43-56
[5] 何蒲,于戈,張巖峰等.區(qū)塊鏈技術與應用前瞻綜述[J].計算機科學,2017.44(4):1-7