蔡志強



摘 ?要: 采用傳統系統無法對輔助信息進行精準查詢,導致系統無法滿足人們需求,為了解決該問題,提出基于云計算的電子檔案輔助信息查詢系統設計。根據系統總體架構,以云計算環境為中心,設計信息存儲器結構,使信息轉化為內存形式,可直接被CPU訪問。針對某些信息存儲歷史記錄,設計分析處理模塊接口電路,保證輸入電流和輸出電流具有規律性,可恢復休眠文件。根據信息分析處理結果,設計信息查詢模塊,保證系統設計的安全性。根據查詢模塊軟件功能,結合檔案錄入流程,設計數據中心存儲機制,采用面向分布式存儲數據與HBase數據庫,開發分布式系統查詢項目,由此完成系統設計。通過實驗對比結果可知,該系統最高查詢精準性為98%,實現了電子檔案輔助信息的高效查詢。
關鍵詞: 云計算; 電子檔案; 輔助信息; 查詢; 存儲器; 存儲機制
中圖分類號: TN99?34; TP311.32 ? ? ? ? ? ? ? ? ? ?文獻標識碼: A ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2019)11?0108?05
Abstract: The traditional system is unable to query the auxiliary information accurately, so the system can′t meet the needs of people. In order to solve the problem, the design of the electronic archives auxiliary information query system based on cloud computing is proposed. According to the overall architecture of the system, the information storage structure taking cloud computing environment as the center is designed, by which the information can be converted into memory form and accessed directly by CPU. In view of the historical records of some information storage, the interface circuit of analysis and processing module is designed to ensure the regularity of the input current and output current, and restore the dormant files. According to the results of information analysis and processing, the information query module is designed to ensure the security of the system design. In combination with the software function of query module and entering process of archives, the storage mechanism of data center is designed. The distributed storage data and HBase database are used to develop the distributed system query project, thus the system design is completed. The experimental results show that the highest query accuracy of the system can reach up to 98%, and the efficient query of electronic archives auxiliary information is realized.
Keywords: cloud computing; electronic archive; auxiliary information; query; memory; storage mechanism
0 ?引 ?言
電子檔案是人們在相關活動中直接形成具有存儲價值的電子化歷史記錄,可存儲于計算機系統之中,面向個人提供基礎服務[1]。由于社會的進步與經濟的不斷發展,電子檔案數量不斷增加,導致保管與查詢工作量也大大增加。在進行電子檔案輔助信息查詢時,如果長期直接查閱原始檔案,會對原始檔案造成嚴重破壞,因此使用計算機系統進行管理,可節約檔案存放時間,加快資料查詢速度,進而減少工作人員的工作量,并對原始檔案起到保護作用。在云計算環境下,電子檔案輔助信息具有海量、異構、種類復雜、保存時間長等特性,目前尚未制定統一的數據規范,由此形成了信息孤島[2]。
電子檔案輔助信息查詢系統領域里,相關學者已經做出了不少研究,針對數據之間的共享問題,提出數據跟蹤管理功能,通過統一方法對異構數據源進行結構化描述,使紙質檔案與電子檔案并行。雖然該方法可有效解決遠程需求,但針對存檔備查的矛盾還無從解決,為此本文提出基于云計算的電子檔案輔助信息查詢系統設計。根據系統具體業務情況分析用戶權限分配策略與控制訪問,完善用戶權限管理方案[3]。
1 ?架構設計
云計算是一種全新的網絡服務方式,改善傳統以桌面為核心的任務處理方式,轉變為以網絡為核心的任務處理,使用互聯網技術實現信息快速傳遞。基于云計算的電子檔案輔助信息查詢系統的設計目的就是實現系統自愿擴展、統一管理和大量數據的高效查詢[4]。根據大數據目標和業務需求設計該系統,具體架構如圖1所示。

由圖1可知:根據系統需求,電子檔案查詢系統必須是在云計算環境下設計的,可進行業務管理擴充以及系統存儲容量橫向擴充。因此,采用云計算理念設計的平臺具有大容量優勢,可容納海量數據信息[5]。
1.1 ?系統硬件設計
根據系統總體架構對系統硬件結構進行設計,如圖2所示。

由圖2可知,系統總體架構由機構層和平臺層組成。其中:機構層包括信息系統,這是電子檔案數據的主要來源;而平臺層是數據交換平臺,具有基本檔案服務、注冊服務、信息共享服務和數據分析等功能[6]。
1.1.1 ?信息存儲模塊
傳統電子檔案輔助信息存儲采用集中串行式存儲方式,該方式存儲的云環境下的大數據信息具有限制性,很難實現對云環境數據庫動態數據信息的存儲。云環境數據庫作為系統物理存儲介質上與應用相關的動態信息總和,通常以固定結構存在于介質之上[7]。
針對云環境下數據庫動態信息資源的存儲,應以云計算環境為中心,將不同設備連接起來共同完成信息查詢,該過程需要建立數據中心,將海量信息存儲在服務器之中,進而為信息分析處理提供方便,信息存儲器結構設計如圖3所示。

由圖3可知:如果出現海量信息,信息存儲時間會大大增加,那么需提高信息存儲速度,保證動態信息進行存儲時可節省時間,此時存儲的信息可直接被CPU訪問;如果存儲器對信息存儲速度加快,需利用內部快速轉換功能,將信息轉化為內存形式,此時存儲的信息可被CPU訪問;如果海量信息存儲內存變小,需提高信息存儲速度,利用相應程序將數據轉換為內存形式,通過高速緩存使數據被CPU訪問[8]。
1.1.2 ?分析處理模塊
分析處理模塊對系統上存在的某些歷史記錄進行分析,并對系統的休眠文件進行恢復處理,并為信息查詢提供依據[9]。
信息查詢的分析處理模塊接口電路設計如圖4所示。

由圖4可知,該接口電路由MCS?51?8051單片機進行電流傳輸,由CAPI服務器進行電流傳出。兩個電阻分別是輸入電流和輸出電流的阻值,可保證電流值具有規律性[10]。
1.1.3 ?信息查詢模塊
根據上述信息分析處理結果,對信息查詢模塊進行設計,如圖5所示。

由圖5可知,當管理員想要查詢電子檔案信息時,需先了解管理員身份信息,驗證管理員身份,確定是讀者還是管理員。若是查閱者,則需了解查閱者身份信息,方便信息查詢。
以云計算環境為中心設計的信息存儲器結構,可節省時間,利用內部快速轉換功能,將信息轉化為內存形式,并直接被CPU訪問;分析處理模塊是對系統上存在的某些歷史記錄進行分析,并對休眠文件進行恢復處理;根據信息分析處理結果,設計信息查詢模塊,保證系統設計的安全性。
1.2 ?系統軟件設計
對查詢模塊進行軟件部分設計時,按照云計算網絡的特點和基礎結構,將系統軟件功能劃分成5個功能,如圖6所示。

由圖6可知:通過對電子檔案處理,可獲取基本輔助信息,由此建立圖片庫和索引庫,為監視與管理提供精準信息。排除對信息中心管理人員的查詢,還需對工作人員、外來人員以及異地人員進行查詢。從錄入批量信息到獲取電子檔案的過程就是實現新電子檔案輔助查詢的過程。由于錄入系統在呈現具體某個電子檔案時,需先讀取網頁,該網頁會自動打開第二個電子檔案,該檔案也會自動替換掉第一個打開的檔案,并錄取無法批量自動操作的檔案。設計的檔案錄入流程如下:對檔案進行初始化整理;打開具體檔案項目;查看項目是否要保存,如果是,則需保存該電子檔案;如果不是,則需查詢另一個檔案項目。
電子檔案查詢系統采用動態網頁與靜態網頁相結合的方式,是基于云計算條件下開發的。后臺數據庫采用Microsoft SQL Server 2005,而中間件采用ADO.NET直接訪問數據庫。在系統運行過程中,管理人員可通過選擇某個電子檔案項目查詢檔案基本信息,并設置報名信息、志愿信息、體檢信息等。為此,設計了數據中心存儲機制,如圖7所示。

采用關系數據庫SQL和非關系數據庫NOSQL相結合的模式對外提供存儲服務,該方式利用高擴展特性,結合關系數據庫存儲敏感數據的優點,展示極強的數據分析處理能力。
根據存儲需求,采用面向分布式存儲數據與HBase數據庫,開發分布式系統查詢項目。為了滿足輔助信息的完整性和安全性,將電子檔案索引信息和注冊信息全部存放于服務器之中,使用轉移工具Sqoop實現關系數據和數據之間的交互功能。
利用關系數據庫負責查詢密集任務,MapReduce進行數據轉換,通過對電子檔案數據挖掘,減輕關系數據庫的計算壓力,由此完成系統設計。
2 ?實 ?驗
采用Matlab R2000b作為實驗平臺,為增強結果的說服力,將傳統基于Lucene的電子檔案檢索系統作為對比組,本文基于云計算電子檔案輔助信息查詢系統作為實驗組,通過對比結果驗證基于云計算電子檔案輔助信息查詢系統的有效性。
2.1 ?實驗條件設置
分別設置單個電子檔案和多個電子檔案查詢模式,如表1和表2所示。


由表1和表2可知,利用查詢系統可獲取單個電子檔案輔助信息和多個檔案輔助信息,但是針對該信息獲取的精準性還需進行對比分析。
2.2 ?實驗結果與分析
分別將傳統系統與基于大數據系統對單個電子檔案和多個電子檔案查詢獲取的輔助信息的精準性進行對比分析。
2.2.1 ?單個電子檔案
對單個電子檔案的項目內容進行查詢,該部分輔助信息的精準性在兩種系統中具有截然不同的結果,如圖8所示。
分析圖8可知:在60 s之內,兩種系統輔助信息查詢精準性變動幅度都比較大;當時間超過60 s后,兩種系統的變化幅度開始呈現一定的規律。當時間為160 s時,傳統系統對項目1和項目2信息查詢精準性達到了最低,為20%左右;當時間為100 s時,傳統系統對項目1和項目2信息查詢精準性達到了最高,分別為60%和56%。當時間為80 s時,本文系統對項目1和項目2信息查詢精準性達到了最低,為77%左右;當時間為180 s時,本文系統對項目1和項目2信息查詢精準性達到了最高,分別為96%和95%。通過對比可知,本文系統對項目1和項目2信息查詢精準性高于傳統系統。

2.2.2 ?多個電子檔案
對多個電子檔案的多個項目內容進行查詢,分別采用傳統系統與基于云計算系統對輔助信息精準性進行對比分析,結果如圖9所示。

分析圖9可知:當時間為100 s時,傳統系統對A組檔案項目1和項目2的信息查詢精準性達到了最高,分別為60%和50%,而本文系統對A組檔案的項目1和項目2的信息查詢精準性分別為42%和45%;當時間為160 s時,傳統系統對A組檔案項目1和項目2的信息查詢精準性達到了最低,分別為19%和10%。而本文系統對B組檔案項目1和項目2的信息查詢精準性在時間為200 s時達到了最低,分別為78%和83%。從圖中可以看出,本文系統對項目1和項目2中的不同檔案信息的查詢精準性高于傳統系統。
2.3 ?實驗結論
根據上述實驗內容,可得出實驗結論:
傳統系統無論是對單個電子檔案,還是多個電子檔案輔助信息進行查詢,其查詢精準度都較低,且最低達到了10%;而基于云計算系統對單個電子檔案和多個電子檔案輔助信息進行查詢,其查詢精準度都較高,且最高達到了98%。由此可知,基于云計算電子檔案輔助信息查詢系統的設計具有有效性。
3 ?結 ?語
基于云計算電子檔案輔助信息查詢系統主要負責溝通客戶與企業,因此對其進行安全設置具有必要性。通過系統硬件實現信息安全查詢,利用軟件存儲相關信息,為檔案服務提供高效、先進的服務。
參考文獻
[1] 章圣冶,羅堯治,沈雁彬.基于云計算的空間結構健康監測物聯網系統設計[J].空間結構,2017,23(1):3?11.
ZHANG Shengye, LUO Yaozhi, SHEN Yanbin. IOT system design for space structural health monitoring based on cloud computing [J]. Spatial structures, 2017, 23(1): 3?11.
[2] 林靜懷.基于云計算的電網調度控制培訓仿真系統設計[J].電力系統自動化,2017,41(14):164?170.
LIN Jinghuai. Cloud computing based system design for power grid dispatching and control training simulation [J]. Automation of electric power systems, 2017, 41(14): 164?170.
[3] 高玉平.海量圖書檢索信息的快速查詢系統優化設計研究[J].現代電子技術,2017,40(6):5?9.
GAO Yuping. Optimization design of fast query system for retrieval information from large amount of books [J]. Modern electronics technique, 2017, 40(6): 5?9.
[4] 班婭萌,趙月鵬,平金珍.基于云計算的分布式電源管理系統設計與實現[J].電源技術,2017,41(2):310?311.
BAN Yameng, ZHAO Yuepeng, PING Jinzhen. Distributed power management system based on cloud computing [J]. Chinese journal of power sources, 2017, 41(2): 310?311.
[5] 王曉靜.基于云計算技術的迎水橋機務段生產管理信息系統設計[J].鐵道運輸與經濟,2017,39(11):52?56.
WANG Xiaojing. Design of production management information system in Yingshuiqiao Locomotive Depot based on cloud computing [J]. Railway transport and economy, 2017, 39(11): 52?56.
[6] 楊志,顧正明.基于物聯網的數字唐徠信息化管理系統設計與實現[J].節水灌溉,2017,20(1):71?75.
YANG Zhi, GU Zhengming. Design and development of digital information management system based on Internet of Things for Tanglai Irrigation District [J]. Water saving irrigation, 2017, 20(1): 71?75.
[7] 賈曉婷,邢潔清.多媒體網絡信息監控與處理系統的設計與實現[J].現代電子技術,2017,40(4):57?60.
JIA Xiaoting, XING Jieqing. Design and implementation of information monitoring and processing system for multimedia network [J]. Modern electronics technique, 2017, 40(4): 57?60.
[8] 張永宏,李海峰,王麗華,等.基于嵌入式Web服務器的微氣象信息遠程監控系統設計[J].電子器件,2017,40(5):1250?1256.
ZHANG Yonghong, LI Haifeng, WANG Lihua, et al. Design of remote monitoring and control system for micro?meteorological information based on embedded Web server [J]. Chinese journal of electron devices, 2017, 40(5): 1250?1256.
[9] 戴閩魯,崔豐驛,雷國平,等.基于RFID的銷售管理與消費信息采集系統設計[J].現代電子技術,2017,40(9):159?162.
DAI Minlu, CUI Fengyi, LEI Guoping, et al. Design of sales management and consumer information collection system based on RFID [J]. Modern electronics technique, 2017, 40(9): 159?162.
[10] 王秋琳,宋立華,閆麗飛,等.一種非結構化數據查詢優化存儲系統設計[J].電子設計工程,2017,25(13):16?20.
WANG Qiulin, SONG Lihua, YAN Lifei, et al. Design of a storage system for unstructured data query optimization [J]. Electronic design engineering, 2017, 25(13): 16?20.