許振哲 于喆



摘? 要:《互聯網時代下的高校智慧型檔案館建設》一文對高校智慧檔案館建設的解讀具有一定的創新性,但也存在認知偏頗和理想化傾向。本文針對該文提出的智慧型檔案館內涵、我國高校智慧型檔案館建設現狀以及相關建設舉措三方面內容與之進行商榷。提出智慧檔案館的智慧內涵在于對內容信息進行Apriori關聯算法分析與主動推送;指出我國高校智慧檔案館建設名不符實,地級智慧檔案館建設未能達到預期的現狀;認為目前建設高校智慧檔案館時機尚未成熟,應著力建設高校數字檔案館,并實現由數字檔案館向智慧檔案館的平穩過渡。
關鍵詞:智慧檔案館;Apriori;主動推送;檔案信息化;高校檔案館
Abstract: The article'the construction of intelligent Archives of universities in the internet era' is innovative to the extent of how to construct intelligent Archives of universities, but it also has the tendency of cognition bias and idealization. This paper discusses from three aspects: the connotation of intelligent Archives, the current situation of intelligent Archives of universities in our country and the relevant suggestions. Points out that the connotation of intelligent Archives is to push information actively by using relevancy algorithm of Apriori; and the construction of intelligent Archives of universities is unworthy of the title, the construction of intelligent Archives of cities also fails to reach the target; Finally, it is concluded that intelligent Archives of universities should not be built until the time is ripe, we should focus on the construction of digital Archives and make a smooth transition from digital Archives to the intelligent Archives.
Keywords: Intelligent archives; Apriori; Active push; Archives informatization; University archives
《檔案管理》雜志2020年第5期刊登了王楠同志撰寫的《互聯網時代下的高校智慧型檔案館建設》(以下簡稱《王文》),文章對智慧型檔案館的內涵做出闡釋,描述了我國高校智慧型檔案館建設現狀,并對高校“互聯網+智慧檔案館”建設的舉措提出相關建議。但《王文》對智慧型檔案館的內涵認知不全面,對高校智慧型檔案館建設現狀分析不到位,提出的相關舉措存在理想化傾向。本文擬從智慧型檔案館的智慧內涵、智慧型檔案館總體建設概況以及高校智慧檔案館建設舉措分析三方面與之商榷。
1 智慧型檔案館的智慧內涵
《王文》認為,智慧型檔案館是指通過應用物聯網、云計算等先進技術,實現跨時空、跨平臺的信息共享和服務集成,便于用戶一站式獲取檔案信息資源。其實質是網絡信息化與高校信息化建設的高度融合,是實現檔案管理信息化的必然結果。[1]這種表述首先在語法上存在問題:缺少賓語,沒有闡明智慧型檔案館究竟是檔案館實體或者是檔案集成服務模式;再者,《王文》著重強調了互聯網技術與高校智慧型檔案館的密切關系,存在將“互聯網化”等同于“智慧化”的技術論傾向,這樣的理解未免有失偏頗。
檔案界對智慧檔案館的內涵有很多不同的界定,至今未能形成統一。楊來青等人認為智慧檔案館是采用物聯網、云計算等新技術智能管理多元化檔案資源、具有感知與處置檔案信息能力并提供檔案信息泛在服務的檔案館模式[2];傅榮校等人認為智慧檔案館是采用物聯網、云計算等新興技術對多元化的檔案資源進行整合、感知、挖掘,并提供多方位、多層次、多渠道的檔案共享利用服務的一種檔案館模式[3];許桂清認為智慧檔案館=檔案館+物聯網+云計算+智慧化設備+智能館舍+信息資源+人力資源。[4]縱觀以上幾種觀點,不難發現檔案界公認智慧檔案館的核心技術應為物聯網、云計算技術。《王文》強調互聯網+技術以及網絡信息化與高校檔案信息化建設的融合,某種程度上仍是數字檔案館時代的建設方針,缺乏智慧性與時代特征。
前國家檔案局局長楊冬權曾強調數據挖掘技術的重要性[5]。我們認為:智慧檔案館的智慧內涵體現為對用戶行為做出智慧化預測,并主動推送信息。實現智慧內涵需要具備一定的前提,即數據化和用戶行為數據的關聯性開發。檔案數據化并不是單純地數字化掃描,而是需要進行OCR識別,保證全文內容信息可供檢索;數據關聯性開發則需用到Apriori(關聯分析算法),通過對用戶行為數據的收集,根據用戶的檢索詞匹配高頻關聯詞,并推送給用戶。筆者構建了一個十名用戶的簡易關聯算法模型對之進行例證,如表1所示。
表1為十名檔案利用者檢索行為數據,將出現頻次≥50%的檢索詞以及頻繁一起出現的雙項、三項檢索詞分別進行統計匯總后,得出結果如表2所示:
其次,《王文》所述互聯網+的智慧服務平臺缺乏現實基礎。由于各高校檔案信息網站的系統兼容性以及檔案安全保密性等各方面因素,校際檔案館全面互聯注定難以實現。高校智慧檔案館作為智慧校園建設的組成部分而設計,目前全國尚缺乏統一的規劃和相應的技術標準,各高校智慧檔案館建設基本處于各行其是的狀態。可以預見,未來各高校智慧檔案館僅服務于本身智慧校園建設,無從溝通互聯,只可能變成一個個信息孤島。[16]
再次,《王文》強調智慧檔案館建成需要社會公眾的有序參與。但高校檔案館的主要受體是學校師生,用戶群體同質性高,因此高校智慧檔案館建設與社會公眾的參與并無太大關聯。提升服務質量的關鍵在于采集師生多元化的檔案利用行為數據,通過云計算技術對這些數據進行處理分析,實現信息的智慧預測,主動推送。
最后,《王文》指出,應當提升搜索引擎服務功能。目前大多數高校檔案館的查檔方式仍然是用戶提出需求,由檔案工作人員在電腦進行檢索。部分檔案館是由用戶個人在電腦自行檢索,但搜索機制仍局限于根據檢索詞和檔案正題名進行字段匹配,因此在查全率、查準率方面有時難以滿足用戶需求。
正如楊冬權先生指出的檔案館應以所有數據可檢索為前提,通過數據挖掘技術主動推送。因此,筆者認為,對于高校檔案館而言,相比優化搜索引擎,現階段最主要任務是腳踏實地做好檔案數字化建設及開放檔案全文數據化識別。[17]現階段絕不可好高騖遠,盲目跟風,急于籌建智慧型檔案館。[18]高校檔案館的當務之急是建成符合國家標準的高校數字檔案館,在此基礎上逐漸引入大數據、云計算技術,提升服務質量,步步為營,最終實現由數字檔案館向智慧檔案館的平穩過渡。
參考文獻:
[1][6][10][13]王楠.互聯網時代下的高校智慧型檔案館建設[J].檔案管理,2020(05): 67-68.
[2][11]楊來青,徐明君,鄒杰.檔案館未來發展的新前景:智慧檔案館[J].中國檔案,2013(02): 68-69.
[3]傅榮校,施蕊.論智慧城市背景下的智慧檔案館建設[J].浙江檔案,2015(05): 14-17.
[4]許桂清.對智慧檔案館的認識與探析[J].中國檔案,2014(06): 70-71.
[5]楊冬權:關于智慧檔案館發展的構想[EB/OL].https://mp.weixin.qq.com/s/OTO0e5Z5UjsuyyfnFinwqQ,2020-12-7
[7]楊來青.智慧檔案館是信息化發展的必然產物[J].中國檔案,2014(06): 64-66.
[8]國家檔案局.2019年度全國檔案行政管理部門和檔案館基本情況摘要[EB/OL].[2020-09-04].https://www.saac.gov.cn/daj/zhdt/202009/5ce902bafc3f490d99596d55c8c33954.shtml.
[9][15]王小健,劉延平.面向智慧城市的智慧檔案館建設[J].檔案與建設,2015(05): 16-20.
[12]王正媛,朱悅華.RFID技術運用于檔案實體管理可靠性研究[J].中國檔案,2016(10): 58-59.
[14]羅琳娜.智慧檔案館服務功能實現研究[J].檔案管理,2017(04):10-13.
[16]王素紅.對智慧檔案館建設和研究熱的冷思考[J].檔案學通訊,2015(04): 39-44.
[17]高旭,趙豪邁.我國智慧檔案館研究現狀與熱點的可視化分析[J].檔案管理,2017(02):34-36.
[18]師寶玉.檔案智能管理的特點與智能服務模式分析[J].檔案管理,2020(01):108-109.
(作者單位:上海理工大學檔案館 來稿日期:2021-01-11)