周林興 謝林蓉
摘 要:通過文本內容分析法對檔案數據治理主體、質量治理、安全治理、開發治理、共享治理、治理體系、治理策略等7個主題進行解析,歸納國內外檔案數據治理研究現狀和進展??偨Y發現國內外檔案數據治理研究總體處于起步階段,因此從研究方向、研究視角、研究對象、研究框架、研究性能等方面對各主題薄弱之處提出完善思路,做出深化檔案數據治理研究內容、豐富檔案數據治理研究方法以及強化檔案數據治理對實踐的指導性等未來研究展望,以期為檔案數據治理研究成果和實踐發展提供借鑒。
關鍵詞:檔案;檔案數據;檔案數據治理
分類號:G270.7
A Review of Archival Data Governance at Home and Abroad
Zhou Linxing, Xie Linrong
( School of Cultural Heritage and Information Management of Shanghai University, Shanghai 200444 )
Abstract: Through text content analysis, this paper analyzes the seven subjects of archival data governance, including the main body of archival data governance, quality governance, security governance, development governance, shared governance, governance system and governance strategy, and summarizes the research status and progress of archival data governance at home and abroad. It is concluded that research on archival data governance at home and abroad is generally in its infancy. Therefore, suggestions are put forward to improve the weaknesses of each subject from the aspects of research direction, research perspective, research object, research framework and research performance. In order to provide reference for research results and practice development of archival data governance, the paper puts forward future research prospects such as deepening the research content, enriching research methods and strengthening the guidance of archival data governance to practice.
Keywords: Archive; Archival Data; Archival Data Governance
1 引 言
數字信息技術發展日新月異,數據價值愈加凸顯,為充分釋放數據價值,各國陸續展開數據治理行動。檔案事業作為國家治理體系的重要組成部分,必須順應這一趨勢,做出新的布局規劃,以檔案數據治理全面推動檔案治理體系、資源體系、利用體系和安全體系的建設。[1]
為更全面地了解國內外檔案數據治理研究情況,采用 SU=((“檔案數據”+“治理”)OR(“檔案數據治理”))OR FT=(“檔案數據治理”)、主題:((“檔案數據”)and(“治理”))or(“檔案數據治理”)(萬方),并將“file data”或“record data”或“archiv* data”與“governance”組合,作為主題詞或標題詞,對中國知網全文數據庫(CNKI)、萬方數據知識服務平臺、Web of Science、Springer LINK、Wiley 等數據庫進行網絡資源調查。起始時間不限,截至2021年11月10日,共獲得50篇有效中文文獻,32篇外文文獻。所獲文獻主要集中在主體、質量、安全、開發、共享、體系、策略等7個方面,因此文章選取這些主題進行分析,以總結檔案數據治理經驗。
2 檔案數據治理研究主題分析
2.1 檔案數據治理主體
該主題研究重點關注治理主體的權責重構和各類檔案數據主體的協調治理舉措。在互聯網用戶擁有溝通和決策參與權、海量數據沖擊以及治理格局形成的情境下,主體多元化特征凸顯。[2]檔案部門承擔統一領導和協調分權的職責,[3]應該分權、賦權,主動建立數據治理格局中多主體協同關系。[4]各數據治理主體之間應強化協調效應,通過現象驅動方法構建主體數據訪問關系,[5]聚焦核心主體,協調其在采集、評估和研究過程中的職責關系,[6]統籌決策者、管理者、使用者和志愿者的數據需求,[7]建立區域聯盟發展模式,[8]努力強化踐行共同體理念。[9]
可見,檔案治理主體正在積極順應數字化和數據化的主流發展趨勢,不斷將檔案治理納入國家治理大格局、大體系和大框架之中,明確各方參與主體,樹立多元協同理念,并從決策、管理、實施、協調、利用等層面入手,進行了主體權力責任和職能的分工。
2.2 檔案數據質量治理
該主題研究主要涉及治理內容、各維度治理建議與各類檔案數據治理重點。在治理內容方面,提出了真實全面、安全可靠、系統可用等性能指標以及從生成到利用的過程質量。[10]在治理層次方面,上層建筑維度亟待建立能夠包容多源異構檔案數據的工作機制,制定相關制度規范,確立評估標準,設定技術保障系統;[11]基礎設施維度需要融合人工智能,運用模式識別、機器學習、自然語言處理等技術,[12]把控過程質量。[13]在各類檔案數據治理重點方面,針對電子健康檔案數據,將完整性、正確性、一致性、合理性、時效性[14]、可獲得性、合理性[15]納入了評估框架;針對企業檔案數據可能存在的冗余等問題,[16]提出需構建整體性檢測框架,進行階段性分析和管控。[17]
可見,檔案數據質量治理依然基于傳統宏觀視角,以制度、機制、規范和技術等為切入點。未來可以從政府、企業、醫療、教育領域汲取經驗,綜合考慮機構、平臺和用戶需求,劃定系統全面的質量評價標準,選定智能技術并建立數據試驗模型。
2.3 檔案數據安全治理
該主題研究主要圍繞概念界定、現代技術應用、重點工作環節以及各類檔案數據安全治理實踐。在概念解讀方面,檔案數據安全治理是指檔案機構對檔案數據實施專業管控,維護其靜態和動態安全,有效實現檔案數據價值。[18]在新技術融合方面,智能技術和手段的應用存在數據獲取缺乏身份認證和監審等問題,[19]為此可以設計加密系統,做好用戶審計和追蹤,簡化和精確元信息導入,利用密文檢索和調閱等技術。[20]在重點工作環節方面,有學者提出要改善備份機構的層級設立,深化備份業務;[21]還可以引入能力成熟度模型,不斷提升檔案數據安全治理標準和能力。[22]在各類檔案數據安全治理實踐方面,有學者研究電子郵件檔案數據賬戶行為模型和挖掘分析系統;[23]還有學者研究制造數據讀取器的測試結果,利用波長技術重組數據集,創造安全加密、數據壓縮和簡單恢復功能等。[24]
可見,汲取計算機等相關學科經驗,有針對性地設計研究方案和模型,對于改善檔案數據安全治理成效具有很大價值。未來研究需繼續緊跟數字化和智能化研究導向,并逐步提高與實踐項目的聯系緊密性和治理戰略的普適性。
2.4 檔案數據開發治理
該主題研究主要涉及意義、理念方向、開發模式和方案制定。在開發意義方面,研究指出檔案數據開發能夠幫助國家和組織應對信息技術革命對政治、經濟、文化和社會等各方面帶來的影響。[25]在理念方向上,指出必須樹立主動輸出檔案數據的開放理念、注重挖掘整合的檔案理念以及關注價值開發的服務理念。[26]明確創新驅動、個性開發治理方向,強化隊伍、館藏、建筑和技術的開發利用。[27]在開發模式方面,提出需要探索新型模式,建立開發者之間的協同信任,創造多元治理結構,并強化利益平衡和成果融合。[28]在開發方案上,提出應結合文檔檢索和分類方法、[29]企業模式和技術創新[30]等領域研究成果,更進一步實現開發價值和效益。
可見,現有研究對檔案數據開發意義的揭示更多停留在信息社會大背景層面,尚未能細化開發價值,同時開發模型的建立缺乏與新技術的深度融合。
2.5 檔案數據共享治理
該主題研究主要基于數字記憶、區塊鏈技術和實踐經驗三個視角,認為檔案數據是數字化形態的新型檔案資源,[31]既參與功能記憶的構建,又是存儲記憶的構成。[32]意識到區塊鏈技術的去中心化、共識機制、多鏈配合等功能契合檔案數據共享需求,[33]能有效應用于公共服務領域檔案治理。[34]此外,有學者以英國NHS健康檔案數據為例解析了政府行政檔案數據共享中的信任平衡抽象系統,指出了公眾信任建立方法,[35]從需求導向、技術采納和群體合作三方面構建了共享實施方案。[36]
可見,檔案數據共享治理研究既涉及學科前沿理論視域,又兼顧國家和社會有關實踐探索。但各視角下的文獻數量較少,內容比較單一,需加強現有研究深度,結合相關學科理論,尋找共享治理新視域。
2.6 檔案數據治理體系
該主題研究主要涵蓋治理體系建設的必要性、能力體系的構建和全局思維的培養。在體系建立必要性方面,提出有利于協調治理要素,明確目標導向、標準規范、范式機制和服務模式。[37]在能力體系構建方面,提出可以分解治理能力因素,構建宏觀和微觀能力結構體系,提升統籌協調、制度建設、組織管理以及開放處置等治理能力。[38]在全局思維培養方面,提出需統籌兼顧國家數據資源體系構建和文化強國建設需求。[39]同時,檔案數據治理應構建“生態層-基礎層-數據層-應用層”體系,[40]設計存檔收集、[41]聚合評估[42]等系統框架,形成完整的治理體系。
可見,檔案數據治理體系研究邏輯清晰,從上層機制出發,逐步聚焦數據處理流程。但普適架構研究數量較少,研究方向較為局限。未來可從數據源管控和數據長期保管需求出發,進一步深化理論探索。
2.7 檔案數據治理策略
該主題研究主要從加強法治化、制度化、科學化、專業化與協同化五個方向出發提出對應策略。首先,要強化法治建設。做好戰略規劃和布局,制定法律法規,及時補充、更新、細化有關規范標準和工作實施條例。[43]其次,要建立制度模式。規制清單制度,序化職能制度。[44]再次,要優化環節治理。利用人工智能技術記錄和識別數據并應用于服務模塊和接口。[45]此外,要創新平臺設計。以提高工作效率,降低協作難度,增強風險保障、提升用戶體驗為目標,突出重要節點,制定數據結構模板,選擇適用技術。[46]最后,要重視建設治理隊伍。明確治理人員梯隊及其職能分工,形成協同規范的檔案數據治理組織格局。[47]
可見,檔案數據治理策略研究內容較為集中,大多以頂層-中層-基層為線索分析可行路徑。未來有必要繼續以相關主體和全局過程為對象進行策略研究,形成高包容性、高借鑒性和高規范性的研究成果。
3 研究展望
3.1 深化檔案數據治理研究內容
檔案數據治理研究起步時間較晚,成果并不成熟,需要進一步深化研究內容。同時,提升理論研究層次,融合國內外治理戰略和實踐特色,準確闡釋內涵、目標、價值、特征等基礎概念,深化體制機制和模式體系的制定和設計研究。此外,還要在適度借鑒國外經驗的基礎上,結合自身國家制度和治理實踐的特征需求,平衡研究方向。
3.2 豐富檔案數據治理研究方法
現有成果所用研究方法比較單一,需要豐富和加強研究方法的選擇和運用。首先,定性研究需明晰治理體制、治理模式、實現機制、建設體系和提升路徑間的關系,建立完整的檔案數據治理框架。其次,需增加定量研究方法的使用,提高研究成果的可靠性和科學性。最后,需擴展運用比較研究法。對比分析不同國家、不同領域檔案數據治理現狀,總結優勢和經驗,充實研究成果。
3.3 強化檔案數據治理研究指導性
檔案數據治理研究的重要目標之一是服務檔案數據治理實踐,因此必須強化研究對實踐的指導作用。首先,要充分發揮實證案例的經驗價值。研究相關機構和地區的檔案數據目錄、數據中心、數據共享利用系統平臺建設情況,實現實踐經驗成果化。其次,要契合國家治理理念和社會經濟發展需求。進一步做好頂層設計研究,規范法律法規和政策制度,制定合理科學的組織方案。最后,要突破新型基礎設施和技術的應用瓶頸。密切關注新技術的變革,尋找其與檔案數據治理的契合點,使研究成果可以更好地轉變為技術應用,以提升檔案數據開發、共享和利用水平。
*本文系國家社科基金一般項目“國家大數據戰略背景下檔案數據質量優化控制研究”(項目編號:21BTQ016)階段性研究成果。
注釋與參考文獻
[1]中華人民共和國國家檔案局.中辦國辦印發《“十四五”全國檔案事業發展規劃》[EB/OL].[2021-06-09].https:// www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb5 5c890762868683.shtml.
[2]張衛東,張樂瑩,趙紅穎.我國檔案治理研究內容與特征識別[J].情報科學,2021,39(08):60-66+85.
[3]何玉顏.檔案部門參與政府大數據治理的路徑研究[J].浙江檔案,2018(08):23-25.
[4]劉越男.數據治理:大數據時代檔案管理的新視角和新職能[J].檔案學研究,2020(05):50-57.
[5]Cotteleer,M J,Wan,X.Does the Starting Point Matter The Literature-Driven and the Phenomenon-Driven Approaches of Using Corporate Archival Data in Academic Research[J]. Journal of Business Logistics,2016(37):26-33.
[6]Luckey,J W,Broughton,A,Sorensen,J E.Archival data in program evaluation and policy analysis[J].Evaluation and program planning,1982(05):319-26.
[7]戰英.高校檔案治理體系與治理能力建設困境和提升途徑研究[J].山東檔案,2020(04):10-12+60.
[8]李振華,陳夢玲.高校檔案數據治理的區域聯盟發展模式研究[J].檔案管理,2021(02):44-45.
[9]張玉昭.新冠疫情防控背景下檔案數據治理效能提升策略研究[J].山東檔案,2021(03):10-13.
[10][37]金波,楊鵬.大數據時代檔案數據治理研究[J].檔案學研究,2020(04):29-37.
[11]龍飛斐.多源異構的城建檔案數據質量管理的探討[J].城建檔案,2017(07):13-14.
[12]陳慧,羅慧玉,陳暉.檔案數據質量要素識別及智能化保障探究——以昆柳龍直流工程項目檔案為例[J].檔案學通訊,2021(05):49-57.
[13]陳慧,羅慧玉,張凱,等.AI賦能檔案:AI技術在檔案管理中的賦能模式探究[J].山西檔案,2020(4):76-83+131.
[14]Weiskopf N G, Weng C.Methods and dimensions of electronic health record data quality assessment:enabling reuse for clinical research[J].Journal of the American Medical Informatics Association,2013,20(1):144-151.
[15]Chan K S, Fowles J B, Weiner J P.Review:Electronic Health Records and the Reliabilityand Validity of Quality Measures:A Review of the Literature[J].Medical Care Research and Review,2010,67(5):503-527.
[16]張寧.主數據驅動視角下的企業檔案數據資產管理[J].檔案學研究,2019(06):47-52.
[17]楊晶晶.企業檔案數據質量管理若干要務[J].浙江檔案,2021(01):60-61.
[18]金波,楊鵬.大數據時代檔案數據安全治理策略探析[J].情報科學,2020,38(09):30-35.
[19]李洪湖.檔案數據安全存儲及智慧監管平臺建設實踐分析[J].浙江檔案,2017(02):58.
[20]劉娜.檔案數據加密信息安全系統設計與實現[J].微型電腦應用,2021,37(06):136-138+142.
[21]許桂清.電子檔案異地異質備份現狀及應對[J].檔案學研究,2018(01):82-88.
[22]周林興,韓永繼.檔案數據安全治理能力成熟度模型構建研究[J].中國檔案,2020(12):79.
[23]Stolfo,S J,Hershkop,S,Wang,K,Nimeskern,O,Hu,CW.A behavior-based approach to securing email systems[C]. Lecture Notes in Computer Science,2003(2776):57-81.
[24]Solomon,R J,Buchman,M,Rosenthal,E.Test Data Reader for Write Once, Read Forever(WORF)Interference Spectra Archival Media[C].13th Annual IS&T Archiving Conference 2016,2016:61-65.
[25]閻曉峰.大數據與檔案資源開發利用[J].中國檔案,2015(11):16-19.
[26]陳研.基于大數據時代的檔案價值及其開發利用[J].蘭臺世界,2018(06):84-86.
[27]曹筠慧,管先海,孫洋洋.基于大數據時代的檔案價值及其開發利用探究[J].檔案管理,2017(01):27-29.
[28]展倩慧.協同治理視域下檔案數據開發模式探究[J].檔案與建設,2020(04):33-37.
[29]Woodward,N J,Xu,W J,Norsworthy,K.On Automatically Tagging Web Documents from Examples[C].35th ACM SIGIR Annual International Conference on Research and Development in Information Retrieval,2012:1111-1112.
[30]Kaulio,M,Thoren,K,Rohrbeck,R.Double ambidexterity:How a Telco incumbent used business-model and technology innovations to successfully respond to three major disruptions[J].Creativity and Innovation Mangement,2017(26):339-352.
[31]倪代川,金波.數字記憶視域下檔案數據治理探析[J].檔案管理,2021(01):41-44.
[32]馮惠玲.數字記憶:文化記憶的數字宮殿[J].中國圖書館學報,2020(03):4-16.
[33]楊鵬.基于區塊鏈技術的檔案數據共享策略探究[J].山西檔案,2020(04):105-112.
[34]Swan M.Blockchain:blueprint for a new economy[M]. USA:O’Reilly Media Inc,2015:35.
[35]羅亞利.國外政府行政檔案數據共享中的信任平衡研究——以英國NHS健康數據為例[J].蘭臺世界,2021(08):47-50+54.
[36]張東營.美國國家檔案與文件署的數據資源整合與共享的經驗與啟示[D].湘潭大學,2020:11-12.
[38]常大偉,潘娜.檔案數據治理能力的結構體系與建設路徑[J].浙江檔案,2020(02):27-29.
[39]朱建邦,王巧玲,謝永憲.國家治理時代我國檔案資源整體治理體系構建研究[J].檔案學研究,2021(02):20-25.
[40]陳艷.我國省級檔案數據治理體系框架構建研究[D].山東大學,2020:49-50.
[41]Smith,B L,Venkatanarayana,R.Usage analysis of firstgeneration intelligent transportation systems data archive-Lessons learned in development of novel information technology application[C].85th Annual Meeting of the Transportation-ResearchBoard,2006(1972):54-59.
[42]Smith,B L,Babiceanu,S.Investigation of extraction,transformation,and loading techniques for traffic data warehouses[C].83rd Annual Meeting of the Transportation-ResearchBoard,2004(1879):9-16.
[43]劉璐瑤,曹航.電子健康檔案數據治理發展方向分析[J].北京檔案,2021(06):14-19.
[44]王鑫.基于MVC模式下全生命周期中的企業檔案數據治理研究[J].黑龍江檔案,2020(05):104.
[45]Intaek, Kim, An, Dae Jin, Rieh, Hae-young. Intelligent Records and Archives Management That Applies Artificial Intelligence[J].Journal of Korean Society of Archives and Records Management,2017(17):225-250.
[46]方嘉昕.數字化轉型企業的固定資產投資項目檔案數據治理策略研究[J].機電兵船檔案,2021(01):59-61.
[47]付博.開放大學數字圖書館數據治理探析[J].廣西廣播電視大學學報.2019(1):81-85.