摘 要:重特大事件檔案專題知識庫整合國內重特大突發事件檔案資源,為公共決策部署及應急方案制定提供可靠的知識服務,能有效實現檔案的資政價值,為公共決策提供有力支撐。文章首先從公共決策需求分析入手,借助CIDOC-CRM模型構建檔案資源本體。其次,將檔案知識庫的內部框架分為數據獲取與處理層、知識組織與加工層及知識存儲層,將知識服務平臺功能分為知識管理模塊、知識檢索模塊、知識決策模塊和系統管理模塊。最后,以地震檔案為例,利用Microsoft Visual Studio作為開發工具,在ASP.NET平臺上構建地震專題知識庫,為公共決策提供智能化服務,實現地震檔案資源的價值增值。
關鍵詞:重特大事件檔案;知識庫;公共決策;本體理論;檔案資政
分類號:G270.7
Research on the Development of a Knowledge Base for Special Archives of Major Events for Public Decision-making: Taking Earthquake Archives as an Example
Tang Changle, Zhang Xiaoqing
( School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444 )
Abstract: The specialized knowledge base for archives of major and unexpected events integrates domestic resources for major and unexpected events archives, providing reliable knowledge services for public decision-making deployment and emergency plan formulation, effectively exerting the political value of archives, and providing strong support for public decision-making. First of all, this article starts with the analysis of public decision-making needs, and introduces the CIDOC-CRM model to construct an archival resource body. Secondly, this article divides the internal framework of the archive knowledge base into data acquisition and processing layer, knowledge organization and processing layer, and knowledge storage layer, and divides the functions of the knowledge service platform into knowledge management module, knowledge retrieval module, knowledge decision-making module, and system management module. Finally, taking earthquake archives as an example, by using Microsoft Visual Studio as a development tool, the construction and implementation of earthquake thematic knowledge base is implemented on the Asp.net, providing intelligent services for public decision-making and realizing the value added of earthquake archival resources.
Keywords: Archives of Major Events; Knowledge Base; Public Decision-making; Ontological Theory; Archival Administration
隨著我國經濟社會的快速發展,國內外政治、經濟、社會環境的復雜性及多變性要求在面對自然災害、事故災難、公共衛生事件等重特大突發事件時,決策者需要快速獲取準確、全面的信息以作出有效響應。檔案資源,尤其是那些記錄重特大事件的歷史檔案,成為決策者的重要參考。重特大事件檔案是黨和國家組織應對自然災害、事故災難、公共衛生事件、社會安全事件等突發事件所形成的具有保存價值的歷史記錄。2021年,中共中央辦公廳、國務院辦公廳印發《“十四五”全國檔案事業發展規劃》,強調各級檔案部門要深入挖掘檔案資源,及時、精準地為各級黨委和政府決策提供參考。[1]2022年,中共中央辦公廳、國務院辦公廳頒發的《關于加強重特大事件檔案工作的通知》強調,收集好、保管好、利用好重特大事件檔案,對于總結歷史經驗教訓、維護國家安全和社會公共利益、推進國家治理體系和治理能力現代化具有重要意義。[2]因此,面對重特大突發事件,如何從知識化角度出發,突破傳統的單一服務方式,運用信息技術拓寬檔案服務渠道,及時為公共決策提供有效的參考咨詢服務,已成為當前提升檔案資政水平的重要研究課題。
目前,國內關于檔案領域知識庫相關研究主要集中在:檔案知識庫構建原則及方法[3-4]、檔案知識庫理論模型[5-6]及面向知識服務[7]、面向政府決策[8-9]的檔案知識庫建設等主題。此外,一些學者對科研機構檔案知識庫[10]、突發事件檔案知識庫[11]、科技檔案知識庫[12]、高校檔案知識庫[13]等進行了探索??傮w來看,關于檔案知識庫的研究已有一定成果,但數量不多,尚未出現重特大事件檔案專題知識庫的相關研究,且理論研究偏多,缺少開發實例。因此,本文提出構建一個面向公共決策的重特大事件檔案知識庫,旨在通過本體理論的引入和信息技術手段的應用,提升檔案資源的利用效率,為決策者提供及時、準確的知識支持。
1 構建重特大事件檔案知識庫的價值闡釋
近年來,社會突發事件頻發,海量且碎片化的檔案資源難以滿足政府決策的需求,亟須整合重特大事件檔案資源,以知識服務的方式為公共決策提供支持。重特大事件檔案知識庫是以重特大事件檔案為基礎,利用先進的信息技術和知識管理方法,為公共決策提供知識服務的平臺。檔案自古以來就有著獨特的資政價值。因其來源真實可靠、內容全面,成為輔助公共決策的有效資源。重特大事件檔案知識庫的建設,不僅能夠充分凸顯檔案的資政功能,還能夠推動檔案事業的創新發展。
1.1 推動檔案整合共享,筑牢知識服務根基
重特大事件發生的時間和地域各異,各個檔案機構獨立保存相關檔案,這導致了檔案資源碎片化和分散化,不利于檔案知識的整合和共享。重特大事件檔案知識庫可以借助標準化和規范化的存儲方法,將不同部門和機構的檔案知識整合到統一的平臺中,將各種檔案資源以知識圖譜的形式進行組織和展示,使得不同利益相關者能夠更加便捷地訪問和利用這些資源。同時,政府和其他組織間跨部門和跨領域的協同合作與資源共享,不僅有助于提高檔案服務的質量和效率,還有助于推動檔案事業的可持續發展,為加快促進檔案知識服務打牢數字化根基。
1.2 創新檔案服務方式,激活資政服務引擎
傳統的以提供檔案信息服務為主的服務模式已經無法滿足當今社會的多樣化知識需求。檔案知識庫依托先進的信息技術和堅實的平臺,利用數據挖掘技術、知識關聯技術以及知識圖譜應用等,為用戶提供更廣泛、更深入的知識服務。通過知識的組織、分析和呈現,幫助用戶更好地理解和利用檔案資源。它不再是簡單的檔案信息提供,而是將檔案中的知識元素挖掘出來,以更豐富、更立體的方式呈現給用戶。這種方式可以滿足公共決策的多元化需求,促進檔案信息服務向檔案知識服務轉變。
1.3 聚焦公共決策需求,賦能數字政府建設
重特大事件檔案知識庫的建設和發展為公共決策部門提供豐富的歷史數據和知識支持,以決策需求為導向,為公共決策提供知識化、個性化服務。一方面,知識庫中的數據和信息可以為決策者提供全面、客觀的背景材料,幫助他們在面對重特大事件時作出更加科學、合理的決策。另一方面,通過構建重特大事件檔案知識庫,政府可以更加透明地展示工作成果和決策過程,接受社會監督。同時,重特大事件檔案知識庫可以為決策者提供責任追溯的依據,強化問責制,確保政府決策的科學性、合法性和合規性,也有助于政府更好地了解社會需求,優化政策制定和執行過程,提高政府治理效能。
2 重特大事件檔案知識庫總體框架設計
檔案知識服務是從用戶需求出發,通過對檔案資源價值的深度挖掘與整合,為用戶提供知識化服務的過程。因此,本文設計了檔案知識庫系統,總體框架見圖1。
2.1 公共決策需求分析
決策需求層主要是對公共決策的需求進行分析。按照決策的范圍可將其分為戰略決策、戰術決策及業務決策。
政府的戰略決策指調整組織的整體活動方向和內容,解決“干什么”的問題,是根本性決策,對檔案的需求主要是宏觀上的需求,包括決策所屬領域的政策法規、行業規范等;戰術決策指調整在既定方向和內容下的活動方式,解決“如何干”的問題,是執行性決策,對檔案的需求主要體現在借助檔案資源保障決策的高效執行;業務決策大多是重復發生的,具有一定確定性的程序化決策,是在日常工作中為提高服務公眾效率而作出的決策,對檔案的需求更具有針對性,如政府針對具體的鄉村文化振興進行統籌設計時,可以借助當地的特色非遺檔案資源進行分析,研究該鄉村文化遺產保護與開發的進展與具體操作。
2.2 知識庫邏輯框架設計
(1)數據獲取與處理層
數據獲取層也可以理解為檔案的資源層,主要利用人工獲取與自動獲取相結合的方式進行資源采集。人工獲取是指各級政府機關與重特大事件相關負責部門,將事件全過程的工作記錄、相關報道及應急方案等相關內容,移交檔案館后,由檔案人員進行分類與歸檔導入,以豐富檔案資源庫。自動獲取主要運用網絡爬蟲等信息技術,對重特大事件相關成因特點及新聞報道等進行數據抓取,以獲得多渠道數據,從多方面反映事件的真實情況。同時,對收集的數據進行處理,利用自動化工具或者人工清洗對原始檔案數據及網絡爬取的相關信息進行格式化與整理,將其轉換為可用于分析的數據。
(2)知識組織與加工層

知識組織與加工的目標是實現由“信息”到“知識”的轉變,該層是關系到整個檔案知識庫的核心層級,主要內容是以數據獲取層的檔案資源為數據來源,經過知識抽取、知識融合、本體構建與邏輯推理等,形成可供查詢、應用的知識單元。其中,知識抽取與知識融合是構建檔案本體的先決條件,建立規范的知識本體是最終目的。知識抽取主要對結構化、半結構化數據或非結構化數據進行實體識別、關系抽取及事件抽取,并基于此,構建檔案知識本體。檔案知識本體描述概念與概念之間的關系,通過定義核心類、屬性設置等規范流程進行構建與邏輯推理,為檔案知識應用奠定基礎。
(3)知識存儲層
知識存儲層主要將檔案資源本體導入數據庫進行儲存。通過利用檔案知識單元之間的語義關聯、規則設定以及多種關系,進行重新組織,使得原本零散、獨立的知識單元變得井然有序,構筑成一個系統化的知識網絡。通過知識網絡的結構,能夠清晰呈現各個檔案知識單元之間的復雜關系,并實現數據查詢和知識圖譜的直觀展示。此外,知識存儲層還具有一定的靈活性。當檔案知識庫中的數據或關系發生變化時,知識存儲層能夠根據新的信息重新組織知識網絡,確保檔案知識庫的實時性和準確性。
2.3 知識服務平臺功能設計
(1)知識管理模塊
知識管理模塊的構建與優化直接關系知識服務的效果和效率。知識管理模塊主要面向系統后端,由知識管理者負責對知識進行維護更新與存儲。這一模塊的設計與實現,旨在確保知識庫能夠為公共決策過程提供及時、準確、全面的知識輸入。因此,為了確保知識庫能夠有效地支持決策制定,保證知識庫的知識單元能夠與決策制定保持同步,知識管理者必須對知識庫進行知識單元的更新、修改和補充。其中,知識存儲功能是指創建資源索引并將索引數據保存到數據庫,主要包括資源存儲、數據標準制定及存儲支持的文件格式的管理。資源存儲涉及知識的分類、組織和存儲,要求知識管理者具備良好的組織和協調能力,確保知識資源的有序存儲。數據標準制定則是為了確保知識數據的準確性和一致性,知識管理者需要根據相關規范和標準,制定數據標準,并對知識數據進行審核和校對。存儲支持的文件格式的管理,則要求知識管理者熟悉各種文件格式,能夠根據實際需求選擇合適的文件格式進行知識存儲。
(2)知識檢索模塊
知識檢索模塊為用戶提供了一種高效、便捷的知識獲取途徑。知識檢索模塊主要分為兩種類型:知識單元檢索與知識專題導航檢索。其中,知識單元檢索是知識服務平臺的基礎功能,用戶通過關鍵詞檢索,可以快速獲取相關的知識。這種檢索方式簡單直觀,用戶只需輸入關鍵詞,系統便會返回與之相關的知識單元。知識專題導航檢索則是一種更為高級的檢索方式,它以導航式的形式呈現各種重特大突發事件。例如,可以按照主題不同,分為地震專題、洪災專題、醫療衛生專題等;也可以按照檔案時間線分為革命歷史時期、民國時期及新中國成立后等。通過專題的檢索,用戶可以完整地了解事件發生的起因、過程及采取的相應措施等。
(3)決策支持模塊
決策支持模塊主要功能是為用戶提供知識推送、應急方案專題及專家咨詢等服務。這些服務的目標是幫助用戶更好地理解和應用知識,為公共決策提供有力的支持。其中,知識推送主要依賴于用戶在進行知識查詢時留下的歷史查詢記錄。通過對這些歷史查詢記錄進行分析,結合用戶群體和個體畫像,利用傳感器、移動智能終端等情境感知工具,挖掘用戶的行為軌跡與高頻使用場景,創建動態化的用戶場景模型,從而動態地滿足用戶的需求。這種個性化的知識推送服務,能夠提高用戶的知識獲取效率,幫助用戶快速找到所需的知識資源。[14-15]應急方案專題是檔案知識庫的重要功能之一,主要分為應急方案案例庫與應急方案推薦服務。應急方案案例庫主要收集了各部門各地市級的一系列預警方案、處理方案等,旨在為用戶提供參考價值。應急方案推薦服務依賴于知識圖譜的知識推理功能,根據已有案例的發生原因、影響范圍等推出能采取何種措施,為制定應急方案提供現實依據。專家咨詢功能是用戶與專家對話的重要渠道,專家所在領域涉及地震研究、預警技術、政策制定、醫療安全等多個領域。通過與專家的對話,用戶可以獲得專業的知識和建議,為公共決策提供知識服務。這種個性化的專家咨詢服務,能夠幫助用戶更好地理解和應用知識,提高公共決策的質量和效率。
(4)系統管理模塊
系統管理模塊確保了平臺的穩定運行和安全性。系統管理模塊主要包括用戶管理與風險管理兩大功能。其中,用戶管理功能是系統管理模塊的基礎,它不僅包括決策部門的用戶,還包括專家用戶。用戶管理主要是對注冊的用戶進行身份審核及權限管理。身份審核是確保用戶身份真實性的重要環節,通過對用戶的身份信息進行核實,可以防止非法用戶進入系統。通過設置不同的權限,可以確保用戶只能訪問和查詢其有權訪問的知識資源,從而大幅度提高知識庫的安全性。風險管理功能是對檔案信息的安全管理,由于重特大事件檔案具有較高的保密性,風險管理顯得尤為重要。風險管理功能需要實時監控系統運作,防范信息泄露、病毒攻擊等安全問題。通過對系統進行實時監控,可以及時發現異常情況,并采取相應的措施進行處理,從而確保檔案信息的安全。此外,風險管理還包括對系統的備份與恢復功能,以防止數據丟失或損壞。[16]
3 重特大事件檔案知識庫構建實現路徑——以地震檔案為例
構建重特大事件專題知識庫是加強重特大事件檔案資源整合、促進檔案資源利用,提高應對重特大事件能力的有效途徑。由于重特大事件包含范圍廣泛,本文以地震檔案為例,初步構建地震檔案專題知識庫原型,汲取過往應對經驗,為今后針對地震等自然災害的公共決策提供知識服務。
3.1 數據獲取與處理
本文以河北、北京、四川、江蘇等34個省市數字檔案館為數據來源,查詢與地震相關的開放檔案,以“地震”“防震”“抗震”等為關鍵詞進行檢索,在剔除不相關數據后,共獲得76條開放檔案數據。收集的數據涉及抗震救災、社會援助、損失統計、地震測繪等內容,文種主要包括令、信函、電報、報告、呈等。
3.2 知識組織與加工
知識加工主要是構建檔案資源本體。常用本體構建方法有很多,鑒于斯坦福大學提出的“七步法”適用范圍更廣且流程更為完善,本研究采用七步法構建方法,借助Protégé工具以實現本體構建,并引入實例進行展示。
(1)確定本體的專業領域及范圍。此次構建本體的對象為地震檔案資源,由于目前此類檔案并未全部公開,因此,本研究進行實證研究的數據主要通過網絡數據庫檢索及相關網站信息查詢獲取,以便于有針對地構建本體。
(2)復用本體。本研究主要復用文化遺產領域通用的國際文獻工作委員會概念參考模型(International Committee Documentation-Conceptual Reference Model,CIDOC-CRM)及參考《中國檔案分類法》《中國檔案主題詞表》等完善地震檔案資源本體的分類層級體系。
(3)核心類的定義。該步驟主要是通過已有本體復用及自建的形式,列出地震檔案資源本體的相關術語及概念,將地震檔案資源本體核心類分為人物、事件、地震檔案資源實體、時間及地域。其中,人物類(E39_Actor )通過復用CIDOC-CRM模型進行構建,用以描述地震相關活動及事件中的所有參與者,并細分為個體與組織兩個子類,以區分具體的個體與組織集合;事件類(E5_Event)主要指記載的一切與地震相關的活動,如抗震救災、防震科普、災情監測、社會援助等;地震檔案資源實體類(E31_Document)主要用來表征具體的檔案資源,其下又設檔案題名、責任者、資源格式、語種、檔案號、檔案保管情況等子類;時間類(E52_Time_Span)表示歸檔時間、檔案保管年限及事件發生的具體時間或時間段;地域類( E53_Place)主要指地震發生、事件發生的地理位置,包括所屬行政區域、具體地理坐標等。
(4)定義類的屬性。根據上述設計的地震檔案資源本體類及其層級結構,通過復用CIDOC-CRM本體模型的部分屬性及新建屬性,實現對地震檔案資源本體類的屬性及其分面進行定義。屬性主要包括對象屬性(Object Property)及數據屬性(Data Property)。對象屬性是用來描述不同實體間的關系,數據屬性用來揭示實體與數據間的關系。根據前文確定的類的種類,以及對CIDOC-CRM概念參考模型的復用,確定地震檔案資源本體模型包含31個屬性,其中13個對象屬性,18個數據屬性,詳見圖2。
(5)實例展示。本體的實例化是對本體模型的具體應用,地震檔案知識的組織不僅是創建一個本體模型,還要表達地震檔案內豐富的知識及相互間的動態關系。根據上文設計的本體模型,結合收集到的處理過的地震檔案資源數據,設計的本體概念模型如圖3所示。
3.3 知識存儲
將上述檔案知識單元存儲在MySQL數據庫與Neo4j數據庫中。MySQL數據庫是關系型數據庫,以行和列的形式存儲數據,可以實現檔案知識的檢索與關聯。Neo4j圖數據庫使用圖相關的概念來描述數據模型,把數據保存為圖中的節點以及節點之間的關系,可以解決關系型數據庫難以克服的問題,直接實現知識圖譜可視化,為后續知識服務提供多樣化檢索結果呈現方式。
3.4 知識服務平臺展示


知識服務平臺展示主要以地震檔案專題知識庫的方式呈現。地震檔案專題知識庫系統旨在滿足不同用戶的知識需求,為用戶科學決策提供知識服務。地震檔案專題知識庫選擇Microsoft Visual Studio 2008作為開發工具,采用B/S結構,在ASP.NET平臺上使用C#技術開發程序的關鍵代碼,后臺數據庫使用MySQL數據庫與Neo4j圖數據庫,應用服務器用IIS最終實現一套功能完備的地震檔案專題網站。該網站首頁上端有知識查詢控件,可直接進行相關知識的查詢,向下依次是導航分類與大地震專題。導航主要分為政策方針、應急方案、知識可視化、防震知識、專家咨詢、地震數據與線上展廳等專題,如圖4所示。
政策方針專題主要收納了各級別的防震減災條例、災后重建條例等相關法律法規,為用戶提供相關政策及規范的查詢瀏覽。應急方案專題主要分為應急方案案例庫與應急方案推薦庫。案例庫主要收集了各地震事件中采取的應急預警方案,可以為用戶提供案例分析及借鑒。應急方案推薦庫主要根據事件級別、地震起因等進行知識推理,并以此推薦出科學的應急方案。知識可視化專題依賴Cypher語句對Neo4j圖數據庫進行查詢,并輸出檢索結果的可視化圖譜。防震知識專題主要收集了地震相關的問題,并基于此進行相關知識科普。地震數據專題則是鏈接到中國地震臺網,可隨時查詢地震相關數據。專家咨詢專題的關鍵是要構建專家庫,包括地質研究、政策法規及醫療等各領域的專家,為決策制定提供咨詢與建議。線上展廳專題則采納實景虛擬的形式,打造數字展廳,實現遠程參觀,發揮知識庫的文化教育功能。
*本文系國家社科基金青年項目“面向數字政府建設的數字檔案資源優化配置研究”(項目編號:23CTQ03)階段性研究成果。
作者貢獻說明
唐長樂:提出論文選題,設計論文框架,撰寫審定論文;張曉慶:收集素材、數據,撰寫修改論文。
注釋與參考文獻
[1]中辦國辦印發《“十四五”全國檔案事業發展規劃》[EB/OL].[2023-09-06].https://www. saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb5 5c890762868683.shtml.
[2]中共中央辦公廳 國務院辦公廳印發《關于加強重特大事件檔案工作的通知》[EB/OL].[2023-09-06].http://news.youth.cn/gn/202212/ t20221212_14191156.htm.
[3]孟歆.結合知識管理淺議檔案知識庫的建立[J].蘭臺世界,2007(24):44-45.
[4]徐擁軍.“檔案知識管理”系統構建的原則與策略[J].檔案學通訊,2009(2):58-62.
[5]黃丹俞,錢智勇,董建成.基于本體論的電子健康檔案知識庫構建初探[J].中國數字醫學,2011(4):14-17.
[6]李寶玲,李珂,郭立鑫.面向深度利用的歷史檔案專題知識庫構建研究——以中福公司檔案為例[J].檔案管理,2023(2):52-55.
[7]李澤鋒,焦浩,葉丹云.面向知識服務的干部人事檔案知識庫構建初探[J].浙江檔案,2023(6):42-45.
[8]魏扣.面向決策的檔案知識庫構建研究[J].檔案學通訊,2014(5):63-67.
[9]魏扣,郝琦,張斌.面向政府決策的檔案知識庫構建需求分析[J].檔案學研究,2016(5):32-35.
[10]周楠.面向科研機構決策的檔案知識庫構建研究[J].資源信息與工程,2019(3):173-175.
[11][16]耿志杰,陳佳慧.突發事件檔案知識庫構建設想[J].檔案學通訊,2021(3):63-70.
[12]崔鑫.科技檔案知識庫運行動力機制研究[J].南京航空航天大學學報(社會科學版),2018(4):35-39,50.
[13]李琴,左瑞玲,張海蕓,等.高校機構知識庫在學術檔案管理中的應用[J].蘭臺世界,2021(3):96-99.
[14]錢毅. 基于U型曲線重新審視檔案信息化工作 [J]. 檔案與建設, 2023(4): 4-8.
[15]陸素梅.基于領域本體的數字圖書館知識聚合服務研究[J].山東圖書館學刊,2021(3):71-75.
(責任編輯:邵澍赟)