周 毅
(蘇州大學社會學院,江蘇蘇州,215123)
黨的十九屆四中全會首次將數據與勞動、土地、知識、技術和管理并列作為重要的生產要素。2020年中共中央、國務院《關于構建更加完善的要素市場化配置體制機制的意見》和《關于新時代加快完善社會主義市場經濟體制的意見》均強調要“培育和發展數據要素市場”。2021年1月中共中央、國務院印發的《建設高標準市場體系行動方案》指出要加快研究制定培育數據要素市場的意見,推動數據資源開發利用。2021年6月全國人大常委會公布《中華人民共和國數據安全法》(以下簡稱“《數據安全法》”),對規范數據處理活動,保障數據安全,促進數據開發利用等作出了明確規定。2022年1月國務院《要素市場化配置綜合改革試點總體方案》提出要積極探索政府數據授權運營,穩妥探索數據資產化服務,促進商業數據流通、跨區域數據互聯、政企數據融合應用。2022年12月中共中央、國務院發布《關于構建數據基礎制度更好發揮數據要素作用的意見》,對數據產權制度、數據交易流通制度等作出了原則性規定。
在上述重要法律法規和政策文件陸續發布的背景下,應當將檔案數據治理放在國家數字化戰略和數據治理體系中來謀劃發展,進一步明確檔案數據治理在數據治理體系中的功能,深入挖掘檔案數據價值和開發檔案數據產品,充分發揮檔案數據對數字經濟、數字政府和數字社會的賦能作用。這是增強數字化發展中檔案機構話語權的基礎,也是避免檔案機構被邊緣化的必然選擇。
近年來國內外圍繞檔案數據治理問題做了一些有益的探索[1],研究內容集中在檔案數據治理的涵義與要素、檔案數據治理主體、檔案數據質量治理[2]、檔案數據安全治理[3]、檔案數據共享治理、檔案數據治理體系[4]、檔案數據治理能力建設[5]和檔案數據治理與檔案治理的關系[6]等方面。金波等認為檔案數據治理是檔案部門、社會組織和公民個人等多個主體協同合作,基于一定的行動規則,共同對檔案事務進行科學、規范管理,實現檔案領域善治的活動和過程。檔案數據治理體系可以從檔案數據質量控制、整合集成、共享利用、安全保障與運行機制等方面進行構建。[7]李宗富等認為檔案數據治理包括對檔案數據生態的治理、對檔案數據管理的治理和對檔案數據的管理三個不同層面。[8]趙躍等認為目前關于檔案數據治理,其內涵、意義、目標、要素、檔案數據治理框架及其與檔案治理的聯系與區別等都不甚清晰。[9]楊茜茜將檔案數據治理內涵概括為三種類型,即檔案部門開展檔案數據的治理、檔案部門參與總體數據治理和多主體共同開展檔案數據的治理。[10]從總體上看,目前學界關于檔案數據治理、檔案數據治理體系的基本內涵、構成內容等已經形成了初步認識,但有關研究尚未充分揭示出檔案數據治理的層次性及其應用方向,檔案數據治理與國家數據治理體系構建的關系等基本問題仍需進一步明確。因此,全面厘清檔案數據治理的多重認識維度及其價值就成為解決相關理論與實踐問題的基礎。
結合檔案數據長遠安全保存、開放共享與開發利用的性質要求,確定檔案數據治理內涵與外延是構建檔案數據治理體系的基本需求和前提條件。
檔案數據治理是以安全與發展為基本要求,由多主體參與、多要素構成和多機制運行的過程[11],其目標是將檔案數據治理融入數據治理體系,逐步實現檔案語義化、知識化和智慧化的服務,實現檔案數據對數字經濟、數字政府和數字社會的賦能。因此,在對檔案數據治理內涵與外延的理解上可以從“對檔案數據開展治理”“依靠檔案數據開展治理”和“圍繞檔案數據實施治理”三個維度分別展開。
這是檔案數據治理的核心維度,重點要回答究竟應將哪些檔案數據對象納入數據治理體系范圍,并如何規范檔案數據治理流程、如何更好地促進數據流通利用和如何保障數據安全。
從可以納入數據資源體系的具體對象看,檔案數據有兩類:一是數據形態的檔案[12],二是具備檔案屬性的數據[13]。隨著信息技術的發展,電子政務內網、辦公自動化系統和有關業務系統的普遍應用,更多的文件與檔案都是以數字形態出現,電子檔案單套制管理逐步具備了基本條件。這表明,近年來數據形態的檔案已經成為增量的檔案主體。數據形態的檔案是存量檔案數字化成果和增量電子檔案的統稱,但這還不是全部意義上的檔案數據。
具備檔案屬性的數據是指在社會活動中具有長遠保存價值但目前尚未納入檔案部門管理體系之中的相關數據。這些數據主要有:一是各類專題或特色基礎數據庫、公共數據庫和開放類公共數據,例如人口、法人、自然資源和空間地理、電子證照、社會信用等基礎庫、索引庫和中間庫,以及公共數據共享開放平臺上的共享與開放數據目錄和開放數據等;二是網絡信息或網頁數據、自媒體信息或數據、政務微博、政務微信、公務郵箱等平臺形成的數據或電子文件等。目前雖然在理論中已經不同程度地認識到這些具備檔案屬性的數據價值,但在實踐中較少有檔案部門將各類基礎數據庫、平臺運行數據等進行有效歸檔。當前已經開展網絡信息或數據歸檔工作的單位比例十分有限,已歸檔單位網絡信息或數據的數量、來源與類型及其所采取的歸檔策略等也有較大差異。[14]這表明,從認識水平、技術能力、保障條件和管理策略上全面推動檔案部門將具備檔案屬性的數據納入數據治理框架已經成為一個亟待解決的問題。
規范檔案數據治理流程主要包括建立可靠業務鏈、可信處理鏈、可控服務鏈和可溯源安全鏈??煽繕I務鏈是指針對傳統業務檔案、文書檔案和專業檔案等進行數字化和數據化的處理過程,以及將公文系統、業務系統和相關數據平臺上不同類型的檔案數據實現單套管理;可信處理鏈是指檔案室和檔案館按照電子文件單套制歸檔和電子檔案單套制管理要求進行電子文件與電子檔案的合規性、合法性等審查,完成對數據封裝、格式轉換和檔案保真等處理過程;可控服務鏈是指立檔單位應制訂檔案數據共享范圍清單、檔案館應制定檔案數據開放清單,使檔案數據共享與開放服務的數量、范圍、安全要求等符合《檔案法》《數據安全法》等法律法規的規定;可溯源安全鏈是指從文件與檔案管理全業務流程上對有關主體的數據處理活動進行記錄,對有條件開放與不開放的檔案數據進行安全控制,采取相關安全技術手段保障檔案數據的可讀、可信和可用。
推動檔案數據與相關數據的協同治理,實現不同類型數據融合也是規范檔案數據治理的應有之義。檔案數據與相關數據的協同治理不僅體現在實現檔案數據治理與文化數字化項目和數字記憶項目的協同發展上,而且體現在實現檔案數據與其他數據內容的融合開發應用上。它不僅是對檔案數據實體(或“物”)與其他相關數據的協同治理,而且是更加突出了檔案數據與相關數據內容的融合開發。推動檔案數據與相關數據內容的融合開發,重點是應用語義網、機器學習等技術,對檔案數字化成果進行智能標引、深度知識挖掘和語義組織,實現不同年代、不同類型、不同來源數據資源的多維知識內容關聯和可視化展示;將文本挖掘、地理信息系統、關聯技術、文本可視化等數字技術應用于數據資源庫建設,加強對檔案數據和各類文化資源數據的關聯挖掘與增值開發。這個過程是檔案數據治理在數字化與數據化基礎上向語義化、知識化和智慧化服務升級的過程,也體現了檔案數據治理從以“安全管護”為中心向以“賦能應用”為中心的變化。
依靠檔案數據開展治理,就是應重視以檔案數據為基礎促進數字經濟、數字政府和數字社會等發展目標的實現,研究如何發揮檔案數據在數字經濟、數字政府和數字社會發展中的作用,研究如何開發出更多檔案數據與相關數據融合應用的具體場景。
檔案數據與其他數據一樣都是重要的生產要素,它是賦能數字經濟發展的重要基礎。進一步激活檔案數據要素的價值,使其實現從原始數據的相對靜態形式到數據增值的動態形式轉型,是推動數字產業化和產業數字化,特別是培育數據服務產業,軟化數字經濟內部結構的關鍵一步。通過檔案數據與相關數據的融合開發應用,可以創新數據產品與數據服務,加速培育壯大一批數字經濟的新業態、新模式,從而使檔案數據與相關數據的融合開發應用成為數字經濟發展的重要增量。
檔案數據是賦能數字社會建設的重要保障。數字技術深度融入生產生活,正在改變社會交往方式、社會組織方式和社會運行方式。隨著數字支付、數字商業、數字網絡、數字媒體等逐漸成為生活工作的常態,記錄數字社會與數字生活的新場景,保證數字社會與生活的可再現,成為了檔案數據治理的重要任務。檔案數據不僅來源于數字社會建設的過程,而且也為數字社會的新發展提供基礎性數據?;橐?、電子證照、社會信用、城市建設、醫療健康等檔案數據庫將為推動各類社會服務的線上線下全面協同和構筑全民暢享的數字生活提供重要保障。
檔案數據是賦能數字政府建設的重要條件。以電子文件前端控制與后端進館選擇等為基礎,依托公文系統、業務系統、專門數據平臺和互聯網平臺等,對不同類型檔案數據進行規范處理,將檔案數據納入政務云、檔案數據存儲中心或相關數據戰略備份中心等進行安全管理,探索將檔案管理部門作為公共數據共享與開放節點的可行性,從而為數字政府建設筑牢“數字底座”貢獻檔案數據的力量。
“圍繞檔案數據實施治理”是指應加強公文系統、業務系統、檔案管理系統、數字檔案室與數字檔案館平臺等的全面數字化改造建設,做好檔案數據存儲中心、電子檔案戰略備份中心、檔案數據算力規劃、檔案開發利用算法及其語料庫建設等數字新基建,實現檔案工作數字化的全面條件保障等。
隨著“網上辦”“掌上辦”等多種類型數字應用場景項目的開發應用,檔案數據歸檔或接收系統等管理基礎設施建設面臨新要求。[15]雖然在2016年至2020年期間,國家檔案局已在黨政機關政務服務事項單套歸檔、企業主營業務系統文件電子化流轉、電子發票電子化報銷入賬歸檔、建設項目電子文件歸檔四個方向開展了電子文件單套歸檔試點,也總結了有效且可復用的技術路線、管理方法和業務規范,但如何將電子文件單套歸檔與檔案接收系統、電子檔案數據存儲中心等檔案數據治理基礎設施放在構建城市數據治理體系、公共數據平臺建設、綠色數據中心與算力規劃等數字化體系內容中進行統籌安排,并從資源投入、數據制度保障、數據標準建設、知識產權保護、數字素養培訓等方面加以促進等問題,目前均未進入各級人民政府及其有關主管部門的視野。例如,在“一網通辦”“一網統管”“一網通用”等平臺中生成或流轉的各類檔案數據尚未實現全覆蓋自動歸檔,特別是垂直管理業務系統中的各類檔案數據“回流”歸檔仍是一個薄弱環節,其主要瓶頸之一就是相關系統對接、數據治理制度和條件保障的有效跟進問題。據調研,江蘇省某市轄區目前可以實現全程網辦的事項約200項,其中約170項涉及上級系統,本級自建業務系統約30項,這意味著如果不能在省級或更高層面上通過系統功能更新與改造、制度與技術保障等措施來解決垂直業務系統的檔案數據“回流”歸檔問題,那么以“項目或事由”共同性為中心所形成檔案數據的完整性均不能得到基本保證。通過全要素統籌、多系統對接等來促進城建檔案數據治理的浙江經驗值得總結和借鑒。[16]浙江省在全國范圍內率先開展建設工程數字化管理,在《浙江省數字化改革總體方案》框架下,以《全省住房城鄉建設系統數字化改革實施意見》為指導,建設全省城鄉住房建設“一網智治”系統和開展工程、住房、城建、城管四大領域數字化集成應用,通過浙江省工程建設數字化管理系統、工程建設全過程圖紙數字化管理系統等實現了以“項目”為中心的城建檔案數據治理。
從理論研究和實踐進展看,目前各級人民政府的大數據主管部門和檔案主管部門尚未充分認知到檔案數據是公共數據的重要組成部分這一價值定位,檔案數據治理不同程度地游離在公共數據治理體系之外。其中一個突出表現就是在有關公共數據立法或規范性文件中普遍未對檔案數據及其治理給予應有關照。
據筆者統計,截至2022年12月底,全國已有上海、浙江、貴州、北京、河北、廣西、江蘇、深圳、蘇州等20多個省市(含有地方立法權的城市)出臺了數據相關條例,《江蘇省公共數據管理辦法》等政府規章也已正式發布施行。在上述地方性法規和政府規章等制訂過程中,較少有來自檔案界專家的參與,在20多個省市數據條例或政府規章等文本中也很少看到與檔案數據治理相關的規定。在筆者所查閱的20多個立法文本中,目前僅在2023年3月1日生效的《蘇州市數據條例》第12條中看到了要加強對存量歷史信息進行檔案數字化處理的規定。上述現象表明,雖然在檔案界關于檔案數據治理問題的討論十分熱烈,但其尚未有效融入數據治理體系,在有關數據條例或政府規章制訂中檔案界已經表現出不同程度的“失語”,政府大數據主管部門和地方人大常委會在立法過程中也表現出對檔案數據及其治理和檔案機構的“漠視”。
基于三重維度的認識并依上文的思路進行梳理發現,目前檔案數據治理的短板主要表現在:第一,檔案數據尚未被充分納入國家和各地區數據治理體系整體框架[17],雖然在國家和省市檔案事業“十四五”規劃中均對檔案數據治理問題給予了不同程度的關注,但很多地區的數字城市或數字政府建設規劃中尚未納入檔案數據治理的內容。第二,檔案部門參與政務數據治理的意識、能力與水平仍存在明顯不足[18],檔案數據統籌管理能力不強,跨部門、跨區域和業務協同困難[19],檔案數據源頭缺乏治理,實際歸檔的檔案數據標準化程度不夠,存在數據項和數據類型缺失等突出問題。第三,業務系統與檔案管理系統分散孤立的情況依然存在,上級業務系統中生成的檔案數據回流歸檔不夠充分,以項目或事由為中心形成的檔案數據完整性受到了很大影響。第四,現有數字檔案館基礎設施和保障條件不能滿足檔案數據治理與服務的迭代發展要求[20],檔案數據共享開放與開發利用的具體應用場景較少,檔案界尚未建立起檔案“數字化—數據化—語義化—知識化—智慧化”依次遞進的工作主線,尚未充分發揮出檔案數據對數字經濟、數字政府和數據社會的賦能作用,尚未發現和挖掘檔案數據進入數據要素市場進行交易流通的潛力和具體方式等。因此,檔案機構在國家數據治理體系構建中,應不斷提升其行動能力和拓展行動邊界,主動通過行動路徑、行動方案等的設計,實現在國家數據治理中的“檔案參與”。[21]
三重認識維度的檔案數據治理之間是互為因果和互相促進的關系,在檔案數據治理體系構建中對此應統籌兼顧。檔案數據治理體系的構建不能僅將重點放在如何推動檔案數字化、電子文件單套歸檔、網絡信息選擇性存檔、電子檔案單套制管理和數字記憶保存等“對檔案數據開展治理”的單一維度上,而且應同時關注其余兩個認識維度,它們不同程度地體現了檔案數據治理的目標和基礎條件。“依靠檔案數據開展治理”重點解決的是檔案數據開放利用、開發應用及其對數字經濟、數字政府和數字社會發展的賦能問題,要在政策框架下通過多源數據融合開發,向數據要素市場提供可交易的數據產品與服務,從而開辟檔案數據價值實現的更多空間。“圍繞檔案數據實施治理”是將有關檔案數據的問題統一納入數據治理體系與治理能力建設之中,防止檔案機構成為“數據孤島”以及在數字城市建設和公共數據治理中被邊緣化。因此,檔案部門應基于上述三個維度,以系統思維開展檔案數據治理體系建設,主動參與和推動國家數據治理體系的構建。
檔案數據治理的三重認識維度以保障檔案數據安全,保護檔案數據合法權益,實現檔案數據要素價值等為基本目標。在不同發展階段,檔案數據治理的重點目標任務會有不同。在數字化轉型和電子檔案單套制管理起步階段,管理理念、體制機制、歸檔流程、標準規范、業務系統和基礎設施等均在轉型期,因此,在此階段檔案數據治理的主要任務是檔案數據歸集、檔案數據管護和檔案數據安全。隨著上述目標任務的明確,檔案數據治理基礎設施與能力建設等瓶頸問題逐步暴露出來,如何推進檔案數據開發應用和賦能發展就會提上日程。因此,從理念上突破目前表現出的“對檔案數據開展治理”這個局限,將會形成主動規劃、主動對接、更加開放、更加融合的檔案數據治理新格局。在今后一個時期,檔案數據治理研究與實踐的議題將會更加關注:如何在繼續推進“存量檔案數字化、增量檔案電子化”過程中,通過各類系統的對接和改造,實現對檔案數據治理的優化;如何設計適合檔案數據的算法和算力方案,通過檔案人才培養、機制保障和制度創新等,推動檔案數據化向語義化、知識化和智慧化的轉型;如何推動檔案數據治理有效融入數據治理體系,實現多源數據的融合開發應用,通過數據產品與服務創新賦能經濟社會發展。
綜上所述,檔案數據治理有“對檔案數據開展治理”“依靠檔案數據開展治理”和“圍繞檔案數據實施治理”三個不同的認識維度。只有對上述三個維度的內涵有了全面系統理解,才能發現目前檔案數據治理的短板,明確檔案數據治理及其體系構建的目標和任務。同樣,政府大數據管理部門和檔案主管部門也應該運用上述三重認識維度來指導數據治理規劃、制度建設等實踐行動。