主持人語:數據要素化是我國數智轉型和數字中國建設的焦點內容。在此背景下強調積極對接融入數據戰略的檔案事業也迎來更多的轉型升級挑戰與更為廣闊的發展空間,也對檔案學科的理論與方法擴充提供了豐富場景。檔案與數據要素化是怎樣的關系、數據要素化是否以及如何對檔案領域產生影響、數據要素化導向下的檔案事業和檔案理論方法如何加以適應、面向數據要素化檔案實踐的可能的創新空間與發展路徑是什么、檔案學科應當如何積極應對數據要素化帶來的機遇和挑戰等問題越發凸顯。對談成果并非標準答案,而是在于一方面發現這一主題的關注點以及對有關概念的差異化認知,另一方面明確這些問題可能的切入點,由此對接數據要素化,從而幫助建構檔案領域中更加嚴謹和系統的研究框架。(周文泓,中國人民大學信息資源管理學院)
關鍵詞:數據要素;檔案數據;數據要素化;檔案理論;檔案方法;檔案管理;檔案工作
▍周文泓:
在討論檔案與數據要素化這一大主題時,通過不同的學術報告、論文,可以看出學者們對數據要素的認知具有一定差異。在差異化的認知下研究檔案領域和數據要素化有怎樣的關系、檔案領域如何融入數據要素化則有更不同的認識。面向數據要素化這樣一個于實踐中極具戰略與復雜性、在理論上充滿未解之題的事物,檔案領域或許不著急下定論或是確定問題的答案,可能需要先做的是發現問題,即便是偽問題,也有它確認的價值。因而探討數據要素化導向下,有怎樣的關鍵議題值得學界關注和推進并映射于業界,是筆者的出發點。
理論方法層面,關鍵的是創新擴展。一是概念問題,比如數據要素化的政治經濟學內涵,如何擴充檔案的界定以及有關檔案數據要素價值的詮釋?數據要素講場景,那是否不同領域的檔案、不同生命周期階段的檔案的界定以及價值的闡述就需要各不相同的解讀?例如,企業檔案和綜合檔案館的檔案的市場化可能性與路徑應該是不同的,從數據要素化的角度來說,這兩類檔案的定義就需要各自界定。二是理論問題。數據要素化導向下已有檔案基礎理論會有怎樣的變化,有可能提出新的理論嗎?比如,數據要素強調流通利用,它會不會對我們的“來源”產生影響,如果“來源”發生變化,那么文件連續體理論、文件生命周期理論、檔案鑒定理論等又有哪些變化?三是方法層面,面對數據的資源化、市場化和治理化,檔案方法是否也有相應擴展創新之處?例如,市場化會否顛覆部分數字檔案資源開發利用的原則、理念、模式等?
實踐路徑層面,檔案實踐應怎樣和數據要素化充分融合?一是檔案事業如何同數據要素化戰略有效對接?比如,檔案事業“十五五”規劃是否會有體現“數據要素×”的版塊或是明確檔案探索數據要素化的優先領域或場景?二是檔案機構在數據要素化之中可以扮演怎樣的角色?是從檔案事業擴展向數據事業的監管和指導,還是以檔案做數據要素化的探索先鋒,抑或是凸顯哪些新的職能和業務?三是數據要素化目前已有相對達成共識的行動模式,如公共數據授權運營、數據交易、數據開放等,不同模式對不同檔案主體、對象、環境等有怎樣的適應性,檔案領域如何采用不同模式、如何優化調整?
學科層面,則著重于科研共同體和教育的問題。例如,當前在新文科導向下強調檔案學科的“數字+”、跨學科、交叉學科等視角,如提出建立中國自主的計算檔案學,數據要素化可以提供豐富的試驗場景,但有哪些關鍵的學科要展開聯動,前提則是我們要知道從檔案主導的視角出發,確定邊界以及可利用的其他學科的內容與方法,這些都如何實現?再如,如果我們要做產學研用的體系化建設,哪些行業更適合檔案參與,又如何構建適用且可行的檔案場景?
總的來說,面向數據要素化,一方面,檔案領域要深刻洞察并充分理解數據要素化是什么,在此基礎上才有可能去討論檔案與數據要素化應有的作用點、探索空間和融合路徑;另一方面,數據要素化始終處于發展進程中,檔案領域應有主動參與并貢獻其中的意識,在尋獲答案之前不如先探尋關鍵議題。此外,理論與實踐總不093b19700ddd373becef59adf71f5a2d24a09f8e545f09c958e8e30e2f1a346c是完全同步的,有關數據要素化的檔案研究倒也不應完全限制在實踐層面,學理性的研究應當盡早布局。
▍丁家友:
筆者關注的問題是數據要素視角下的檔案跨界合作問題。當前研究中,“檔案的跨界合作”概念中重要的部分在于什么是“界”,以及檔案相關機構在合作中的目的是什么。關于“界”的判定,主要呈現出三種觀點,即以“檔案行業”為界,以“檔案服務”為界,以“檔案所在文化機構”為界。就“目的”而言,現有文獻對其描述較為模糊,其一是給出如紅廉檔案數字編研、檔案文創產品等具體的目的,另一則是通過宏觀且多元的描述將多項檔案工作作為目的描述。就檔案跨界合作模式來說,其主要分為四種:一是與圖、博等為代表的公共文化機構合作;二是與媒體行業合作,包括與報紙、電視、廣播等傳統媒體和微博、抖音等新媒體跨界合作兩種形式;三是與社會公眾合作;四是與其他機構合作。
檔案跨界合作概念定義的核心問題在于以何為界,以何為目的。前者劃清理論界限,后者指明實踐導向。從數據要素的視角闡述這一定義,檔案跨界合作應是以檔案服務為界,通過與其他行業互補人才、資金、知名度、數據資源等方式完成包括檔案收集、保存、處理、利用等一系列檔案工作,最終目的在于發揮檔案數據的要素價值與潛力。由數據要素的視角出發,檔案跨界合作的模式可理解為與數據端、開發端和資本端的合作,最終可劃歸到數據要素的資源化、資產化和資本化的合作。在資源化階段,檔案行業通過與以民間團體為代表的數據端合作,以眾包、UGC等協同方式,提供高質量的檔案數據資源;在資產化階段,檔案行業負責提供可用的檔案數據資源;在資本化階段,為檔案數據賦予金融屬性得以最終完成檔案數據的要素化過程。
檔案的跨界合作離不開客觀條件的助推與支持。具體而言,檔案學科的衍變為其提供了理論基礎,并在很大程度上證明了檔案跨界合作的必然趨勢;新興數字技術的發展不僅拓寬了檔案跨界合作的可能,而且有助于實現檔案成果的多元應用和價值拓展;“局館分設”的檔案機構改革更加明確了檔案跨界合作的分工。三者共同創造了檔案跨界合作的機遇。
從宏觀上來看,檔案跨界合作以檔案數據要素化為根本目的,在頂層設計上應當依照“引進來”和“走出去”的原則進行相關活動。其一是“引進來”,涉及多元化數據、相關技術等多方面檔案領域所不具備的外界資源,具體體現在檔案數據要素資源化及資產化的過程之中;其二是“走出去”涉及檔案數據要素創造社會效益并最終具備有價性、增值性、收益性等資本化特點,需要借助外部手段進行合作開發與流通運營。具體體現在檔案數據要素資產化及資本化的過程之中。通過資源化、資產化和資本化三階段,不斷獲取可用、可信的高質量檔案數據資源,進而利用檔案數據所展現出的金融屬性,實現拓寬數據價值的目標。
▍祁天嬌:
數據要素視角下的檔案數據化及資源組織,關乎三個研究問題。一是數據要素化視角下檔案與數據的關系是什么,或者說檔案領域如何去審視數據要素這樣一個經濟學概念,并在這一概念影響下如何反思檔案自身概念的變化。二是面向數據要素化,檔案數據化工作的核心任務是什么,或者說數據要素化對傳統檔案管理提出了哪些新命題。三是如何通過檔案資源組織來實現檔案數據化、數據要素化,或者說檔案管理領域面向數據要素化要開展哪些具體工作。
數據要素是數字中國建設尤其是數字經濟發展過程中出現的一個經濟領域概念,強調的是從數據到數據要素的一種生產關系的變化。數據泛指對客觀事物的數量、屬性、位置及其相互關系進行抽象表示,以適合在這個領域中用人工或自然的方式進行保存、傳遞和處理。數據要素是指那些以電子形式存在的、通過計算的方式參與到生產經營活動并發揮重要價值的數據資源。這兩者的核心區別在于數據能否作為生產要素參與到生產經營活動中,即價值層面的區別。換句話說,數據要素化的核心意義在于為數據增值。從檔案視角來看,我們往往會把利用土地、人力、能源等傳統生產要素開展生產的業務過程中產生的各類數據稱之為業務數據,而把業務數據中具有憑證性價值和參考性價值、應長期保存的數據進行歸檔留存,這部分數據即成為檔案。歸檔過程中我們對數據價值的鑒定本身也成為數據要素化的一個重要基礎。如若對這部分檔案再進行增值開發,使其賦能生產經營的各項業務,那么從數據到檔案、從檔案到數據要素、從數據要素再到新的業務數據產生,就會形成檔案參與下的數據要素化閉環。
其中,我們將從已歸檔數據即檔案,經過資源開發、業務融合和流通利用轉化為數據要素賦能業務生產的過程稱為檔案數據化。檔案數據化的核心任務是要基于一定的數據標準,顯現化、量化處理檔案的內容、結構、背景與管理過程數據,使之能夠為機器可理解、可操作,并通過人機互動挖掘檔案關系、規則與模式,為用戶提供檔案知識服務。為完成這一任務,檔案數據化需要經過檔案整序、檔案利用、檔案融通、檔案流通等基本流程。其中檔案整序是面向檔案管理者開展的一種資源組織行為,旨在通過對檔案的描述、分類、主題揭示來建構檔案的秩序;檔案利用是一種面向檔案信息利用者開展的組織行為,旨在通過對檔案的意義描述、多元分類、主題抽取來形成可供檢索的檔案數據庫并提供數據利用服務;檔案融通是一種面向機構資產協同管理開展的資源組織行為,旨在通過檔案與業務的關聯、檔案與數據的關聯、多模態檔案的關聯等,實現檔案跨庫、跨系統、跨業務、跨領域的匯聚融通,形成機構檔案資產;檔案流通則是最終面向市場交易者開展的資源組織行為。
在探討數據要素化之前,檔案資源組織的單元主要集中在三個層級,分別是:集合單元,即以一個檔案匯集作為資源組織的對象,例如一個全宗、一個類或一個專題等;文本單元,即以一個具有明晰的、可判別范圍的主題的文本,作為一個資源組織對象,例如一份文件;數據單元,即以一個具有明確語義的數據作為資源組織對象,一般表現為一個概念、一個知識單元或一個實體。數據要素化的核心主旨是為數據增值,因此在面向數據要素化的檔案數據化過程中,還應關注一種新的資源組織單位——價值單元,即以一個可開放、可流通、可交易的價值體作為一個資源組織單元,可表現為一個數據單元或多個數據單元的匯集。
基于明確的資源組織對象,面向數據要素化的檔案資源組織過程就更為清晰。由于數據要素是經過標識的數據,因此要對檔案進行標識標注的基本描述;由于數據要素是經過分級分類的數據,因此要根據檔案的精準描述對檔案開展分級分類;由于數據要素是具有經濟價值的數據,因此要將檔案與業務生產關聯起來,挖掘其中的數據價值;由于數據要素是經過確權的數據,因此要基于檔案描述、檔案與業務的關系對檔案開展溯源;由于數據要素是要在市場上流通的數據,因此要進一步強化檔案的開放、共享、融通和交易。
總的來講,數據要素化提出通過檔案數據化實現檔案增值的核心命題,而要解決這一命題,檔案數據化過程中的諸多檔案組織工作還需要長期的數據化改革與轉型。
▍王 寧:
數字政府建設視域下的檔案數據價值實現涉及三個問題。首先是數字政府建設背景下的數據治理特征。數字政府建設已是一個持續多年的命題,我國數字政府轉型的推進程度也日益加深,2023年發布的《數字中國建設整體布局規劃》更是將發展高效協同的數字政務作為推進“五位一體”的重要構成。其中數字政務發展的核心要求是數據賦能,一是數據匯聚融合,二是數據共享開放,三是數據開發利用,在此過程中貫穿全程的是數據的依法有序流動,也是跟數據要素化最切合相關的一項工作。基于數據賦能的治理工作,實現的是對數字政府建設的兩大目標的支撐,一是推進政府的科學決策,二是推進管理服務效率的提升。那么在數字政府建設下的數據治理要求是什么?在這一場景下,開放數據賦能的目的主要是配合數字政府發展所體現的技術驅動的整體性治理、精準化驅動的決策服務和多主體協同的治理合力等核心特征,需要立足于公共數據的開放共享、政務信息化基礎設施的共享共用和規模性數據價值的充分釋放。基于這樣的核心要求,數字政府領域的數據治理仍面臨著數據治理體系不完善、數據權屬不明晰、數據標準不完善、數據共享障礙和開放性不足等現實問題。結合我國國家數據局初建的階段,可以得出一個認知,即我國數字政府領域的數據治理仍處于發展階段,數據治理機制的各方各面均待完善。那么在這樣一個建設性階段,檔案數據,或說檔案部門的積極入場,恰逢其時。一方面,檔案數據作為數據治理的重要資源可以也應該積極融入數字政府建設;另一方面,政府領域數據治理的現存問題也能夠幫助我們照見自己,反思檔案數據資源建設和治理的關鍵問題,以尋求優化和發展的空間。
其次是檔案數據在數字政府建設中的價值特征。結合數字政府建設對數據匯聚融合、數據共享開放和數據開發利用的核心要求,檔案數據的主要優勢和不足分別如何體現?當然,我們取得廣泛共識的是,檔案數據資源是參與數字政府建設的資源寶藏,包括檔案數據所蘊含的豐富的規范化管理的政務活動背景信息、對業務活動進行可信管理的數據信息及長期保存的重要數據信息,等等。概要而言,檔案數據具有可靠性強、綜合度高和價值豐富等核心優勢,尤其是綜合度高的優勢非常重要。當前大部分數據挖掘、數據分析都是基于規模性、即時性的數據在開展,然而面向檔案數據這樣的跨時性、跨機構的數據成果,將可以進行更為全面和深入的場景開發,實現其重要的歷史重現和信息重用價值。這部分數據既包括檔案館長期館藏保存的檔案數據,也包括各政府機構歸檔和待歸檔的重要電子文件數據,其跨時性和豐富性非常凸顯。這些具有獨特性,能夠體現我們職能價值、功能優勢的數據資源,在數字政府建設進程中有著非常重要的價值實現空間。基于政策的相關調研也發現,當前我國電子文件和電子檔案在數字政府領域的價值實現場景,也正在從社保、稅務、婚姻登記等民生服務領域向資政決策、科技開發、文化教育、企業建設、信用服務等更廣泛的范疇拓展。與此同時,檔案數據存在的問題主要體現在檔案數據的流動性弱、滯后性強和追求“固化”的傳統管理方法等方面。流動性弱源于長期存在的“重藏輕用”的理念和追求“高安全”的職業思維,在一定程度上限制了檔案數據與其他公共數據的流通共享;滯后性強重點體現于“后端意識”主導,參與業務活動的主動性不足,此外還包括檔案數據價值的應用場景認知不清晰,服務意識不足等問題;檔案管理的特殊方法決定了檔案數據的非結構化程度普遍較高,細顆粒度的數據開發有限。整體上,檔案數據在數字政府建設中的存在感較弱,核心職能優勢亟待挖掘。
最后,數據要素化思維對檔案數據賦能數字政府建設的啟發。數據要素化的本質建設思路是市場化配置,即由市場評價貢獻、按貢獻決定報酬,要求數據要素需要具備“可量化(計算)、權屬明晰、可控制、可交換”等指標特征,這也為檔案數據價值的實現提供了相對明確的指標思路參考。在“數據要素化”的路徑中,檔案數據的價值實現需要從檔案數據的產權制度、檔案數據產品加工的深化、檔案數據的可信流通保障和檔案部門參與數據要素戰略等層面著手,逐步推進檔案數據在要素化背景下的價值實現。一是檔案數據產權制度的確立。長期以來,檔案的開放性不足除了理念問題之外,與產權、授權制度的不明晰、不完善也有直接關系。“數據二十條”已明確提出公共數據授權制度的重要性,那么我們需要著重思考包括行政管理檔案數據、公共檔案數據和個人檔案數據等在內的檔案數據資源的確權和利用問題。二是在數據價值鏈理論的啟發下,深化推進從檔案數據的資源化向資產化階段的發展。資源化是當前檔案數據資源建設的重點關注階段,而資產化則需要形成更加豐富有力的能夠支持決策和公共服務的各類檔案知識產品,不再僅僅依據檔案的“原始面貌”來發揮作用。此外還應推進檔案數據資產的登記工作,和其他類別數據資產一樣來衡量其價值,尤其是基于“向內賦能”的思路,進行檔案數據資產的登記工作。三是結合檔案部門的“可信管理”職能,在數字政府建設背景下實現檔案數據要素的流通和合理配置,重點解決數據來源可信、交易可信、用戶可信、審計可信等問題,掃除信任機制導致的數據要素價值實現障礙,實現檔案數據要素的共享和價值共創。最后,檔案部門應承擔起作為公共數據管理機構之一的重要職責,積極參與到建設可信數字政府、發展高效數字政務的進程中,在數據質量管控、技術標準建設和可信流通治理等方面主動貢獻自己的能量。
▍宋 懿:
在檔案事業領域,伴隨“檔案數據化”與“數據檔案化”雙向融合趨勢的快速發展,全國各地涌現大量檔案數據治理實踐,檔案數據基礎理論與知識體系建設迫在眉睫。目前,研究者對“檔案數據”的概念界定尚未統一,學界對檔案數據治理的理論研究仍處起步階段。對此,筆者認為在學術探討中應有效區分“檔案數據”在“開發與計算語境”和“保存與開放語境”中的雙重意涵,并逐步厘清要素化背景下檔案數據要素的屬性特征、權屬界定和流動方向等關鍵問題。為此,筆者立足“要素價值論”視角,引入法學領域數據權屬問題的相關研究成果,在考察我國授權運營背景下公共數據權屬界定實踐現狀的基礎上,探討與公共數據屬性相似的檔案數據在權屬界定及治理方面的未來發展。
權屬是一個法律概念。在我國傳統財產權制度體系中,“權屬”一般指向狹義的“財產所有權”,關注法律范圍內所有者對財產使用、收益和處分的權利。“數據權屬界定”的難點在于:(1)數據利用的非排他性等特征,與所有權絕對性等特征間的矛盾沖突;(2)前數據時代的法律主體制度框架的核心內容,與數據運作底層邏輯關鍵構成要素間的矛盾沖突;(3)全生命周期中數據屬性特征對場景的高度依賴性,與法律規范相對靜態性間的矛盾沖突。由此可知,數據權屬界定的關鍵在于:確定哪些利益需要保護,構建科學的數據權利體系,形成不同利益主體間的激勵相容。
公共數據是指各級行政機關以及具有公共管理和服務職能的事業單位,在依法履行職責過程中獲得的各類數據資源;授權運營是有權機關代表政府,授權具有專業化運營能力機構對公共數據進行加工處理,開發形成數據產品和服務,并向社會和市場提供的行為。作為我國數據要素化探索的前沿實踐之一,公共數據授權運營在數據權屬與授權制度等方面的經驗,對我國檔案數據要素價值實現和數據治理理論發展具有一定的適用性和可借鑒性。在吉林大學法學院齊英程副教授與筆者開展的合作研究中,經對現行公共數據授權運營政策文本(截至2024年5月底)和數據管理專家訪談的內容分析,我們將當前我國公共數據權屬中的授權現狀特征歸納為:(1)授權主體行政資質不定,且授權流程模糊;(2)授權運營方式不一,且運營風險突出;(3)授權規則制度不明,且監管機制匱乏。摸底調查表明,在中央層面尚未明晰公共數據授權運營制度法律定位的前提下,公共數據的權屬界定面臨著“國有和民營企業授權平等”“營利與公益目標平衡”“政策與規范動態平穩”等風險與挑戰。
數據要素化背景下,推動檔案數據管理實踐和治理理論的進一步發展,亟須辨明檔案數據屬性、闡釋價值生成機理、協調多元主體關系。結合授權運營背景下公共數據權屬調研結果,筆者認為應在未來制定相互協調的系統化檔案數據治理制度,以確保檔案數據的合理利用。首先,需挖掘典型場景中檔案數據的屬性特征、進行分級分類,明確其在法律、經濟和社會層面的基本定位,為檔案數據全生命周期有效管理提供清晰的指導原則。其次,應深入闡釋檔案數據的價值生成機理,包括檔案數據如何轉化為經濟、社會、文化價值,以及如何驅動知識創新和決策支持。再者,協調檔案數據價值實現過程中多元主體間關系至關重要。授權運營框架下,如何保護政府、企業、公眾和科研機構等多元主體權益,需構建有效溝通機制和協商平臺。最后,未來政策應著重明確檔案數據授權流程、規范運營方式,建立健全監督機制,推動檔案數據的高效利用和創新價值實現。
(責任編輯:張 帆)