

摘 要:大數據、人工智能、大模型等熱點詞頻出,昭示當前已進入數智時代。數據和技術的結合可以推動產業變革,促進經濟發展。數據已經成為一種不可缺少的生產要素。從收集機構的角度對數據實行分類,區分為公共數據和非公共數據。非公共數據的運營從改革開放發展至今,已發展多種模式。而公共數據運營自然也無法置身事外。本研究從國內國外兩方面分析對比了數據運營的異同點。指出國內數據運營特重點,并以檔案數據為例來展開探討。檔案數據由政府機關等公共部門收集整理而成。其處理周期長,屬于“冷數據”,風險可控。在分析檔案數據類型和利用的基礎上,總結其原有運營模式,并分析其利用率低等不足。立足當下新興技術,探索其未來運營模式。并論證新運營模式所帶來的潛在收益,從而推動公共數據運營建設發展。
關鍵詞:公共數據運營;數據資產化;檔案數據
中圖分類號:G271 文獻標識碼:A
一、背景簡介
進入數智化新時代,數據要素和數字技術的穿透效應使得產業鏈、供應鏈、上下游之間的物流、信息流、業務流、資金流等更加便捷、更加融通。數據要素的重要性不言而喻。數據運營是將從數據要素轉化成數據資產的過程,也是值得研究深思。
1.國內外數據運營相似點。從國內外兩個角度來看數據運營,兩者都是利用數據作為寶貴資產,推動經濟增長、創新和社會發展的過程。兩者都涉及對數據資源的戰略性利用,以創造價值,優化流程。兩者有以下共性:
(1)數據驅動決策:兩者都涉及使用數據分析、機器學習等先進技術:來做出明智的決策。組織分析來自大量不同來源的大數據,以確定趨勢、模式和機會,使他們能夠優化操作、提高效率并推動創新。(2)數據基礎設施和技術:兩者都注重建立和維護數據基礎設施和技術能力。這包括以大數據為主的數據存儲、處理和分析平臺以及采用云計算、區塊鏈、人工智能等新興技術,以支持數據驅動的創新。
2.國內外數據運營差異點。從全球和國內兩個角度來看數據轉化,兩者有所差異點如下:
(1)國外更加側重于資本化。從全球的角度來看,在數據貨幣化方面,與國內有明顯的區分。國外的數據貨幣化主要體現在加密貨幣和去中心化上,如基于區塊鏈技術的比特幣和以太坊。國內的數據貨幣化體現在電子貨幣應用上,如手機銀行、手機第三方支付平臺等。另外國外在數據運營理念方面更強調數據的標準化、規范化和質量控制,同時注重數據資產的管理和價值挖掘。(2)國內數據運營更加側重于管理。公共數據授權運營是一個很好的例子,通過授權運營,政府將數據資源的開發利用權賦予特定的機構或企業,讓基于數據開發新的產品和服務,從而為社會創造更多的價值。另外國內數據運營理念目前還停留在數據治理方面,更多地關注數據的收集和存儲,對數據的深層次應用和價值開發處于探索階段。
基于這些差異點,本研究以檔案數據為例,著重研究國內公共數據運營。檔案數據是一種典型的公共數據,為政府決策、學術研究和文化傳承等提供重要價值。
二、檔案數據利用
1.檔案數據類型。檔案館的主要職責是征集和接收企事業單位具有長期和永久保存價值的檔案等相關資料。歸檔數據是指為了長期訪問和引用而保存和存儲的數據集合。
檔案數據從載體來看包含電子檔案、紙質檔案、照片檔案、錄音檔案以及錄像檔案等。電子檔案,由于便于電子產品操作、適用于電子網絡傳輸、檢索方便快捷等特點,在數據運營方面存在著相應優勢。從檔案館保存的龐大的數據規模和齊全的數據類型來看,其是一座隱藏的巨額寶藏,將在公共數據運營中發揮重要的作用。
2.檔案利用。檔案利用是指有目的和有意義地利用檔案數據來支持研究、學術、教育、文化遺產倡議和公眾參與等。檔案數據利用方面如下:
(1)教育研究。學者、研究人員和學生利用檔案材料作為歷史研究、分析趨勢和解釋過去的事件等。檔案館與學校、大學和社區組織合作,促進教育項目、研討會和展覽,以提高對檔案收藏的認識和欣賞。(2)文化傳承。檔案材料在保存和記錄語言、身份、文化遺產和傳統方面起著至關重要的作用。檔案館與社區、文化機構和政府機構合作,通過檔案來保護和促進文化遺產。(3)數字人文和推廣。數字人文學者利用數字技術和計算方法來分析、可視化和解釋檔案數據,揭示歷史和文化現象。檔案館通過現場參觀、在線門戶、展覽和外聯活動向公眾提供檔案閱覽、講座、參觀和研討會等。
三、存在不足
通過分析檔案數據、檔案利用,發現存在一個問題,即耗費巨額的檔案數據利用率不高。檔案館從各個政務機關企事業單位收集并保存海量檔案數據,需要投入巨大的人力物力來管理。然而檔案館收集的海量數據并沒有得到很好的利用,相當于雪藏的一筆寶藏。
造成這個現象的原因,主要存在以下兩方面:
1.學術理論缺失。在2018-2019年國內外檔案研究論文歸納的18個研究主題中,沒有出現檔案數據運營相關的關鍵詞。
2019年的學術熱點提名分析沒有出現檔案數據運營相關的關鍵詞。2020-2021年檔案相關學術文檔也沒有檔案數據運營相關。
關鍵詞出現的頻次能在一定程度上反映研究領域的熱點情況,分析2022年排名前20位的關鍵詞,沒有檔案數據運營相關詞匯。
從最近五年檔案學術領域研究熱點來看,檔案數據運營等相關詞不是主流研究方向。當然,也有學者從其他角度意識相關問題,如基于城市數據的相關研究,顯得較為匱乏。
2.傳統研究思路
(1)國家設立檔案館,正是為了收集整理保存文書檔案資料以備查用,如漢初的蕭何收集圖書資料典故。由于檔案館的主要功能導致其必然是一種公共事業,而不是盈利機構。(2)檔案館的數據都是從政務機構部門、企事業單位收集而來,遵從紙質檔案利用方式的傳承,其相應的思維還停留在傳統研究思上,紙質資料利用范圍有其局限。隨著檔案數字化的發展,才生產了海量的數字檔案。(3)針對檔案數據,激進的利用方式可能帶來數據確權等問題,故需要妥善處理。從法律管理角度看,也要避免將自己局限在文件檔案管理單個視野中。隨著大數據、人工智能等新興信息技術的出現,為解決上述問題提供了新的思路和方法。
四、技術模式
檔案數據運營,數據要素的形態經歷了“信息信號→原始數據→數據資源→數據產品→數據資本”的動態變化。檔案數據要素形態轉化的方向由保管導向到價值導向的轉變。檔案數據是多種類型數據的結合模式,鑒于其巨大的數據量,需要采用大數據模式;鑒于各個檔案產生部門行政和地理上的分離,需要采用云平臺模式;鑒于檔案的非結構化,非命題式,需要采用人工智能技術;鑒于檔案的防偽鑒真,需要采用區塊鏈技術。
1.大數據技術。檔案數據具有數據種類多樣化、數據量大等特點。利用大數據技術可以實現海量數據存儲、冷熱數據分離、熱數據實時處理、數據統計分析、數據挖掘等場景。
2.云平臺技術。云計算技術按開放程度,包括私有云、公有云、混合云。運用公有云可以構建開放式的檔案數據系統,運用私有云可以構建保密式的檔案數據系統,運用混合云可以構建基于權限管理的混合系統。
3.AI人工智能技術。AI是人工智能的簡稱,可以處理人類經驗缺失和復雜耗時等的領域。基于機器學習提取特征,構建有價值的模型,挖掘有價值的數據。如人工智能在構建家譜知識圖譜的具體實踐,并通過定性和定量的評價展示了協作智能的優勢。
4.區塊鏈技術。區塊鏈技術適用于防偽鑒真及基于區塊鏈技術的比特幣等經受了相當長時間的考驗,可以通過區塊鏈等防篡改技術來保證電子檔案的真實性。基于上述技術模式,構建數據運營平臺,對外提供數據要素。企業采用人工智能技術,基于數據要素,開發數據產品、創新產品、公益產品、價值產品等。有了產品,就需要考慮運營模式,對于新興產品,選擇適合的運營模式至關重要。
五、運營模式
從政府、企業、居民關系來看,傳統檔案數據服務模式主要有G2C、G2G、G2B和幾種結合模式。本章在解析傳統檔案數據利用模式的基礎上,搭建未來檔案數據運營模式。
1.檔案傳統服務模式
(1)G2C模式,即是政府對公民的電子政務的簡稱。具體有檔案館對公民提供的檔案閱覽室以及公民利用網絡在線檔案查閱等。(2)G2B模式,即是指政府與企業間的電子政務的簡稱。具體有檔案數字化項目外包、電子檔案館系統項目建設等。(3)G2G模式,即是不同級別或不同地區政府間的電子政務的簡稱。具體有檔案館對政務機構、企事業機構提供檔案收藏管理利用等服務。
2.檔案數據運營模式暢想
未來必定是多角色參與相互結合的一種商業模式,如政府、企業與公民之間三方相互結合的一種電子政務與商務的模式。在這種模式下,政府為企業提供數據要素,企業根據數據要素構建產品為公民提供服務,公民反饋監督政府。這種模式簡化為G-B-C-G的一種大循環。一個好的運營模式需要綜合考慮經濟、社會、環境等多方面的因素,以實現長期、穩定、可持續的發展,本研究從理論上來論證持續有效和適應性。
六、可行性論證
檔案數據運營從政策、市場需求、社會反響等各個方面展開論證。
1.政策支持力度大。隨著土地財政的日漸式微,政府在積極的探索其他政策,包括數據運營。如北京市經濟和信息化局關于印發《北京市公共數據專區授權運營管理辦法(試行)》的通知。
2.市場需求量大。兼容傳統檔案業務,如國家機關、社會組織、企事業單位檔案等都可以接入,會帶來穩定的需求。新型業務的涌現,會帶來新的商業機會,如其作為數據提供方,給AI模型公司和第三方征信公司提供數據等。
3.社會各方也在積極響應探討。如澎湃新聞上的,5G時代海量數據如何歸檔存儲,實現數據資產化。
4.基礎設施建設完備。基礎設施包括檔案數字化和數據運營兩部分。從2000年開始檔案數字化,至今已有二十余年,產生了大量數字化檔案數據。從web1.0至現今興起的大數據、人工智能、區塊鏈等技術為數據運營提供了扎實的基礎。
5.人才儲備豐富。從紙質到數字檔案,積累了大量檔案專業型人才,且每年高校都有對口專業培訓。在互聯網興起發展時期積累了大量相關的人才,包括技術、產品、運營等。
通過上述分析綜合所得,檔案數據運營既有利于自證價值,又能提供市場所需,還能響應國家政策,促進智慧城市建設發展。
七、結論與建議
本研究論證了檔案數據運營的可行性,并分析具有巨大的潛力和價值。它不僅有助于檔案事業自身的發展,提升檔案管理的效率和價值,還可以為數字產業帶來財富效應。特別是在當前數字化、智能化的時代背景下,檔案數據運營的前景更加廣闊。本研究提出G-B-C-G服務模式非常具有啟發性,其強調了政府、企業和公民之間的互動和合作,形成了一個良性的生態循環。政府通過政策引導和支持,為企業提供數據要素,企業則利用自身的技術和市場優勢,為公民提供優質的服務,公民在享受服務的同時,也可以反饋和監督。當然,任何研究都存在局限性,特別是在探索初期階段。相信在不久的將來,檔案數據運營將會取得更大的進步和發展,為社會進步和經濟發展做出更大的貢獻。
參考文獻:
[1]西桂權,李 輝,賴茂生.面向產業鏈自主可控的科技安全情報服務價值與模式研究[J/OL].情報理論與實踐,2023,46(10):46-53.
[2]加小雙,姚 靜,張晨文,王春蕾.聚焦服務中心大局扎實記錄國家記憶—2022年中國檔案資源體系建設發展報告[J].中國檔案,2023(03):24-24.
[3]黃霄羽,管清瀠,裴佳勇.2018—2019年國外檔案學理論的研究熱點與前沿趨勢探析[J].檔案學通訊,2020(05):29-30.
[4]閆 慧.2019年中國圖書情報與檔案管理領域研究熱點回顧[J].情報資料工作,2020(02):5-6.
[5]連志英,徐擁軍,陳 怡.2022 年中國檔案學研究現狀、特點及發展趨勢—基于對《檔案學研究》《檔案學通訊》的發文統計[J].檔案學研究,2023(01):12-13.
[6]劉彥平,錢明輝,王玉璽.孵化網絡創新協同對區域創新效率的溢出效應——基于我國三大城市群的實證研究[J].中國軟科學,2023(03):32-33.
[7]謝 麗,李思藝,馬林青.電子文件管理相關法律與電子文件管理——加拿大不列顛哥倫比亞省案例引起的思考[J].檔案學通訊,2020(06):43-43.
[8]于施洋,黃倩倩,虞 洋,馬文博,任 明.數據要素市場的價值增值研究:理論構建與實施路徑[J].電子政務,2024(02):36-37.
[9]牛 力,黎安潤澤,劉慧琳,曾靜怡.從物理到數據:智慧檔案2.0體系構建研究 [J].檔案學研究,2022(03):85-86.
[10]任 明,賈君枝.基于協作智能的數字人文領域知識圖譜構建[J].圖書情報工作,2023(04) :131-132.
[11]北京市人民政府.[EB/OL].[2023-12-05].https://www.beijing.gov.cn/zhengce/zhengcefagui/202312/t20231211_3496032.html.
[12]澎湃新聞.[EB/OL].[2024-02-07]. https://www.thepaper.cn/newsDetail_forward_8112135.
作者單位:中國人民大學
作者簡介:燕鵬(1991—),男,漢族,江西吉安人,在讀碩士,研究方向:信息資源管理。