高書生
【摘要】隨著互聯網、大數據、云計算、人工智能、區塊鏈等新興技術日益融入經濟社會發展各領域全過程,我國從建設社會主義文化強國、厚植數字時代文化自信的高度,對國家文化數字化作出戰略部署,以積極應對科技革命和產業變革給文化建設帶來的機遇和挑戰。國家文化數字化戰略,旨在構建從文化資源到文化生產再到文化傳播、文化消費的全新體系。實施國家文化數字化戰略的出發點是發力供給側、激活文化資源,實現文化生產體系現代化。各級各類文化機構是國家文化數字化戰略的重要實施主體,在數字化轉型過程中仍面臨版權保護、數據安全、投入產出失衡等問題,構建國家文化專網、加強標識解析體系建設則是針對這些問題的技術解決方案。促進文化數字化生產力充分發展是實施國家文化數字化戰略的中心環節,其中數據是核心生產要素,數據關聯是核心生產力,應通過數據分類、編目、標簽化,實現文化內容采集、加工、交易、分發、呈現全流程數據化,打通數據孤島,實現數據關聯,推動文化產業發展邁上新的臺階。
【關鍵詞】文化數字化? 國家文化大數據體系? 文化數據? 國家文化專網? 數據關聯
【中圖分類號】G122? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2022.23.002
為繁榮發展文化事業和文化產業,推進文化自信自強,鑄就社會主義文化新輝煌,黨的二十大報告明確指出:“實施國家文化數字化戰略,健全現代公共文化服務體系,創新實施文化惠民工程。健全現代文化產業體系和市場體系,實施重大文化產業項目帶動戰略。”本文擬就實施國家文化數字化戰略的技術路線與中心環節進行探討。
國家文化大數據體系是把握國家文化數字化戰略的鑰匙
近年來,互聯網、大數據、云計算、人工智能、區塊鏈等技術加速創新,日益融入經濟社會發展各領域全過程。以習近平同志為核心的黨中央站在統籌中華民族偉大復興戰略全局和世界百年未有之大變局的高度,把握數字化、網絡化、智能化方向,部署加快新型基礎設施建設,加強戰略布局,推進數字產業化和產業數字化,抓住世界科技革命和產業變革的先機,搶占未來產業競爭的制高點。
為應對科技革命和產業變革給文化建設帶來的機遇和挑戰,2020年,黨的十九屆五中全會作出了推動公共文化數字化建設、實施文化產業數字化戰略的決策部署。2022年5月,中共中央辦公廳、國務院辦公廳印發了《關于推進實施國家文化數字化戰略的意見》(以下簡稱《意見》),《意見》明確,到“十四五”時期末,基本建成文化數字化基礎設施和服務平臺,基本貫通各類文化機構的數據中心,基本完成文化產業數字化布局,公共文化數字化建設躍上新臺階,形成線上線下融合互動、立體覆蓋的文化服務供給體系;到2035年,建成物理分布、邏輯關聯、快速鏈接、高效搜索、全面共享、重點集成的國家文化大數據體系,文化數字化生產力快速發展,中華文化全景呈現,中華文化數字化成果全民共享、優秀創新成果享譽海內外。
把握國家文化數字化戰略的精髓,國家文化大數據體系是一把鑰匙。《意見》為實施國家文化數字化戰略指明了前進方向,規劃了實施路徑,在指導思想部分明確以國家文化大數據體系建設為抓手,在主要目標部分確定到2035年建成國家文化大數據體系。《意見》提出了八項重點任務,其中第一項是“關聯形成中華文化數據庫”,即統籌利用文化領域已建或在建數字化工程和數據庫所形成的成果,全面梳理中華文化資源,推動文化資源科學分類和規范標識,按照統一標準關聯零散的文化資源數據,關聯思想理論、文化旅游、文物、新聞出版、電影、廣播電視、網絡文化文藝等不同領域的文化資源數據,關聯文字、音頻、視頻等不同形態的文化資源數據,關聯文化數據源和文化實體,形成中華文化數據庫。
國家文化大數據體系在架構上可概括為“兩側四端”,“兩側”分別是供給側、需求側。所謂需求側文化大數據,是指在文化消費過程中所產生的數據;而所謂供給側文化大數據,就是從文化資源中“萃取”的數據。顯然,中華文化數據庫中的“大數據”,在性質上是屬于供給側的,是來源于文化資源的數據,是將中華民族積淀了五千多年的文化資源,轉化為文化生產要素,使其成為文化創新創造的素材和源泉,并從中提取具有歷史傳承價值的中華文化元素、符號和標識,豐富中華民族文化基因的當代表達,全景式呈現中華文化。這是國家文化大數據體系的本質特征。
“四端”分別是資源端、生產端、消費端和云端。資源端是指公共文化資源收藏或保管機構,既包括博物館、圖書館、美術館、文化館、檔案館、資料館等公益性文化事業單位,也包括廣播電臺電視臺、報刊社、出版社、文藝院團等文化生產機構。生產端是指對文化資源數據進行采集、加工、生產的機構。生產端和資源端可能是重疊的,即作為公共文化資源的機構,同時從事文化資源數據的采集、加工、生產;生產端和資源端也可以是分離的,一些并不擁有公共文化資源的機構或個人,也可以從事文化資源數據的采集、加工、生產。消費端是指文化消費場所或機構。《意見》將線下文化消費場所分為兩類,一類是新時代文明實踐中心、學校、公共圖書館、文化館、博物館、美術館、影劇院、新華書店、農家書屋等文化教育設施;另一類是旅游服務場所、社區、購物中心、城市廣場、商業街區、機場車站等公共場所。云端是指服務于文化資源數據的存儲、傳輸、交易和文化數字內容分發的機構,包括文化數據服務中心和文化數據服務平臺兩類。
根據上述國家文化大數據體系架構,可以用一張圖來直觀呈現《意見》提出的重點任務。如圖1所示,實施國家文化數字化戰略,旨在構建從文化資源到文化生產再到文化傳播、文化消費的全新體系。實施國家文化數字化戰略的出發點,概括地說就是發力供給側、激活文化資源,實現文化生產體系現代化。
實施國家文化數字化戰略的技術路線
國家文化數字化戰略的實施主體,應當是法人機構和公民個人,特別是各級各類文化機構。推進實施國家文化數字化戰略,必須堅持問題導向,即針對文化機構的疑慮提出相應的對策。
早在2011年,中共中央辦公廳、國務院辦公廳印發的《國家“十二五”時期文化改革發展規劃綱要》就已明確提出“實施文化數字化建設工程”,即對文化資源、文化生產和文化傳播實施全面數字化。文化機構對文化數字化都持開放態度,認為這是大勢所趨,特別是突如其來的新冠肺炎疫情導致線下文化活動基本停擺,線上文化消費需求“井噴式”增長,文化機構深切體會到錯過數字化就會被邊緣化甚至被淘汰。
對跨越“數字鴻溝”,文化機構存在以下擔憂。一是盜版問題,即如何保護數字版權。二是數據安全,文化數據屬于國家、民族的核心信息資源,特別是文化基因數據,其地位同生物基因數據一樣重要,確保數據安全是第一位的。三是投入產出失衡,這些年一些文化機構積極探索數字化轉型升級,取得了一定成效,但始終沒有解決“兩張皮”問題,即數字化新業務同傳統業務未能有效融合,特別是新業務尚未實現盈虧平衡。
為解除文化機構的后顧之憂,《意見》給出了技術解決方案:一是形成國家文化專網;二是加強標識解析體系建設。
關于國家文化專網,《意見》從基礎設施、建設主體、接入服務、數據管理四個方面作出了安排。其一,依托現有有線電視網絡設施、廣電5G網絡和互聯互通平臺,形成國家文化專網。其二,鼓勵多元主體依托國家文化專網,共同搭建文化數據服務平臺。其三,鼓勵和支持文化旅游、文物、新聞出版、電影、廣播電視、網絡文化文藝等領域的各類文化機構接入國家文化專網,利用文化數據服務平臺,探索數字化轉型升級的有效途徑。其四,發揮好國家文化專網網關物理隔離作用,對數據共享、關聯、重構等主體實行準入管理。
國家文化專網的功能主要包括四個方面。一是接入服務,即各級廣電網絡公司把各級各類文化機構都接入國家文化專網,在一個閉環系統中匯集、加工文化資源數據。二是存儲服務,即各級廣電網絡公司為文化機構的數據存儲提供服務器租賃服務。三是算力服務,即在國家文化大數據體系的區域中心建設具備云計算能力和超算能力的文化計算體系,構建一體化算力服務體系。四是分發服務,即各級廣電網絡公司鏈通各級各類文化消費場所,并與互聯網消費平臺銜接,通過多網多終端分發文化數字內容。
上述四項服務都是依托現有設施提供的,避免了重復建設。接入服務是利用廣電網絡公司現有的光纖資源,為百萬家文化機構提供服務。儲存服務主要為不具備建設數據中心能力的中小文化機構提供,目前已有廣電網絡公司研制出一體化機柜,價格適中,可在全國范圍內推廣。算力服務目前可利用部分廣電網絡上市公司已建成的大型數據中心進行部署。分發服務更是廣電網絡公司的優勢,就是將文化數字化成果分發到學校、公共文化機構、影劇院、旅游景區、社區、購物中心、商業街區、機場車站等,為廣電網絡公司開辟廣闊的業務空間。
關于標識解析體系,《意見》從底層部署、基礎設施、建設主體、技術創新、標準推廣五個方面作出了安排:其一,依托信息與文獻相關國際標準,在文化機構數據中心部署底層關聯服務引擎和應用軟件;其二,依托現有有線電視網絡設施、廣電5G網絡和互聯互通平臺,部署提供標識編碼注冊登記和解析服務的技術系統;其三,鼓勵多元主體依托國家文化專網,共同搭建文化數據服務平臺,提供文化資源數據和文化數字內容的標識解析、搜索查詢、匹配交易、結算支付等服務;其四,文化產權交易機構要充分發揮在場、在線交易平臺優勢,推動標識解析與區塊鏈、大數據等技術融合創新;其五,加強標識解析體系建設,推廣信息與文獻相關國際標準。其中兩次提到的“信息與文獻相關國際標準”,是指由我國提案、國際標準化組織正式發布的《ISO17316-2015 信息與文獻國際標準關聯標識符》(ISLI),該項國際標準的國際注冊機構(ISLI Registration Authority, ISLI RA)設在我國香港特別行政區,底層技術系統提供商為設在我國境內的公司。
國家文化專網是依托現有的有線廣播電視網絡設施而形成的,不是重復建設;而依托我國主導的信息與文獻國際標準關聯標識符,部署提供標識編碼注冊登記和解析服務的技術系統,即形成了國家文化專網標識解析體系。部署了底層關聯服務引擎和應用軟件的各類機構和個人,只要接入國家文化專網,就可以對數據進行標識、關聯,被標識和關聯的數據在國家文化專網將暢通無阻。
標識編碼是標識解析的基礎。所謂標識編碼,就是給每一個數據分配唯一可讀的標識符,這個標識符類似于“身份證”。迄今為止,國際標準化組織在信息與文獻領域發布了12項標識符國際標準。在ISLI發布之前,國際信息與文獻領域原有的10項標識符(ISBN、ISSN、ISRC、ISMN、ISWC、ISTC、ISAN、ISNI、DOI、ISCI),都是針對不同屬性單一資源的標識符。與其他標識符不同的是,ISLI并不標識一個單一的實體對象,而是標識兩個實體之間的關聯關系,不改變實體的各種屬性和標識。《意見》提出全面梳理中華文化資源,推動文化資源科學分類和規范標識,按照統一標準關聯形成中華文化數據庫,這個“統一標準”,就是依托我國提出并主導的國際標準ISLI,但不替代各個行業正在執行的其他標識標準。
一條專網、一款標識符,構成了實施國家文化數字化戰略的技術路線。各級各類文化機構按照物理分布、邏輯關聯原則,在國家文化專網這一閉環系統中可以順暢地完成數據的采集、加工、存儲、傳輸、交易和分發,數據安全得到有效保障。
為進一步打消文化機構的顧慮,《意見》在保障措施中專門提出“加強文化數字化全鏈條監管”的要求,具體來說:一是在數據采集加工、交易分發、傳輸存儲、數據治理等環節,制定文化數據安全標準;二是強化中華文化數據庫數據入庫標準,發揮好國家文化專網網關物理隔離作用,對數據共享、關聯、重構等主體實行準入管理;三是完善文化資源數據和文化數字內容的產權保護措施;四是加強文化消費新場景一體化監管,確保進入傳播或消費渠道的內容可管可控。
實施國家文化數字化戰略的中心環節
互聯網將消費推向了極致,催生了一系列消費新模式、新方式和新業態,數字化則把生產推向了新高度,引發生產方式革命性變革,創造了生產力的新形態——數字化生產力。促進文化數字化生產力充分發展,是實施國家文化數字化戰略的中心環節。
黨的十八大以來,以習近平同志為核心的黨中央高度重視發展數字經濟,將其上升為國家戰略,極大地推動了數字經濟的快速發展。從2012年至2021年,我國數字經濟規模從11萬億元增長至超45萬億元,數字經濟占國內生產總值比重由21.6%提升至39.8%。[1]數字經濟時代,數據是重要的生產要素,也是國家基礎性戰略資源。2020年4月,中共中央、國務院發布的《關于構建更加完善的要素市場化配置體制機制的意見》,將數據同土地、勞動力、資本、技術等生產要素并列,強調通過加快數據要素市場培育,充分發揮數據要素對其他要素效率的倍增作用,使大數據成為推動高質量發展的新動能。
我國是文明古國,也是文化資源大國。新中國成立以來,國家已組織開展多次全國性文化資源普查,形成了海量文化資源數據。2012年至2016年,國務院統一部署開展了第一次全國可移動文物普查,全國共登錄珍貴文物3,856,268件,其中一級文物218,911件,二級文物551,192件,三級文物3,086,165件。登錄文物照片5000萬張,數據總量超過140TB。[2]2013年至2016年,原文化部開展全國美術館藏品普查,藏品涵蓋繪畫、書法篆刻、雕塑、工藝美術、設計藝術、民間美術等各種類型的美術作品,藏品實物數量592,663件,藏品圖片820,288幅,數據總量6.9TB。[3]2015年至2017年,原文化部在全國范圍內開展了地方戲曲劇種普查,普查出348個戲曲劇種,組織編寫《中國戲曲劇種全集》,共計350冊。組織建設民族音樂數據庫,已收集音頻資料10萬余段、視頻資料3000余條、樂譜2萬余冊、書籍7000余本、論文3萬余篇,內容涉及民族音樂領域代表性樂曲、樂譜、樂團、樂人、樂事和民族音樂理論研究的學術成果。[4]
除上述全國性文化資源普查數據,報刊社、廣播電臺、電視臺等新聞單位擁有媒資庫,文化館、檔案館、出版社、電影制片廠、文藝院團等文化機構也都擁有自己的數據庫,這些數據庫各具特色、彌足珍貴,諸如中國民族民間文藝基礎資源數據庫、中華老唱片數字資源庫、國家舞臺藝術音像庫、中國生物志庫、中國地方歷史文獻數據庫、延安時期文獻檔案數據庫、海外藏中國民俗文化珍稀文獻庫、中華石刻數據庫等,包含大量紅色經典影像、珍貴歷史材料、優秀科普資料等內容。
文化機構特別是負責收藏和保管公共文化資源的機構,雖然擁有海量文化資源數據,猶如坐在金山上,但是由于沒有將這些資源關聯起來,每個機構都守護著一個數據孤島,無法體現數據的文化價值。如果文化機構都接入國家文化專網,進入國家文化大數據體系,關聯文化資源數據,延展文化數據供應鏈,運用數字化手段創新表現形態、豐富數字內容,推動圖書、報刊、電影、廣播電視、演藝等傳統業態升級,推動中華文化瑰寶活起來,就可以在文化數據采集、加工、交易、分發、呈現等領域,造就一大批新型文化企業,推動文化產業發展躍上新臺階。
世界因互聯而多彩,數據因關聯而增值。數據的價值就在于其描述或表達的文化內涵。進行數據關聯,要找準數據所在的坐標系。一是要對文化數據進行科學分類,分類標準可參照聯合國教科文組織的文化統計框架,將數據劃分為六大類別,即文化和自然遺產、表演和節慶活動、視覺藝術和手工藝、書籍和報刊、視聽(音像)和交互媒體、設計和創意服務;二是按照專業性的知識圖譜進行編目,確定每個數據的方位;三是對文化資源數據的特征進行描述并進行數據標簽化。如同無人駕駛汽車需要海量關聯數據支撐,百度等數據技術公司集中大量的人力對交通數據進行標注一樣,可以預見在不遠的將來,文化行業也會出現數據關聯的車間或基地,成千上萬的年輕人將加入文化數據關聯行業,數據關聯將成為新職業。
如果說數據關聯是生產過程,那么,關聯數據就是產出成果。實施國家文化數字化戰略,各級各類文化機構都應將數據關聯納入經常性工作,對本單位的數據加以標識和標注,形成關聯鏈,這是內關聯;其他單位亦對新產生的數據進行標識和標注,對已形成的關聯鏈進行再標識和標注,并通過國家文化專網形成更大范圍的關聯鏈,這是外關聯。未來的文化數據或許將以關聯鏈面目出現,關聯鏈將成為文化機構的新業態,客戶可通過購買關聯鏈訪問不同文化機構的數據庫,無論建設數據庫還是生產關聯鏈,都能夠獲得收益,那種只投入不產出的局面將被改變。為了讓關聯數據的變現收益在分配上體現多勞多得,就需要為每個關聯數據發放“身份證”,即前面提到的標識符,它不僅能在文化資源數據的元數據中標注著作權人,標明關聯數據的歸屬主體,而且將終身伴隨著數據流轉,在底層技術上保護版權。
結語
國家文化數字化戰略,旨在構建從文化資源到文化生產再到文化傳播、文化消費的全新體系。國家文化大數據體系是把握國家文化數字化戰略精髓的一把鑰匙。實施國家文化數字化戰略的出發點,是發力供給側、激活文化資源,實現文化生產體系現代化。各級各類文化機構是國家文化數字化戰略的重要實施主體,推動文化機構積極開展數字化轉型,必須探索形成國家文化專網、加強標識解析體系建設的技術解決方案,以消除文化機構在實踐中的擔憂。促進文化數字化生產力充分發展,是實施國家文化數字化戰略的中心環節。數據是核心生產要素,數據因關聯而增值,數據關聯是核心生產力,關聯數據是核心資產,數據變現是核心驅動力,數據安全是核心競爭力,生產網、生產線、生產端是核心環節。這些共同構成了國家文化數字化戰略的核心要素。應通過數據分類、編目、標簽化,實現文化內容采集、加工、交易、分發、呈現全流程數據化,打通數據孤島,實現文化數據內外關聯,推動文化產業發展邁上新的臺階。
注釋
[1]《中國數字經濟規模超45萬億元》,《人民日報·海外版》,2022年7月6日,第8版。
[2]國務院第一次全國可移動文物普查領導小組辦公室、國家文物局:《第一次全國可移動文物普查工作報告》,2017年4月7日,http://www.ncha.gov.cn/art/2017/4/7/art_1984_139379.html。
[3]全國美術館藏品普查工作辦公室:《全國美術館藏品普查工作簡報(第六十一期)》,2018年12月27日,http://ccamc.mct.gov.cn/pcb/tongzjb/201812/2fdb3b8e29464b7fa2ba364721292a70.shtml。
[4]《文化和旅游部關于政協十三屆全國委員會第三次會議第2361號(文化宣傳類125號)提案答復的函》,2020年9月24日,https://zwgk.mct.gov.cn/zfxxgkml/zhgl/jytadf/202012/t20201204_907077.html。
責 編/陳璐穎