【摘 要】出版數據要素市場化面臨制度層面的堵點、難點,具體表現為出版數據產權界定的制度性困境、交易秩序的特殊失范、跨境流通的監管適配困難等。造成這些困境的原因主要有產權制度的結構性缺陷、交易規制的工具性缺陷和監管體系的工具性缺陷等。加快推動出版數據要素市場化的進程,亟須通過體系化的規制創新重塑出版數據要素市場的權利結構、交易規則與治理模式,構建出版數據產權的動態確權機制,優化出版數據的定價基準,變革數據監管范式,將出版數據要素市場化納入法制軌道。
【關" 鍵" 詞】出版數據;數據要素市場化;數據確權;要素市場化監管
【作者單位】鄭海山,浙江工商大學法學院。
【基金項目】國家社科基金一般項目“數字治理背景下新型政商關系規制研究”(23BZZ086)的階段性成果。
【中圖分類號】G239.21 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2025.08.014
數據已經上升為國家戰略資源,數據要素市場化指將數據資源通過確權、定價、交易等方式融入市場體系,實現其價值增值。《中共中央" "國務院關于構建數據基礎制度更好發揮數據要素作用的意見》(簡稱“數據二十條”),明確要求加快培育數據要素市場,推動數據資源向數據資產、數據資本轉化。出版業順應這一政策導向,積極探索出版數據要素市場化的多元價值實現路徑。然而,出版數據要素市場化面臨諸多制度層面的難點、堵點,阻礙了出版數據要素市場化的進程,如何通過法律手段進行調適是各方關心的問題。
一、出版數據要素市場化的特殊性價值與規制訴求
1.出版數據要素市場化的三重價值維度
(1)經濟維度:數據資產化對出版業收入結構的優化
從經濟角度看,數據要素市場化的核心在于將數據轉化為可計價、可交易的資產,進而作為資本投入再生產過程,其主要包括“資源—資產—資本”三階段[1]。先將原始數據資源整理加工,形成有用的數據產品或服務,即數據資產;繼而通過評估定價、確權登記,讓數據資產進入市場交易或融資環節,發揮資本功能。
在數據資產化實踐方面,中國青年出版總社聯合數元Meta平臺打造數字藏品,選取具有文化價值和市場潛力的出版物IP,通過區塊鏈鑄造數字藏品,在數元Meta平臺限量發行,用戶購買后可同時獲得數字資產所有權和衍生權益。出版集團在財務報表中將數字內容資源計入無形資產,體現了數據資產對公司市值和融資能力的貢獻,從而促使內容IP運營等新業態出現。
(2)社會維度:出版數據的公共文化價值與國際傳播
在文化普惠方面,數據共享能夠提高全民獲取知識文化的便利性和公平性。數字出版數據的廣泛傳播能夠顯著提高知識獲取的便捷性和普惠性。出版單位通過數據開放、與互聯網平臺協同共享承擔更多社會責任,推動優質知識資源以數字形式惠及全民,這體現了出版數據要素市場化的公益價值。
(3)科技維度:高質量內容數據對科技創新的支撐
人工智能尤其是自然語言處理領域的“大模型”訓練極其依賴海量且高質量的語料數據。數字化出版物內容是理想的訓練語料來源[2],通過數據要素市場化,可促成出版單位與科技企業的數據合作。出版單位將部分內容數據集以授權許可的方式提供給模型訓練,按照數據價值獲得報酬和后續成果權益。高質量出版數據得以成為商品進入市場,這既解決了AI模型數據缺乏的問題,又為出版單位帶來新的收益和技術合作的機會。
2.出版數據要素市場化的規制訴求
(1)市場失靈矯正需求
數據要素市場的有效配置有賴于自由流通與公平競爭。然而,大型互聯網平臺往往憑借自身在數據、算法和流量方面的優勢,控制傳播渠道,設置數據獲取門檻,從而形成壁壘,導致市場競爭失靈。借助區塊鏈技術,數字藏品改變了傳統出版內容的發行與交易方式,但相關侵犯著作權的案例接連出現,說明市場自身難以有效甄別和規范數字藏品交易中的權利邊界,現行法律仍有空白。
(2)權益保護需求
作者與出版商存在權益沖突,AI大模型抓取海量出版物數據用于訓練,以提高算法的智能水平,但可能引發侵權爭議。目前我國著作權法尚未明確“大數據挖掘/機器學習豁免”,因此,法律需要在著作權制度中明晰此類數據利用的邊界和規則。此外,用戶行為數據的隱私保護受到威脅,過度收集和利用用戶個人數據會侵犯隱私權并引發相關后果。
(3)安全效率平衡需求
出于保護個人隱私和數據安全的考慮,法律要求對含有個人信息的出版數據匿名化或脫敏處理后才能進一步共享和利用。但高度匿名化的數據在一定程度上削弱了精準度,影響分析精度和研究價值,形成“匿名化與數據效用相沖突”的悖論,因此需要通過規制來加以平衡。
二、出版數據要素市場化的法律規制困境表征
1.出版數據產權界定的制度性困境
第一重困境是出版數據要素的確權問題,主要是進入市場的出版數據要素產權歸屬界定邊界模糊,以及由此引發的利益沖突等問題。數據確權是釋放數據要素、賦能經濟高質量增長和構建有效數據要素市場的重要前提和基礎[3]。然而,由于現行法律法規制度的不完善、多方出版權益主體之間的沖突和區塊鏈等動態確權技術應用尚不夠成熟等原因,出版數據要素的確權面臨制度性困境。
(1)平臺數據確權失序
用戶在使用數字化出版資源的過程中,會產生和積累大量的行為數據,而出版商、平臺方與用戶等不同利益主體可能會對同一數據主張不同權利,繼而引發對用戶行為數據的權屬爭議。現行法律暫未明確定義出版數據的“所有權”“使用權”等概念,也未明確規定不同利益主體對同一數據要素的權利優先順位、權屬占比等問題,這會導致出版數據要素交易出現權責不清的問題,抑制出版數據要素的市場化進程。
(2)衍生數據財產化困局
不同創作主體對出版內容數據二次開發利用產生版權衍生數據,如數據庫產品、用戶生產的閱讀批注和評論等,其權利邊界存在模糊不清、認定困難等問題,這對版權數據作為財產進行交易造成一定困難,甚至會引發相應的權利歸屬和利益分配糾紛。盡管可以嘗試將數據銀行模式遷移至出版業,對出版數據要素開展數據資產管理并提供增值服務,但仍面臨諸多困難與挑戰。
2.出版數據交易秩序的失范
第二重困境是出版數據的交易秩序合規問題。出版數據要素市場化交易過程存在標的物定性爭議和定價依據缺失等問題,加之行業自律規范薄弱,如出版數據交易平臺在用戶協議條款等自定規則中往往出于自身利益對法定責任進行規避,出版數據市場交易規則有待清晰和確認,這些原因導致出版數據要素市場化過程中容易出現交易的合規性風險。
(1)標的物法律定性爭議
從標的物本身來說,出版數據要素在市場化過程中有其特殊性。對出版數據要素進行屬性界定和分類分級是數據市場交易合規有序的前提。相關部門應建立健全出版數據要素的分類分級標準體系,區分公開內容數據和敏感隱私數據(如用戶偏好等)。在屬性界定上,最典型的是數字藏品NFT(非同質化代幣),它是使用區塊鏈技術對特定作品、藝術品進行唯一標識后生成的數字憑證。在保護數字版權的基礎上,數字藏品NFT能夠實現發行、購買、收藏和使用的數字化。目前,對于數字藏品NFT侵權的法律適用存在物權、版權等不同觀點沖突,權利屬性的法律認定和侵權行為法律適用也存在模糊不清的情況。
(2)定價機制不完善
由于出版數據要素不同于物質形態商品的特殊性,其價值難以準確評估和認定,實踐中缺少法定標準和法律指引,這可能會出現出版數據要素的定價結果不合理甚至產生商業壟斷問題,進而影響市場供需關系。出版數據要素價值釋放的過程主要包括出版數據的資源化、資產化和資本化[4]。對于出版數據要素的定價策略,學界目前主要有兩種思路[5]:一是基于市場反應定價,如動態定價、使用量定價和免費增值定價等策略;二是基于數據本身價值定價,如根據信息熵、數據集大小和數據沙普利值(Data Shapley Value,DSV)等因素輔助定價。
3.出版數據跨境流通的監管適配困境
第三重困境是出版數據要素市場流通過程中的監管適配問題。國內流通市場的監管同時涉及網信辦、版權局、市場監管等多個部門多頭執法,各監管責任主體分別依據不同的法律介入數據流通市場,這既可能存在職能交叉重疊問題,又可能導致監管缺位。國外流通市場的規制則涉及國際市場規則與本土法律規定的適配性問題,如何促進二者在出版行業數據交易實踐中實現更好的適配是亟須解決的問題。
(1)算法監管與內容審核的時滯
算法監管與內容審核的時滯性主要體現在技術和制度等層面。在技術層面,依托算法監管對于深度偽造文本(Deepfake)的識別檢測具有滯后性,一些新興的內容違規數據在初期可能會成功逃避檢測。此外,僅依賴算法監管和技術識別手段的準確性不能夠完全保證內容的合法合規,有時還需要結合人工內容審核的判定結果,這加劇了監管的時滯性。出版數據侵權行為的損害具有長期、隱蔽等特性,且對出版數據侵權行為的事后救濟不足,但現行的法律訴訟時效和舉證規則等內容都未從制度設計層面解決這一現實問題。
(2)跨境數據合規成本轉嫁
隨著數字經濟在全球加速發展,數據跨境流通成為全球多邊貿易的一項重要議題[6-7]。歐美發達經濟體希望促進數據自由流動,中國等發展中國家則采用“本地化”防御方式來抵御數據領域的長臂管轄[8]。我國網絡安全法原則上禁止向境外提供境內收集和產生的個人信息或重要數據,可見我國目前對于關鍵領域的數據保護主要采取數據本地化存儲的態度。因此,出版數據要素跨境流通面臨雙重規制沖突:一方面是國際規則落地困難,對本土化的適配度不足;另一方面是本土化要求與國際自由流動需求存在矛盾。這使得國際數字出版合作中的合規壓力陡增,而法律適配、技術升級、風險評估等壓力又通過產業鏈傳導,最終轉嫁給出版單位、內容創作者和消費者等市場參與主體,從而影響整個行業生態。
三、出版數據要素市場化規制困境的成因
數據要素的市場配置并非天然自洽,其有效運行需以權屬清晰、規則完備、機制協同為基礎支撐[9]。從制度機制視角分析,上述表象困境分別指向三個具有結構性特征的核心成因:一是產權界定之困,根源于數據產權制度在權利類型劃分與配置邏輯上的結構性缺陷;二是交易秩序失范,實質暴露了規制工具在交易客體分類、價值評估與定價機制方面的功能性不足;三是監管適配受阻,反映了多元治理體系在職責劃分、技術能力與協同機制方面存在系統性短板[10]。這三組“表象—成因”關系構成了出版數據要素市場化規制研究的理論框架,也為深入分析提供了邏輯起點。
1.出版數據產權制度的結構性缺陷
出版數據產權制度是對出版數據權屬配置的制度安排,目前我國尚未建立專門的出版數據產權立法體系,現行的數據產權規則散見于著作權法、數據安全法及“數據二十條”等多層法律規范中[11]。這些數據產權規則在實際適用場景中存在一些問題,如法律層面的所有權缺位與政策層面的三權分置存在張力等[12]。筆者梳理發現,法律制度的結構性缺陷常源于不同價值取向的內在沖突與外部規則的不適應性移植。
(1)立法價值沖突
“數據二十條”提出的數據產權“三權分置”制度(數據資源持有權、加工使用權和經營權),強調數據加工使用權的獨立性與市場流通性。著作權法體系則要求尊重作品的精神權利,如署名權、保護作品完整權等。兩種法律制度取向上的價值沖突在現實案例中表現得尤為突出。例如,趙德馨教授訴中國知網侵權案和“Google圖書館項目案”,說明對于單一強調加工使用權與流通效率的確權邏輯,若未同步設置精神權利保障機制,必然導致權利失衡。筆者認為,在未來出版數據產權制度設計中應引入“精神權利優先保護”原則作為三權分置模式的價值補充,以實現確權效率與文化人格保護的協調平衡。
(2)規則移植錯位
規制工具的外源性失配也是導致確權困境的重要因素之一。近年來,隨著國際數字服務治理標準的快速演變,我國在互聯網平臺治理實踐中移植了部分國外規則,以探索規范內容填補的制度經驗,尤以歐盟《數字服務法》(Digital Services Act,DSA)的移植問題最為典型。DSA構建了數字服務提供商分級責任體系,對大型平臺提出非法內容移除、算法透明度披露、用戶申訴機制等核心要求,強調平臺作為“信息中介者”的審慎責任[13]。然而,DSA規則移植到中國出版環境的適配失效表現為三方面:一是DSA強調為平臺提供責任豁免的“避風港”原則,與我國出版平臺的“先審后發”制度相悖;二是外部投訴處理機制與內部專業審核體系重疊,大型出版平臺與內部審核體系并行的外部投訴處理機制,會導致運營成本增加20%—35%;三是算法透明度要求與出版平臺內容推薦策略存在根本沖突。
2.出版數據交易規制的工具性缺陷
交易環節的規制工具功能性失靈成為阻礙市場秩序有效構建的重要因素之一。這種工具層面的紊亂直接導致了確權實施困難、交易邊界模糊和市場估值失真等問題。
(1)客體分類標準混亂
數據可劃分為客戶內容數據、衍生數據、服務商數據等類別。出版數據既包括原始內容數據,又包括用戶行為數據,以及由平臺加工形成的內容元數據、推薦模型數據、語義分析數據等衍生數據。出版平臺在用戶數據分類與權屬界定上的標準不一,不僅增加了法律的不確定性,還加劇了市場運行秩序風險。以用戶行為數據為例,不同出版平臺對其權屬認定存在顯著差異。微信讀書因未獲單獨同意收集用戶閱讀時長數據被訴,法院認定“持續行為軌跡”屬于敏感信息;相較之下,豆瓣平臺將用戶評分數據等歸類為“內容衍生元數據”,規避了用戶單獨同意的義務要求。
(2)定價模型缺陷
在傳統出版體系中,作品定價通常依據印刷數量、發行規模及版稅比例設定,形成了相對固定的收益分配結構。但在數字環境下,出版數據的價值越來越取決于內容的用戶黏性、流量貢獻、數據再利用潛力等動態因素,缺乏統一、科學的價值評估和定價標準,增加了交易的不確定性和合同履行爭議風險。目前傳統印數定價模式與基于流量分成、按點擊量計價等新興模式并存,導致利益分配混亂,如亞馬遜等平臺通過動態定價模型頻繁調整分成政策,進一步壓縮作者收益。
3.出版數據監管體系的系統性缺陷
目前,我國出版數據監管體系在實踐中暴露出明顯的系統性缺陷,主要表現在多部門協同低效與技術治理能力不足兩個方面。
(1)多部門協同低效
我國出版數據治理職能目前分散在多個部門,各部門在審批權限、執法范圍及標準設定上存在不同程度的交叉與重疊。如在圖書館著作權侵權案件中,由于司法裁判不統一等原因,圖書館維權成本高、效率低。此外,在出版物侵權糾紛中,行政保護和司法救濟的協調不足,導致處理效率低下。這表明多部門協同治理在實踐中存在部門間協作不暢、利益沖突、制度設計缺陷等問題,從而導致處理效率低下和效果不佳,進一步加劇了出版數據要素市場的制度性摩擦,延長了數據流通周期,增加了交易成本。
(2)技術治理能力不足
區塊鏈技術以其多點化驗證、數據不可篡改等特征,被廣泛應用于確權存證、交易憑證生成和侵權追溯等環節,能顯著提升數據流通的可信度和透明度。但出版行業在技術治理能力建設上相對滯后,影響了相關技術的充分應用。
四、出版數據要素市場化的規制路徑
1.出版數據產權制度的創新設計
(1)動態確權機制
出版數據產權制度運行是一個動態過程,需立足出版流程的階段性特征,構建相適配的動態確權機制,為權利分配奠定堅實基礎。按照出版流程的權益設計能精準反映不同主體對數據價值的貢獻比例,最大限度地避免數據出版利益失衡,保障原始創作者的核心權益,并且能充分激勵中間環節參與者的持續投入,形成全鏈條數據產權分配模式。
動態確權機制需要建立權利流傳的彈性規則體系。應設置利益協調機制,遵循“誰投入、誰貢獻、誰受益”的原則,允許多元主體根據貢獻值確立分配比例。在此過程中,立法部門可以將智能合約技術作為預設觸發條件,明確當數據應用場景發生實質性擴展時,應自動啟動權益評估程序,將各方權益歸屬予以實時分配。為確保動態利益評估的有效落實,立法部門還應建立配套的爭議解決機制,促使權利流轉過程兼具公平性與可操作性。
(2)權益平衡設計
一方面,需明確作者數據可攜帶權與出版商數據資產收益的法定邊界。法律應明確作者基于可攜帶權享有對核心內容數據的遷移自由,出版商則基于其在數據加工、標注、場景化應用中的實質性貢獻,保留對衍生數據資產的使用權與收益權。在現有制度體系下,權能拓展模式更加具有可行性,即確立出版者對其版面的信息網絡傳播權,無論采取何種解釋路徑,出版者的版式利益都能得到妥善保護。
另一方面,基于動態收益共享機制實現作者與出版商利益分配的實質公平。出版物擁有的高質量數據是出版業發展的基礎。在出版數據形成過程中,不同權益主體的利益實現始終處于相互裨益的共同體狀態,構成多方主體利益協同演進的動態網絡。在出版利益共同體中,共同目標的實現能夠滿足成員的需求,促使個體進行合作。利益共享機制既要符合“數據二十條”倡導的“按貢獻分配”原則,又要最大限度地激勵雙方持續優化數據質量與運營效率,最終形成良性互動的出版數據合作生態。
2.出版數據交易秩序的體系重構
(1)分層治理框架
分層治理的合法性源于出版數據要素的異質特性與價值生成規律的內在要求。原始數據承載著作者的著作人身權與智力創造核心價值,需通過確權機制的精密設計實現權屬固化[14]。衍生數據治理難點在于隱私保護訴求與數據挖掘需求的調和,需遵循最小必要原則與動態同意機制。分層治理框架既要激活數據價值,又要保障用戶的知情控制權,繼而建立涵蓋智能審計、合規認證與風險預警的復合型監管體系,實現出版數據資產流動性提升與安全保障能力的雙重優化。
分層治理體系需遵循“風險適配”與“價值釋放”的雙重底層邏輯,通過差異化規則設計實現安全與效能的動態平衡。就原始數據治理層而言,需建立貫穿創作全周期的元數據標準體系,以強制性登記制度錨定核心要素;就衍生數據治理層而言,應依據行為數據敏感度劃分安全等級,按照不同場景實施分類管理,實現數據價值的集約開發;就數據產品治理層而言,要著力平衡流通效率與風險防控,將智能合約納入民法典的合同編解釋范疇,賦予其強制執行效力,建立全流程監管鏈條。
(2)定價基準優化
定價基準優化需深度融入出版行業特有屬性,構建基于內容垂直度與用戶黏性指數的法律規制框架。內容垂直度與用戶黏性指數的變量嵌入構成定價模型優化的首要前提。在出版數據形成過程中,內容垂直度衡量特定領域知識密度的專業層級,直接決定了數據的稀缺性與跨場景復用潛力。科學數據資源的賦權重點在于促進科學數據流通利用、實現數據要素價值最大化。
運用蒙特卡洛模擬技術對海量歷史交易數據進行概率分布擬合與隨機抽樣。蒙特卡洛模擬需嵌入動態風險對沖機制,以應對出版市場的不確定性與長尾效應。相比傳統定價模型難以捕捉此類非線性波動,蒙特卡洛方法通過隨機過程模擬,可覆蓋數據生命周期內的多重風險場景。立足于數據要素的屬性價值與“可供”面向,針對長尾型數據交易可設計分層定價協議,從基礎層、支撐層、整合層揭示數據要素驅動出版產業數字化動態能力的內在機理,明確當數據應用觸發預設的垂直領域擴展閾值或黏性突破臨界點時,自動激活價格重估程序。
3.出版數據監管范式的變革方向
(1)治理架構革新
克服傳統出版數據監管體系中的職能碎片化與協同低效問題,其核心在于打破行政壁壘,實現全生命周期監管閉環,即國家數據局升級為唯一監管主體,將版權驗證、市場合規與安全審計深度結合。同時,法律秩序需確保法律適用的穩定性,針對實踐中暴露的問題,立法需權衡平臺責任的合理范圍與限度,厘清真實性審查責任、發現與判斷責任以及安全保障責任的履行標準。如此,既能系統性消解多頭管轄衍生的制度性內耗,又能為數據要素的合規流通與價值轉化提供支撐。
(2)技術賦能機制
出版數據監管范式的技術賦能機制本質上是治理邏輯從被動響應向主動干預的范式躍遷。監管沙盒試點作為技術賦能的制度載體,其價值內核在于構建包容審慎的試驗空間,在風險可控的前提下釋放技術創新活力。技術與產業的深度融合為出版行業提供了持續前進的動力。構建虛實融合的測試環境需突破傳統技術框架,形成覆蓋數據采集、算法訓練、場景模擬的全棧式技術支撐體系,尤其要實現區塊鏈技術的深度應用。
此外,還要通過歷史數據回填與實時數據注入構建高度擬真算法測試場景。區塊鏈技術的可追溯性以及不可篡改性可以解決數字產品盜版問題。因此,應推進區塊鏈技術的落地及版權保護標準的統一,在保持風險控制精準性的同時,為技術創新的安全驗證提供可靠試驗場。
出版數據要素市場化的法律規制是一個系統工程,未來應圍繞出版數據產權制度的創新設計、出版數據交易秩序的體系重構以及出版數據監管范式的變革方向進行整體優化,從而將出版數據要素市場化融入法治軌道之中。
|參考文獻|
[1]盧浩. 數字產品知識產權存續規則的理論基礎、技術挑戰與優化路徑[J]. 法理:法哲學、法學方法論與人工智能,2024(1):167-194.
[2]李政,胡成盛,周振. 積極推進數據要素市場化配置改革[J]. 宏觀經濟管理,2025(3):70-77.
[3]張平文,邱澤奇. 數據要素五論:信息、權屬、價值、安全、交易[M]. 北京:北京大學出版社,2022.
[4]張奕欣,王一楠,呂欣潤,等. 數據跨境流動各國立法和國際合作機制初探[J]. 法制博覽,2020(2):113-114.
[5]葉開儒. 數據跨境流動規制中的“長臂管轄”對歐盟GDPR的原旨主義考察[J]. 法學評論,2020(1):106-117.
[6]陳兵,林思宇. 數字經濟領域數據要素優化配置的法治進路:以推進平臺互聯互通為抓手[J]. 上海財經大學學報,2022(3):123-138.
[7]馮曉青. 數據財產化及其法律規制的理論闡釋與構建[J]. 政法論叢,2021(4):81-97.
[8]張素華,王年. 數據產權“雙階二元結構”的證成與建構[J]. 中國法律評論,2023(6):138-156.
[9]陳福大. 法律價值中自由與秩序的沖突[J]. 甘肅行政學院學報,2004(3):59-61.
[10]CLARKE,DONALD. Lost in Translation?Corporate Legal Transplants in China[J]. SSRN Electronic Journal,2006(7):1-20.
[11]楊東,申衛星,馮曉青,等. 數據知識產權規則的構建[J]. 數字法治,2025(3):31-50.
[12]中共中央 國務院關于構建數據基礎制度更好發揮數據要素作用的意見[N]. 人民日報,2022-12-20.
[13]吳沈括,胡然. 平臺治理的歐洲路徑:歐盟《數字服務法案》《數字市場法案》兩項提案分析[J]. 中國信息安全,2021(1):71-74.
[14]張文紅,楊雨虹. 技術賦能下我國出版教育的結構現狀與變革方向:從2023年出版專業、學科基礎數據談起[J]. 出版廣角,2024(17):46-52.