王漪,康林沖,姜曉軼,童心,曹磊,符昱
(1.國家海洋信息中心,天津 300171;2.國家海洋科學數據中心,天津 300171)
隨著科學研究第四范式——數據密集型研究的興起和發展,科學發現與科技創新越來越依賴對科學數據的集成與分析,科學數據作為國家科技支撐條件的基礎性和戰略性地位愈發顯著[1]。我國高度重視科學數據管理和開放共享工作,制定發布了《國家科技資源共享服務平臺管理辦法》和《科學數據管理辦法》等政策制度,從國家層面為我國科學數據工作奠定了政策基礎。2019年,科技部、財政部在原有科學數據國家平臺基礎上,調整組建了海洋、氣象、地球系統、基因組、微生物等領域的20 個國家科學數據中心,形成了支撐國家宏觀決策的科學數據領域布局和多元化運行機制。我國科學數據的發展迎來了歷史上最好形勢。近年來,科學數據開放共享成效顯著,特別是驅動新型國家建設的作用日益凸顯。
近年來,黨中央、國務院高度重視數據要素發展。自黨的十九屆四中全會將數據增列為生產要素以來,密集出臺了《關于構建更加完善的要素市場化配置體制機制的意見》(以下簡稱“《意見》”)等多項政策法規。2022 年12 月19 日發布的《關于構建數據基礎制度更好發揮數據要素作用的意見》,首次從數據產權、流通交易、收益分配、安全治理等四個方面提出20 條政策舉措(又被稱為“數據二十條”),初步搭建了我國數據基礎制度體系,標志著我國正式進入數據要素市場有序規范的探索階段。數據作為新型生產要素,具有無形性、非消耗性等特點,對傳統產權、流通、分配、治理等制度提出了新挑戰,亟須構建與數字生產力發展相適應的生產關系。“數字二十條”的發布,有利于充分發揮數據要素作用,賦能實體經濟,推動高質量發展;做大做強數字經濟,推動全民共享數字經濟發展紅利,也為各地區、各行業參與培育數據要素市場提供了基本遵循和行動指南。
作為數據宏觀范疇的重要分支,科學數據在已有開放共享成效的基礎上,該如何順應時代潮流,開展市場化數據流通與交易服務,在培育數據要素市場的進程中發揮促進科技創新的引擎作用,是科學數據工作者當前應該思考的重要問題。以海洋為例,隨著海洋在促進數字經濟發展領域的重要性越來越高,在開展海洋科學數據開放共享的實踐中,沿海地方、涉海企業等各類用戶對海洋科學數據的精細化、定制化需求越來越迫切,數據需求的深度與廣度也在不斷延伸,在數據申請過程中有大量用戶提出了明確的購買意向。但由于海洋科學數據流通交易在研究方面尚屬空白,在實踐中也存在著哪些數據可以交易、數據該如何定價、收益該如何分配、數據安全要如何保障等現實挑戰,越來越多的數據交易需求得不到有效滿足。開展相關政策機制的研究,參考國內外海洋科學數據及相關領域數據交易的經驗和教訓,是推動海洋科學數據流通交易落地實施的有效途徑。
本文從政策脈絡、運行機制、服務模式和技術手段等角度梳理了國內外海洋及相關領域科學數據流通交易的發展現狀,并提煉出值得借鑒的經驗和教訓,結合海洋科學數據特點以及我國海洋科學數據管理與共享服務現狀,分析了目前在我國海洋領域開展科學數據流通和交易服務可能面臨的問題和挑戰,并初步提出了推進實施思路。
美國在科學數據開放共享方面,嚴格以投資來源和數據產權為依據,劃分為完全開放、保密和市場管理三種機制。對于政府所有或由政府資助產生且不會危及國家安全、影響政府政務、涉及個人隱私的科學數據,美國遵循無償、無限和無歧視原則,實施完全開放策略。對于可能涉及國家安全或按照交換協議規定不能擴散的數據,實施保密性運行管理。被納入市場管理體系的有兩種情況,一是由私營企業投資產出的科學數據,二是用戶需要大量歷史數據、精細化處理或定制化的數據產品,這兩種情況均需支付一定費用,包括提檔復制分發、數據加工處理和定制化開發服務費等。以國家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)為例,可從互聯網下載的數據大多是免費的,但利用采購的商用衛星數據研制形成的產品則需付費,用戶可在網上商店付費獲取定制請求數據、以CD-ROM 或DVD 存儲的歷史數據和出版物等。數據產品和服務的價格根據NOAA 和美國商務部的指導方針制定,價格水平需不妨礙獲取數據且定期根據市場價值和管理成本調整,并在聯邦公報上發布[2]。
歐洲國家同樣采取“無償+有償”的策略提供科學數據共享服務,數據交易主要發生在提供定制化產品等場景,一些國際組織和研究機構也會根據數據所有者和用戶權限決定數據服務模式以及數據定價。英國氣象局(Met Office)通過國家氣象圖書檔案館(National Meteorological Library&Archive)和氣象觀測網站(Weather Observation Website,WOW)無償發布科學數據在線目錄,而公開數據與具體商業場景結合定制而成的氣象分析報告則需付費使用,例如通過智能氣象模型和敏感度分析工具得出天氣條件對特定業務影響指數的分析報告,定價一般在500~1 500英鎊之間,具體要視所需時間和專業知識而定[3]。英國海洋資料中心(British Oceanographic Data Center,BODC) 的數據共享模式完全由數據所有者決定:CTD 剖面、波浪、海流等觀測數據以及自主研發的數據產品全部無償共享;用戶如需獲取BODC 與世界大洋環流試驗(World Ocean Circulation Experiment,WOCE)、聯合全球海洋通量研究(Joint Global Ocean Flux Study,JSOFS)等國際項目合作產生的科學數據,則需向如美國國家環境信息中心(National Centers for Environmental Information,NCEI)和世界數據中心(World Data Center,WDC)等項目實施單位提出購買申請[4];代表其他組織發布的數據需經過所有者授權認證才能向用戶提供,數據定價及用途規則均由數據所有者確定[5]。歐洲中長期天氣預報中心(European Centre for Medium-Range Weather Forecasts,ECMWF)則主要根據用戶權限劃分數據共享服務模式,ECMWF 由23 個成員國和11 個合作國組成,提供7×24 h 全球海洋氣象再分析數據,其成員國和合作國及其授權用戶擁有完全訪問ECMWF 產品和服務的權限,但其他商業組織必須購買商業使用許可才可獲取數據下載和API 調用等服務[6]。歐洲國家在數據流通交易方面還擁有較完善的法律和政策體系作為支撐,例如《通用數據保護條例》(General Data Protection Regulation,GDPR)注重在“數據權利保護”基礎上的“數據自由流通”。為了促進數據的進一步開放和使用,歐盟圍繞GDPR 打造了《開放數據和公共部門信息再利用的指令》[7]等一系列法律文件,為歐盟數據流通活動提供了明確規則和操作指南。
在我國,隨著大數據技術的飛速發展和國家“培育大數據交易市場”的政策引導,各地以多種形式開展了關于數據交易的探索和實踐,先后成立了貴陽、東湖、華中等48 家大數據交易所或交易中心[8]。這些交易機構多數由政府主導建立,有相當一部分數據屬于科學數據范疇,交易形式主要有API 接口、數據包、解決方案和定制服務等,在推動數據交易發展的進程中逐漸形成了系列標準和規范體系。例如,貴陽大數據交易所制定的《貴陽大數據交易觀山湖公約》《貴陽大數據交易所702 公約》《大數據交易區塊鏈技術應用標準》等文件,強化了平臺管理力度,明確了數據交易準入門檻,規范了技術手段在數據交易中的應用標準。深圳大數據仲裁中心嘗試通過電子證據固化、在線公證保全等方式為數據交易過程中產生的爭議提供解決方案,創造法治化的交易環境。這些大數據交易中心先試先行,在交易形式、標準規范、技術手段等方面開展了積極的探索與嘗試,為海洋科學數據要素市場培育提供了大量的正向參考。
但事實上,大多數交易機構的實際運營情況與預期存在著很大差距,甚至有些機構已停止運營或轉變經營方向[8]。這一局面的形成主要歸因于以下三點:一是數據量較少,內容不夠豐富,服務模式固化,不能滿足多樣化的市場需求;二是數據確權等交易機制缺失,數據所有者和使用者的利益難以得到保障,數據安全仍是制約流通交易的一把枷鎖;三是市場監管缺位,一旦發生數據泄露等安全事故,無法通過溯源得到交易過程中權利讓渡記錄;如出現交易糾紛無處投訴,無法維權,數據交易市場總體秩序欠佳。這些交易中心在發展中暴露出來的問題,值得我們進行反思,并采取積極的策略進行規避。
氣象部門是我國最早實行數據有償服務的行業部門,在科學數據流通交易方面為其他相關領域樹立了典型示范。早在1985 年,國務院辦公廳就發布了《關于氣象部門開展有償專業服務和綜合經營的報告》(國辦發〔1985〕25 號),允許和鼓勵氣象部門在繼續做好無償公益服務的同時,逐步推行有償專業服務。隨著25 號文件的批復,有償服務逐步在全國氣象部門普及,并取得了良好的效果,貴州[9]、山東[10]、廣東[11]等省市和地區的氣象部門在開展有償服務的最初幾年,就呈現出科技收入逐年增加、服務項目領域飛速拓展的良好勢頭。其成功的實踐經驗可總結為以下三點:一是利用專業優勢,通過定制化服務針對性地解決數據需求方的痛點問題;二是以農業生產、海洋漁業、交通運輸等受氣象影響較大行業的典型應用場景為切入點,通過氣象災害預測提升農業產量、為漁場提供精細化預報服務、解決省際包車業務因道路結冰導致效益差等問題的方式促進經濟社會發展;三是不斷完善氣象預報模式,健全質量管理體系,持續將氣象產品推向市場,不斷尋找新的利潤增長點,注重打造品牌效應,逐漸形成專業服務拳頭產品。
氣象部門創造性地打通了氣象產品作為商品進入市場的渠道,使氣象產品實現了從潛在到現實生產力的轉化,充分體現出數據價值,為海洋科學數據流通交易打造了優秀范本。多年來,氣象部門不斷推動專業有償服務向規范化和產業化方向發展。2014 年修訂的《中國氣象法》,以立法的形式規范氣象有償服務活動,對有償服務主體資質、項目范圍和收費標準等做出了明確的規定。國家氣象科學數據中心通過中國氣象數據網發布地面氣象、高空氣象、數值模式等10 類API接口服務,用戶可以根據需要定制臺站、層次和要素,免費試用7 天后再選擇是否購買,有償服務愈發安全便捷。
海洋科學數據是指通過海洋調查、觀測監測、海洋綜合管理、國際合作交換等活動獲取或形成并可用于科學研究活動的原始數據及其衍生數據。海洋科學數據在研究海洋本身的機理機制、科學知識,以及海洋綜合管理、海洋開發與可持續利用等方面發揮著重要作用,是關心海洋、認識海洋和經略海洋的重要基礎性信息[12]。
海洋科學數據的本質是科學數據,具有科學數據的普遍特征,同時也具有鮮明的學科領域特征。2003 年,孫九林院士總結了科學數據資源的12個特征[13]:分離性、駕馭性、共享性、客觀性、長效性、積累性、增值性、傳遞性等。隨著近20年的發展,科學數據的共享性、積累性、增值性等特征得到進一步強化。
高度開放是對科學數據的基本要求,《科學數據管理辦法》明確要求“保障科學數據安全,提高開放共享水平”,以“開放為常態,不開放為例外”為原則,大力推進科學數據資源尤其是由國家財政支持產生的科學數據開放共享。科學數據開放共享是提高科學數據共享應用水平和效率的重要方式,共享的核心要義在于讓有限資源得到最大化的利用[14]。科學數據與科研設施、生物種質等其他科技資源一樣,具有形成、成長、成熟的生命過程,其生命周期呈現螺旋式上升趨勢,且沒有銷毀終點。對科學數據進行分析挖掘,形成的科學數據產品價值難以估量,科學數據增值空間巨大,《科學數據管理辦法》首次明確了科學數據增值服務的主體、對象以及服務方式,鼓勵社會組織和企業開展市場化增值服務。
在學科領域特征方面,由于海洋本身的整體性及其與各種自然過程相互作用的多層耦合性,海洋科學研究具有明顯的特殊性和復雜性,且直接依賴科學觀測。這些長期、連續、系統和多層次的科學觀測獲取的海洋科學數據,具有種類多、覆蓋面廣、時空跨度大、獲取成本高、數據結構復雜等鮮明的領域特征。
從來源看,海洋科學數據來源于海洋調查/科學考察項目、海洋業務化觀/監測、海洋綜合管理、國際合作與交換等。從學科看,海洋科學數據覆蓋了海洋水文、海洋氣象、海洋地球物理、海洋地質、海洋生物、海洋化學、海洋光學、海洋聲學、海洋遙感和海洋基礎地理等多個學科。從數據獲取角度看,海洋科學數據采集呈現“天”(天基:遙感衛星)-“空”(空基:飛機、無人機)-“岸”(岸基:海洋環境監測站、高頻地波雷達等)-“海”(海基:浮標、船舶等)-“潛”(潛標、水下移動潛器等)-“底”(水下水聲探測等)的立體化布局,采集難度大且獲取成本高;由于海洋是瞬息萬變的,同一要素在同一地點、不同時間都在不斷地變化,所以科學觀測一般是連續的,多數海洋科學調查也要持續數年之久。由于來源多樣,數據結構也復雜多變,且不同數據之間由于時空關聯也可能具有高度耦合性。海洋科學數據具有豐富的空間、時間和屬性信息,通過分析挖掘可為深入研究海洋及其周邊其他地球系統項目作用的過程和機理提供科學、客觀的信息保障,是一座極為重要的科學金礦。
我國通過長期的海洋觀測、監測、調查和管理工作,已經產生和積累了海量的海洋科學數據,依托國家海洋科學數據中心等平臺,不斷強化海洋科學數據的匯聚、處理、管理與共享服務,建立了海洋科學數據分類分級管理體系,并以此為依據開展數據開放共享服務。目前,我國將海洋科學數據劃分為公開數據、內部數據和敏感數據三個級別,對應完全公開、有條件公開和離線共享三種服務模式。公開數據一般在互聯網上以“主動公開”的方式發布清單和實體[12],主要用于公共安全、環境保護、公益性科學研究等領域。內部數據一般只在互聯網發布數據清單,而數據實體需要按照“依申請公開”方式提供離線服務,或在海洋通信專網環境下提供實時分發和在線使用服務。敏感數據的清單和實體要求嚴格保密,一般不提供數據共享服務。
海洋科學數據開放共享,已在我國經濟開發、權益維護、環境保護、防災減災等海洋工作中發揮了重要的數據支撐作用。以國家海洋科學數據中心為例,截至2022 年底,已通過海洋科學數據共享服務門戶系統(互聯網版)發布400 余個數據集,累計已有1 100 余所涉海單位的2 萬余名用戶實名注冊,日均訪問量2 000余次,在線服務累計3 500 余萬次,熱門數據集下載量達100 余萬次。針對內部和敏感數據,通過離線定制化模式,平均每年為軍方、涉海科研院所等單位提供離線服務200 余次。數據共享成果廣泛應用在國家海洋發展決策規劃、涉海科學研究和科技創新、重大涉海工程建設和社會公眾科普等領域,應用案例和證明300余項,社會效益和經濟效益顯著。
國家海洋科學數據中心的建設成果極大地促進了海洋科學數據共享生態的良性發展,為我國海洋科學數據的互聯共享和服務應用起到了引領作用,但新的問題也隨之而來。越來越多的沿海地方和涉海企業提出了定制化的數據產品需求,需求多樣化且精細化要求高,中心不僅需要匯聚多學科技術力量開展專業化的數據分析與挖掘工作,還要制定合理的數據定價和收益分配規則。據不完全統計,目前已收到百余項數據有償服務需求,基本采用“一事一議”方法開展共享服務,亟須通過開展相關研究工作,逐步形成體系化的海洋科學數據流通交易制度、標準和技術體系,推動海洋科學數據流通交易的落地實施。
在海洋科學數據分級分類管理體系中,公開數據已在互聯網公開,不納入可交易的數據范疇;敏感數據要求嚴格保密,應作為明確不能交易或嚴格限制交易的數據內容。而內部數據一般未經過加工處理但卻最能直接反映海洋環境要素和海洋現象的本質,在此基礎上進行分析挖掘或定制產出的數據產品,極具學術和實用價值,可作為流通數據交易的主要內容。建議進一步考慮數據的覆蓋時空范圍及連續性、時間序列、空間范圍、分辨率或比例尺、應用場景等因素,持續優化更新海洋科學數據分級體系,在保障國家安全和社會公共利益的前提下盡可能給數據“松綁”,不斷提升數據開放程度,將越來越多高質量的海洋科學數據及其衍生數據納入可流通交易范疇。
海洋科學數據獲取成本極高,無法使用市場法、成本法等普適性的資產價值評估方法對其進行價值認定,在目前國內數據要素市場已探索形成的交易雙方協議定價、第三方平臺預定價、拍賣定價等定價策略[15]中,基于數據使用權的交易定價機制適用性最高,可以參考引用。首先,基于海洋科學數據多源異構多模態的特征,構建數據質量評價體系,根據數據量、類別、時間跨度、空間覆蓋范圍、完整性、一致性、實時性、權威性、稀缺性等指標給出評價結果和合理的價格區間。其次,確定數據交易形式,可考慮以API 接口、數據包、人工智能工具等方式提供產品服務,將數據交易歸結為數據和技術的增值服務。
收益分配機制是基于數據權利歸屬和定價方式的數據價值實現機制[16]。結合科學數據全生命周期流程,海洋科學數據流通交易參與方可歸納為數據獲取方、數據處理方、產品制作方、服務平臺方和數據需求方,主要職責分別為:開展數據采集、生產與制備;對數據進行排重、缺測、一致性檢查等標準化處理;研發形成高附加值數據產品;匯聚管理數據資源,公布海洋科學數據目錄清單并提供數據服務。根據貢獻大小,制定公允的收益分成比例,有助于提高數據供給方的參與積極性,實現供需雙方效益最大化。
在制度設計方面,建議相關部門聯合制定海洋科學數據流通交易管理辦法。該辦法一是要明確交易的原則性條件,即在確保公益性海洋數據無償服務的前提下,可以依法開展有償服務,服務內容包含但不限于為漁業生產、海洋開發、交通運輸、水利電力、法律仲裁等行業的企事業單位和個人提供專業產品或技術服務。二是要對數據供方資質作出要求,包括并不限于具有較強的海洋科學數據生產和整合能力,數據資源應具有明顯的學科或區域特色,且體量較大等。三是要確立服務范圍、收費標準、審查管理等具體規則,明確交易各參與方的責任權利,做到“責任可追溯、過程可控制、風險可防范”。
在安全監管與防控方面,建議有關部門成立海洋科學數據交易監管機構,該機構一般由主管部門或其授權委托的第三方專業機構承擔,主要職責是建立健全海洋科學數據交易制度和標準規范體系,對交易各方行為進行規范化管理,對交易全流程進行合規性監督,有效避免出現數據供方無資質、數據質量無保障、定價規則不透明、數據安全風險高等問題。
本文以智慧漁業、海洋交通運輸和海洋油氣開發三個受海洋影響較大的典型應用場景為切入點,探討潛在的數據市場化需求。在海洋漁業方面,近海海水養殖極易受到海洋環境的影響,為改變“靠天吃飯”的困境,滿足穩定持久發展的產業需求,可通過構建針對典型養殖經濟物種的病害與環境預測預警模型,提升海水養殖抵抗環境風險的能力;在遠洋捕撈時,結合海洋數值預報和海洋遙感數據,研究海洋要素時空變化及動力過程對漁場位置變動及移動趨勢的影響,快速準確確定漁場位置,提升捕撈效率。在交通運輸方面,可通過對長時間序列的完整潮汐周期數據進行分析挖掘,建立多點潮位站點間的潮位回歸方程,實現多點乘潮在深水航道設計中的應用。在海洋油氣開發方面,基于渤海海域衛星遙感影像數據,對海冰的空間分布、面積及外緣線的變化趨勢進行分析,通過精細化的海冰預警預測服務,有效降低海上鉆井平臺事故發生率,避免造成重大經濟損失。
人工智能、零知識證明、區塊鏈等新興技術飛速發展,將這些技術手段與海洋科學數據交易深度融合,才能規避流通交易過程中數據安全問題。例如,基于隱私計算的“數據可用不可見”模式[17]是目前較為有效的解決方案,該模式通過多方安全計算、聯邦學習等隱私計算方法對交易數據加密傳輸與保存,在“數據不動”的基礎上實現“價值流動”。海洋科學數據的原始數據一般以如專項調查數據、業務化觀/監測數據、低分辨率海底地形數據等原始接收資料和特定比例尺基礎地理數據為主,這些數據一般由國家公共財政支持的科研項目產出且開放程度較低。如能確保這些原始數據不出域,只傳輸模型計算結果,數據使用者只被允許在“數據安全島”上對數據進行合理使用和分析建模,即可有效避免數據泄露,又可實現數據所有權不因流通發生讓渡。上述技術手段都可為海洋科學數據在責權利界定、數據溯源、權利讓渡和權益保護等交易環節的安全問題提供技術方案,在未來還需要探索更多樣化、普適性的綜合技術方案,從應用場景出發保障海洋科學數據要素安全可控。
加快培育數據要素市場,促進數據流通交易已成為大勢所趨,在數據作為新生產要素的時代背景下,實現海洋科學數據從數據資源到數據資產再到數據資本的轉變,是推動數據要素流通、釋放數字資源紅利、促進數字經濟發展的重要舉措。本文結合《科學數據管理辦法》的有關要求,借鑒國內外政策理念和實踐經驗,提出與我國海洋科學數據開放現狀及市場需求相適應的流通交易實施路徑,以期激活數據要素潛能,釋放數據要素價值,充分發揮海洋科學數據驅動數字經濟高質量發展的引擎作用。