李啟沅 王博 吳靜靜

摘 要:本文首先論述了海洋生物樣本及其信息重要的科學意義,并對國內外海洋生物產業發展趨勢進行闡述,通過對比目前國內外海洋生物樣本保藏數據標準化情況,提出了海洋生物樣本的信息化管理,明確保藏核心元數據是整個信息化管理的重要基礎,并在此基礎上初步搭建了標準框架。
關鍵詞:海洋,生物樣本,保藏,信息,核心元數據,標準化
DOI編碼:10.3969/j.issn.1002-5944.2022.20.008
生命大健康產業是全球發展速度最快的產業之一,是各國推動經濟增長和優化經濟結構的重要力量。近年來,海洋生物資源已經成為世界各國競相開拓的新的健康產業資源,尤其在海洋藥物與生物制品方面,英國、美國、西班牙等國家將其提至戰略發展層面,持續加大在海洋生物醫藥領域的研發投資力度。海洋健康產業已經成為大健康產業發展的新趨勢[1]。海洋生物產業的發展與海洋生物技術的發展息息相關。海洋特殊的生態環境造就了海洋生物特殊化學結構和生物活性。以海洋生物為原料或從中提取有效成分,利用現代生物技術生產海洋生物化學藥品、保健品和基因工程藥物等產業發展迅速。而海洋生物樣本則是所有活動的前提,也是基礎研究的源頭和關鍵環節,具有重大的科學、社會與經濟價值。海洋生物樣本研究數據不但含有時間信息,并且含有海洋深度、定位等信息。相對于陸地生物樣本,要準確合理地長期保存海洋物種數據相對比較復雜。隨著數據采集手段的不斷進步,數據存儲趨于海量化。大量數據資源沒有統一的格式,缺少對原始數據有效記錄和說明,使用者很難正確理解并利用數據。因此,對海洋生物樣本元數據標準進行深入研究顯得尤為重要,以期為使用方提供可以識別的、有價值的數據,實現互通互聯。
1 海洋生物產業發展趨勢
根據2022年10月Markets and Markets發布的《海洋生物技術- 全球市場趨勢與分析》顯示,2020年全球海洋生物技術市場大約為57億美元,預計到2027年將增至92億美元[2]。醫藥、食品、農業和化妝品行業對海洋生物原料的需求促進了市場的增長。美國對海洋生物技術日益重視,對專門從事海洋生物技術的海洋研究中心進行巨額投資,根據統計,在2021年美國海洋生物技術市場已經達到了11億美元。
自1978年全國科學大會提出“向海洋問藥”后,我國海洋藥物開發研究不斷得到國家重視。近年來,海洋生物醫藥產業的發展已經上升至國家戰略高度。《國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》提出“積極拓展海洋經濟發展空間”的戰略部署;《“十四五”海洋經濟發展規劃》以深化供給側結構性改革為主線,以改革創新為根本動力,加快構建我國海洋生物醫療產業快速發展。隨著國家政策的支持和研發力度的不斷加大,海洋生物醫藥產業市場規模逐漸增大,產業增加值從2016年的336億元增長至2021年的492億元[3]。這為我國海洋生物技術行業的發展帶來了政策上的保證。遼闊的海域面積和豐富的海洋生物資源也是我國發展海洋生物技術產業的巨大優勢。根據Reportlinker 發布的關于全球海洋生物技術產業的報告顯示,美國、加拿大、日本、中國和歐洲將推動該領域5.2%的年復合增長率。中國是這一領域中增長最快的國家之一。在澳大利亞、印度和韓國等國家的引領下,亞太地區的市場預計到2026年將達到2.026億美元[4]。
2 國內外標準化現狀
2.1 國外海洋生物樣本保藏信息標準化概述
海洋生物為近年來迅速發展的新興產業,海洋樣本保藏數據相關的標準或技術操作規范還是在各個相關的產業組織或研究組織中自行制定并使用。然而,不同組織對于生物樣本保藏的信息側重點有所不同,導致系統中的數據結構、格式方式均存在差異,對數據共享造成了阻礙。元數據是按照一定標準,對信息資源進行規范化描述,是特征元素的集合。規范化的描述可以準確且完備地說明信息資源的各項特征。
在海洋領域關于元數據標準研究主要有:國際海洋資料和信息交換IODE的MEDI(海洋環境數據目錄),歐洲的EDIOS(歐洲海洋觀測系統數據目錄)以及ODAS(海洋數據獲取系統)等[5]。但在生物樣本保藏領域,國際標準化組織并未在信息數據方面開展相關的標準化活動[6]。目前,國際標準化組織僅集中在海洋技術領域,如在海洋和海域觀測、開發和保護用設備、系統、基礎設施和技術的試驗方法、操作、設計、建造和后勤方面設立標準化組織,設立的技術委員會分會為ISO/TC 8/SC 13 Marinetechnology(海洋技術)。 但無論是在與生物技術相關的技術委員會(如 ISO/TC 276、ISO/TC 215和ISO/TC 212),還是海洋領域的技術委員會,均沒有海洋生物技術領域相關的標準。
2.2 我國海洋生物樣本保藏信息標準化過程及現狀
海洋生物相關的標準主要是集中在海洋生物調查、生物質量和術語類的方面;行業和地方標準主要是集中在海洋生物樣本的技術檢測方法方面,對于樣本保藏信息數據方向目前尚未有相關標準。
而我國海洋生物技術領域研究隨著“十四五”期間國家的政策支持和研發力度不斷加大,產業發展正處于加速期。而與我國海洋生物技術的加速發展相比,海洋生物樣本保藏信息標準化的發展明顯呈現滯后狀態,主要表現在對于各個樣本采集、儲存,研發機構之間在數據表達和結構方面存在差異性,缺乏統一性。
我國與國際存在相同的問題,即更多在海洋勘測、海洋漁業、海洋生態等領域進行標準化規范。海洋生物樣本保藏信息在國家標準層面還處于空白,未建立成體系的標準規范。
3 海洋生物樣本保藏信息標準化的建設構想
3.1 設計路線
海洋生物技術是海洋大數據產生和應用的重要領域之一,加強大數據建設是海洋生物技術發展的必然要求。生物樣本是發現疾病成因和表征疾病發展不可缺少的資源,是開發新藥、診斷和治療方法的重要依據,是預測和治療人類疾病以及作物改良和創新的基本平臺。海洋生物更是因為其生物多樣性和龐大的物種數量而被為海洋生物產品的來源,樣本的保藏顯得尤為重要。海洋生物樣本保藏包括樣本采集、處理、保存、檢索和分發,樣本保藏信息技術路線如圖1所示。
3.2 標準項目建設構想
(1)標準框架構建
海洋生物樣本保藏核心元數據主要由數據標識信息、數據內容信息、數據質量信息和元數據信息等4個元數據子集組成,圖2為海洋生物樣本保藏核心元數據標準結構框架。
(2)數據標識信息
數據標識信息描述了數據集的基本信息,包含唯一標識數據的信息,是元數據的重要組成部分,其中包括數據集引用、摘要、關鍵字或詞、數據分類等元素。通過對格式、樣本瀏覽圖、限制、關鍵字、項目信息等標識信息作出明確定義,可以讓不同領域的用戶對數據有一致性的理解。
(3)數據內容信息
數據內容信息是關于數據要素的說明,提供數據集內容特征的描述信息。數據集包含海洋樣本采集要素的類型以及相應的要素名稱、數量級單位等相關內容特征信息。對其所派生的子類分別定義兩個描述子類:數據要素說明和數據覆蓋層說明[5]。數據要素說明用于數值型數據以及圖層數據的內容描述;內容信息的“資源域”屬性是必備的元數據元素,用以描述數據集所在的資源范圍。
(4)數據質量信息
數據質量信息包括數據覆蓋范圍、數據質控方法、數據質控標識等,其擁有統一的檢查規則管理、檢查規則的審批流程定義,是對數據集質量的總體評價。數據覆蓋范圍是對數據集的時間范圍和空間范圍的描述,需要明確數據集的時間序列和采樣頻率等;考慮到海洋生物樣本的地理空間分布性,空間范圍用于描述采樣數據的地理位置、采樣深度等。規范化數據質控方法是為了甄別異常數據所采用的數據質量控制方法。數據質控標識主要提供有關資料的質量信息(包括反映數據的質量水平、質量控制方法、可疑或者錯誤的類型和是否訂正的信息等),同時在對數據進行質量控制過程中應詳細標識數據的質量情況,并最終給出簡單明了的質量標識。
(5)元數據信息
元數據通常被定義為關于描述數據的數據或數據的數據,對數據及信息資源的描述性信息。目的是在不同人或系統之間共享有關信息資源,實現對信息資源互操和管理。元數據信息主要用于描述元數據使用的語種、字符集、圖像等關于元數據的重要信息。通過對元數據信息的規范,有助于數據的整合、匯總和分析,實現信息的管理、利用和共享。
4 結 語
標準作為支撐產業發展的技術力量,對推進海洋生物技術高質量發展具有重大意義。本文綜合國內外對海洋生物樣本保藏數據的現狀,提出了建立海洋生物樣本保藏信息核心元數據標準化構想。海洋生物樣本保藏信息核心元數據標準是實現互操和互換的支撐,可以促進跨領域的共享和應用。
參考文獻
陳力,吳黃銘,湯熙翔.我國海洋生物資源在大健康領域的應用現狀分析[J].海洋開發與管理,2022,39(8):17-21.
Resea rch a nd ma rkets. Ma r ine Biotech nolog y - Globa lMarket Trajectory & Analytics[EB/OL].[2023-01-11]. https://w w w.resea rcha ndma rkets.com /repor ts/4911755/ma r inebiotechnology-global-market-trajectory.
火石創造.海洋生物醫藥產業發展要素與趨勢分析[ E B /OL].(2022-06-30)[2023-01-11]. https://www.hsmap.com/detail/1/956.
GlobeNewswire. Global Marine Biotechnology Market to reach$5 billion by 2026[EB/OL].(2022-03-11)[2023-01-11]. https://www.globenewswire.com/news-release/2022/03/11/2401843/0/en/Global-Marine-Biotechnology-Market-to-Reach-5-Billionby-2026.html.
宋坤,周雪.元數據技術在海洋觀測數據集成中的應用研究[J].海洋開發與管理,2014,31(6):14-17.
陳喆民,王曉鋒.海洋核心元數據標準初探[J].現代計算機(專業版),2007(6):120-122.
作者簡介
李啟沅,高級工程師,主要從事生物技術標準化研究。
王博,副研究員,主要從事生物技術研究。
吳靜靜,通信作者,主要從事生物技術標準化研究。
(責任編輯:張佩玉)