徐 玄,于連超,任思源
(中國計量科學研究院,北京 100029)
當前,生命科學已成為前沿科學研究活躍領域,而生物技術正在成為推動未來發展的關鍵因素。隨著生物技術的快速發展,以基因組學、遺傳學和神經信息學等為代表的各學科領域積累了龐大的數據信息資源,與此同時,生物數據以其數據量大、價值高和多樣化等特征,在疾病預防、疾病診斷以及疾病治療等領域的重要性正日益彰顯。《自然》雜志2018 年10 月刊以封面文章展示了通過收集50 萬人的體液、血液以及他們的家族病史和生活習慣等生物信息,建立了前所未有的高質量生物信息數據庫,極大地促進全球數千名科學家開展研究,深入理解人類疾病[1]。因此,生物數據已成為生命科學進步的重要引擎,并且正在從根本上改變生物健康產業的發展格局。
以美國為首的西方國家高度重視生物大數據的發展,發布了一系列相關戰略規劃,積極推動基因組學研究、醫學遺傳學以及生物信息學等領域的創新融合,研究其生物數據戰略的政策內容及特點對我國相關戰略的制定具有較高的借鑒價值。黨的十八大以來,我國在生命科學研究與生物產業發展領域取得了巨大的成果,對生物數據的重視也在日益提升。2017 年12 月,我國正式啟動世界最大規模的人類基因組計劃,旨在通過構建中國人的精密基因組圖譜,深入研究疾病與健康之間的基因遺傳關系。2021 年3 月,《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035 年遠景目標綱要》(以下簡稱“十四五”規劃)中也明確提出構建國家生物數據中心體系、制定完善人類遺傳資源和生物資源目錄等要求。同時,我國生物數據的發展也面臨不少挑戰,生物數據資源開發利用體系尚不完備,生物數據發展缺乏頂層設計和統籌協調等,需科學分析國內外生物數據發展形勢,把握面臨的風險挑戰,科學規劃、系統推進我國生物數據戰略規劃。
為推動我國生物數據戰略進一步發展,本文全面梳理美國生物數據戰略演進歷程,掌握其基本發展規律,總結美國生物數據戰略實施過程中的關鍵舉措和主要特點,立足于我國生物數據發展現狀與問題,系統性設計我國生物數據發展路徑,以期為我國生物數據戰略的頂層設計提供參考借鑒。
戰略的演進緣于戰略制定的與時俱進。所謂戰略制定,就是根據當下時局為背景,立足于國家利益為根本出發點,制定適合未來國家發展的宏觀方略和微觀方案的過程。美國生物數據戰略經過比爾·克林頓到約瑟夫·拜登五屆政府的發展后,其戰略體系逐漸完善,戰略框架日漸清晰。通過對美國生物數據戰略演進的研究,掌握其基本發展規律,研判其未來發展的基本方向,具有極為重要的意義。
美國作為隱私權的發源地,歷來高度重視個人隱私的保護。早在1890 年,美國學者沃倫和布蘭迪斯共同在《哈佛法律評論》發表了一篇題為《隱私權》的論文,被學界認為是最早在法理上對“隱私權”的論述[2]。為維護美國公民隱私,美國國會于1974年12 月通過《隱私權法》,該法案對涉及美國政府有關部門收集和利用個人數據等方面做出規定。
與此同時,隨著生物科技的飛速發展,人體的指紋、面容等個人生物識別信息的獲取和應用越來越便利和普及,美國對個人生物信息安全的關注度日益提升[3]。與一般個人信息數據相比,生物識別信息具有唯一性、永久性和不可替代性的特點,因而可能會引發侵犯隱私、種族歧視等風險。1996年8 月,克林頓總統簽署通過《1996 年健康保險可移植性與責任法案》(HIPAA 法案),HIPAA 法案主要關注醫療保健數據的隱私安全問題[4]。1999年11 月,美國衛生與公共服務部(HHS)發布了征求公眾意見的《HIPAA 隱私規則》建議版本,對HIPAA 法案進一步充實完善,其中規定了例如指紋和聲紋、面容特征等個人生物識別信息使用和披露標準,并確保了病人對其個人生物信息的控制權和隱私保護。根據這些意見,美國衛生與公眾服務部于2000 年12 月發布了《個人可識別健康信息的隱私標準》,強調確保公民的醫療健康信息得到有效合規利用,從而為大眾提供更優質的醫療服務。HIPAA 法案奠定了美國生物數據政策的基礎,對隨后的相關法律和政策制定產生了深遠影響。
美國生物戰略源于對公民生物信息的保護,在其后續的發展過程中,隨著生物技術的快速發展與美國國家需求的變化,美國生物數據戰略也不斷擴展其范圍和內涵。
一是持續在生命健康領域擴展。隨著HIPAA 法案生效至今,經歷了20 余次的修訂完善,已經比較完備地對公民生物信息保護做出了規定。2008 年國際金融危機爆發后,美國在保障人民生活的公共物品供給領域出現了嚴重不足,尤其是醫療保障領域的供給嚴重缺乏。為應對這一問題,奧巴馬政府將改革美國醫療保障體系作為執政重點之一,目標是建立覆蓋廣泛而又費用低廉的醫療保障體系。奧巴馬醫改涉及了眾多方面的改革,包括擴大醫療保險覆蓋范圍、推動醫療記錄的電子化等。2009 年2 月,美國國會通過了《經濟和臨床健康信息技術法案》(HITECH 法案)[5],鼓勵全美各醫院與相關機構通過數字化的方式儲存電子病歷等相關生物信息數據。HITECH 法案順應了電子時代個人健康醫療數據逐步電子化的趨勢,進一步擴展了HIPAA 法案的適用范圍。在醫療改革的框架下,奧巴馬政府意識到生物數據對精準醫療的重要性,2015 年1 月,奧巴馬政府推出精準醫療計劃,旨在通過收集和分析患者的遺傳、生活方式等大規模生物學和臨床數據集,實現對每個患者進行精準的疾病風險預測、早期篩查、診斷和提供個體化治療方案,以提高疾病防治效果和患者生活質量。此外,精準醫療計劃也關注了數據隱私和倫理問題,政府致力于確保在收集、存儲和共享個人生物信息時,保護患者的隱私和數據安全。
二是滿足國家安全的整體需要。由于“9·11”事件的影響,布什政府極為重視貫徹實施信息安全戰略的措施,特別是在炭疽攻擊事件發生后,美國多次發現恐怖組織試圖開發生物武器,這引起了政府的極大關注。隨著生物學的快速發展,特別是對人類與微生物之間長期共生關系的新認識,布什政府強調了“先發制人”戰略,并決心提高美國國家的生物安全能力。生物安全能力的提升不僅包括疫苗、藥物和檢測診斷等醫學應對措施,還涉及到各種監測設施與網絡系統、大規模生物數據的收集與大型計算機的分析處理系統等多個方面。2004 年4月,布什政府出臺《21 世紀生物防御》行政令確立以感知、預防、檢測、響應為主生物防御領域的四大支柱。在這背景下,美國特別注重構建生物監測能力和推動核心技術的研發,在2005 財年預算中增加了2.74 億美元資助生物監測計劃。2012 年7 月,奧巴馬政府發布的《國家生物監測戰略》再次強調要整合國家生物監測系統的重要性,以便在危急情況下及時為決策者提供信息。2018 年9 月,特朗普政府發布美國首個全面解決各種生物威脅的系統性戰略《國家生物防御戰略》,提出要建立高效的生物威脅監測和應對網絡,加強國內外生物信息的及時共享和交流,以提高對突發生物威脅的防范和應對能力。
隨著新冠疫情的暴發,百年變局加速演進,世界經濟形勢總體極為嚴峻。全球主要經濟體增速放緩或負增長,國際貿易和投資大幅萎縮。以美國為首的發達國家通脹率居高不下,美聯儲連續加息導致金融環境收緊。與此同時,俄烏沖突引發糧食能源危機,進一步加劇通脹壓力。各國面臨的經濟下行壓力和通脹壓力“雙疊加”,當前全球經濟增長動能明顯不足,復蘇乏力。
相較美國前任政府的生物數據戰略,拜登政府更加注重生物數據在促進美國科學與經濟發展中的作用。2022 年8 月,美國總統拜登在白宮正式簽署了《芯片和科學法案》,該法案分為半導體、科學研究兩個部分,其中在科學研究部分就對生物經濟的發展提出建設性意見。其中,該法案針對生物數據庫及相關工具的發展提出四點建議:一是在不危害國家安全及數據隱私的前提下,支持建立、篩選和維護包括植物、動物和微生物在內的基因組學、表觀遺傳學和其他相關的組學數據庫,以供研究人員開展工程生物學研究;二是制定生物數據庫的相關標準,包括篩選標準、互操作性標準以及隱私和安全保護標準;三是支持開發包括人工智能工具在內計算工具,以加速基于這些數據庫進行的研究和創新活動;四是對聯邦政府所有的生物數據庫進行評估,根據發展需要對其進行適當改進,并為生物數據基礎設施投資提供決策信息。
2022 年9 月,拜登政府宣布啟動《國家生物技術和生物制造計劃》,其中為了促進美國生物經濟的發展,提出將建立生物經濟數據共享倡議(Data Initiative)。該倡議提出一是加大對促進衛生、氣候、能源、糧食、農業和生物制造發展相關的基因組和多組學信息等生物數據的研發;二是支持建立生物數據庫平臺,從而確保高質量、廣泛、易于獲取和安全的生物數據庫能夠推動美國生物經濟取得突破。2023 年3 月,為跟進《國家生物技術和生物制造計劃》,美國白宮科技政策辦公室(OSTP)聯合能源部、農業部、商務部、衛生與公眾服務部、國家科學基金會共同發布報告《美國生物技術和生物制造戰略目標和優先事項》,用以推進美國本土的生物技術和生物制造,強調要在 5 年內進一步發展生物數據基礎設施與先進數據共享機制,通過基于生物數據的相關標準、工具和功能的研發和集成,支持生物技術促進商業化和貿易的發展。
隨著經濟社會不斷發展和國際局勢的變革,美國生物數據戰略也在不斷的調整與轉型,從過去側重公民生物信息保護,向更加全面和系統的方向發展。在這一轉型的進程中,美國采取了一系列舉措以滿足包括推動生物經濟發展、提高公民醫療健康水平、加強生物信息安全管控等多重需求。
由于生命的復雜性,生命科學研究往往面臨著實驗結果數據高度不可復現的嚴峻挑戰。根據全球生物標準研究所(Global biological Standards Institute,GBSI)的研究結論顯示,生命科學領域研究導致實驗數據不可復現主要因素包括生物試劑和標準物質、實驗設計、數據分析方案以及實驗室操作程序[6]。研究測量結果的可復現和可溯源,本身就是計量科學的范疇,而參考測量方法和標準物質研究正是生物計量學所研究的核心[7]。以美國國家標準與技術研究院(NIST)為首的科研機構一直以來通過開發核酸、蛋白質、代謝物和細胞系統的定量分析測量工具,以及制定相關關鍵標準與方法等舉措,為生物技術研究人員提供測量幫助。2022 年8 月,美國《芯片與科學法案》中再次明確要求NIST 開展基因測量、生物分子及系統測量、研發測量標準和標準物質等研發任務,以保證美國相關行業在全球中的競爭力。
與此同時,隨著高通量測序技術的不斷發展,組學數據已經從以基因組為代表的PB 量級時代提升到多組學融合的EB 量級時代,如何保證生物數據的分析結果準確可靠成為目前研究的熱門話題。美國政府長期以來大力支持計量與大數據技術的深度融合與創新,并從國家層面持續推動生物信息核心技術體系建設。早在2016 年5 月,美國國家科技委員會發布國家大數據戰略性文件《聯邦大數據研發戰略計劃》,強調新興技術對推進大數據發展的重要性。緊隨其后,2018 年6 月,NIH 也相應地提出《NIH數據科學戰略計劃》,指出要從生物醫學數據的精準采集、數據的標準化管理以及大數據分析技術入手,最終確保由 NIH 資助的全部科學數據符合 FAIR(definable,accessible,interoperable and reusable)原則,以加速生物醫學研究的進展[8]。2022 年9 月,拜登簽署的《關于促進生物技術和生物制造創新以建立可持續、安全和有保障的美國生物經濟的行政命令》,進一步強調新興生物技術的基礎研發要與計量、標準等技術進步相結合。通過生物計量技術和大數據等計算機技術的深度融合,將為多組學時代的大數據分析的廣泛使用和大型數據集的集成帶來新的機遇,進而驅動生物經濟迭代發展。
美國高度重視生物數據基礎設施建設,深刻認識到強大的基礎設施對實現生物信息應用價值的戰略意義。為此,美國政府在國家層面持續大力投入,培育和壯大了一系列頂尖的公共生物信息數據庫,如美國國家生物技術信息中心(NCBI)、國家標準參考數據中心(NSRDC)等。這些數據庫為科學家提供海量的數據資源,支持開展前沿生物領域的科學研究,推動生物技術成果轉化。
以NCBI 為例,它由美國國立衛生研究院于1988 年創立,致力于研發尖端信息技術來助力解析生命的奧秘,創建可存儲、分析、共享各類生物信息的大型自動化系統,并大力推廣數據庫和軟件工具在科研中的廣泛應用。NCBI 的建設和運行主要依靠政府財政撥款支持,2017—2021 年期間,NCBI 每年獲得3 億~4 億美元的穩定資助[9]。在資金持續投入的促進下,NCBI 已經發展成為全球最大最全面的公共生物信息數據庫,據2023 年1 月的最新數據顯示:NCBI 共擁有35 個不同數據庫,這些數據庫總共包含3 億條記錄[10]。以NCBI 下屬用于儲存高通量測序數據的SRA(Sequence Read Archive)數據庫為例,2018—2021 年的年均增長率均在30%以上,2021 年底SRA 的數據規模已超過36PB。
NCBI 數據庫資源的高速擴張,充分反映了美國政府在加強生物信息基礎設施建設方面的戰略決心和持續投入力度。隨著生物數據量呈幾何級數增長,美國開始關注構建聯盟式的分布式數據庫網絡。拜登政府2022 年9 月的《關于促進生物技術和生物制造創新以建立可持續、安全和有保障的美國生物經濟的行政命令》明確提出建立生物數據共享聯盟,旨在通過連接各種分布式數據庫資源,最大限度匯聚信息以釋放更大應用價值。這表明美國將打造靈活的分布式網絡作為數據基礎設施建設的新方向。美國在生物數據基礎設施建設上持續進行巨額投入,并建立了長期穩定的支撐機制。與此同時,美國還及時根據生物數據爆炸的現實情況,進而調整技術路線。這種持續的資金支持與靈活的技術策略調整,都服務于美國全力促進生物經濟快速發展的國家戰略目標。
科學數據的有效匯交與高效共享,對推動生命科學與生物經濟發展具有戰略意義。數據匯聚可以避免重復建設和研究,共享可使更多科研人員獲得已有成果,充分發揮協同效應。此外,共享機制還可加速研究成果轉化,使更多社會群體從中受益,這也是美國政府持續推進生物信息流通體系建設的重要原因。美國主要從3 個層面持續推動生物數據的有效匯聚與廣泛共享。
在生物數據匯聚端,美國各大科研資助機構、大型科學研究計劃要求其資助的研究項目提交科學數據的管理計劃。美國主要的科研資助機構如國家國立衛生研究院(NIH)、美國國家科學基金會(NSF)、美國國家標準與技術研究院等都制定了數據提交制度。以NIH 為例,2023 年1 月《NIH 數據管理和共享政策》正式生效,該政策進一步強化了NIH 的長期承諾,即通過有效和高效的數據管理和數據共享實踐向公眾提供NIH 資助的研究的結果。同時,“人類基因組計劃”“DNA 元件百科全書計劃”等大型科學研究計劃建立了數據匯交制度,從而實現數據共享。此外,美國擁有Science、Cell等全球高質量的生物醫學期刊,長期吸引著全球高水平的生物醫學研究成果發表。這些期刊規定研究人員要將科學數據匯交到 NCBI 指定的數據庫中。正是這種可持續的數據匯聚,才使NCBI 能穩步快速擴張,發展成為全球最大的基因序列數據庫之一。
在生物數據儲存端,美國相關機構一致認為標準化儲存是推進生物科學研究的關鍵環節。具體來看,NSF 資助的研究計劃都明確要求利用數據庫等標準化格式來儲存科研過程中產生的數據。早在2011 年,NSF 就在其《申請與資助政策指南》中首次增加了數據管理計劃(DMP)的要求,提出研究人員若條件允許,應當優先使用大型的、可公開訪問的社區公認數據存儲庫來儲存各類研究數據,并針對不同數據類型使用符合標準的儲存格式和元數據格式。此外,NSF 還采用了項目負責人負責制來實施數據管理要求,要求研究計劃在申請書中詳細描述各參與方在數據管理過程中的職責分工,并且項目的年度報告和最終報告中也必須包含數據管理計劃的具體執行情況,這些詳細的要求反映出NSF對標準化生物數據儲存的高度重視。與此同時,NIH也非常關注生物信息標準化儲存,《NIH 數據科學戰略計劃》提出要解決海量生物醫學研究數據的存儲效率和安全性問題。隨著生物信息學進入大數據時代,生物數據類型日趨復雜豐富,美國相關科研機構正在采用了可擴展的數據庫技術來儲存不同格式的生物數據,并重點實施數據的生命周期管理,從而有效挖掘與整合分析這些不同類型的數據,進而實現生物信息學的理論與應用研究[11]。
在生物數據共享端,美國則注重建立用戶友好的數據庫服務平臺,以便數據被廣泛使用。例如NCBI 就利用網絡技術、可視化圖形、人機交互等前沿手段,使其旗下生物數據庫更易于訪問和理解[12]。此外,美國還通過立法持續支持開發更多生物信息分析工具,以進一步擴展數據庫的應用場景。2022年8 月,《芯片與科學法》中再次提出支持開發計算工具,包括人工智能工具,能夠加速利用這些數據庫進行研究和創新。2022 年9 月,《國家生物技術和生物制造計劃》明確表示未來生物數據庫平臺建設應滿足可查找、可訪問、可互操作和可重用四類要求。這種數據庫技術創新的思路,使美國生物信息平臺在世界范圍內數一數二,并且通過匯聚、儲存、共享3 個層面的協調發展,美國形成了高效的生物數據流轉體系,為生物經濟快速推進提供了有力支撐。
美國構建了較為完善的政府數據開放和公民隱私保護的法規體系。《信息自由法》《隱私權法》等法律在規范美國政府信息利用以及公民隱私權保護方面發揮著重要作用,這些法律成為美國政府數據開放制度的關鍵基石[13]。針對醫療衛生數據,美國衛生與公眾服務部頒布了《HIPAA 隱私規則》以滿足HIPAA 法案的要求。并且,由于信息技術的發展,對公民信息的保護難度會逐漸提升。國會因此要求指出美國衛生與公共服務部需要在HIPAA 法案中納入對個人健康信息的隱私保護條款。在科研數據方面,美國NIH、NSF 等科研機構也高度重視參與者隱私的保護,并將其視為研究者和機構共同的責任。在2022 年9 月,為促進高效的科學數據共享,保護研究參與者的隱私,NIH 跟進發布了《NIH數據管理和共享政策補充信息: 共享人類研究參與者數據時保護隱私》,其中建議對科學數據進行最大程度的去標識化,建立數據共享和使用協議以及宣傳教育等手段防止數據泄露與濫用。
全球正迎來一場新一輪科技革命和產業變革,大數據技術的廣泛應用大幅提升了生命科學與生物技術的研發效率。與此同時,測序技術的迅猛發展推動了各種組學技術快速成熟并逐步應用于臨床領域,使得生命科學進入了大數據、大平臺、大發現的時代[14],而海量的生物數據已經成為支撐科學研究和產業創新不可或缺的寶貴資源[15]。在這樣的背景下,生物數據在推動科學研究、促進生物產業發展以及保障國家安全等方面的重要性不言而喻,因此,我國正在積極推動生物數據戰略的制定與實施。
一是開展生物數據戰略頂層設計。2021 年3 月,《“十四五”規劃》提出了在生物安全領域的規劃,其中包括統籌布局生物安全基礎設施,構建國家生物數據中心體系,加強高級別生物安全實驗室體系建設和運行管理。強化生物安全資源監管,制定完善人類遺傳資源和生物資源目錄,建立健全生物技術研究開發風險評估機制,為我國新時期生物數據戰略指明方向。同年10 月,國家發展和改革委員會緊跟發布《“十四五”生物經濟發展規劃》,其中強調建立國家層面生物資源共享體系。推進生物資源受控共享和安全交換,推進生物資源在科學研究、工業生產、臨床診療等領域的應用。建立統一的資源數字信息管理接口標準,實現跨地區、跨類型的資源數據集成及無縫連接,提高生物資源共享和生物數據高效利用能力。統籌實現我國生物數據資源統一匯交共享。
二是進一步夯實生物數據基礎設施。2017 年4月,科技部印發《“十三五”生物技術創新專項規劃》,其中強調以國家目標和戰略需求為導向,加強科研平臺和基礎設施建設,積極推進國家生物信息中心和人類遺傳資源庫、生物醫學大數據等重大戰略資源平臺建設。2022年1月28日,國務院印發《計量發展規劃(2021—2035 年)》,明確提出在生命健康領域培育一批計量數據建設應用基地,建設國家標準參考數據庫[16]。
三是推動生物數據資源共享和管理規范化。早在2018 年 2 月,科學技術部、財政部印發《國家科技資源共享服務平臺管理辦法》,強調規范管理國家科技資源共享服務平臺,推進科技資源向社會開放共享[17]。隨后,2018 年 4 月,國務院辦公廳印發《科學數據管理辦法》,進一步規范管理戰略生物資源數據。并在2019 年6 月,科技部、財政部聯合發布了《關于國家科技資源共享服務平臺優化調整名單的通知》,其中包括了生命科學和醫學等20 個國家科學數據中心[18]。并且,在2019 年國家生物信息中心也已正式掛牌,標志著我國生物大數據管理進入實質建設階段。
四是加強生物安全與數據安全管理。為確保生物數據安全與合理利用,中國于2020 年10 月頒布了《中華人民共和國生物安全法》,該法明確指出建立統一的國家生物安全信息平臺,有關部門應當將生物安全數據、資料等信息匯交國家生物安全信息平臺,實現信息共享[19]。隨后,在2021 年4 月,《中華人民共和國數據安全法》正式出臺,強調要堅持以數據開發利用和產業發展促進數據安全,以數據安全保障數據開發利用和產業發展,該法對生物數據的安全利用以及實現生物經濟有著重要的指導意義[20]。
這些政策的制定與實施為中國生物數據的合理管理、科學研究的推進以及生物產業的發展提供了堅實的法律和戰略基礎。然而,我國生物數據發展依舊面臨問題,主要有以下幾個方面:
一是運用計量技術、大數據等工具促進生物數據發展的應用機制不健全。生物計量是計量科學中的前沿領域[21],能夠為生物制造提供準確數據和參考標準,是保障國家安全和實現生物經濟中的關鍵支撐。大國競爭形勢下,美國極其重視計量、大數據等技術研發工作,雖然我國已提出要推動生物技術創新,但更多聚焦于生物能源、生物材料等領域,相比美國在生物信息核心技術體系建設方面的全面布局與前期積累,我國在生物計量技術和大數據分析應用等方面的研發投入力度還稍顯不足。
二是生物數據基礎設施建設與我國生命科學研究與產業快速發展的需求不匹配。生命健康領域被視為最有望實現革命性突破的重點領域之一,而生命健康產業快速發展的根基在于生物信息資源的收集、整合與應用。目前我國存在生物數據庫數量有限、數據庫更新不及時、數據缺乏標準化、數據庫穩定性差、數據主體形式單一以及數據共享性差等情況[22],嚴重限制了科學研究、醫療創新和生物科技領域的進步,進而導致未能有效滿足產業快速發展的需求。
三是生物數據管理機制不完善,戰略部署欠缺。目前,我國針對生物數據的頂層規劃設計大都只停留在鼓勵建設相關數據庫的層面,而在生物數據的采集、管理、應用以及共享等方面,缺乏相應的制度設計。另一方面,我國各有關部門對生物數據資源的職責劃分不夠清晰,數據共享和開放程度有限,人力和資金資源投入有限,統籌不足,尚未形成工作合力。
聚焦計量、大數據等工具等生物信息核心技術,發揮我國集中力量辦大事的制度優勢,盡快縮小與世界領先水平的差距。堅持密切跟蹤國際技術前沿,組建高水平創新團隊,著力培養具有世界科技前沿水平的高層次領軍人才。強化國家戰略科技力量的引領作用,加強生物計量科學家、計算機與大數據專家與生物學家的交流,通過學科間深度交叉融合,使得計量科學的相關理論方法可以提升生物研究過程中的實驗實踐基礎能力,從而幫助研究者對其所研究的實驗結果數據盡可能接近真實。
堅持“四個面向”,強化財政經費保障,優先支持生物信息領域關鍵技術研發與國家亟需的生物大數據基礎設施建設,努力實現我國生物數據資源的獨立自主和安全可控。此外,由于我國長期以來存儲和管理數據的經驗不足,并且生物信息技術攻關存在較大難度等因素,建議我國通過“賽馬制”“揭榜掛帥”等考核機制,遴選一批高水平、基礎扎實的研究團隊實行有效的穩定支持,確保我國生物數據資源的高效利用和可持續發展。
加快制定統一完善的生物數據管理法規體系,明確不同部門和單位在生物數據管理中的職責,加強統籌協調,保障生物數據合規合法利用。借鑒發達國家成功經驗,結合我國國情建立有效的生物數據匯聚和共享機制,通過制定激勵政策鼓勵科研工作者提交實驗數據,并監督管理數據質量。積極推動生物數據領域的標準化工作,提升科研數據質量,研發用戶友好的生物數據庫服務平臺,實現不同系統之間的互操作性,促進生物數據被廣泛高效的使用。