999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生命組學大數據安全管理實踐

2024-12-01 00:00:00王彥青陳婷婷張思思朱軍偉陳煥新肖景發宋述慧章張趙文明鮑一明
農業大數據學報 2024年3期
關鍵詞:安全管理

摘要:生命組學大數據是國家重要基礎性、戰略性資源,對支撐生命科學基礎研究和應用創新、推動生物經濟創新發展、維護國家安全具有重要意義。隨著數據規模的不斷增長,生命組學大數據的安全管理問題逐漸凸顯。國家基因組科學數據中心(National Genomics Data Center, NGDC)面向我國人口健康和社會可持續發展的重大戰略需求,建立了生命與健康大數據匯交存儲、安全管理、開放共享與整合挖掘研究體系,形成了一系列數據安全管理的制度和措施。本文聚焦于生命組學大數據全生命周期的安全管理問題,探討生命組學大數據安全管理框架,全面分析在數據匯交、存儲、管理、共享全生命周期中涉及的安全管理內容,并總結了NGDC在生命組學大數據安全管理方面的成效。最后,本文展望了生命組學大數據安全管理的發展方向,包括完善數據分級分類制度、提升數據分級安全管理技術和加強數據異地災備建設,以期實現生命組學大數據的安全管理與可持續發展。

關鍵詞:生命組學大數據;數據匯交;數據共享;安全管理

1 "引言

生命組學大數據是生命體通過高通量測序技術所衍生出的基因組、變異組、轉錄組、表觀組等多維生物數據,是生命科學研究范式轉變和產業創新發展的核心驅動力。生命組學大數據推動生物安全、人口健康、社會可持續發展等國家重大戰略和世界科學前沿的基礎科學研究,對支撐我國搶占未來生命科學和健康醫學發展制高點具有重大戰略意義、科學價值和社會經濟效益。

隨著數據量的急劇增長和應用領域的不斷拓展,在全球數字化進程加速、網絡威脅增加以及跨境生物信息流通的背景下,生命組學大數據安全問題逐漸凸顯。全球范圍內,各個國家在生物數據安全方面不斷加強立法保護。美國于2021年提出的《基因組學支出和國家安全增強法案》(Genomics Expenditures and National Security Enhancement Act, 簡稱基因法案, the GENE Act)[1]和《基因組數據安全法案》(Genomics Data Security Act)[2],聚焦基因數據安全保護,對外資企業,特別是受關注國家的企業在基因數據采集、使用、共享等方面制定了嚴格的監管措施;2024年提出的《生物安全法》(BIOSECURE Act)[3]草案,計劃禁止美國行政機構與受關注的生物科技公司進行特定交易,防止美國人的基因數據流入受關注國家(Countries Of Concern);2024年初,美國總統拜登簽發的《關于防止受關注國家獲取美國人大量敏感個人數據和美國政府相關數據的行政命令》(Executive Order on Preventing Access to Americans’ Bulk Sensitive Personal Data and United States Government- Related Data by Countries of Concern)[4],提出建立對受關注國家在包括個人生物特征數據、健康數據、組學數據等敏感個人數據方面交易監管制度。歐盟也發布了一系列數據安全相關的法規,其中最為重要的是2018年發布的《通用數據保護條例》(General Data Protection Regulation, 簡稱GDPR)[5],該條例強調個人數據保護的重要性,要求研究者在收集、存儲、處理和傳輸個人數據時必須獲得明確同意,并對將個人數據轉移到歐盟以外的國家或地區進行了嚴格的規定,確保這些國家或地區的保護水平與歐盟一致。

在中國,2021年《中華人民共和國生物安全法》[6]、《中華人民共和國數據安全法》[7]和《中華人民共和國個人信息保護法》[8]的陸續實施標志著生物信息數據安全在政策層面得到了高度重視。這些法律的出臺促使國家逐步建立了一個以“法律/法案-法規-指南”為框架的數據安全管理體系。在人類遺傳資源管理方面,分別于2019年和2023年發布了《中華人民共和國人類遺傳資源管理條例》(國務院令第717號)[9]和《人類遺傳資源管理條例實施細則》(科學技術部令第21號)[10],涵蓋人類遺傳資源的收集、保存和利用,明確監管職責和法律責任。通過這一管理體系,中國致力于在保障數據安全和個人權益的同時,實現生物科技的創新發展和社會責任的平衡,在保護個體和社會利益同時,也為生物信息管理提供了新的發展方向。

在生物數據安全問題備受關注的態勢下,構建統一、安全的生命組學大數據匯交、管理和共享平臺,促進數據的合規、有序、安全共享,不僅具有現實的科學意義,而且具有重要的社會意義。國家基因組科學數據中心(National Genomics Data Center, NGDC)[11]正是在這樣的背景下,在中國科學院北京基因組研究所生命與健康大數據中心[12]的基礎上,由科技部、財政部于2019年6月5日發文成立。NGDC也是20個國家科學數據中心之一,其目標是面向我國人口健康和社會可持續發展的重大戰略需求,建立生命與健康大數據匯交存儲、安全管理、開放共享與整合挖掘研究體系,建設支撐我國生命科學發展、國際領先的基因組科學數據中心。經過幾年的發展,NGDC已初步建成具有自主知識產權、安全可控的多維組學數據匯交、存儲、管理和共享體系,包括組學原始數據歸檔庫(Genome Sequence Archive, GSA)[13-14]、人類遺傳資源組學原始數據歸檔庫(Genome Sequence Archive for Human, GSA-Human)[14-15]、基因組數據庫(Genome Warehouse,GWH)[16]、基因序列數據庫(GenBase)[17]、基因組變異數據庫(Genome Variation Map,GVM)[18]和多元數據歸檔庫(Open Archive for Miscellaneous Data, OMIX)[14]等,承載著我國生物數據安全管理的使命,為科研用戶提供不同組學數據的匯交、存儲、管理和共享,以及國家重大科技項目數據管理服務。

2 "生命組學大數據安全管理框架

面向生命組學大數據的匯交存儲和共享應用,以促進生命組學大數據安全共享為目標,針對數據匯交、審核、存儲、共享全生命周期安全管理的需求,構建生命組學大數據安全管理框架。從管理制度、網絡安全、核心技術、系統服務等4個層面出發,制定標準和規范,搭建安全網絡防護環境,研發核心技術和系統,建立數據服務平臺,全方位保障生命組學大數據的安全管理。整體框架如圖1所示。

2.1 "安全管理制度

依照國家法律法規及行業規范,制定生命組學大數據安全管理相關規范和制度,用于指導數據管理系統設計、建設、運行和維護的全流程操作。遵照中華人民共和國《生物安全法》《數據安全法》《人類遺傳資源管理條例》等相關規定,結合生命組學大數據的多維、多模態的特點,制定適用于生物信息領域的數據分級分類標準。在數據分級分類標準的基礎上,建立數據分級操作規范,針對不同的數據級別,對數據管理者和用戶進行權限分級,明確不同級別數據存儲、處理和訪問的安全邊界。數據安全管理制度主要面向數據操作人員(包括數據提交者、數據管理者、數據使用者等),建立數據安全相關的管理制度和指南,實現數據全流程操作的安全、合規。系統開發管理規范主要面向系統開發和運維人員,對系統設計、開發、測試、運維的每個環節制定安全操作準則,最大化降低系統層面的安全漏洞,確保數據安全管理。

2.2 "網絡和系統環境安全防護

網絡安全建設是生命組學大數據安全管理的重要部分,為數據匯交和共享提供安全可靠的網絡環境。網絡安全環境建設需要充分結合管理數據的重要性分級情況,既要保證數據得到充分的安全防護,也要為用戶的數據共享提供便利的獲取途徑。除部署基礎的防火墻、堡壘機等必要的網絡安全設備和入侵防御、態勢感知等安全系統外,還要據生命組學大數據不同程度的安全需求,建設不同安全等級的網絡保護系統,并設置不同的訪問控制策略。如對重要數據,建立網絡安全等級保護三級系統,在網絡層面規劃數據獨立

管理區域,建立更加嚴格的邊界控制、訪問確權、運維審計等,保證數據可控訪問的實現。最后,需要在網絡層面建立數據安全監測系統,對數據的流入、流出進行監測和管控,保證數據的入口和出口安全。

2.3 "數據安全管理核心技術與系統

針對生命組學大數據管理的全生命周期,開發通用的數據安全管理算法與工具,形成組學數據安全管理核心技術體系,為數據匯交、管理、共享等服務系統提供技術支撐。具體包括數據脫敏、數據加密等數據安全保護技術,數據動態訪問控制技術和數據安全審計技術。數據脫敏技術包括元數據脫敏及組學序列文件脫敏,需要采用特定的算法,對可能包含的隱私信息如姓名、年齡、身份證號等信息進行刪除或修改;另外,針對圖像、測序數據等文件中的敏感信息,研發相應的方法和技術,實現多組學數據文件脫敏。數據加密是指對于安全級別較高的數據,采用加密算法進行加密,保證數據在流轉過程中的安全。數據動態訪問控制技術針對多種類、多級別的數據,研發細粒度的數據權限和訪問控制技術,在保證數據訪問安全的情況下,促進數據的開放共享。安全審計技術針對數據匯交、存儲、共享全流程操作過程,建立數據審計方法,實現數據操作可追蹤、可溯源。此外,利用云計算技術,整合中心數據資源和算力資源,建立安全計算平臺,為用戶提供在線數據計算服務,實現數據不出域情況下的安全計算,方便用戶使用數據,促進數據的共享利用。

2.4 "全生命周期數據服務系統

圍繞數據匯交存儲、共享應用全生命周期,建立全鏈條式數據服務系統,為用戶提供包括數據匯交、數據審核與質控、數據共享、數據分析等服務。數據匯交系統主要包括用戶身份認證、元數據遞交和數據文件上傳等過程,需要實現用戶登錄、權限分配以及數據安全上傳和數據隱私保護;數據審核與質控系統主要實現數據的完整性和一致性校驗和數據的質量控制,為用戶提供高質量的數據資源,并保證數據在遞交、歸檔、發布和共享全流程的一致性;數據存儲系統根據數據分級分類標準,建立數據分級分類存儲機制,為數據匯交、歸檔、發布的全過程提供數據存儲空間和轉移通道,確保數據安全流轉;此外,為保障數據存儲安全,還需要建立備份及恢復策略,實現數據的實時備份和災難恢復。數據共享與應用系統以數據開放共享為目標,根據數據的不同級別,建立生命組學數據多級共享和訪問控制機制;此外,針對組學大數據安全、便捷利用的需求,結合隱私計算等技術,打通數據系統與安全計算平臺的通道,研發數據隱私計算服務模塊,實現數據的“可用不可得”。

3 "生命組學大數據安全管理實踐

國家基因組科學數據中心在生命組學大數據匯交、管理、共享實踐中,貫穿數據的全生命周期管理,在數據匯交、審核、存儲、管理、發布和共享等階段實施了一系列的安全措施,保障數據的全流程安全。

3.1 "數據遞交

數據遞交包括用戶登錄、元數據信息遞交和數據文件上傳等過程。用戶必須在系統中注冊賬號,經過身份認證后才能進行后續的操作。

在用戶賬號管理和身份認證方面,NGDC引入Single Sign On (SSO)單點登錄系統[19],實現了各匯交子系統的用戶統一注冊、管理、登錄和鑒權。從安全角度考慮,統一單點登錄減少了用戶密碼管理的負擔,降低了弱密碼和密碼重復使用的風險;通過提供統一登錄入口,減少多個登錄界面,降低了網頁漏洞和網頁攻擊的風險;SSO可以更容易地實施和執行復雜的安全策略,如多因素認證(MFA)。此外,集中的身份驗證系統能更有效地監控和管理用戶的訪問,可及時發現并響應異常活動。因此,統一單點登錄系統提高了數據匯交體系整體認證系統的安全性。

鑒于人類遺傳資源數據的重要性,NGDC對于人類遺傳資源組學原始測序數據的遞交制定了更加嚴格的規范。在SSO統一賬號安全管理的基礎上,增加了對人遺相關系統數據提交者賬號的要求。例如,GSA-Human系統只允許以課題研究組長的身份進行數據提交,在提交數據的人工審核階段,系統會對數據提交者進行項目負責人身份認證,以確保數據提交者是人類遺傳資源數據的責任人,保證數據全生命周期的安全可控管理[15]。

在數據文件上傳方面,結合SSO統一認證技術,為用戶提供增強的數據訪問控制權限。例如,系統的FTP上傳服務通過SSO賬號進行統一身份認證,并為每個注冊用戶分配獨立的數據上傳空間,用戶只能訪問和讀寫自己的上傳目錄。用戶上傳文件時,必須使用SSO賬號進行登錄,并將文件上傳至自己的數據空間。這在一定程度上保護了用戶數據上傳的安全性。特別地,針對人類遺傳資源數據,也開辟了專用上傳通道,以加強數據安全保障。

3.2 "數據審核與質控

數據的完整性和一致性直接影響數據共享平臺的可靠性和可用性。為確保數據不被非法修改和破壞,中心制定了嚴格的數據審核與質控策略。在數據遞交、質控、歸檔、發布和共享的每一步驟,都會進行數據一致性校驗。在方法上,利用文件的MD5碼來驗證數據的一致性。系統規定用戶在提交數據時,必須同時提供文件的MD5碼,并在數據關聯、歸檔、發布等各個環節,進行數據MD5碼復驗,以保證數據在流轉過程中的一致性。該策略保證了用戶本地存儲的數據、系統歸檔和發布的數據以及用戶下載的數據之間的一致性。此外,針對不同的數據類型,分別建立數據質量控制流程,對用戶匯交的數據進行嚴格的審核和質量控制,保證數據的完整性、高質量。例如,Fastq格式的原始測序文件的質控流程,除了審核文件格式,還會對文件內容進行審核,該流程目前共能檢測出30余種常見的文件錯誤。此外,還對錯誤類型進行細分編碼并實時反饋用戶質控結果,方便用戶了解錯誤情況。數據一致性、完整性校驗,是數據管理和數據安全的基礎,能夠為用戶提供可信、高質量的數據,促進數據資源的高效流轉和利用。

3.3 "數據存儲

中心初步制定了分級分類存儲策略,以保障數據存儲安全。將數據按照兩個維度進行分類:數據類型和訪問權限。首先,根據不同的類型,如原始測序數據、基因組組裝數據、基因數據、變異數據等,為數據劃分獨立存儲空間;其次,按照訪問權限,將數據劃分為私有數據、受控數據和公共數據,并對每類數據采取物理隔離的方式進行存儲。將私有數據和受控數據分別存儲在私有存儲空間和受控存儲空間,不提供對外訪問接口;公共數據存放于公共存儲空間,并建立數據訪問接口,用戶可通過FTP或HTTPS等訪問接口進行訪問。系統包含完善的數據發布流程,當數據發布后,會自動從私有空間轉存到公共空間。此外,還建立了完善的數據備份和恢復策略,所有數據都以磁帶庫的方式進行備份,確保數據存儲安全。

3.4 "數據共享

數據的安全共享是生命組學大數據安全管理的重

要環節。NGDC以數據開放共享為目標,遵循我國生命組學數據相關法律法規,參考國際生命組學數據共享政策,建立生命組學數據開放共享機制。在數據共享方式方面,將數據分為一般數據和重要數據,并根據數據的不同類別,制定不同的數據訪問方式。一般數據主要是指病原體、動植物、微生物等普通物種的原始組學測序數據、分析過的數據如基因組組裝數據、變異數據、轉錄組數據、表觀組數據等;重要數據是指人類遺傳資源相關的原始組學測序數據、基因組變異數據等。一般數據采用公開訪問方式,全球用戶都可通過NGDC的BIG Search平臺在線檢索、瀏覽、下載已發布的公開訪問數據。對于重要數據,采用“申請–審核制”的受控訪問方式,數據使用者須通過數據平臺向數據所有者提出數據使用申請,獲得授權后才有權限下載使用。在受控數據安全訪問和下載方面,NGDC提供了基于Apache Mina FtpServerp[20]開發的文件傳輸服務系統。系統引入單點登錄賬號信息和NGDC賬號內部ID信息雙重認證機制,對登錄鑒權進行多因子校驗,保證用戶登錄安全;此外,為通過數據授權的用戶開辟專有的數據目錄,并對數據設置只讀權限,通過安全隔離和最小操作權限的方式,進一步保證數據下載的安全性。

為了更好地落實執行國家在人類遺傳資源數據管理方面的制度,NGDC遵照《中華人民共和國人類遺傳資源管理條例》《人類遺傳資源管理條例實施細則》等法律法規,制訂了《人類遺傳資源數據共享政策》[21],數據使用者需要在遵循該政策的基礎上,申請、下載和使用數據。該政策符合相關國際規范,包括禁止對下載的數據進行再分發、再傳播等行為。NGDC的人類遺傳資源數據共享機制有效保護了人類遺傳資源數據的合理、合法和合規使用,降低了安全風險和隱患。

3.5 "網絡和系統環境安全防護

在系統和網絡安全防護方面,NGDC也部署了一系列的網絡安全設備,為數據匯交訪問提供安全可靠的網絡環境。目前NGDC已建立網絡安全等級保護二級、三級系統各一個,建成了較為完整的網絡安全防御體系,在互聯網接入、辦公、安全運維、業務生產區域間設置不同的訪問控制策略,部署IPS、WAF、防火墻、堡壘機、防病毒、日志審計、數據庫審計等必要的網絡安全設備,并完善數據全生命周期安全管

理制度。

實踐中,NGDC已開展數據分級工作,將一般數據和相關應用系統納入網絡安全等級保護二級系統管理,重點關注數據的完整性和可獲得性,為科研用戶提供公開的數據匯交、共享服務。針對具有一定規模的人類遺傳資源等重要數據,建立網絡安全等級保護三級系統,建立嚴格的數據授權訪問機制,在網絡層面規劃數據獨立管理區域,建立更加嚴格的邊界控制、訪問確權、運維審計、加密策略等,保證數據可控訪問的實現。

4 "成效

面向國家生物安全、人口健康、生物多樣性等重大戰略需求,國家基因組科學數據中心建立了自主安全可控的綜合性數據匯交管理體系,保障國家數據安全、主權和發展需求。截至2024年6月,數據匯交體系服務用戶2,735萬人,累計服務各級各類科技計劃項目(含課題和子課題)2萬余個,支撐發表文章3,584篇,匯交的數據總量超過50.7 PB,數據日均下載量超6 TB。

在服務國家人類遺傳資源信息管理方面,受中華人民共和國科學技術部委托,中心自2022年7月18日起開始承擔我國人類遺傳資源信息統一匯交管理任務,整合已有數據匯交管理系統(包括GSA-Human、GenBase、GWH、GVM和OMIX),建成人類遺傳資源信息管理、備份、發布與共享一體化管理體系。截至2024年6月,備份平臺已分配備份編號3,564個,關聯歸檔數據的總量超過2.6 PB。在此期間,受控數據累計申請1,658次,授權數據下載總量756.70 TB。

此外,中心的網絡安全防御體系已形成了網絡邊界和內部安全計算區域多層防護、重要系統持續審計和周期性網絡安全檢測等安全機制,高峰時網絡邊界每周記錄攻擊告警總數近100萬次,年主動開展安全檢測網站頁面超10萬頁面/次。

5 "問題與建議

近年來,國際社會越來越重視生物安全,涉及生物數據安全、隱私保護、數據共享等方面的法律法規不斷出臺和完善。國家基因組科學數據中心雖然在生物組學大數據匯交、管理、共享等方面取得了一定的成果,也實施了一系列的生物數據安全管理措施,但是,在生物數據隱私保護、數據分級分類管理、數據高效共享和利用等方面,還有待進一步加強。

5.1 "推進生命組學大數據分級分類標準制定與實施

基因組科學與生物安全、臨床醫學等多個領域的交叉發展,使得科研領域內通用的數據開放政策與數據保護法規之間的矛盾逐漸顯現[22]。為了在國家政策和開放科學之間達到平衡,應盡快在國家層面推進生命組學大數據分級分類標準的制定和實施,并依據標準研發相應的數據分級保護技術,促進生命科學數據安全、合規、高效共享。

對于生命組學大數據,應根據數據的重要性、敏感性及數據遭到破壞后的危害性等對其進行細致的分級分類,以便采取相應的安全措施進行精準保護。2021年11月14日,國家互聯網信息辦公室發布了《網絡數據安全管理條例(征求意見稿)》[23],根據對國家安全、公共利益及個人、組織合法權益的影響,將數據分為一般數據、重要數據和核心數據三級。袁康等人在此基礎上構建了5級數據安全分級體系,并給出了重要數據特征的相關分析[24]。對于生命組學大數據,可先基于數據的組學類型,初步分類為基因組、變異組、轉錄組、翻譯組、表觀組、蛋白質組、代謝組等。其次,可根據數據挖掘程度,將每個類型的組學數據細分為個體原始輸出數據、個體分析數據、群體統計數據等不同層次。最后,對不同樣本類型、數據類型的數據進行風險評估,并根據風險級別和重要程度進行分級。在數據安全管理和共享系統建設中,研發相應的數據分類分級安全保護技術,保護數據存儲管理和共享利用的安全性,保障生命科學研究和健康醫學安全、快速發展。

5.2 nbsp;融合先進信息和計算技術,進一步強化生命組學大數據安全管理技術體系建設

生物組學大數據安全與國家生物安全息息相關,目前國家級生物安全大數據分析核心算法匱乏,也是我國生物安全面臨的重要問題[25]。作為生物組學大數據管理平臺,應該從數據收集、存儲、共享、利用等各個環節進行安全技術提升,以加強數據的安全性保障。目前,在基因組學數據隱私處理領域,已產生相關技術體系,如利用轉換、聚合、混淆、合成等數據擾亂技術實現數據隱私保護,使用同態加密、安全多方計算、可信執行環境、區塊鏈等加密技術實現基因數據的安全使用[26]等。在數據共享與應用方面,除了常規的數據受控管理模式外,采用云計算、聯邦計算等可提供靈活便捷的計算資源和數據處理流程的新型計算模式[27-28]在一定程度上可以保護人類遺傳數據的安全可控。未來,我們將針對生物組學數據及其共享應用的需求,利用數據加密解密、云計算、聯邦計算等先進技術,從數據要素安全、數據共享和應用安全等多角度出發,研發數據安全管理技術體系,保障生物組學大數據的安全、高效利用。

第一,數據要素安全。針對人類遺傳資源數據等

重要生物數據安全保護的需求,結合基因組多組學數據的特點,開發加密解密、數據脫敏等技術,保護數據的私密性和安全性。

第二,數據共享安全。利用零信任技術,根據數據的分級分類情況,建立細粒度的訪問控制及風險監測機制,保障數據訪問和流轉安全。

第三,數據應用安全。原始測序數據通常體量較大,數據傳輸不夠便捷,并且數據分級策略通常將重要原始測序數據劃分在受控級別較高的等級,不便公開獲取。因此,結合云計算、隱私計算等技術,構建數據在線分析處理平臺,使用戶可以在不接觸原始數據的前提下獲得分析結果,真正實現原始數據的可用不可得,提升數據利用效率。

5.3 "加快數據異地災備設施建設,提升數據安全保障能力

災難備份是開展大數據安全工作的基礎,必須能夠確保出現極端危害事件的情況下可以獲得有效的數據副本。目前通行的做法是建立空間獨立,在同一時刻無相同危害風險的備份中心。

NGDC正在規劃相關的基礎設施的建設工作,可選方案包括具有設施基礎的分中心,此方案具有地域距離遠、同發災難概率低的優勢,但需進行獨立的設施投入。利用未來國家生物信息中心基礎設施資源,也是較為可行的方案之一,具有無需重復投入、設施標準高的優勢,但國家生物信息中心與NGDC現有設施的距離較近,存在同發災難事件的可能性。

致謝:感謝NGDC全體成員的敬業工作;感謝北京大學的羅靜初教授、中國科學院生物物理研究所的陳潤生院士、中國科學院分子植物科學卓越創新中心的趙國屏院士的指導;感謝科學技術部、國家衛生健康委員會、中國科學院以及NGDC的兩個共建單位——中國科學院生物物理研究所和中國科學院上海營養與健康研究所的支持。

參考文獻

[1] Genomics Expenditures and National Security Enhancement Act [EB/OL]. https://www.congress.gov/bill/117th-congress/senate-bill/ 1745/text.

[2] Genomics Data Security Act [EB/OL]. https://www.congress.gov/bill/ 117th-congress/senate-bill/1744/text.

[3] BIOSECURE Act [EB/OL]. https://www.congress.gov/bill/118th- congress/house-bill/7085/text

[4] Executive Order on Preventing Access to Americans’ Bulk Sensitive Personal Data and United States Government-Related Data by Countries of Concern [EB/OL]. https://www.federalregister.gov/ documents/2024/03/01/2024-04573/preventing-access-to-americans-bulk-sensitive-personal-data-and-united-states-government-related.

[5] General Data Protection Regulation [EB/OL]. https://gdpr-info.eu/.

[6] 中華人民共和國生物安全法 [EB/OL]. https://www.gov.cn/xinwen/ 2020-10/18/content_5552108.htm?eqid=ee76ba160000091a000000036465eef7.

[7] 中華人民共和國數據安全法 [EB/OL]. https://www.gov.cn/xinwen/ 2021-06/11/content_5616919.htm.

[8] 中華人民共和國個人信息保護法 [EB/OL]. https://www.gov.cn/ xinwen/2021-08/20/content_5632486.htm.

[9] 中華人民共和國人類遺傳資源管理條例 [EB/OL]. https://www. safea.gov.cn/xxgk/xinxifenlei/fdzdgknr/fgzc/flfg/201906/t20190612_147044.html.

[10] 人類遺傳資源管理條例實施細則 [EB/OL]. https://www.gov.cn/ zhengce/202306/content_6887562.htm.

[11] CNCB-NGDC Members and Partners. Database Resources of the National Genomics Data Center, China National Center for Bioinformation in 2024[J]. Nucleic Acids Research, 2024, 52(D1): D18-D32.

[12] BIG Data Center Members. The BIG Data Center: from deposition to integration to translation[J]. Nucleic Acids Research, 2017, 45(D1): D18-D24.

[13] WANG Y, SONG F, ZHU J, et al. GSA: Genome Sequence Archive[J]. Genomics Proteomics Bioinformatics, 2017, 15(1):14-18.

[14] CHEN T, CHEN X, ZHANG S, et al. The Genome Sequence Archive Family: Toward explosive data growth and diverse data types[J]. Genomics Proteomics Bioinformatics, 2021,19(4):578-583.

[15] 張思思,陳旭,陳婷婷,等. GSA-Human: 人類遺傳資源數據管理的公共系統[J]. 遺傳, 2021, 43(10):988-993.

[16] CHEN M, MA Y, WU S, et al. Genome Warehouse: A public repository housing genome-scale data[J]. Genomics Proteomics Bioinformatics, 2021,19(4):584-589.

[17] BU C, ZHENG X, ZHAO X, et al. GenBase: A nucleotide sequence database[J]. Genomics Proteomics Bioinformatics, 2024, qzae047.

[18] LI C, TIAN D, TANG B, et al. Genome Variation Map: A worldwide collection of genome variations across multiple species[J]. Nucleic Acids Research, 2021, 49(D1):D1186-D1191.

[19] Single Sign-On [EB/OL]. https://www.apereo.org/projects/cas.

[20] Apache MINA FtpServer [EB/OL]. https://cwiki.apache.org/ confluence/display/FTPSERVER/Index.

[21] 國家基因組科學數據中心人類遺傳資源數據共享政策 [EB/OL]. https://ngdc.cncb.ac.cn/gsa-human/document/Principle_of_Accessing_Human_Genetic_Resource_Data_in_NGDC_V1.pdf.

[22] Mark Phillips. International data-sharing norms: from the OECD to the General Data Protection Regulation (GDPR)[J]. Human genetics, 2018.

[23] 網絡數據安全管理條例(征求意見稿)[EB/OL]. https://www.cac. gov.cn/2021-11/14/c_1638501991577898.htm.

[24] 袁康,鄢浩宇. 數據分類分級保護的邏輯厘定與制度構建——以重要數據識別和管控為中心[J]. 中國科技論壇, 2022(7):167-177.

[25] 王秉,朱媛媛.大數據環境下國家生物安全情報工作體系構建[J/OL]. 情報雜志, 2021, 40(6):82-88. https://kns.cnki.net/kcms/detail/61.1167. G3.20210511.1427.028.html.

[26] WAN Z, HAZEL J W, CLAYTON E W, et al. Sociotechnical safeguards for genomic data privacy[J]. Nature Reviews Genetics, 2022, 23:429-445.

[27] Genomic Data Science Community Network. Diversifying the genomic data science research community[J]. Genome Research 2022, 32: 1231-1241. doi:10.1101/gr.276496.121.

[28] LANGMEAD B, NELLORE A. Cloud computing for genomic data analysis and collaboration[J]. Nature Reviews Genetics, 2018, 19(4): 208-219. DOI: 10.1038/nrg.2017.113.

引用格式:王彥青,陳婷婷,張思思,朱軍偉,陳煥新,肖景發,宋述慧,章張,趙文明,鮑一明.生命組學大數據安全管理實踐[J].農業大數據學報,2024,6(3): 325-332. DOI: 10.19788/j.issn.2096-6369.000053.

CITATION: WANG YanQing, CHEN TingTing, ZHANG SiSi, ZHU JunWei, CHEN HuanXin, XIAO JingFa, SONG ShuHui, ZHANG Zhang, ZHAO WenMing, BAO YiMing. Practice of Security Management of Omics Big Data in Life Sciences[J]. Journal of Agricultural Big Data,2024,6(3): 325-332. DOI: 10.19788/j.issn.2096-6369.000053.

Practice of Security Management of Omics Big Data in Life Sciences

WANG YanQing1,2, CHEN TingTing1,2, ZHANG SiSi1,2, ZHU JunWei1,2, CHEN HuanXin1,2, XIAO JingFa1,2,3, SONG ShuHui1,2,3, ZHANG Zhang1,2,3, ZHAO WenMing1,2,3*, BAO YiMing1,2,3*

1. National Genomics Data Center, China National Center for Bioinformation, Beijing 100101, China; 2. Beijing Institute of Genomics, Chinese Academy of Sciences, Beijing 100101, China; 3. University of Chinese Academy of Sciences, Beijing 100049, China

Abstract: Omics big data is a significant foundational and strategic resource for the country, which plays an important role in supporting the basic research and application innovation of life sciences, promoting the innovative development of bioeconomy, and maintaining national security. With the rapid accumulation of omics data, the security of data management has become increasingly prominent. Facing the major strategic needs of China's population health and sustainable social development, the National Genomics Data Center (NGDC) has established a comprehensive research architecture for collecting, storing, managing, sharing, and mining of big data in omics, forming a series of practices and measures for the security management of the data. This paper delves into the issues of security management of omics big data throughout its lifecycle, elaborating on NGDC's security management measures implemented in the collecting, storing, managing and sharing of the data. Furthermore, it summarizes NGDC’s achievements in the security management of omics big data. Finally, this paper envisions the future directions for the security management of omics big data, including enhancing the data classification and categorization system, enhancing data hierarchical security management technologies and strengthening the construction of off-site disaster recovery, in order to achieve the security management and sustainable development of omics big data in life sciences.

Keywords: omics big data; data archive; data sharing; security management

猜你喜歡
安全管理
現代煤礦安全生產管理
淺析建設工程安全管理
對化工安全與生產管理問題探析
淺析如何構建企業安全文化
水管單位工程施工安全管理研究
高速公路養護施工安全管理現狀及建議
房建施工中的質量與安全管理的研究
淺談電力工程項目施工的安全管理
關于深基坑施工的安全管理和防范策略
淺談煤礦安全管理的創新
主站蜘蛛池模板: 精品国产一区二区三区在线观看| 东京热av无码电影一区二区| 精品無碼一區在線觀看 | 92精品国产自产在线观看| a级毛片一区二区免费视频| 91亚洲精品国产自在现线| 无码AV日韩一二三区| 欧美国产成人在线| 国产99热| 久久青草精品一区二区三区| 婷五月综合| 亚洲国产天堂久久综合| 欧美一区日韩一区中文字幕页| 免费毛片视频| 欧美第二区| 成人精品免费视频| 免费高清自慰一区二区三区| 日韩在线网址| 国产欧美在线视频免费| 一级毛片在线播放| 狂欢视频在线观看不卡| 在线视频亚洲色图| 韩日免费小视频| 在线免费亚洲无码视频| 国产Av无码精品色午夜| 欧洲熟妇精品视频| 少妇露出福利视频| 久久精品午夜视频| 2019年国产精品自拍不卡| 激情综合激情| a级毛片在线免费观看| 青草视频在线观看国产| 青青久久91| 91久久夜色精品国产网站| 亚洲精品人成网线在线| 又黄又湿又爽的视频| 亚洲av色吊丝无码| 日韩无码精品人妻| 亚洲国产av无码综合原创国产| 国产香蕉一区二区在线网站| 人妻一区二区三区无码精品一区| 国产美女91视频| 毛片网站在线看| 国产91特黄特色A级毛片| 亚洲精品国产综合99| 亚洲天堂免费| 国产欧美网站| 欧美日韩一区二区在线免费观看 | 亚洲中文无码av永久伊人| 亚洲精品视频在线观看视频| 国产成人综合亚洲欧美在| 色偷偷综合网| 极品国产一区二区三区| 国产精品精品视频| 国产在线专区| 久草视频一区| 久久99国产综合精品1| 亚洲精品图区| 日本免费a视频| 国产成人综合日韩精品无码首页| 国产高清免费午夜在线视频| 国产成人无码Av在线播放无广告| 欧美精品啪啪一区二区三区| 区国产精品搜索视频| 91无码视频在线观看| 亚洲娇小与黑人巨大交| 香蕉视频国产精品人| 午夜视频在线观看免费网站 | 国产亚洲精品97AA片在线播放| 亚洲日韩高清无码| 欧美自拍另类欧美综合图区| 91在线无码精品秘九色APP| 国产真实二区一区在线亚洲| 天天综合亚洲| 欧美另类第一页| 国产成人精品男人的天堂下载 | 欧美一区精品| AV熟女乱| 欧美一级专区免费大片| 国产网友愉拍精品视频| 99久久国产综合精品2023| 欧美午夜在线视频|