999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“中心+節點”分布式生命科學數據平臺構建模式研究
——基于歐洲ELIXIR的案例分析*

2023-06-30 02:27:22王流芳賈曉峰
醫學信息學雜志 2023年5期
關鍵詞:培訓資源服務

王流芳 賈曉峰

(中國醫學科學院/北京協和醫學院衛生健康管理政策學院 北京 100730) (國家衛生健康委衛生發展研究中心 北京 100044)

胡志民

(中國醫學科學院/北京協和醫學院衛生健康管理政策學院 北京 100730)

1 引言

21世紀以來,以數據為中心、數據驅動的科學研究第四范式逐漸興起,生命科學領域科研活動產生的大量科學數據成為推動未來科研發現的重要資源,但從較大體量的數據集變成驅動科研新發現的資源庫依舊存在數據平臺標準不統一、工具不足、合作機制缺乏、算力和數據整合優化不足等問題[1]。2021年《中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要》提出“構建國家科研論文和科技信息高端交流平臺”,為科學數據的融合、交流提出明確要求和方向,而以何種模式構建生命科學數據的融合、交流平臺成為當前關注重點。歐洲生命科學信息基礎平臺(European Life-Science Infrastructure for Biological Information,ELIXIR)模式可提供重要參考[2]。

ELIXIR成立于2013年12月,是匯集歐洲各地生命科學資源的政府間組織,由歐洲分子生物學實驗室(The European Molecular Biology Laboratory,EMBL)、21個成員國和1個申請中的觀察國(塞浦路斯)組成,是一個分布式的歐洲生命科學數據研究基礎設施[3-4]。ELIXIR通過協調數據庫、軟件工具、培訓材料、云存儲和超級計算機等方面的資源,為歐洲各地研究者使用現有設施存儲、轉移和分析大數據集提供便利,已成為科學數據發現、共享和交流的重要途徑[5-6]。

2 平臺模式

2.1 “中心+節點”組織架構

ELIXIR采用“中心+節點”的組織架構,ELIXIR中心負責提出總體工作策略、協調各節點運行并對其進行服務委托、支持各節點的科學研究工作,以及聯合其他生物醫學科學組織共同應對大數據帶來的挑戰。ELIXIR節點由各個成員國或EMBL的研究機構集合而成,主要涉及各節點的強勢學科領域,負責運行各自的資源與服務,每個節點均由一個領導機構監督工作。

ELIXIR中心與節點通過簽署合作協議、設立協作監督小組、建立合作協調組織等方式確保組織架構整體穩定。一是簽署《ELIXIR合作協議》,對節點角色、服務及監督進行定義,這是ELIXIR中心向節點委托服務的法律基礎。《ELIXIR合作協議》有2014版、2018版兩個版本,內容包括4份附件:各節點服務交付計劃,明確各節點應提供的服務;委托服務合同,概述由節點執行的委托服務項目(由ELIXIR預算提供資金);中心合作計劃,概述ELIXIR中心提供給各節點的服務;保障機制,明確各節點間的法律協議。二是ELIXIR組織設有協作監督小組(collaboration oversight group,COG),小組成員包括節點負責人 (head of node,HON)、ELIXIR主任、其他與合作流程相關的人員(如節點協調員等);協作監督小組對《ELIXIR合作協議》中規定的內容進行年度審查,并將報告提交給ELIXIR中心管理團隊[4]。三是建立ELIXIR合作協調組織,包括技術協調員小組(the technical coordinators group,TeCG)、培訓協調員小組(the training coordinators group,TrCG)和節點協調員小組(the node coordinators group,TnCG),其中:技術協調員小組由來自各ELIXIR節點的技術代表組成,主要任務是探討技術突破問題,促進技術交流;培訓協調員小組由各ELIXIR節點的培訓代表組成,主要負責定期舉行培訓會議、分享培訓信息、普及專業知識并協調和領導整個歐洲ELIXIR培訓計劃的實施;節點協調員小組由ELIXIR節點的代表組成,目的是分享ELIXIR節點的操作信息和最佳實踐[4]。

2.2 “平臺+領域單元”運行機制

2.2.1 5個平臺 ELIXIR 5個平臺分別為數據、工具、計算、互操作和培訓平臺,由ELIXIR中心的技術協調員負責維護,由各節點的高級科學家規劃發展戰略,見表1。(1)數據平臺旨在確定、遴選和融合全歐洲的關鍵數據資源。(2)工具平臺幫助研究者找到最好的數據分析軟件工具。(3)計算平臺負責開發服務,使存儲、共享和分析大型數據集變得更便捷。(4)互操作平臺開發統一的標準描述生命科學數據。(5)培訓支持系統(training esupport system,TeSS)為培訓師和學員提供培訓材料、教程等方面服務[7-8]。

表1 ELIXIR平臺及功能

2.2.2 15個領域單元 ELIXIR領域單元是協調不同利益相關方共同使用ELIXIR數據資源的重要場所,主要作用是將特定領域專家聚集在一起來確定和解決特定問題或開展小型項目,見表2。每個領域單元至少有一個核心數據庫,除人類聯邦數據領域單元、人類拷貝數變異領域單元和罕見病領域單元之外,每個領域單元都有自己獨特的技術標準和法律標準[9]。

表2 ELIXIR領域單元及功能

2.3 “整合優化+共享保護”管理方式

2.3.1 資源遴選 ELIXIR核心數據資源是指歐洲生命科學和生物數據長期保存的數據資源,通過將生命科學相關數據匯集起來供研究者使用,提升數據價值[10]。ELIXIR創建正式流程動態識別、遴選歐洲最重要的生命科學數據資源作為ELIXIR核心數據資源[11]。截至2020年4月1日,ELIXIR有19項核心數據資源,涵蓋廣泛的生命科學數據類型,包括基因和基因組、蛋白質、化學、分子結構相互作用以及研究文獻等。ELIXIR使用一套定性、定量相結合的指標,評價數據資源的質量和影響力,以確定具有極高科學影響力的數據資源,主要包括數據質量、數據資源所服務的領域、數據服務質量、法律和資金管理、數據影響和成果轉化5個方面。核心數據資源管理人員每年提供以上5方面指標數據以評價核心數據資源[12]。

2.3.2 整合優化 一是整合工具與科學數據資源。ELIXIR將其成員國所開發的各種類型生命科學相關軟件工具、教育資源進行整合,形成統一的發現平臺;核心數據資源之間表現出高度的連通性和相互依賴性,反映不同數據類型之間的生物學關系[12]。二是持續開展數據評估。ELIXIR節點負責人會議每2~3年審查一次所有核心數據資源,每次審查至少需要3個ELIXIR節點負責人才可以對特定數據資源進行異常評估;如果審查提出問題,節點負責人委員會應負責制定下一步改進計劃[7]。三是統一標準,落實推動數字資源管理和開放共享可發現、可訪問、可互操作、可重復(findable,accessible,interoperable,reusable,FAIR)原則,通過開發數據管理工具包推動全歐洲生命科學數據管理標準化(包括元數據標準、本體、詞表、標識符等在內的一系列標準)。

2.3.3 開放使用 許多ELIXIR領域單元已經著手改善核心數據庫的數據存儲,并采用元數據標準(包括本體)描述數據,特別是植物科學、海洋宏基因組學、代謝組學和蛋白質組學領域單元。但是由于各方面原因,數據往往不易整合到中央數據庫中,例如人體受試樣本中的某些數據出于監管原因不能跨國界使用。ELIXIR通過兩個方案解決這一問題:一是將這類不便提交的數據庫連接到歐洲基因組檔案(The European Genome-phenome Archive,EGA),并通過EGA共享元數據。二是通過信標對潛在有用的數據集進行分析,判斷數據是否能被溯源,并根據隱私要求對數據進行相應保護[9]。ELIXIR通過用戶分級管理推動數據對不同用戶個性化開放,通過認證和授權身份驗證基礎設施(authentication and authorization infrastructure,AAI)驗證用戶身份,并授權和限制用戶在服務中的可操作范圍[13]。ELIXIR AAI允許用戶使用全球身份認證聯盟(The Inter-Federation of Identity Federation Across the Globe,eduGAIN)認證的身份登錄服務平臺,并提供資源分配管理、數據集授權系統、多因素身份驗證等服務[14]。ELIXIR中心沒有權限訪問各節點的內部數據和歐盟資助項目的科學數據,由各個節點處理自己的內部數據[4]。

2.3.4 數據保護協議 由于成員國并不都屬于歐盟,所以ELIXIR在數據保護標準方面保持開放態度。對ELIXIR節點而言,歐盟成員國數據受歐盟《通用數據保護條例》(General Data Protection Regulation,GDPR)保護;非歐盟成員國,如以色列、瑞士和英國,其數據受本國數據保護規則保護,兩者保護水平相當。ELIXIR是一個政府間的聯盟組織,因此缺乏自己的法律人格。為解決該問題,ELIXIR節點中唯一一個不是國家的組織——EMBL已經同意允許ELIXIR使用其法律人格作為一個國際組織。這種“借來的”法律人格有兩個主要特征:一是EMBL和ELIXIR不受歐盟GDPR和國家數據保護法的約束,并且ELIXIR繼承了EMBL作為國際組織的特權和豁免權;二是ELIXIR把EMBL《內部政策68》(Internal Policy 68,IP68)作為其數據保護法;《內部政策68》與歐盟GDPR一樣具有相當高標準的數據保護規則,適應國際科學研究組織的需要,反映了歐洲數據保護法的原則[4]。

2.4 “多元+混合”籌資方式

作為分布式基礎設施,ELIXIR采用以公共資金為主的混合融資模式,見表3。一是ELIXIR中心和節點共同競爭歐盟“地平線2020(Horizon 2020)”和創新醫學計劃(Innovative Medicines Initiative,IMI)的資金。二是ELIXIR中心的資金來自成員國,即ELIXIR節點支付的會員費,這些資金大部分被返還各節點來支持ELIXIR 5年科學計劃。三是ELIXIR節點通常通過國家投資獲得資金,支持相關服務的開發和運營。四是ELIXIR節點可獲得國際資助者的支持,例如美國國立衛生研究院(National Institutes of Health,NIH)支持的資金。五是一些ELIXIR節點能夠獲得歐盟結構基金,支持經濟發展和產業結構的調整。節點的其他資金來源還包括基金會(如惠康信托基金和瓦倫堡基金會)和企業,但是與獲得的公共資金相比,這部分資金規模較小。

表3 ELIXIR融資渠道

3 經驗與啟示

3.1 ELIXIR模式的經驗

3.1.1 以需求為牽引,廣泛整合資源 ELIXIR匯集23個國家和組織的220多家研究所,將地方性和區域性的國家基礎設施與全歐洲的數據資源、數據標準服務聯系起來,形成一個連貫的基礎設施,滿足歐洲50多萬生命科學家需求,最大程度確保用戶方便地訪問數據資源。ELIXIR與許多國際組織建立良好合作關系,例如全球基因組與健康聯盟(the Global Alliance for Genomics and Health,GA4GH)和科學研究數據全球聯盟(Research Data Alliance,RDA)等,在非洲人類遺傳與健康(Human Heredity and Health in Africa,H3Africa)等項目上不斷擴大對外合作,研究環境和遺傳因素之間的復雜相互作用以及非洲人群的疾病易感性和藥物反應。如ELIXIR 2019—2023計劃所述,ELIXIR成員國承諾聯合提供服務,使歐洲研究者及其合作者能夠方便訪問、分析和重復使用大型、復雜和地理特色明顯的數據集[15]。

3.1.2 善于總結交流,提升實踐經驗 ELIXIR組織中的節點協調員是國家資助的重要崗位,其主要職責是分享ELIXIR節點的操作信息和最佳實踐。ELIXIR研究者致力于從特定研究領域吸取經驗教訓,挖掘同樣適用于其他領域的通用研究方法或解決問題的方案,然后通過各節點、用戶群體之間的信息共享,將這些好的做法和經驗擴展到其他不同領域[9]。2016年德國正式加入ELIXIR組織,2018年9月德國生物信息網絡(The German Network for Bioinformatics Infrastructure,de.NBI)組織第1次云會議向用戶傳授云計算方面的最佳實踐,包括案例介紹、數據處理、工具使用和工作流程方面的新技術、新做法。此外,ELIXIR將運營大型基礎設施方面的經驗引入生命科學管理其他方面,為基因組學從生物醫學研究轉化為醫療保健系統的常規應用奠定基礎[8]。

3.1.3 注重資源交互,服務內容全面 ELIXIR通過支持核心數據資源之間以及ELIXIR服務和新興服務之間的交互提升資源和服務價值,可訪問性資源不僅包括數據還包括其他類型,例如軟件工具、工作流程和培訓材料[10]。注冊表工具作為ELIXIR工具平臺的一部分,使研究軟件資源的過程更加標準化,并為培訓材料、培訓流程提供TeSS注冊表,使研究者能夠輕松查找和訪問培訓資源[16-17]。FAIRsharing提供有關數據和元數據標準的精選資源,通過規范源頭數據的注冊表實現數據集和軟件的互操作性[18]。

3.1.4 持續完善平臺,實現提質增效 計算平臺開發的ELIXIR認證和授權身份驗證基礎設施可實現將人類敏感數據傳輸到安全云存儲;數據平臺定義了ELIXIR核心數據資源的標準并對其進行識別,有助于建立全球生物數據聯盟基礎設施;互操作平臺確定了一套互操作性資源生物架構(Schema.org),并且不定期召開互操作性服務能力建設研討會;工具平臺設置了ELIXIR工具和數據服務中心注冊表,還開發了數據和方法(embrace data and methods,EDAM)本體用于對工具和服務注釋[19];培訓平臺向60個國家19 000多人提供850多項培訓活動,建立了TeSS、ELIXIR培訓門戶網站、電子學習平臺和虛擬學習室,擴大歐洲培訓網絡,并且開發了ELIXIR培訓工具包等[13]。

3.1.5 積極對外合作,提升數據價值 ELIXIR積極參與歐洲100萬個基因組計劃(the beyond 1 million genomes,B1MG)(2020—2023)、生物多樣性社區綜合知識庫(the biodiversity community integrated knowledge library,BiCIKL)(2021—2024)、基因組數據基礎設施(genomic data infrastructure,GDI)(2022—2026)等項目[4]。在植物和農業研究中,ELIXIR橫跨歐洲最大的植物表型分析中心的數據聯盟現已全面運作,為歐洲植物數據庫聯盟提供基礎,開展跨國分布式植物“組學數據集”探索。ELIXIR協調FAIRplus項目,促進歐盟創新藥物倡議資助項目數據的可發現、可訪問和可重復。ELIXIR還協調歐洲開放科學云(the European Open Science Cloud,EOSC)生命項目,推動歐洲研究與創新戰略論壇(European Strategy Forum on Research and Innovation,ESFRI)為EOSC創建開放協作的數字空間。此外,德國生物信息學基礎設施網絡de.NBI為ELIXIR提供了大量高質量的培訓課程,為不同研究領域、不同知識水平的研究者提供幫助[8]。

3.2 對我國的啟示

3.2.1 建立“中心+節點”分布式科學數據平臺模式 以政府主導的國家核心數據中心為“中心”,遴選系列高質量數據庫作為“節點”,通過中心鏈接、整合,提升節點數據質量,推動數據開放共享。節點數據庫的選擇應基于對現有數據資源質量、管理、服務和轉化應用情況的評估和遴選,按照成熟一個、納入一個的原則逐漸累積節點資源庫。

3.2.2 推動數據、工具、標準等方面全方位整合 中心平臺應推動以FAIR原則為目標的數據融合、質量改進、工具整合,并在數據標準、協議等方面持續優化、提升,以支持更加廣泛的開放共享。在具體實施方面,中心平臺可通過建設集數據庫、分析工具、數據計算、交互和培訓等功能于一體的綜合性科學活動平臺,也可通過建設領域性、行業性的論壇或互聯網社區(如罕見病社區、植物科學社區)等方式實施。

3.2.3 以數據使用為目標牽引,開展多元化業務 中心平臺應通過開展培訓、宣傳、交流、參與項目等多種業務形式,推動數據應用,實現價值轉化提升。各節點可設立協調員小組,負責技術協調、培訓協調以及分享操作信息和最佳實踐,不斷挖掘和總結不同行業領域數據管理的成功經驗,鼓勵各行業將好的經驗做法通過科學活動互聯網共享交流。

3.2.4 持續優化中心與節點合作模式、完善運作機制 在國家層面確定中心和各節點的合作模式及考核方式,明確各自的權利和義務。中心和各節點之間要遵循一定數據協議,建立數據共享及保密機制。

4 結語

我國當前已經建成多樣化、分散的生命科學數據庫,共享應用是各數據庫可持續發展、發揮數據價值的唯一路徑,采用“中心+節點”分布式生命科學數據平臺形式是推動我國生命科學數據從分散建設到集中使用的可參考模式。通過建設中心平臺,遴選整合優秀的節點數據庫,推動數據、工具、標準等方面多元融合,開展以FAIR原則為總體原則的數據提質改造工作,整體實現數據質量、標準、管理和服務能力的提升,并推動以共享使用為目標的多元化運作機制,是實現我國科學數據“用起來”較為可行的發展路徑。

歡迎訂閱 歡迎賜稿

猜你喜歡
培訓資源服務
基礎教育資源展示
培訓通知
一樣的資源,不一樣的收獲
從五方面做好引導培訓
勞動保護(2019年7期)2019-08-27 00:41:26
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
資源回收
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
主站蜘蛛池模板: 在线亚洲精品自拍| 中国黄色一级视频| 99在线观看精品视频| 国产浮力第一页永久地址 | 91精品啪在线观看国产91九色| 欧美亚洲欧美| 免费观看成人久久网免费观看| 欧美国产日产一区二区| 亚洲人在线| 国产视频只有无码精品| 一本色道久久88| 国产精品无码一区二区桃花视频| 久久视精品| 色视频国产| 无码精品福利一区二区三区| 欧美在线黄| 国产福利在线观看精品| 97青草最新免费精品视频| 无码乱人伦一区二区亚洲一| 欧美国产成人在线| 在线看免费无码av天堂的| 亚洲欧美一区二区三区图片| 91口爆吞精国产对白第三集| 男女性午夜福利网站| 欧美一级高清片欧美国产欧美| 91精品国产自产在线老师啪l| 欧美成人一区午夜福利在线| 热思思久久免费视频| 欧美成人一级| 日韩精品毛片| 毛片免费视频| AV在线天堂进入| 日韩人妻精品一区| 国产成人欧美| 香蕉99国内自产自拍视频| 69综合网| 亚洲伊人久久精品影院| 亚洲最新网址| 欧美全免费aaaaaa特黄在线| 波多野结衣中文字幕一区二区| 伊人久久大线影院首页| 亚洲人成电影在线播放| 免费人成网站在线观看欧美| 国产乱子伦视频三区| 日韩在线永久免费播放| 成人毛片免费观看| 天堂中文在线资源| 国产青青草视频| 美女被躁出白浆视频播放| 欧美成人精品在线| 国产永久在线视频| 久久无码高潮喷水| 久久香蕉国产线看观| 欧美成人午夜视频免看| 久久一本精品久久久ー99| 亚洲AV色香蕉一区二区| 午夜欧美理论2019理论| 日韩一区二区三免费高清| 亚洲美女久久| 亚洲人人视频| 亚洲国产综合精品一区| 天天干天天色综合网| 广东一级毛片| 久久青青草原亚洲av无码| 天堂va亚洲va欧美va国产| 欧美亚洲国产日韩电影在线| 日韩精品久久无码中文字幕色欲| 国产一区二区福利| 久久99国产综合精品女同| 亚卅精品无码久久毛片乌克兰| 伊人蕉久影院| 国产亚洲精品91| 在线看AV天堂| 亚洲成综合人影院在院播放| 一级成人a毛片免费播放| 国产成人综合欧美精品久久| 亚洲精品黄| 无码专区在线观看| 欧美一级在线看| 欧美日本激情| 欧美午夜一区| 呦女精品网站|