柏雪 陳茫 鄭聰
摘要數(shù)字科研基礎設施是科學研究的虛擬支柱和創(chuàng)新的重要驅(qū)動力。論文選取加拿大數(shù)字科研基礎設施生態(tài)系統(tǒng)作為案例,通過網(wǎng)絡調(diào)研和郵件咨詢,在調(diào)查和分析加拿大數(shù)字科研基礎設施生態(tài)系統(tǒng)發(fā)展演化歷程及其重要構(gòu)成組件的基礎上,揭示其運行機制和主要特征。據(jù)此為我國構(gòu)建數(shù)字科研基礎設施生態(tài)系統(tǒng)提出相關建議。
關鍵詞數(shù)字科研基礎設施;生態(tài)系統(tǒng);加拿大
分類號G32;G259.1
Analysis and Enlightenment on the Ecosystem of Digital Research Infrastructure in Canada
Bai Xue,Chen Mang,Zheng Cong
AbstractDigital research infrastructure is a virtual pillar of scientific research and an important driving force for innovation. This paper?selects the Canadian digital research infrastructure ecosystem as a case study. Through online research and email consultation, based on the investigation and analysis of the development and evolution process of the Canadian digital research infrastructure ecosystem and its important components, the operating mechanism and main characteristics are revealed. Based on this, relevant suggestions are proposed for building a digital research infrastructure ecosystem in China.
KeywordsDRI. Ecosystem. Canada.
0引言
數(shù)字科研基礎設施(Digital Research Infrastructure,簡稱DRI)在加拿大是支持科學研究所需的特定服務和資源的首選術語。加拿大創(chuàng)新、科學和經(jīng)濟發(fā)展部(簡稱ISED)將DRI定義為:允許科研人員將大數(shù)據(jù)轉(zhuǎn)化為科學突破的工具和服務的集合[1]。加拿大創(chuàng)新基金會(簡稱CFI)在《為加拿大發(fā)展數(shù)字科研基礎設施戰(zhàn)略:CFI的視角》[2]報告中將其定義為:全國各地的科研機構(gòu)和與用戶共同管理和運營的共享設施和服務組件。DRI的組成部分包括計算能力、數(shù)據(jù)存儲、技術服務、科研軟件、中間件、高速光網(wǎng)絡和科學數(shù)據(jù)管理能力。它們在規(guī)模、復雜度和成本上都是單一機構(gòu)無法提供的。DRI支持復雜的數(shù)據(jù)處理、建模、模擬和可視化,使研究人員能夠方便而安全地在線訪問設施和資源,能夠滿足研究人員和創(chuàng)新者對高速通信網(wǎng)絡、高性能和高吞吐量計算、多學科數(shù)據(jù)管理和科學軟件協(xié)作的需求。因此,DRI越來越被認為是公共和私營部門科研和創(chuàng)新的必要條件。
在理論研究方面,學者們對DRI的研究內(nèi)容主要集中在DRI運行治理模式[3-4]、共享機制[5-6]、平臺建設[7-8]、資助管理[9]、科研數(shù)據(jù)基礎設施[10-13]等方面,在DRI生態(tài)系統(tǒng)方面的研究成果較少。在實踐方面,英國、歐洲、美國、加拿大和日本等國家或泛國家聯(lián)盟陸續(xù)制定了DRI發(fā)展戰(zhàn)略,為支持卓越研究提供有效的數(shù)字基礎設施條件,從而加速研究和創(chuàng)新成果產(chǎn)出。歐盟在2014年至2020年期間通過其“地平線2020電子基礎設施計劃項目”在DRI上投資超過8.5億歐元。英國力圖通過建設國際領先的國家DRI并發(fā)展其DRI能力(包括數(shù)據(jù)、超級計算機、軟件和人員),為科研部門帶來數(shù)字化轉(zhuǎn)型。我國于2017年提出了中國科技云(簡稱CSTCloud計劃)[14],為教育、科研、科技社區(qū)、相關政府部門和高科技企業(yè)提供網(wǎng)絡接入、身份管理等一系列網(wǎng)絡基礎設施和互聯(lián)網(wǎng)服務,以及計算能力、云存儲和科研軟件。
加拿大在為各地科研人員建立一個高性能DRI生態(tài)系統(tǒng)方面已取得顯著進展。本研究對加拿大DRI生態(tài)系統(tǒng)的發(fā)展歷程、重要構(gòu)成組件及其組件之間的關系、系統(tǒng)運行機制、系統(tǒng)特征進行調(diào)研和分析,并提出相關建議,以期為我國在數(shù)字中國戰(zhàn)略背景下構(gòu)建DRI生態(tài)系統(tǒng)提供參考。
1加拿大DRI生態(tài)系統(tǒng)演化過程分析
1.1萌芽期(2016年以前)
早期,加拿大政府通過各種供資和政策機制,為DRI的一些組成部分發(fā)展了先進的能力,包括:①發(fā)展了一個世界級的國家超高速數(shù)字骨干網(wǎng)。②為科研人員提供了一系列先進的計算資源、大量有價值的科研數(shù)據(jù)、分析技術和工具。例如,加拿大計算聯(lián)合會(簡稱CCF)及其前身提供高級科研算力(簡稱ARC)服務,CANARIE的科研軟件(簡稱RS)計劃促進RS的開發(fā)、實踐以及加拿大新興軟件工程師文化和社區(qū)的發(fā)展。③創(chuàng)建和加強了幾個獨立的利益相關方組織。例如,2015年,加拿大研究圖書館協(xié)會(簡稱CARL)啟動了Portage Network,為加拿大高等教育機構(gòu)的科學數(shù)據(jù)管理(簡稱RDM)提供實際支持,并解決加拿大國家RDM基礎設施中的具體差距。
在這一階段,加拿大允許不同的行為體獨立運作和發(fā)展。由于缺乏正式的角色、流程和資源,盡管這些行為體在發(fā)揮其特定功能方面表現(xiàn)強勁,卻并沒有轉(zhuǎn)化為DRI生態(tài)系統(tǒng)整體的成功。這種獨立發(fā)展的方法是造成缺乏凝聚力、碎片化、無組織DRI的根本原因。大數(shù)據(jù)時代的到來,以及數(shù)據(jù)密集型和計算密集型研究的流行,導致研究界對DRI產(chǎn)生了更大的需求。
1.2形成期(2016—2019年)
在技術快速變革和第四科研范式的背景下,DRI生態(tài)系統(tǒng)不斷演進,開始從分散的DRI組件向分布式的DRI生態(tài)系統(tǒng)發(fā)展。加拿大政府作為制度構(gòu)建者和參與主體,通過政策干預、資金資助和資源整合,促進DRI生態(tài)系統(tǒng)的形成。采取的主要措施包括:①由加拿大國家科學部牽頭,ISED提供資金,數(shù)字研究基礎設施領導委員會(簡稱LCDRI)召集由廣泛利益相關者組成的工作組,對加拿大的DRI形勢進行分析,向ISED提交了具有指導性的加拿大RDM、ARC和RS立場文件,為制定DRI戰(zhàn)略計劃和服務交付模式提供參考。②開始開發(fā)國家級DRI平臺,重視DRI工具和資源的整合。例如,開發(fā)了聯(lián)邦科研數(shù)據(jù)存儲庫(簡稱FRDR)、在Potage門戶網(wǎng)站上集中提供一系列RDM工具和培訓資源等。③成立新DRI實體組織(簡稱NDRIO),構(gòu)建國家協(xié)調(diào)機制,與加拿大各地的合作伙伴和利益相關者合作,推進各組件的協(xié)同合作。
在這一階段,DRI生態(tài)系統(tǒng)初步形成,但存在結(jié)構(gòu)不清晰的特征。在加拿大DRI戰(zhàn)略和相關政策與資金的支持下,NDRIO開始推動各要素協(xié)同運行,發(fā)揮要素合力。由于涉及許多角色和任務重疊的行為體,且各要素間的交互不頻繁且不穩(wěn)定,使得系統(tǒng)尚未達到最佳運行狀態(tài),精簡組織結(jié)構(gòu)和優(yōu)化治理機制可能會帶來更高的效率。
1.3成熟期(2019年至今)
這一階段的重點是確保在加拿大建立高效的DRI生態(tài)系統(tǒng),促進各個組成部分和參與者之間更大的協(xié)調(diào)和一致性,發(fā)展以研究人員為中心的、負責的、敏捷的、戰(zhàn)略性和可持續(xù)的DRI生態(tài)系統(tǒng)。主要采取了以下措施:①成立了覆蓋面更廣泛和無縫銜接的國家級組織--加拿大數(shù)字研究聯(lián)盟(以下簡稱“聯(lián)盟”),與全國利益相關者合作,推進國家DRI戰(zhàn)略,集中規(guī)劃和分配大部分資金,協(xié)調(diào)和資助與RDM、RS和ARC相關的活動。②調(diào)整組織結(jié)構(gòu),將Portage、加拿大研究數(shù)據(jù)協(xié)會(簡稱RDC)等組織陸續(xù)合并到聯(lián)盟,以會員制的組織模式聚集了加拿大140多所頂尖大學、學院、研究醫(yī)院和研究所,以及DRI領域的其他領先組織加入聯(lián)盟。③整合RDM、RS和ARC三大平臺,集成、優(yōu)化DRI的各類服務和功能,構(gòu)建了一個統(tǒng)一的、全國性的加拿大DRI平臺,服務效率得到極大提升。
在這一階段,加拿大DRI生態(tài)系統(tǒng)進一步演化升級,形成了由多個主體和組件所構(gòu)成的復雜但有凝聚力的網(wǎng)絡,組織模式和運行機制趨于成熟,整體性能得到較大提升。由聯(lián)盟作為核心主體發(fā)揮主導作用,與DRI社區(qū)內(nèi)的主要利益相關者進行廣泛磋商,制定戰(zhàn)略計劃,對各組件進行了更為合理的規(guī)劃與協(xié)調(diào),注重系統(tǒng)布局和統(tǒng)合力。聯(lián)盟利用其地位優(yōu)勢和資金優(yōu)勢建立正式的系統(tǒng)運行機制,使得主體間聯(lián)系互動強度大幅提升,生態(tài)系統(tǒng)的適應能力逐步增強。
2關鍵組件分析
通過調(diào)研發(fā)現(xiàn),加拿大DRI生態(tài)系統(tǒng)有四個關鍵組,包括:①用于研究和教育的數(shù)字網(wǎng)絡:允許研究人員在加拿大和世界各地共享數(shù)據(jù)和協(xié)作;②科學數(shù)據(jù)管理(簡稱RDM):允許研究人員查找、訪問數(shù)據(jù);④科研軟件(簡稱RS):使研究人員能夠訪問和使用數(shù)據(jù);④先進科研算力(簡稱ARC):涉及允許研究人員分析大量數(shù)據(jù)的超級計算機。
2.1科學數(shù)據(jù)管理(RDM)
RDM能夠提高研究的可見性和影響力,實現(xiàn)研究結(jié)果的再現(xiàn)性。加拿大的RDM由一系列相互關聯(lián)的組件構(gòu)成,包括:存儲和計算、互操作性、數(shù)據(jù)服務和治理[15]。這些組件相互作用并相互支持,隨著研究實踐和技術的發(fā)展而演變,形成一個圍繞支持基礎研究數(shù)據(jù)流動的不斷增長的網(wǎng)絡。在這個系統(tǒng)中的關系不僅僅是數(shù)據(jù)生產(chǎn)者和給定數(shù)據(jù)集之間的關系,還包括對數(shù)據(jù)生命周期產(chǎn)生影響的許多相關方面,例如,應用于數(shù)據(jù)的標準和協(xié)議,創(chuàng)建、分析和存儲數(shù)據(jù)的基礎設施,創(chuàng)建者和管理人員接受的培訓,以及相關的治理策略。
從調(diào)研結(jié)果上看,RDM組件具有以下特征:
(1)持續(xù)推進利益相關者圍繞DRI戰(zhàn)略中的RDM方面的全國性對話機制,以促進參與者溝通交流并建立合作關系,在全國范圍內(nèi)構(gòu)建RDM合作網(wǎng)絡。加拿大研究數(shù)據(jù)中心(簡稱RDC)為全國對話創(chuàng)造了機會,召開了一系列國家數(shù)據(jù)服務框架峰會,召集了廣泛的RDM利益相關者討論和協(xié)調(diào)國家數(shù)據(jù)服務框架,產(chǎn)生了《卡納塔宣言》《RDM路線圖2019—2024》等關鍵成果。
(2)持續(xù)提供資金和政策支持。在政策方面,加拿大三大科研資助機構(gòu)陸續(xù)制定了《數(shù)字數(shù)據(jù)管理原則聲明》《三方機構(gòu)數(shù)據(jù)管理政策草案》《三方機構(gòu)數(shù)據(jù)管理政策》[16-17]。加拿大高校和研究機構(gòu)以及主題領域?qū)用嬉苍诖嘶A上制定了與之一致的RDM政策和要求[18-19],為引導和促進健全的數(shù)據(jù)管理和實踐從而支持加拿大的卓越研究提供政策支持。在資金方面,CARL成員機構(gòu)通過投資和實物支持Portage,ISED、CANARIE向CARL Portage及其合作伙伴提供資金,以支持提升開展RDM活動的能力。
(3)提供RDM平臺、工具和培訓資源支持。CARL的Portage Network協(xié)調(diào)加拿大各地機構(gòu),匯集了一個專家網(wǎng)絡,以開發(fā)管理平臺、服務、工具、外聯(lián)和培訓,并與其他機構(gòu)合作;相關機構(gòu)開發(fā)了一系列RDM工具包括國家數(shù)據(jù)存儲庫(如FRDR)、國家RDM平臺(如DMP Assistant)、培訓工具和資源(如CIHR和Portage的在線模塊),以及研究平臺和領域知識庫(如Ocean Networks Canada、CBRAIN、Polar Data Catalogue);聯(lián)盟提供一系列RDM培訓材料,從一頁指南到在線培訓模塊和視頻,涵蓋了研究數(shù)據(jù)的生命周期。一些運營RDM服務的研究組織也提供專門的RDM培訓,如第一民族信息治理中心的OCAP基礎課程[20]、不列顛哥倫比亞省人口數(shù)據(jù)中心的教育和培訓系列[21]等。
2.2先進科研算力(ARC)
ARC支持具有重要數(shù)據(jù)或計算需求的研究活動,包括數(shù)據(jù)采集、模擬、實驗、分析和探索,可以幫助科研人員解決對他們而言太大或太復雜的研究問題。加拿大ARC的關鍵組件包括:計算(如中央處理單元(CPU)和圖形處理單元(GPU);主動存儲和備份(如運行時、近線和臨時存儲);來自高素質(zhì)人員的支持、培訓和咨詢(簡稱HQP);軟件管理和支持(系統(tǒng)軟件和常用庫和通信協(xié)議);隱私、安全和認證;國家和國際研發(fā)網(wǎng)絡以及站點之間的高速連接;支持和協(xié)調(diào)其他DRI組件(如網(wǎng)絡、數(shù)據(jù)管理、中長期存儲、研究軟件)。
從調(diào)研結(jié)果上看,ARC組件主要表現(xiàn)出以下特點:
(1)形成了強大的ARC供應網(wǎng)絡。在地方層面,大學提供各種科研計算服務和支持,作為其中央IT運營、圖書館的一部分,或作為獨立的大學級科研算力運營;在區(qū)域?qū)用妫珹RC交付的協(xié)調(diào)由WestGrid、Compute Ontario、Calcul Québec和ACENET提供;在國家層面,由聯(lián)盟協(xié)調(diào)和資助ARC,加拿大計算聯(lián)合會(簡稱CCF)提供高端ARC系統(tǒng)。
(2)服務模式向集中式改進。CCF通過集中式憑證實現(xiàn)統(tǒng)一訪問[22],改進數(shù)據(jù)傳輸服務。采用集中式方法提供更統(tǒng)一的存儲產(chǎn)品(通過標準化的文件系統(tǒng)布局和策略),進行安全檢查,集中化軟件以及用于賬戶和資源分配的集中式應用程序過程。
(3)構(gòu)建了一個強大專業(yè)的HQP社區(qū)。ARC系統(tǒng)在其配置、軟件和硬件堆棧、操作和使用的幾乎所有方面都是高度復雜的,需要高級專業(yè)知識,需要幾年的專業(yè)化學習才能掌握。CCF網(wǎng)絡組建了一個大約由200名HQP全職員工組成的專業(yè)化團隊,為各地科研人員提供直接支持,確保所有研究人員都能獲得進行尖端科研所需的高質(zhì)量資源。
2.3科研軟件(RS)
RS是科研的基礎,在科學發(fā)現(xiàn)和成果分享方面發(fā)揮重要作用。加拿大RS包括研究平臺或服務(各種稱為虛擬科學實驗室、虛擬研究環(huán)境(VRE)或科學網(wǎng)關)[23],這些平臺或服務實例化了RS源代碼的集合,包括大型軟件框架、學科特定工具、服務和粘合代碼,并部署用于支持研究工作流程和參與協(xié)作研究的實踐社區(qū)。DRI的技術和文化趨勢正在推動加拿大RS的持續(xù)和快速發(fā)展,使其在推進研究方面更為關鍵。
從調(diào)研結(jié)果上看,RS組件主要表現(xiàn)出以下特點:
(1)RS服務提供商多元化。包括:①加拿大研究、工業(yè)和教育促進網(wǎng)絡(簡稱CANARIE),資助并促進研究軟件工具的開發(fā);②加拿大計算機聯(lián)合會(簡稱CCF),提供統(tǒng)一的RS環(huán)境;③加拿大各地的大專院校、研究醫(yī)院和附屬機構(gòu),在基礎設施和獲取RS工具、資源、研究平臺、專業(yè)知識和培訓方面為其研究人員提供直接支持;④私營部門,經(jīng)常向研究人員提供RS研究報告;⑤期刊,通過其官方出版政策及其實踐社區(qū),在指導和影響研究者的RS方法方面發(fā)揮重要作用。
(2)采用管轄權(quán)方式提供RS支持。加拿大的RS是通過一個高度分布式的網(wǎng)絡開發(fā)和交付的,涉及各種參與者和利益相關者,包括研究人員、學生、科研軟件工程師、圖書館員、大學管理人員、特定學科和非營利組織的專業(yè)人員以及政府公務員。由于參與者數(shù)量眾多,加拿大通過管轄權(quán)的方式,按照地方、區(qū)域或省、國家和國際,每個級別通常以不同的關鍵方式提供支持。
(3)為RS的發(fā)展提供專門的政策、資金和工具支持。制定了科研軟件FAIR原則和RS培訓倡議[24],在促進和協(xié)調(diào)加拿大國家一級的RS相關活動方面發(fā)揮了領導作用。CANARIE和CFI向RS團隊提供專用資金專注于促進RS工具的開發(fā)和科研軟件工程師社區(qū)的發(fā)展。
2.4數(shù)字網(wǎng)絡
數(shù)字網(wǎng)絡被視為加拿大DRI生態(tài)系統(tǒng)的一個組成部分,包括防止未經(jīng)授權(quán)訪問數(shù)字資產(chǎn)的機制、戰(zhàn)略、政策和實踐,以及各種基于軟件和硬件的有線和無線通信網(wǎng)絡解決方案。所有大型研究基礎設施都依賴于信息和通信技術資源,數(shù)字網(wǎng)絡使通用通信協(xié)議能夠在網(wǎng)絡節(jié)點之間共享數(shù)字資源,為地理分布的協(xié)作和共享提供了新的可能性。
從調(diào)研結(jié)果上看,數(shù)字網(wǎng)絡主要具有以下特點:
(1)成立專門的非營利性公司來管理數(shù)字網(wǎng)絡。加拿大于1993年成立了CANARIE,負責運營協(xié)調(diào)數(shù)字網(wǎng)絡,與省和地區(qū)網(wǎng)絡伙伴密切合作,將省級和地區(qū)網(wǎng)絡相互連接,并連接到全球研究和教育網(wǎng)。將加拿大的研究人員、教育工作者和創(chuàng)新者相互聯(lián)系。
(2)注重組織間的合作。CANARIE與NREN、政府、學術界和私營部門的合作伙伴合作,資助、實施和支持網(wǎng)絡安全舉措。NDRIO與CANARIE、加拿大計算中心、加拿大網(wǎng)絡安全中心合作,構(gòu)建了一個網(wǎng)絡安全框架。
(3)重視網(wǎng)絡安全,保護DRI資源。①為CANARIE提供專門的網(wǎng)絡安全資金,用于開發(fā)和提供工具以加強數(shù)字網(wǎng)絡的安全性。②為確保DRI的所有資助協(xié)議都包含強制性的網(wǎng)絡安全要求,聯(lián)盟協(xié)調(diào)DRI系統(tǒng)開展網(wǎng)絡安全審計。③為學術界提供身份管理服務,使學生、教職員工能夠安全地訪問全球?qū)W術資源和服務目錄。
2.5各組件之間的關系分析
加拿大的RDM、RS、ARC和數(shù)字網(wǎng)絡組件之間的關系從根本上來說是相互作用和相互依賴的,而且是在生態(tài)系統(tǒng)的所有層次上。各組件集成后作為一個整體一起發(fā)揮作用產(chǎn)生系統(tǒng)性能以實現(xiàn)共同目標。
數(shù)據(jù)密集型和計算密集型研究通常使用ARC基礎設施和系統(tǒng)進行,其中大量數(shù)據(jù)由RS存儲和處理。大規(guī)模并行和加速增強的ARC系統(tǒng)需要非常復雜和高度可擴展的RS產(chǎn)品。加拿大大部分RS托管在ARC中,因此可以認為ARC和RS組件具有相互依賴的交互作用。
高效的RDM依賴于一系列強大的支持基礎設施,其中包括ARC和RS組件。與調(diào)試、數(shù)據(jù)分析、大規(guī)模數(shù)值建模和可視化相關的開發(fā)活動越來越多地直接在ARC環(huán)境中存儲的數(shù)據(jù)上進行。而ARC的能力是由RS流程和RDM的需求決定的。ARC和RS的有效使用要求其支持的研究數(shù)據(jù)在其整個生命周期內(nèi)通過有效的RDM實踐進行維護。
3加拿大DRI生態(tài)系統(tǒng)運行機制分析
加拿大DRI生態(tài)系統(tǒng)的結(jié)構(gòu)是復雜多面的,橫向上聚集了廣泛異質(zhì)和地理上分散的從服務提供商到用戶的整個服務系統(tǒng)的利益相關者網(wǎng)絡,縱向上集成從戰(zhàn)略規(guī)劃、運營協(xié)調(diào)到提供服務的全過程。生態(tài)系統(tǒng)中不同行為體的決策機制和優(yōu)先級可能有很大差異,運行機制是加拿大DRI生態(tài)系統(tǒng)各組件有效聚合、有序協(xié)同的重要保障。
3.1管理控制機制
該機制主要包括:①制定戰(zhàn)略規(guī)劃、指導方針、政策框架和路線圖,以統(tǒng)籌、指導DRI的規(guī)劃、部署、運營、管理和維護。②建立資金治理模型,以確保未來投資的戰(zhàn)略性、成本效率和資金的可持續(xù)性。③在組織結(jié)構(gòu)上,通過聯(lián)邦政府資助,成立中立的全國性非營利會員制管理組織-聯(lián)盟,將合作伙伴和利益攸關方聚集在一起,以合作的方式開展工作。聯(lián)盟的成員構(gòu)成包括:董事會、會員和研究人員委員會。會員模式分為具有投票權(quán)的主要會員和無投票權(quán)的準會員。④明確界定國家、區(qū)域和地方各級參與者的角色、權(quán)利和責任。例如,加拿大政府負責提供資助;ISED制定國家DRI戰(zhàn)略和愿景,對生態(tài)系統(tǒng)進行戰(zhàn)略管理和監(jiān)督;聯(lián)盟是DRI的服務提供商、服務協(xié)調(diào)者和資助者,負責推進與實施國家DRI戰(zhàn)略;HQP為研究人員提供咨詢和支持服務;研究人員通過定義問題或需求為生態(tài)系統(tǒng)貢獻價值。⑤對生態(tài)系統(tǒng)的運營進行全面監(jiān)督、審查和評估,包括DRI發(fā)展現(xiàn)狀評估、財務報告、投資策略和投資戰(zhàn)略審計、DRI專業(yè)人員評估、EDIA評估、DRI資源分配流程評估、人力資源政策和實踐審查、項目撥款審查(包括技術可行性評估、運營成本評估)等。
3.2協(xié)同合作機制
該機制主要包括:①制定共同目標和愿景,促使各主體愿意圍繞共同目標調(diào)整自己的活動并分擔責任,從而直接或間接地為實現(xiàn)同一生態(tài)系統(tǒng)的目標做出貢獻,實現(xiàn)目標協(xié)同。②協(xié)調(diào)參與者之間的交互,確保關鍵組織的合作,建立伙伴關系,實現(xiàn)主體協(xié)同。當參與者開始聯(lián)合起來,但缺乏相互聯(lián)系的結(jié)構(gòu)時,根據(jù)參與者與其他合作者的關系和兼容性、活動或經(jīng)驗、能力或技能和信任度等來設計參與者的活動(包括協(xié)作者的個人行為和與其他協(xié)作者的交互,如子任務的協(xié)調(diào)和決策等),催化和加速建立伙伴關系的過程,并持續(xù)推進協(xié)商討論機制,使參與者達成信任、理解和共識,從而促進行動者之間相互聯(lián)系和交流,促使參與者形成一個動態(tài)交互的有目的的協(xié)作網(wǎng)絡。③制定參與者之間的資源分配和共享規(guī)則,實現(xiàn)資源協(xié)同。資源包括用于支持合作的各種形式的資產(chǎn),如資金、平臺、工具、技術等。在資源開始積累,需要更有目的地管理時,由聯(lián)盟集中規(guī)劃和分配大部分資金,把資金、業(yè)務與管理責任緊密結(jié)合起來。制定協(xié)調(diào)政策(如許可證管理)、標準(如元數(shù)據(jù)標準、互操作性標準)和協(xié)議(如通信協(xié)議、服務水平協(xié)議)來協(xié)調(diào)聯(lián)盟成員之間資源的流動和平衡。④構(gòu)建良好的協(xié)同合作環(huán)境。倡導遵循公平、多樣性和包容(EDI)原則的組織文化、以及公平原則的研究文化、為研究人員服務和參與DRI社區(qū)的文化,直接或間接地促進合作。
3.3更新反饋機制
該機制主要包括:①各組件工作組定期更新ARC、RS和RDM的發(fā)展現(xiàn)狀調(diào)查評估報告,為聯(lián)盟分析師和管理層、聯(lián)盟委員會和聯(lián)盟研究人員理事會提供咨詢和背景信息,以支持需求評估過程,以及聯(lián)盟新的服務模式、戰(zhàn)略計劃和籌資發(fā)展進程。②允許重新定義DRI資源的協(xié)作、收集、共享和組織方式,從而支持DRI服務的設計、相關活動的執(zhí)行以及需求和供給之間的匹配。③允許對利益攸關方進行適度調(diào)整。重視與利益攸關方的磋商和參與,以增進對該系統(tǒng)如何運作的理解,確定連貫的政策行動,重新調(diào)整利益攸關方,并根據(jù)利益攸關方的動機和潛在權(quán)力影響建立承諾。④在服務交付模型上,與利益相關者采用迭代設計和開發(fā)方法。聯(lián)盟與ISED、CANARIE、Compute Canada、CARL、區(qū)域、主機站點和其他參與提供DRI服務的機構(gòu)合作,建立新的服務提供和資助模式。
4加拿大DRI生態(tài)系統(tǒng)特征分析
4.1一體化
一體化特征主要體現(xiàn)在:①戰(zhàn)略框架一體化。成熟的加拿大DRI生態(tài)系統(tǒng)是一個有機整體,確保所有行為者納入一個協(xié)調(diào)一致的國家框架,盡量減少重復、分散和重疊,并避免利益攸關方和服務提供者之間的競爭,這體現(xiàn)了一體化特征。②服務平臺一體化。將DRI的核心組成部分置于聯(lián)盟這一單一組織和戰(zhàn)略的運作之下,使得研究人員將能夠從單個平臺一站式訪問ARC、RDM和RS服務,從而提高效率和有效性。把基礎設施和服務納入國家活動,以精簡的方式專注于提供優(yōu)質(zhì)服務,將確保對研究人員的干擾最小化,將使其更容易及時獲得所需的服務和資源。③治理框架一體化。加拿大通過一體化的治理框架加強結(jié)構(gòu)、資金和政策設置,確保決策過程透明、業(yè)務開展有效、資源分配適當,在DRI生態(tài)系統(tǒng)的各個層面提供利益。
4.2公平性、包容性與多樣性
公平性、包容性與多樣性特征主要體現(xiàn)在:①將公平、多樣性和包容原則(簡稱EDI)嵌入到組織結(jié)構(gòu)中,確保研究人員有公平的參與機會。聯(lián)盟與CANARIE一起成立了一個聯(lián)合EDI工作組,以推動支持兩個組織的公平、多樣性和包容性的舉措。②通過與研究界(包括研究人員、研究機構(gòu)、資助者和服務提供商)定期進行戰(zhàn)略性溝通,在服務的機構(gòu)和行業(yè)利益相關者社區(qū)尋求多樣化的代表。婦女、土著人民、殘疾人、少數(shù)群體、職業(yè)早期科研人員和非傳統(tǒng)學科(包括社會科學、人文科學和藝術研究人員)均可公平、包容、無障礙地獲得DRI。③平等地支持可以公開共享的數(shù)據(jù),以及需要額外隱私和安全保障或遵守不同治理體系的各種形式的敏感數(shù)據(jù)。
4.3可持續(xù)性
可持續(xù)性是加拿大DRI生態(tài)系統(tǒng)的重要特征。可持續(xù)性主要表現(xiàn)在:①建設的可持續(xù)性。每年更新對當前狀態(tài)的評估,在此基礎上制定下一步的戰(zhàn)略計劃和業(yè)務規(guī)劃。②投資的持續(xù)性。為建立和運營DRI,加拿大制定了連續(xù)投資框架,這在減少加拿大創(chuàng)新體系碎片化的負面影響和達到DRI投資的臨界質(zhì)量方面發(fā)揮了關鍵作用。③支持可持續(xù)性。確保專業(yè)支持人員的長期可持續(xù)性是加拿大國家DRI戰(zhàn)略的優(yōu)先事項。專業(yè)支持人員是國家DRI生態(tài)系統(tǒng)的重要組成部分,無論是在地方還是國家層面。它們包括機構(gòu)信息技術和圖書館服務,以及來自國家組織的技術團隊。加拿大提供特殊資金流支持機構(gòu)和研究團隊留住員工并提供就業(yè)保障。
4.4用戶導向性
用戶導向性特征主要體現(xiàn)在:①加拿大把研究人員的需求作為國家DRI生態(tài)系統(tǒng)設計和交付的核心。其DRI戰(zhàn)略旨在增加用戶獲取DRI資源的機會,以滿足研究人員需求,這體現(xiàn)了用戶導向性特征。②將研究人員作為主體參與到DRI生態(tài)系統(tǒng)的構(gòu)建過程中。從評估研究人員優(yōu)先需求和戰(zhàn)略優(yōu)先事項的過程中獲得信息,為組織的戰(zhàn)略計劃和活動提供參考。③營造以研究人員為中心的文化環(huán)境。確保無論用戶的學科、地理位置或機構(gòu)規(guī)模如何,都能夠建立對DRI的認識和了解,并有能力訪問DRI服務和平臺,并支持和促進在其研究中選擇和使用DRI。
5啟示
5.1制定長期的DRI戰(zhàn)略規(guī)劃,提供有針對性和持續(xù)性的資助
①制定一個長期的DRI發(fā)展框架。包括DRI的國家愿景、戰(zhàn)略目標、政策框架、預期結(jié)果、關鍵優(yōu)先事項、實施路徑等。一個高效的DRI生態(tài)系統(tǒng)需要至少5到7年的長期規(guī)劃,這種長期視角為生態(tài)系統(tǒng)帶來穩(wěn)定性和可預測性,并有利于利益相關者更大程度的參與,也具有融資優(yōu)勢。②制定DRI戰(zhàn)略審查框架,支持服務提供商和機構(gòu)根據(jù)其DRI政策制定和分析其DRI戰(zhàn)略。③制定DRI投資框架,為計算、數(shù)據(jù)存儲和網(wǎng)絡基礎設施及其運維實施制定可預測、可持續(xù)的撥款計劃。持續(xù)和可預測的資金會對DRI生態(tài)系統(tǒng)的長期規(guī)劃產(chǎn)生重大影響,如優(yōu)化協(xié)調(diào)RS開發(fā)、人力基礎設施和共享研究數(shù)據(jù)基礎設施等優(yōu)先事項,有效地部署用于DRI的人力、技術和財政資源等。④制定DRI資助治理模型,包括基于同行或業(yè)績的評審過程,以評估和決定資助獎勵,使投資效益最大化。
5.2構(gòu)建高效的組織管理模式和長效的系統(tǒng)運行機制,推動DRI戰(zhàn)略的實施
①優(yōu)化組織架構(gòu),提升決策和執(zhí)行效率。可以成立一個全國性的中立治理的非營利組織,專門負責統(tǒng)籌國家DRI戰(zhàn)略方向和活動資金,引導和協(xié)調(diào)各個利益攸關方群體,并調(diào)整和優(yōu)化各層級的組織結(jié)構(gòu),形成一個全國性的聯(lián)盟。②構(gòu)建協(xié)同機制,實現(xiàn)價值共創(chuàng),提高系統(tǒng)整體能力。為各級利益相關者制定溝通和協(xié)調(diào)機制,促進研究人員、服務提供者、決策者和其他利益攸關方之間建立伙伴關系,加強生態(tài)系統(tǒng)整體協(xié)調(diào)和一致性,從而提升協(xié)同作用和效率。③構(gòu)建資源保障機制,提升資源共享效率。制定分布式資源的聚合、協(xié)調(diào)和調(diào)度規(guī)則,確保資源提供和用戶參與的透明度和問責制。制定資源共享流程和程序、標準和協(xié)議,保障分散機構(gòu)的互操作性。④構(gòu)建評估審查機制,引導生態(tài)系統(tǒng)轉(zhuǎn)型升級。定期對系統(tǒng)整體績效進行評估,衡量系統(tǒng)在實現(xiàn)戰(zhàn)略目標和優(yōu)先事項方面的進展情況。定期對系統(tǒng)有效性進行評估,衡量參與者執(zhí)行各自任務并交付預期結(jié)果的能力。
5.3構(gòu)建一體化國家平臺,提供一站式DRI服務
加拿大的經(jīng)驗表明,國家對數(shù)據(jù)存儲庫和保存平臺以及底層軟件和存儲系統(tǒng)的支持與協(xié)調(diào),對于長期管理和最大化研究資金的價值與影響是必要的。當前,我國許多現(xiàn)有的DRI基礎設施、工具和平臺在相對孤立的情況下運行。這在跨領域中尤其具有挑戰(zhàn)性,因為不同領域在整個生命周期中管理數(shù)據(jù)的實踐和工具可能存在巨大差異。可采取以下措施:①建立服務分類模型,在國家、區(qū)域和地方層面定義DRI服務,以確定每一層的服務范圍,與每個服務提供商制定服務級別協(xié)議、責任和資金要求以及有效的服務交付要求。②采用共享的標準、模式和認證,以實現(xiàn)生態(tài)系統(tǒng)組件之間可信的互操作性,從而更好的集成新的和現(xiàn)有的服務和資源。③構(gòu)建國家級通用平臺、單一登錄系統(tǒng)和持久標識符,打造綜合性的DRI服務環(huán)境,為研究人員提供必要的數(shù)字工具和無縫服務。④根據(jù)自身能力盡量支持服務的統(tǒng)一提供,在不可能的情況下,可以為用戶提供單一入口點,建立集中的服務目錄,包括服務清單和描述、關鍵文檔的鏈接,服務提供者和聯(lián)系信息。
5.4重視研究人員需求,加強其對DRI的認識和利用
①開展DRI需求調(diào)研,包括DRI的一般需求,以及RDM、RS和ARC技術方面的需求。發(fā)起一項全國范圍的調(diào)查咨詢,旨在了解來自不同學科、地理區(qū)域和機構(gòu)的研究人員的DRI需求和優(yōu)先事項。收集關于DRI當前和未來狀況的各種觀點和建議,對當前DRI的發(fā)展現(xiàn)狀進行總結(jié)和評估。②采取各種宣傳推廣措施,提升研究人員對DRI工具和服務的認識。開發(fā)并推出國家DRI服務和資源目錄,充分的描述和推廣資源和服務,讓研究人員能夠快速找到適合需求的解決方案。③培養(yǎng)高素質(zhì)的專業(yè)支持人員團隊,構(gòu)建全國DRI專家網(wǎng)絡,提高研究界使用DRI的能力。將支持人員融入機構(gòu)、區(qū)域、國家和國際等不同級別的支持。④按需為研究人員提供DRI培訓。可利用分層培訓方法提高跨人群(包括研究生)和跨學科的DRI總體素養(yǎng)。DRI資源的使用在各學科之間存在高度異質(zhì)性,可以采用定制培訓法改善研究人員在具體學科中對DRI的使用能力。
參考文獻:
[1]Innovation, science and economic development Canada. Digital research infrastructure[EB/OL].[2023-05-05]. https://ised-isde.canada.ca/site/digital-research-infrastructure/en.
[2]Canada foundation for innovation. Developing a digital research infrastructure strategy for Canada: The CFI perspective[EB/OL].[2023-04-27]. https://www.innovation.ca/sites/default/files/Funds/cyber/developing-dri-strategy-canada-en.pdf.
[3]張麗麗,黎建輝.科研信息基礎設施的運行治理模式研究[J].數(shù)據(jù)與計算發(fā)展前沿,2022,4(6):92-104.
[4]BAIJAK F, ECCLES K, MEYER T, et al.The emerging governance of e-infrastructure [J]. Journal of Computer Mediated Communication, 2013,18(2):113-136.
[5]劉洢穎,董誠,韓旭.國外科研基礎設施開放共享機制探索[J].科學管理研究,2021,39(1):148-154.
[6]馮偉波,周源,周羽.開放式創(chuàng)新視角下美國國家實驗室大型科研基礎設施共享機制研究[J].科技管理研究,2020,40(1):1-5.
[7]史廣軍,焦文彬.開放科研基礎設施的共享管理平臺機制、功能與流程:基于中國科學院儀器設備共享管理平臺案例的分析[J].中國科學基金,2019,33(3):246-252.
[8]王何健,黎貞崇.面向公眾的科研基礎設施共享平臺的建立策略[J].實驗室研究與探索,2018,37(2):289-292.
[9]潘昕昕.歐盟大型科研基礎設施資助管理的經(jīng)驗與啟示[J].世界科技研究與發(fā)展,2022,44(3):332-341.
[10]周雷,楊萍,袁汝兵.德國科研數(shù)據(jù)基礎設施的構(gòu)建模式及啟示[J].圖書情報工作,2020,64(21):140-150.
[11]周雷.德國國家文化遺產(chǎn)科研數(shù)據(jù)基礎設施構(gòu)建模式研究及啟示[J].情報資料工作,2021,42(1):105-112.
[12]章昌平,米加寧,黃欣卓.超越數(shù)據(jù)洪流:第四研究范式下的社會科學研究數(shù)據(jù)基礎設施[J].學海,2019(3):55-61.
[13]饒梓欣,鄧璐薌,許鑫.國際視野下面向人文研究的數(shù)據(jù)基礎設施分析與探討[J].圖書情報知識,2022,39(5):31-41.
[14]中國科學院計算機網(wǎng)絡信息中心.中國科技云[EB/OL].[2023-04-25].https://www.cstcloud.cn/xmjs.
[15]Alliance research data management working group. The current state of research data management in Canada[EB/OL].[2023-06-08]. https://alliancecan.ca/sites/default/files/2022-03/rdm_current_state_report-1_1.pdf.
[16]Government of Canada. Tri-agency statement of principles on digital data management[EB/OL].[2023-05-19]. https://science.gc.ca/site/science/en/interagency-research-funding/policies-and-guidelines/research-data-management/tri-agency-statement-principles-digital-data-management.
[17]Government of Canada. Tri-agency research data management policy[EB/OL].[2023-05-19]. https://science.gc.ca/site/science/en/interagency-research-funding/policies-and-guidelines/research-data-management/tri-agency-research-data-management-policy.
[18]閻婷婷.加拿大高校圖書館科研數(shù)據(jù)管理服務調(diào)研[J].圖書館建設,2017,275(5):66-72.
[19]王成一.加拿大科學數(shù)據(jù)管理及啟示[J].圖書館雜志,2020,39(6):77-82,91.
[20]First Nations Information Governance Centres. Education and training[EB/OL].[2023-05-16]. https://fnigc.ca/what-we-do/education-and-training/.
[21]Population data BC. Education and training[EB/OL].[2023-05-16]. https://www.popdata.bc.ca/etu.
[22]Alliances advanced research computing working group. Current state of advanced research computing in canada[EB/OL].[2023-06-08]. Current State of Advanced Research Computing in Canada.
[23]MICHELLE B, OLABARRIAGA D. The global impact of science gateways, virtual research environments and virtual laboratories[J]. Future Generation Computer Systems, 2019(95):240-248.
[24]Alliances advanced research computing working group. Research software current state assessment[EB/OL].[2023-06-08]. https://alliancecan.ca/sites/default/files/2022-03/rs_current_state_report_1.pdf.
柏 ?雪 桂林理工大學圖書館副研究館員。 廣西桂林,541004。
陳 ?茫 桂林理工大學商學院教授。 廣西桂林,541004。
鄭 ?聰 桂林理工大學圖書館副研究館員。 廣西桂林,541004。
(收稿日期:2023-09-01 編校:謝艷秋)