——以荷蘭4TU.ResearchData 為例"/>
999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?封 潔
(中南財經政法大學圖書館 湖北武漢 430073)
大數據時代,科學研究向數據密集型范式發展,科研數據的保存、管理和共享受到科技界的高度重視。當前高校中小型科研數據機構庫的數據保存和共享能力有限,迫切需要高校之間優勢互補,資源共享,走向合作,共同構建高校科研數據機構庫聯盟,以最大限度地發揮科研數據的研究價值,推動科學研究發展。聯盟的形態優勢顯著,但同時也會讓組織成員面臨除自身風險外的組織合作風險。因而,預先分析高校科研數據庫聯盟的運行風險并探討相應的風險防范對策,可以有效提高聯盟運行的成功率,從而更好地為高校科研數據的存儲、組織、共享提供平臺和保障。由于目前我國還未構建起高校科研數據機構庫聯盟,本文選取荷蘭4TU.ResearchData作為案例進行分析,以期為我國未來構建高校科研數據機構庫聯盟提供借鑒和參考。
荷蘭4TU.ResearchData是4TU科研數據中心(4TU.Centre for Research Data,簡稱4TU.ResearchData),是由荷蘭埃因霍芬理工大學(Eindhoven University of Technology)、特文特大學(University of Twente)和代爾夫特理工大學(Delft University of Technology)三所高校共同發起并建立的科研數據聯盟,其宗旨是使科研數據得到長期保存和再利用,提高科研數據的可見性、可獲得性以及可引用性。4TU.ResearchData為科研人員提供數據管理計劃、數據存儲與出版、數據管理專業培訓等服務,以規范、安全的組織方式保存管理科研數據,致力于科研數據的共建共享和科研數據的管理監護服務。
聯盟的風險從其性質來看,可劃分為關系風險和績效風險。具體來看,高校科研數據機構庫聯盟的關系風險主要是指在管理與合作中所面臨的風險,聯盟運行階段的績效風險可以劃分為數據采集風險、數據組織風險、數據存儲風險以及數據服務風險。將這五大類風險列為一級指標,對其進行進一步分析,構建風險管理二級指標,如表1所示。

表1 高校科研數據機構庫聯盟風險評估指標
由于科研數據的價值性和利益相關性,科研人員通常不愿意主動共享自己的科學研究數據。荷蘭SURF基金會曾對荷蘭科研人員的數據存儲和訪問需求進行調研,發現科研數據的存儲和獲取仍存在缺乏共享動力和缺乏信任的障礙因素,說明科研人員共享意愿風險仍然存在。4TU.ResearchData采取了一系列措施努力提升科研人員的共享意愿,在一定程度上降低了科研人員的共享意愿風險。如通過完善的元數據標引政策嚴格保護科研人員的科研數據知識產權,且只有經過科研人員提交許可書,才會正式發布科研數據,以增強科研人員對聯盟的信任。此外,4TU.ResearchData積極與湯森路透等專業機構合作,允許數據引文索引(DCI)、DataCite等收割和保存聯盟的公開數據或元數據[1]。2018年,4TU.ResearchData的數據集在引導頁面嵌入schema.org元數據,使數據集可以在Google中實現檢索,以提升數據資源的可見度,擴大研究者的影響力,降低科研人員的共享意愿風險。
4TU.ResearchData支持兩種數據采集方式,一是由科研人員自己上傳,二是由聯盟工作人員協助上傳。由科研人員自行上傳的數據需要經過數據管理人員的審核才能夠存儲在數據庫中,管理人員對數據格式的規范性進行審查,以保障數據的長久存儲和再次利用。并且,聯盟制定了完整的數據提交流程和詳細的指導手冊,幫助科研人員順利上傳科研數據,降低數據提交風險。但由于聯盟沒有對所提交的科研數據進行內容方面的質量把控,并且數據的采集依賴科研人員的自愿提交,數據的采集效率和完整性存在一定的風險。
在元數據風險方面,4TU.ResearchData為科研數據的組織制定了較為完整的元數據方案,采用DC元數據標準進行數據組織,包括題名、創建者、創建日期、主題、描述、語言等核心元數據以及擴展元數據。聯盟為機構庫中發布的所有數據集賦予數字對象標識符(DOI),并且可由科研人員選擇為數據集的任意粒度賦予DOI進行標注,從而為該資源提供永久標識,方便未來其他研究者的引用,因而4TU.ResearchData的元數據風險較低。
4TU.ResearchData的數據組織遵循DSA(Data Seal of Approval)所提出的16條數據組織指導原則,獲得了DSA的質量認證[2]。該原則從數據生產者、知識庫、數據使用者三個層面對存儲在知識庫中的數據質量進行了標準規范,其中包含了對元數據等數據組織方面的規范要求,說明收錄在4TU.ResearchData中的科研數據經過了較好的組織規范和標引,具有較低的數據組織風險。
由于缺少定制元數據、數據分析以及針對特定主題的同行評審這些高級功能,4TU.ResearchData難以與特定的研究社區建立牢固的聯系。研究者目前僅把4TU當作一個偶爾使用的工具,而不是每天的研究必備工具。為降低元數據風險和數據分析風險,4TU.ResearchData在其2020—2023年的發展戰略中提到,平臺目前雖然無法實現復雜的分析管理過程,但應圍繞科研過程開展支撐培訓與討論,包括如何使用NetCDF格式、如何促進FAIR數據在不同學科領域實施等內容。
為保障聯盟中數據資源的安全性和可讀性,4TU.ResearchData制定了詳細的數據資源保存計劃[3]。首先對存儲的數據格式進行明確的規范,建議用戶使用標準且可轉換的數據格式來存儲數據,以保障數據的兼容性和可讀性,為未來的數據遷移做準備。其次,采用安全的存儲方式和數據備份計劃。聯盟的數據資源存儲由代爾夫特理工大學的IT部門提供技術支持并進行管理,使用RDID6技術將科研數據資源存儲在硬盤上,進行每日同步備份,并且每隔兩周將數據資源備份于不同存放位置的磁盤之中,備份的數據會保存一年。此外,為確保數據恢復系統的正常運行,聯盟會將根文件系統進行三個月的異地備份。
由于4TU.ResearchData中存儲的科研數據數量大且類型復雜,聯盟采用OPeNDAP技術存儲數據文件,主要采用NetCDF網絡通用數據格式,實現OPeNDAP服務器和客戶端之間的數據傳輸。Fedora操作系統主要用于存儲聯盟的所有元數據信息以及非NetCDF格式的數據集。強大的操作系統和數據中心技術保障了聯盟的數據存儲和服務,有效降低了聯盟的技術風險。
在存儲空間方面,4TU.ResearchData通過規定免費存儲空間范圍和提供在線動態存儲服務來保障存儲空間的充足。聯盟付費成員的研究者每人每年可以免費擁有1TB的存儲空間,其他科研人員每年可以享有10GB的免費存儲空間,超出部分按每GB4.5歐元收費。此外,4TU.ResearchData為聯盟成員的科研人員提供了在線動態存儲的數據實驗室(Data-lab),可用來存儲、處理并共享在研究進程中的科研數據,聯盟成員的研究者可免費享有50GB的動態存儲空間[4]。但由于聯盟存儲權限的區分不利于聯盟更多科研數據的獲取以及樹立國家級乃至世界級科研數據機構庫聯盟的形象,4TU.ResearchData在最新的發展戰略中提出要努力建立與荷蘭國內高校以及世界上其他高校的合作,獲取更多科研數據,這也對聯盟現有的存儲空間及存儲技術提出挑戰。
在科研數據資源的存儲利用過程中,聯盟制定了完善的數據保存政策和數據存檔與獲取流程,以詳細的元數據描述方案保障數據創建者信息記錄的完整性,并要求用戶在使用科研數據前簽訂用戶使用協議,嚴格保護科研人員的知識產權和隱私信息,有效降低了科研數據在共享利用過程中的知識產權和隱私風險。
在科研數據的共享方面,4TU.ResearchData建立了統一的數據管理平臺,實現了聯盟成員高校之間的數據共享和統一檢索。用戶在該平臺上可以使用布爾邏輯進行檢索,或按照數據創建年份、創建者、數據類型、格式、館藏類別、地理位置等字段進行分類瀏覽。在聯盟官網上進行注冊后,用戶即可下載包括一般數據集、碩士論文數據集在內的部分科研數據,而聯盟成員用戶可以下載所有的科研數據資源,較好地實現了聯盟內部科研數據資源的共享利用。此外,4TU.ResearchData采用CCO協議(Creative Commons)作為研究人員共享數據集的默認方法,研究者在上傳科研數據時,也可以從預定列表中選擇許可證,以促進科研數據的共享和利用。
在數據監管方面,4TU.ResearchData以嵌入科學研究全過程為服務目標,其網站的類目也按照科學研究過程進行組織,從科學研究的計劃、執行和發布階段分別指導研究者利用聯盟的服務。為應對荷蘭科學研究組織(Netherlands Organization for Scientific Research,NWO)、荷蘭皇家科學院(Koninklijke Nederlandse Akademie Van Wetenschappen,KNAW)等研究資助機構對被資助科研人員提出的制定數據管理計劃要求,4TU.ResearchData為科研人員提供了數據管理計劃的模板服務[5],該模板包含數據收集、數據存儲和備份、數據文件、數據獲取、數據共享與再利用、數據保存與存檔六個部分,幫助研究者在正式開展研究之前制定合理的科研數據計劃。聯盟在科研的執行階段提供數據檢索瀏覽以及數據的動態存儲服務,并在科研項目完成后提供數據存檔和發布服務,通過DataCite為數據分配DOI,并且可精細到數據的任何粒度,以保障數據的檢索、定位、獲取和再利用。但4TU.ResearchData在其制定的2020—2023年發展戰略中提到,目前研究者對于科學數據管理的需求在不斷擴展,而4TU.ResearchData所實現的服務功能還僅僅停留在剛成立的時候。當前研究者越來越關注科研的整個生命周期以及其所在的特定研究領域,4TU.ResearchData也應重視這些需求。
在數據可獲得性方面,4TU.ResearchData自2018年起開始解決其數據獲取流程中的功能缺陷問題。計劃到2020年,4TU.ResearchData將能夠實現提供應用程序編程接口(API),限制訪問,鏈接至Github,使用情況的高級統計,以及自定義元數據等各種改進的功能,以提升數據集的可獲得性。此外,為提高聯盟管理人員的專業素養,培養更多的數據管理人員,4TU.ResearchData提供數據管理專業課程、研討會以及系列講座[6]。其中,“科研數據支持四要素”(Essentials 4 Data Support)是聯盟與DANS和SURFSara共同合作開展的培訓課程,包括基本概念介紹、規劃階段、研究階段、用戶階段、科研數據政策法規、數據支撐六個部分,幫助數據管理人員更好地了解科研數據的生命周期,提高科研人員的數據管理和支持能力,降低專業科研數據管理人員不足的風險。
4TU.ResearchData為荷蘭4TU聯盟合作計劃的一部分,4TU聯盟是荷蘭四所高校為增強科研實力、培養更多高質量研究者、創造更多有價值的科研成果而合作建立的高校聯盟,其成員包括代爾夫特理工大學、埃因霍芬理工大學、特文特大學和瓦赫寧恩大學(Wageningen University)。目前4TU聯盟中的代爾夫特理工大學、埃因霍芬理工大學、特文特大學三所高校參與了4TU.ResearchData數據共享聯盟項目。4TU.ResearchData由代爾夫特理工大學圖書館負責運作,其組織結構包括項目管理組、項目執行組、支撐組、研究與知識轉移部和專家委員會,是目前為數不多的由圖書館主導的科研數據聯盟模式[1]。4TU聯盟的研究管理委員會(The Research Management Committee)負責監督和管理4TU.ResearchData的合作和運行,協調并監管聯盟各成員間的合作關系,以保障聯盟的順利運行[7]。此外,參與4TU.ResearchData科研數據共享聯盟的三所高校均為理工科性質的大學,其學科分布具有共同點,便于共同開展科研數據的保存和共享服務,有利于高校間的協調合作。從整體上看,4TU.ResearchData依托4TU高校聯盟而建立運行,具有規范的組織結構和監管部門,但并沒有制定具體的聯盟成員管理計劃,如明確聯盟成員的績效考核標準、制定聯盟的利益分配計劃等,存在一定的管理合作風險,需要引起聯盟管理者的重視。
(1) 有效提升科研人員共享意愿。提升科研人員的科研數據共享意愿對聯盟的順利運行至關重要。高校科研數據機構庫聯盟應定期在聯盟各成員高校中開展面向全校科研人員的科研數據素養培訓,使科研人員可以熟悉科學數據共享平臺的使用方法,提升聯盟科研人員檢索和獲取科研數據資源的能力,進而使其體會到科學數據共享的益處。同時,可以設立專人通過對高校科研數據機構庫聯盟的數據資源及相關數據庫資源進行組織加工,向科研人員推送最新的學科前沿信息,幫助科研人員了解高校科研數據機構庫聯盟的存在價值,從而使其在有效利用他人科學數據的情況下逐漸改變自己的共享意愿。
(2)制定統一的數據采集政策。數據采集是高校科研數據機構庫聯盟運行中的首要環節,采集的數據質量和采集效率極大影響后續對數據的加工和利用,并且聯盟涉及不同高校之間的數據采集合作問題,因而需要制定統一而完善的數據采集政策。高校科研數據機構庫聯盟的數據采集政策需要對數據采集模式、數據采集標準、質量控制體系做詳細規范和控制,并且需要設置相關數據指標檢查已采集入庫的數據。高校科研數據機構庫聯盟各成員需要遵循統一的上傳資源采用標準,通過同行專家評審和學科館員審核,對提交入庫的資源進行質量控制,必須是具有學術價值,能夠代表一定的科研實力和水平的數據資源才可入庫。高校科研數據機構庫聯盟的管理部門需在各成員高校挑選評審專家,對提交內容進行嚴格審核,以保證聯盟數據資源的質量[8]。
(1)建立完善的元數據管理方案。由于科研數據具有短暫性、臨時性、數量龐大的特點,只有經過組織標引的資源才能被用戶充分利用和共享[9]。高校科研數據機構庫聯盟的元數據方案直接關系到聯盟能否滿足聯盟用戶的不同需求,影響著聯盟數據服務質量及可持續發展。因而需要建立完善的元數據管理方案,滿足聯盟成員間不同學科、不同用戶的元數據需求,使科研數據具有可擴展性數據結果,從而降低聯盟在數據組織方面的風險。我國高校科研數據機構庫聯盟需要在建設前期確立目標和功能定位,針對未來收錄的科研數據的學科特征和屬性特征,結合各類元數據標準的特點選擇適當的元數據標準,以保證高校科研數據機構庫聯盟元數據標準的適用性。為盡量降低數據標引錯誤率,減小數據組織風險,高校科研數據機構庫聯盟的元數據管理方案還應包括對元數據的質量控制。
(2)應用語義分析、挖掘技術和工具。高校科研數據機構庫聯盟中的科研數據具有動態性和復合性特征,需要根據科研數據的生命周期對數據進行標注,并分析數據集之間和數據集內部的邏輯關系。因而高校科研數據機構庫聯盟的數據組織應充分應用基于本體的語義化組織,以實現對聯盟機構庫內科研數據的細粒度描述,將不同學科的元數據方案進行有效交換和互聯,進行可共享的語義化描述,為計算機的自動識別處理打下基礎。此外,高校科研數據機構庫聯盟的重要功能之一是為聯盟用戶提供數據監護服務,將服務嵌入到研究者的科研過程之中,為科研人員提供最前沿的數據信息資源。為實現這一功能目標,高校科研數據機構庫需要在數據組織環節將科研數據與其他信息資源進行整合集成,深入挖掘科研數據的語義內涵和關聯關系,將科研數據發布為關聯數據,從而進行邏輯層面的數據集成。
(1)建立數據安全保障體系。高校科研數據機構庫聯盟的數據安全是聯盟正常運行的基本保障,也是專家學者高度關注的風險項。聯盟內科研數據的安全性不僅涉及到高校科研數據機構庫聯盟整個管理體系的科學性,也包含聯盟管理人員的工作態度和聯盟用戶的素質等因素。我國高校科研數據機構庫聯盟應建立完善的管理體系,構建包括數據管理、機房管理、設備管理、網絡管理、人員管理的數字資源安全管理制度,提高安全防范意識。建立機房、設備安全管理辦法,形成制度化的工作規范,加強安全漏洞檢查,定期對軟硬件設備進行維護,并對數據進行及時備份,以保在風險發生時將損失降到最小。此外,高校科研數據機構庫聯盟在運行中還要加強工作人員的安全意識,對機房設備管理人員進行安全知識培訓,確保管理人員掌握數據安全方法,提高工作人員的責任心與安全管理能力。
(2)制定科研數據的保存政策。合理保存科研數據是高校科研數據機構庫聯盟的重要功能之一,科研數據的存儲和保存是實現科研數據共享的基礎,也是對科研數據進行重用和增值的必要條件。由于高校科研數據機構庫聯盟所需要保存的科研數據種類多、體量大,在盡可能提升存儲技術、擴大存儲空間的基礎上,制定完善合理的科研數據保存政策十分必要。高校科研數據機構庫的數據保存政策首先應明確規范科研數據的保存期限,以免科研數據因為過早被剔除而無法重用。其次,應對超出保存期限的科研數據的處理方式進行規范。部分已經超出保存期限的科研數據可能仍具有很高的利用價值,應進行慎重考量,不能一律剔除。最后,科研數據的保存政策還應對數據保存要求進行規范,以保證數據的可獲得性。如匹斯堡大學規定保存的科研數據必須具有足夠的細節來保證他人可以檢驗和復制該科學研究,從而保障數據的真實性和可靠性[10]。
(1)建立科研數據知識產權保護體系。高校科研數據機構庫聯盟應該針對聯盟的實際情況,制定適合聯盟發展的科研數據知識產權保護體系,構建合理的科研數據使用授權許可協議。科研數據的使用許可是對使用人合法使用科研數據行為的規范,無論是免費使用還是有償使用,都需要對科研數據進行授權[11]。高校科研數據機構庫聯盟的授權許可可以參照知識共享協議(Creative Commons License)制定聯盟的科研數據使用授權許可。此外,高校科研數據機構庫聯盟還需要明確科研數據發布者的版權信息,在數據提交環節就應對科研數據發布者的版權信息及貢獻程度進行詳細記錄,以保障數據發布和研究者的知識產權。同時,高校科研數據機構庫聯盟應制定統一的數據引用標準規范,提高科研人員對于數據引用的重視程度,保障科研數據發布者的權利。
(2)提高聯盟的整體服務質量。高校科研數據機構庫聯盟的服務質量對聯盟的知名度和長期發展具有十分重要的作用,因而提高聯盟的整體服務質量是防范聯盟服務風險發生的重要舉措。首先,應強化聯盟的數據監護服務,使聯盟服務有效嵌入科研。從科研數據的生命周期出發,整理記錄科研數據處理情況,為科研人員提供面向科研流程全過程的服務,如幫助學者制定數據管理計劃,對科研數據進行合理保存和發布,提供數據整合和分析服務等。其次,建立統一的科研數據管理與共享平臺,將聯盟各成員的科研數據資源整合在該平臺,為聯盟用戶提供統一的數據管理與監護服務。再次,提高聯盟管理人員的信息素養,配備專業的科研數據管理人員,為科研數據創建選擇元數據標準、為用戶提供科研數據管理計劃的指導、提供數據分析與數據發現服務等。
(1)確立資金支持計劃保障聯盟經費。高校科研數據機構庫聯盟的建設和運行需要人力、物力、財力的長期投入和支持,聯盟的系統配置、平臺開發、數據管理、服務提供等均需要資金的投入,因而資金保障是聯盟順利運行的重要因素。當前,國內外知識機構庫的經費支持主要有三類,一是國家或者政府的資助;二是高校或研究機構的資助;三是社會機構或企業的捐贈。如莫納什大學的國家數據服務中心由澳大利亞聯邦政府提供經費支持[12];香港科技大學機構庫由本校提供經費資助;美國校際社會科學數據共享聯盟(Inter-University Consortium for Political and Social Research,ICPSR)由政府機構和私人基金會共同提供資助。而目前國內大多數機構知識庫的資金支持主要來源于圖書館經費。由于圖書館經費的有限性,很容易出現經費短缺的現象,甚至造成項目中斷等嚴重后果,因而建立起良好的資金保障機制十分必要。我國高校科研數據機構庫聯盟的建立可以一定程度上減輕各高校單獨建立科研數據機構庫的經費負擔,形成規模效益,但也需要國家和政府的大力支持,還可在運行中通過會員制度和適當的有償數據服務來補充資金缺口。此外,積極尋求基金會或其他社會資金的支持,拓寬經費來源,也是保障聯盟順利運行的重要措施。
(2)建立合理的利益分配及協調機制。高校科研數據機構庫聯盟作為利益共同體,聯盟中各成員高校有著共同的利益驅動,也有著各自不同的利益要求,成員間利益分配的平衡與否直接影響著成員參與合作的動力和積極性,進而決定著聯盟的成敗。高校科研數據機構庫聯盟中的利益平衡指各成員高校在參與科研數據共建共享活動中,所投入的人力、資金、信息資源等生產要素和所得到的產出是否平衡。在進行成員利益分配時要做到公平合理,遵循平等協商、互惠互利、權責對等原則。在聯盟正式開始運行之前,各成員高校需共同確定一個合理的分配方案,將責任、權利、成本風險、利益分配進行預期和規定,并在實際的運行環節中,根據聯盟各成員高校的實際貢獻程度對分配方案進行適當協商并調整,以保障聯盟成員參與共建共享的積極性和主動性。
總體來看,荷蘭4TU.ResearchData聯盟具有共建共享、一體化服務等特點,有效推動了科研數據的保存、共享和再利用。4TU.ResearchData雖然在管理合作、數據采集等方面存在著一定的風險,但其所面臨的整體風險較低,是當前較為成功的高校科研數據機構庫聯盟案例,可以為我國未來建立高校科研數據機構庫聯盟提供參考。