999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校開放科學數據平臺建設探索*
——以浙江大學開放數據平臺為例

2023-12-05 10:23:54姚翔宇黃晨葛杭
大學圖書館學報 2023年6期
關鍵詞:科學用戶建設

□姚翔宇 黃晨 葛杭

1 引言

開放科學數據是開放科學運動向縱深發展的重要領域,其重點在于對既有數據進行發布和共享,以發掘數據的新價值或驗證既往研究。由數據公平港灣倡議組織(Data FAIRport Initiative)提出的FAIR原則已經成為開放科學數據活動的宏觀目標和重要共識,該原則包括可發現、可訪問、可互操作、可重用4個方面[1-2]。以專注于科學數據管理和傳播標準研究的數據文檔倡議組織(Data Documentation Initiative,DDI)提出的數據生命周期模型為參照[3],開放數據活動主要涉及數據生命周期中的存儲、發布、發現、重用環節。

圍繞科學數據的開放共享,各國先后提出了相關倡議和政策要求。2012年歐洲研究型大學聯盟(League of European Research Universities)發表《關于開放研究數據的聲明》支持科學數據開放[4]。2013年美國白宮科技政策辦公室(Office of Science and Technology Policy)發布《聯邦資助科研成果開放獲取政策》,要求促進對聯邦資助研究中的科學數據提供開放獲取[5]。2016年英國國家科研與創新署(UK Research and Innovation)發布《開放研究數據協議》,制定了10項利用開放研究數據的原則[6]。2018年中國國務院印發《科學數據管理辦法》[7],2019年國際科學理事會數據委員會(Committee on Data of the International Science Council)發表《科研數據北京宣言》[8],顯示出開放科學數據相關工作在國內關注度和重要性的提升。同時,近年來隨著數據驅動的人工智能技術快速發展,各細分科學領域的研究范式也在快速演化,其中基于高質量的科學數據建立大數據模型、以人工智能輔助研究發現和科技創新已成為各國尋求科技突破的重點競爭領域,這一趨勢對科學數據的快速積累、有效組織和開放獲取提出了更迫切的要求。

開放科學數據活動涉及諸多要素,包括數據政策、數據平臺、數據服務、數據素養等。其中數據平臺是數據活動的主要載體,是開放科學數據活動實踐不可或缺的信息基礎設施,承擔著將數據本體與數據生產者、使用者、管理者等利益相關方聯結起來的作用。現有相關平臺可歸納為存儲型、索引型、導航型3類,它們自下而上共同構成了開放科學數據平臺體系。存儲型平臺直接保存科學數據,能夠涵蓋數據的存儲、發布、發現、重用等全過程,例如哈佛大學的Harvard Dataverse,密西根大學主導的ICPSR等。索引型平臺收割、整合與揭示多個平臺中科學數據的元數據,一般不直接存儲科學數據,例如作為澳大利亞國家科研基礎設施的Research Data Australia等。導航型平臺通過自主提交或主動采集的方式登記其他平臺的信息,并進行標引、揭示甚至評價,以協助用戶發現潛在的數據來源或存儲設施,例如德國研究基金資助的數據存儲庫注冊平臺Re3data等。

高校是從事科研活動的重要主體,具備科學數據產出的能力,面臨數據保存、管理和發布的綜合需求,高校開放科學數據平臺(以下簡稱高校平臺)的需求和能力特征主要對應存儲型平臺。從現有的情況看,存儲型平臺也主要由直接從事數據生產和發布活動的機構建設,包括科研院所、高等院校、科技成果出版機構等。但是從實踐的總體情況看,一方面相對于國外,我國的平臺建設與應用仍相對滯后,處于“平臺數量少,尚未形成規模”的階段[9],Re3data上登記的存儲型平臺有3136個,其中美國1170個、德國501個、英國319個,而中國大陸僅有81個[10]。另一方面在國內現有平臺中,占主體的是科研院所建設的平臺,例如國家高能物理科學數據中心等20個國家科學數據中心[11];而高校方面僅有北京大學、復旦大學等數個高校進行了平臺建設。結合我國高校不斷提升的科研產出占比,這兩個方面顯示出在國際相關平臺建設已經達到相當規模的情況下,國內高校平臺建設仍處在十分初級的階段,需要加大力度開展開放科學數據平臺的實踐探索、研究總結和應用推廣,以匯聚散落在高校科研團隊中的科學數據,更好支撐我國數據驅動的科學研究轉型發展。

2 高校平臺實踐現狀及問題

在高校主導的開放科學數據平臺建設方面,國外特別是歐美地區起步較早、數量較多,平臺建設路徑、服務功能等方面都形成了較為豐富的實踐。國內高校相關實踐主要開始于2011年武漢大學高校科學數據共享平臺的建設,此后復旦大學、北京大學、華東師范大學等先后建設了各自的開放科學數據平臺。通過調查國外高校平臺及國內前述4個高校平臺,本文對國內外實踐現狀進行了比較和總結。

(1)建設路徑和技術方案。國外高校體現出較強技術實力,許多平臺采用自主研發形式建設,例如ICPSR、UKDA、Harvard Dataverse等均結合自身需求進行平臺研發和迭代,其中哈佛大學從2007年開始搭建的Dataverse系統,作為開源社區項目已經開發至5.13版本,也被許多其他高校采用。歐洲部分高校采用了商業化的平臺解決方案,如牛津大學、倫敦大學學院、荷蘭四校聯盟的4TU.ResearchData等均基于商業化云端數據系統Figshare開展服務。另外開源的通用機構文檔存儲系統DSpace、Fedora也有應用。國內平臺主要是在國外開源系統基礎上進行部署和二次開發,如武漢大學平臺基于DSpace部署,復旦大學和北京大學平臺基于Dataverse定制開發。華東師范大學則選擇了自主建設路徑搭建平臺。

(2)主要功能。國內外高校平臺在基本功能上均涵蓋了開放數據活動周期的主要環節,主要以數據存儲為基礎,提供數據發布、發現、訪問等功能。部分平臺如Dataverse還集成了數據的在線預覽和分析功能,但是相關功能一般比較簡單。除ICPSR通過接入在線數據分析平臺SDA進行高級數據分析外,較為復雜和專業的數據分析一般未在開放科學數據平臺中提供。

(3)用戶參與和數據組織。國外平臺存在兩種不同的取向,ICPSR、UKDA等側重于數據匯交和發布服務,它儲存用戶在線或離線提交的數據,在按照一定標準審查處理后以數據集為單元發布。用戶對平臺功能的參與度低,側重在平臺之外完成數據組織。新興應用Dataverse、Figshare等系統的平臺則側重用戶參與數據組織,例如Dataverse提出數據空間概念,用層層嵌套的空間將數據集和用戶權限按照層次關系組織起來,提供了團隊用戶共同管理數據集的條件。Figshare更強調用戶空間,用戶的賬戶與數據集建立關聯,可以如社交平臺一樣運營自己的數據集。相應地Figshare更貼合用戶的研究過程,數據集版本通常有較高的更新頻次。國內平臺主要偏向于對數據進行多層次組織,并允許用戶自主管理權限范圍內的數據。除了應用Dataverse系統的平臺外,華東師范大學平臺具有數據集、課題、文件3個層次的數據包含關系并對應分配用戶權限,在通常作為基本單元的數據集層次之下進行了課題子集劃分;武漢大學平臺在繼承DSpace組織模型的基礎上開放了課題、數據集兩個組織層次,用于歸集和分級管理數據。

(4)平臺合作和數據融合。國外平臺體現出較高的合作與融合程度,體現為合作聯盟、系統通用性和數據標準等多種形式。ICPSR、UKDA、4TU.ResearchData等通過多機構聯盟形式建設,形成統一的數據存儲和服務,是最直接的合作形式。Figshare作為商業化云系統,在為不同高校提供定制化服務的同時,通過主平臺入口提供了各機構數據的統一揭示。數據標準包括技術層面及關涉語義的數據描述層面,技術層面體現為廣泛應用OAI-PMH、RESTful API等建立數據接口,通過DOI對數據進行統一標識和索引。數據描述包括使用兼容性的元數據元素等。兼顧自然科學和社會科學的平臺通常以都柏林核心元數據集DC元素為基礎;起步于社會科學數據管理的平臺多以DDI元素為基礎,其中Harvard Dataverse也通過元數據導出形式對DC元素進行了完整映射;不過也有ICPSR、UKDA等平臺主要根據自身需要設計元數據元素。國內平臺目前在這方面還比較薄弱,主要的融合特征體現在技術層面,例如復旦大學、北京大學、華東師范大學的平臺均采用OAI-PMH作為數據接口,北京大學成熟應用DOI標識符并向科學數據注冊平臺DataCite提交數據。在數據描述上,除武漢大學采用自定義的元數據元素外,其他平臺主要選用部分DDI元素構建元數據、但相互之間選用的基本元素存在差異,其中北京大學也支持元數據導出為DC格式、但并未實現元素的完整映射。同時,國內平臺主要由各高校獨立建設和運營、缺少數據合作,復旦大學和北京大學盡管都應用了Dataverse系統,但是尚未在數據互通方面進行嘗試。

結合國內外高校平臺實踐特點,特別是國內平臺建設現狀,本文將重點關注和探索以下問題:

(1)探索自主研發路徑下平臺建構的思路和邏輯。國外自主研發及市場化開發的建設路徑,形成了圍繞需求定位的正向邏輯構建,具備平臺不斷迭代進化的主動性,而國內以選型應用、二次開發為主,有一定被動性。本文將通過探索自主研發的建設思路,構建平臺整體功能框架,豐富國內平臺建設路徑和思考。

(2)探索能夠更好支持研究過程中數據組織和用戶協作的平臺功能。高校平臺主要吸納機構內的科學數據,提升數據數量和質量需要政策、咨詢服務等多方面的支持,而在平臺層面則需要結合用戶特點做好功能建設、增強用戶黏性。高校平臺建設已經體現出以數據存儲為基礎,覆蓋數據發布、發現、重用的共性,而同時高校平臺與校內研究團隊具有服務共生關系,在數據管理方面需要考慮團隊內部數據使用與存儲的動態性、團隊內跨項目的成員組成和項目數據之間的關聯性,向數據的團隊協作、過程管理和自助管理方面傾斜。這方面國內平臺已經關注到團隊數據管理并嘗試了不同的數據組織形式,但是對協作的理解主要還停留在數據歸集和層次管理上,功能易用性也有待商榷,本文將通過對相關功能的進一步探索,強化平臺在用戶數據過程服務方面的作用。

(3)探索面向數據融合的數據描述方法。單一高校平臺面臨數據來源有限的局限性,最終需要通過平臺間合作建立數據互通和統一揭示體系、擴展數據范圍。為了實現這一點,除了政策、機制、資金等方面的保障,在單一平臺建設中還重點需要關注面向數據融合的數據標準。其中技術方面OAI-PMH接口、DOI標識符等的應用已經比較成熟,而數據描述方面國內各平臺主要基于自身需要進行元數據自定義或者DDI衍生應用,還未形成面向數據融合的建設導向和統一規范。在國內高校尚未形成緊密合作機制的背景下,本文將從具有兼容性潛力的數據描述方法切入,進行數據融合的前期探索。

3 建設思路和方法

3.1 總體框架

浙江大學開放數據平臺(以下簡稱浙大平臺)建設由依托浙江大學圖書館成立的浙江大學信息資源分析與應用研究中心實施,通過自主設計平臺架構和具體需求、委托軟件開發企業進行系統開發的路徑落地實施。在學校推進“雙一流”建設的背景下,浙大平臺以推動浙江大學科學數據的開放、交流與共享為總目標,以服務3類對象為具體目標:面向數據生產者提供科學數據的存儲、管理和發布服務,創建面向研究過程、易于協作的數據共享環境;面向數據使用者提供科學數據的發現、瀏覽和訪問服務,創建信息揭示清晰、訪問通道順暢、倡導學術規范的數據使用環境;面向管理者提供與數據開放過程相適應的合規審核和系統管理功能,支持平臺的持續有序運行。

在現狀調研和問題分析的基礎上,平臺設計明確了“以數據存儲為基礎、服務開放科學數據周期,重視研究過程動態性和團隊協作性,重視學科通用性和跨平臺互操作性”的特征定位,形成如圖1所示架構。其中功能應用層(以下簡稱功能層)是指直接面向用戶和數據活動的功能實體,數據生命周期和過程服務主要在這一層次體現;協議規范層(以下簡稱協議層)是指功能背后的標準規范,數據服務在跨學科、跨平臺方面的通用性和互操作性主要在這一層次體現。基礎要素是指平臺應該具備的基本特性,對應于開放科學數據活動中存儲、發布、發現、重用各環節的基礎性需求及定義平臺架構邏輯的核心層次,完成基礎層建設即可實現平臺的可用;拓展要素是指能夠進一步提升用戶體驗、平臺質量的需求,可以在平臺建設迭代中逐步加強和優化。

圖1 浙江大學開放數據平臺架構

同時,浙大平臺采用分期建設策略,以逐步擴大服務范圍為原則,劃分館內、校內、校際3個建設階段。第一階段主要是結合館內科學數據活動相關的實際場景,進行系統設計、基礎層開發和平臺試用,積累具體經驗;同時以小范圍社會科學學科用戶為試運行目標對象,對涉及多學科的功能在設計方面保持框架完整、在落地實施方面參照試運行學科的具體需要進行原型驗證性開發。第二階段進行平臺優化和拓展層開發,并將平臺在校內全面推廣使用。第三階段是逐步開展校外服務,同時通過校際合作探索不同高校平臺間的互通對接和數據統一揭示。

3.2 圍繞協作過程的功能層建設重點

(1)數據組織結構

將數據存儲和發布過程與數據生產者在研究過程中的協作活動結合起來,并提供與之相適應的數據組織結構,是浙大平臺選擇自主開發模式的重要動因。具體地,浙大平臺在數據基本單元的定義上延續了現有通常做法,即將數據集作為檢索、訪問、管理的基本單元,據此組織數據文件和元數據。但同時重點設計了數據集的父層級,以承擔多人協作和共同管理的高級功能(見圖2):父層級包含實體層(空間和項目)和虛擬層(文件夾)。

圖2 浙江大學開放數據平臺數據組織結構

實體層的“空間”反映了一組數據集的成果歸屬屬性,它不同于Dataverse中層層嵌套的空間概念,而是僅劃分兩種類別,以對應現實中的數據生產者實體,即研究者個人或研究團隊。對于研究者個人,他能夠直接創建和管理自己所擁有的研究數據,而個人空間是展示和匯聚這些數據集的權屬集合。對于研究團隊,能夠基于個人用戶組成關系穩定的群組,通過內部角色分工創建和維護團隊共有的數據集;并且在數據集發布前,團隊空間可作為研究過程數據的管理集合供團隊內部查看和編輯,實現高校數據平臺將存儲功能由長期保存到過程性存儲的延伸。實體層的“項目”反映了一組數據集的內容關聯屬性,便于規模相對較大的研究團隊既能將有關聯的數據集分別組織起來,也能將不同分工的成員進一步組織起來。

虛擬層的“文件夾”,是為研究者管理大量數據集而設置的靈活分類組織層次。文件夾介于項目和數據集之間,最多允許創建兩層子文件夾,它本身不附加權限和用戶管理屬性,僅作為可選形式對成員展示,以便利團隊內部管理和使用中對不同數據集的標記、區分和整理。在面向數據使用者時,文件夾的結構則不會呈現出來,以保持數據集作為基本單元的層次清晰性、降低用戶認知成本。

(2)權限控制

開放數據不等同于無條件開放獲取。已發布的數據應是始終公開、可訪問的,但它可能要求支付費用、接受法律協議,或者得到數據生產者的允許[12]。相應地,需要對數據訪問進行權限設置。同時,當引入團隊協作功能之后,基于團隊分工和管理的需要,也需要對數據權限進行控制。

為了實現多場景權限控制的靈活性和細粒度,浙大平臺從兩個維度定義了權限體系。其一是依附于空間的權限控制(見表1)。這一維度主要面向團隊協作活動,空間內部賦予用戶高度自主的管理權,可以通過空間中的角色分組實現日常數據活動的批量授權管理。其二是依附于數據集的權限控制(見表2)。由于數據集被定義為數據管理的基本單元,所以基于數據集設定的權限具有最高的優先級和最小的粒度。其中,已發布的數據集意味著可被發現和查看,對它的權限控制主要在于數據文件的可訪問性,即根據用戶為數據集設置的公開程度,控制相應數據文件可供下載的用戶分組。未發布的數據集則不對外公開,需要通過邀請用戶加入協作組的形式賦予有限的合作編輯功能。協作組的形式也為跨團隊數據合作提供了靈活性。

表1 浙江大學開放數據平臺依附于空間的權限設計

表2 浙江大學開放數據平臺依附于數據集的權限設計

在平臺與用戶的權限關系方面,則降低系統干預度、增加用戶自主權。例如平臺管理員僅對團隊創建和數據集發布環節進行合規審核,不直接干涉用戶的數據權限;平臺為團隊空間設定默認角色權限模板,但是允許用戶自主調整角色權限定義。

(3)計劃任務和數據統計

團隊協作中對數據的管理最終要落實到對數據活動的管理,這種管理不僅是對成員分工的管理,也包括對數據工作計劃任務的分配和對數據工作狀態及成效的統計。其中計劃任務功能主要是以待辦提醒的形式實現,允許團隊管理者添加任務和發送提醒,并且可以設置周期任務定時發送提醒消息,以方便團隊開展長期的、周期性的數據采集工作。數據統計功能主要是以用戶行為為基礎,以人員、時間、學科、標簽等為維度,客觀描繪數據工作、數據使用相關的指標。除了常見的訪問量、下載量、數據集容量等指標外,還著重納入了與數據活動過程相關的數據工作量、成員參與度等指標,以方便用戶追蹤數據工作軌跡、評估數據影響力。

3.3 面向數據融合的協議層建設重點

(1)元數據

元數據是用于描述數據的數據,浙大平臺以數據集作為數據管理和發現的基本單元,相應的元數據建設主要圍繞數據集層次展開,并將元數據的兼容性作為主要出發點,設計了元數據層次和元素。

元數據層次與跨學科維度有關,高校平臺具有學科綜合性,需要兼顧不同學科在數據特征方面的差異。從數據融合的視角看,關系到數據可發現和可訪問的部分處于相對底層,容易在跨學科大范圍內實現統一,關系到數據可互操作和可重用的部分處于相對頂層,只能在特定學科小范圍內統一[13]。因此,浙大平臺規劃了“基本元數據+專業元數據”的二級元數據層次。其中,基本元數據學科特征不顯著,是描述數據集的基礎,而專業元數據用于增強不同學科數據集專業性、差異化的元數據表示能力。

元數據元素與跨平臺維度有關,單一高校平臺的數據主要來自本機構的數據生產者,因此高校平臺有融入廣泛的數據集成體系的內在要求,需要考慮基本元數據跨平臺交換的語義對應關系。浙大平臺將基本元數據的元素劃分為3個部分,其中基本信息部分主要包含數據集的通用描述信息,服務于數據集的發現和訪問;方法部分主要包含數據集的采集、處理信息,服務于數據集的重用;權利部分主要約定數據所有權和使用限制方面的條款。具體元素綜合考慮了DC元素、DDI元素和平臺調研中記錄的常用元素,并明確了相互間的映射關系。其中對DC元素能夠完全覆蓋,而DDI元素非常豐富,這里主要參考了ICPSR、UKDA選取的常用元素和DDI精簡集提示的重要元素[14]。對于各個元素分別給出英文名稱、中文名稱、元素說明并定義了必填項和錄入格式(見表3)。

表3 浙江大學開放數據平臺基礎元數據設計及與DC、DDI元數據的映射關系

(2)引用格式

引用格式是數據描述的另一維度。恰當引用科學數據是加強學術規范、擴大傳播影響力、提高重用價值的重要環節,也是促進數據在不同學術成果形式間關聯融合的媒介。開放數據平臺自動生成和展示信息明確的數據引用格式,有助于引導用戶進行合理引用和跨平臺傳播。盡管目前開放數據活動中還沒有就引用方式形成統一的規范,但是國內外關于數據引用格式已經形成了一些標準和實踐方面的探索,浙大平臺對國內《GB/T 7714-2015信息與文獻 參考文獻著錄規則》《GB/T 35294-2017信息技術 科學數據引用》,國外Dataverse引用格式[15]、ICPSR引用格式[16]進行了比較,最終基于《GB/T 7714-2015信息與文獻 參考文獻著錄規則》中規定的“電子資源”引用格式,選取主要元素、并增加版本元素形成了引用格式(見圖3),在數據集頁面進行生成和展示。

圖3 浙江大學開放數據平臺的引用格式

在格式選型設計中主要考慮了兩方面因素。一是相關格式涵蓋的信息量。劉小宇等通過調查我國科學數據平臺的被引狀況,發現平臺提供的引用聲明不夠具體是造成引用不規范的重要原因,只包含平臺名稱和平臺網址,不包含數據創建者、數據名稱和數據解析地址的引用格式,很難回溯獲取相應科學數據[17]。通過對比引用格式中包含的元素信息(見表4),可見4種引用格式都包含了訪問科學數據的必要元素,其中《GB/T 7714-2015信息與文獻 參考文獻著錄規則》提供的元素最豐富,其他3種格式都包含了額外的版本元素。二是相關格式的應用潛力。Dataverse格式在部署該系統的平臺中集成,有一定的平臺傳播效應,例如北京大學、復旦大學平臺采用了該格式;ICPSR格式主要是該平臺自定義的標準;《GB/T 35294-2017信息技術 科學數據引用》是專門針對科學數據制定的國內標準,但是尚未出現有影響力的應用;而《GB/T 7714-2015信息與文獻 參考文獻著錄規則》中“電子資源”引用格式是國內廣泛應用的文獻著錄規則的一個子集,易于與現有的參考文獻應用場景相融合,同時國內開展數據論文出版的學術刊物《中國科學數據》和《圖書館雜志》給出的數據引用格式也復用了該標準,在影響力和易用性方面相對具有較大潛力。

表4 科學數據引用格式元素對照

4 成效和思考

4.1 建設與應用成效

浙大平臺在2022年初完成一期建設并開展了試運行(網址:ciraa.zju.edu.cn/opendata),實現了基礎層的功能、協議方面主要設計構想,具備以下應用特點:(1)覆蓋開放數據活動周期,提供豐富的權限控制體系;(2)面向研究過程,適應個人工作與團隊協作,可通過建立團隊賦予成員多樣的權限,將平臺作為團隊數據協作工具,編輯和維護研究團隊共有的數據集;(3)具備通用性的元數據元素、自動生成引用格式;(4)提供多樣的檢索發現路徑,支持關鍵詞檢索和垂直學科導航;(5)支持高寬容度數據文件上傳和數據安全保護。

試運行期間,平臺主要面向受邀用戶開放注冊,截至2023年10月已收錄9個團隊空間、295個數據集。通過試用,建設團隊也同步收集了用戶反饋的功能建議,并結合分期規劃確定了后續建設要點。

4.2 建設路徑的決策因素

國內外平臺建設實踐呈現出了多種技術應用路徑,浙大平臺選擇自主研發路徑,主要基于對商業方案、開源方案和國內開發生態的適用性分析。購買商業化平臺的系統服務能夠實現平臺的快速落地、減輕后續運維負擔,國外以Figshare為代表的商業方案經過長期迭代在功能上日臻完善,但是其在本地化、定制化上的不確定性以及云服務的數據安全風險仍然是主要障礙。以Dataverse為代表的開源產品專門面向開放科學數據活動,覆蓋了主要的需求場景,但是其功能集成耦合程度高,存在二次開發難以觸及核心功能的問題,不利于實現在架構層面強化數據協作功能的開發設想;同時存在版本升級與定制功能兼容適配困難的問題,為平臺后續迭代升級工作帶來不確定性。與此同時,近年來國內信息產業發展快速,頭部企業技術實力增強也帶動了相關企業的數量增加和質量提升。在前期調研中,有來自圖書館技術服務、高等教育信息化、綜合性信息服務等不同領域的多家企業展現了合作意愿,為推進自主方案的落地提供了成本可控、技術可行的市場條件。

4.3 實踐中的館員參與機制

在平臺建設中,定義產品經理和數據用戶的館員角色,有助于避免創新型功能開發可能產生的預期偏差。一方面,不同于通常采取的需求方提出意向和框架、由承建單位負責需求細化和實施的開發模式,浙大平臺實踐通過設置產品經理角色,預先開展詳細的系統設計,對業務流程、功能節點、頁面交互、術語規范等方案進行完整構建,并對項目全流程進行跟蹤把控,為落實平臺自主開發路徑創造了過程可控的條件。另一方面,圖書館從事學術情報數據工作的團隊是平臺的直接用戶群體,將相關館員作為數據用戶納入團隊,全程參與需求調整和數據工作流程測試,以直面用戶的方式完善平臺設計,為平臺的用戶體驗和細節控制提供了保障。

4.4 高校平臺的建設與合作

實現未來高校平臺數據融合和體系構建,需要在數據描述方法、技術方法和合作機制方面結合現實條件因地制宜、多點發力。在數據描述層面,面對國內目前缺乏統一標準的局面,浙大平臺研究應用了注重兼容性的元數據和基于“參考文獻著錄規則”的引用格式,以期提出有參考性的解決方案。在技術層面,結合國內平臺將DOI用于數據集標引和永久訪問、將OAI-PMH用于元數據收割等的應用經驗[18-20],浙大平臺傾向于沿用成熟技術方案,降低對接成本。在合作機制層面,浙大平臺通過中國高校研究數據管理推進工作組(1)2014年成立,由復旦大學圖書館、北京大學圖書館、浙江大學圖書館等9家單位組成。網址:http://society.library.sh.cn/node/2611.的工作會議分享了平臺建設的方案和思考。目前這一機制仍有較大的潛力等待挖掘,通過開展更緊密的合作研究,特別是在元數據元素選用、學科主題詞表建設方面推進相關國內共識的建立,將有助于為更高層次的開放數據合作創造條件。

5 結語

對高校及高校圖書館來說,建設作為開放數據活動基礎設施的系統平臺是應對科學數據開放趨勢和支持數據驅動研究的重要步驟。本文通過闡釋浙大平臺的建設重點和實施過程,論述其中的探索和思考,或許能為相關實踐提供一些參考。

同時要注意到,一方面盡管開放科學數據平臺的建設有許多功能和標準方面的共性需求,但是各建設主體仍要結合自身條件確定建設路徑、提出特定思考、明確建設重點,這不僅是更好服務核心用戶的需要,也是現階段豐富國內平臺建設實踐的需要。另一方面,從科學數據開放活動的長期發展來看,高校平臺中的數據需要依賴于更高層級的統一發現和揭示服務來促進存量數據的利用和融合。為達成這一目標,在建設運營好各自平臺的基礎上,還需要各建設主體通力合作,建立科學數據開放生態,逐步搭建起存儲型、索引型、導航型平臺相互協同的開放數據平臺體系。

猜你喜歡
科學用戶建設
自貿區建設再出發
中國外匯(2019年18期)2019-11-25 01:41:56
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
基于IUV的4G承載網的模擬建設
電子制作(2018年14期)2018-08-21 01:38:28
《人大建設》伴我成長
人大建設(2017年10期)2018-01-23 03:10:17
保障房建設更快了
民生周刊(2017年19期)2017-10-25 10:29:03
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
科學
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
科學拔牙
主站蜘蛛池模板: 日韩无码视频网站| 亚洲第一黄片大全| 91久久偷偷做嫩草影院免费看| 91久久夜色精品国产网站| 久久福利片| 国产精品网址在线观看你懂的| 99这里只有精品免费视频| 亚洲无码高清一区| 一本色道久久88| 国产成人精品高清在线| A级毛片高清免费视频就| 亚洲无码37.| 国产不卡一级毛片视频| 中文字幕在线观看日本| 国产一级小视频| 五月婷婷亚洲综合| 99热这里只有精品在线观看| 爆乳熟妇一区二区三区| 国产午夜福利亚洲第一| 色欲色欲久久综合网| 在线观看国产网址你懂的| 亚洲欧洲日产国码无码av喷潮| 最新午夜男女福利片视频| 熟妇丰满人妻| 欧美色综合网站| 婷婷色狠狠干| 国产成人精品一区二区三在线观看| 国产精品久久久精品三级| 国产激情无码一区二区免费| 日韩人妻精品一区| 国产精品片在线观看手机版 | 五月激情综合网| 欧美日韩一区二区在线播放| 三级欧美在线| 久久久四虎成人永久免费网站| 久久精品国产精品国产一区| 国产噜噜噜视频在线观看| 在线无码九区| 精品伊人久久久久7777人| 亚洲综合色区在线播放2019| 亚洲综合专区| 国产人在线成免费视频| 亚洲无码熟妇人妻AV在线| 91精品专区国产盗摄| 国内精品自在欧美一区| 成人综合久久综合| 尤物成AV人片在线观看| 国产精品美女自慰喷水| 亚洲小视频网站| 欧美日韩资源| 免费在线观看av| 亚洲欧美精品在线| 亚洲伊人天堂| 中文字幕啪啪| 91福利国产成人精品导航| 国产欧美日韩综合在线第一| 日本国产精品| 亚洲中文字幕在线一区播放| 国产精品天干天干在线观看| 国产欧美精品专区一区二区| 亚洲美女高潮久久久久久久| 精品一区二区三区波多野结衣| 中文字幕在线不卡视频| 国产精品久久久久久久久久98| 99无码中文字幕视频| 免费无码又爽又刺激高| aa级毛片毛片免费观看久| 亚洲欧美日韩综合二区三区| 国产美女无遮挡免费视频| 欧美成人综合在线| 亚洲成人网在线观看| 亚洲最猛黑人xxxx黑人猛交| 91香蕉国产亚洲一二三区| 国产女人综合久久精品视| 中文字幕欧美日韩高清| 久无码久无码av无码| 国产成人欧美| 亚洲婷婷在线视频| 中文字幕 91| 日韩成人午夜| 无码一区18禁| 亚洲国产一区在线观看|