黃如花劉 龍陳 萌
(1.武漢大學信息資源研究中心 武漢 430072 ;2.武漢大學信息管理學院 武漢 430072;3.武漢音樂學院圖書館 武漢 430060)
·工作研究·
科學數據開放存取的途徑*
黃如花1劉 龍2陳 萌3
(1.武漢大學信息資源研究中心 武漢 430072 ;2.武漢大學信息管理學院 武漢 430072;3.武漢音樂學院圖書館 武漢 430060)
文章詳細論述了科學數據開放存取的多種途徑,包括利用數據檢索工具,訪問Dataverse倉儲,訪問相關組織或機構的開放數據站點,查閱開放存取倉儲注冊系統或目錄,查閱開放數據期刊,利用綜合性搜索引擎等,以期為用戶查找并獲取科學數據提供一些參考。
科學數據 研究數據 開放存取 途徑
〔引用本文格式〕黃如花,劉龍,陳萌.科學數據開放存取的途徑[J].圖書館,2016(11):26-33
科學數據是指各類科技活動產生的原始性、基礎性的數據及其分析研究信息,是國家創新體系中最活躍的要素之一[1],無論對經濟發展、政府決策、科技創新還是科學研究都具有重要意義。科學數據的開放存取越來越受到世界各國的重視,根據相關統計,截至2015年11月27日,在調查的全球157個科研資助機構中,有60個出臺了要求或鼓勵研究數據開放存取的政策[2]。2015年更是被稱為“開放數據授權年”(The Year of Open Data Mandates[3]),一大批機構在該年出臺了科學數據開放存取的政策。美國國家科學基金會(National Science Foundation,簡稱NSF)分別于2015年3月和7月發布《國家科學基金會公共獲取計劃:今天的數據,明天的發現》(NSF’S PUBLIC ACCESS PLAN: Today’s Data, Tomorrow’s Discoveries[4])和開放政府計劃3.5(Open Government Plan3.5[5]),以促進其資助的科學數據等研究成果的開放獲取;歐盟于2015年10月頒布了推動研究數據開放獲取的文件《地平線2020:科學出版物和研究數據開放獲取指南》(Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020[6]);英國工程和自然科學研究委員會(EPSRC)制定的《EPSRC研究數據政策框架》(EPSRC Policy Framework on Research Data)于2015年5月1日正式生效[7];我國國務院發布的《促進大數據發展行動綱要》也明確提出積極推動由國家公共財政支持的公益性科研活動獲取和產生的科學數據逐步開放共享[8]。
開放存取政策的出臺為科學數據的開放存取提供了條件。但由于缺少跨機構和地域性的一站式檢索站點,公開可用的科學數據散布在眾多獨立的組織或機構站點中,導致用戶很難從紛繁復雜的各類數據存儲站點中找到自己所需的科學數據,因此了解和掌握科學數據開放存取的途徑就變得尤為重要。本文介紹了多種科學數據開放存取的途徑,可以為用戶查找和獲取科學數據提供一些幫助。
數據檢索工具可用于直接檢索特定的科學數據資源,用戶只需輸入相應的檢索詞即可得到準確的檢索結果,是最為快捷、方便的科學數據查找途徑。DataCite[9]、CrossRef[10]、Zanran[11]、Voovle[12]以及Google Public Data Explorer[13]等都可算是這類工具的典型代表。本文選取DataCite元數據搜索、CrossRef元數據搜索和Zanran來進行介紹,其中前兩者分別隸屬于全球最大的兩家DOI(數字對象標識符)注冊、發布機構DataCite與CrossRef,可分別檢索在這兩個機構注冊的數據集,Zanran是一個專門用于查找數值型數據(Numerical Data)搜索引擎,功能非常強大。
1.1 DataCite元數據搜索
DataCite元數據搜索(DataCite Metadata Search)是一個通過搜索數據集在Datacite上注冊的關鍵詞、日期、位置等相關元數據信息,來查找和獲取某些特定數據集的數據檢索工具。Datacite作為一個幫助研究者發現、識別和引用研究數據的非營利性機構,目前已注冊了大量的研究數據集,用戶可利用DataCite元數據搜索來獲取所需的科學數據。
DataCite元數據搜索提供簡單檢索和高級檢索兩種檢索方式,并且給出了詳細的使用方法。使用簡單檢索時,用戶只需輸入DOI或相關元數據,如題名、主題等作為檢索詞,點擊檢索按鈕即可;使用高級檢索時,用戶可從DOI、標題、創建者、出版者、貢獻者、格式、主題、日期等13個字段中選擇輸入一個或幾個進行檢索,同時還可根據數據中心、資源類型和語言等進行檢索過濾。
1.2 CrossRef 元數據搜索
CrossRef 元數據搜索(Crossref Metadata Search)可通過元數據來檢索Crossref數據庫的資源。CrossRef是一個旨在促進學術成果內容更容易被發現、鏈接、引用和評定的非營利性會員組織,截至2015年11月21日,其數據庫收錄的資源記錄已超過7700萬個,其中很多為研究數據。目前僅提供簡單檢索這一種檢索方式,用戶可通過輸入作者、標題、DOI、ORCIDs、 ISSNs、FundRefs等元數據信息來進行檢索,檢索頁面給出了多種查詢示例以幫助用戶進行操作[14],例如輸入DOI“10.2331/ suisan.32.804”來查找某一特定的學術成果。
1.3 Zanran
Zanran是一個專門用來查找數值型數據(Numerical Data)的搜索引擎,可幫助用戶找到網絡上半結構化的開放數據,格式包括PDF、Excel、HTML Tables和Images等,比如他人發表的PDF格式的圖表、EXCEL格式的表格、圖片或HTML格式的條形圖等,其中很多是研究論文中的數值型數據。相比綜合性搜索引擎,Zanran檢索結果更為精確,而且操作也更為簡單,Zanran會在搜索框中給出檢索提示,用戶根據提示可以很容易地構造出標準的檢索式,提高檢準率。除此之外,用戶還可以在輸入檢索詞的同時選擇地區(如澳大利亞、加拿大等,也可以是特定的網址)、日期(所有日期、最近6個月、最近12個月、最近24個月)和文件類型(PDF、Excel、HTML Tables、Images)等進行限定,進一步精確檢索結果。因此,利用Zanran進行檢索是一種非常便捷、高效地獲取科學數據的途徑。
Dataverse倉儲(Dataverse Repository)即基于Dataverse軟件而建立的科學數據倉儲。Dataverse是一種分享、保存、引用、查找和分析研究數據的開源網絡應用程序,以利于研究數據更方便地為他人獲取和復用。一個Dataverse倉儲一般會收錄多個 Dataverse,每個Dataverse包含多個數據集以及其他的Dataverse,每個數據集又包括元數據和各種數據文件[15]。用戶訪問Dataverse倉儲不僅可以獲取大量的研究數據,而且可以找到很多其他的Dataverse,然后再通過這些Dataverse又可以獲取更多的科學數據和Dataverse。因此,相對于基于DSpace、CKAN等其他開源軟件建立的科學數據倉儲而言,Dataverse倉儲更適合用戶查找和獲取科學數據。
哈佛大學的Harvard Dataverse[16]是由哈佛大學社會科學研究所(Institute for Quantitative Social Science,IQSS)、哈佛大學圖書館(Harvard Library)和哈佛大學信息技術中心(Harvard University Information Technology,HUIT)合作開發的,作為目前收錄數據資源最多、最為著名的Dataverse倉儲,截至2015年11月21日,共收錄1331個Dataverse以及涵蓋社會科學、經濟學、物理學、生物學等學科的59580個研究數據集、286741個數據文件。這些數據資源既可按出版日期、主題和作者名進行瀏覽,也可通過簡單或高級檢索功能進行檢索、下載和引用。目前其資源下載次數已超過140萬次。

表1 Dataverse倉儲列表
這里所指的開放數據站點是各種開放數據資源存儲地點的統稱,其形式包括開放數據倉儲(Open Data Repository)、開放數據門戶(Open Data Portal)、開放數據平臺(Open Data Platform)和開放數據庫(Open Database)等。近些年,開放科學數據站點呈現爆發式增長,各類組織或機構紛紛建立起自己的開放數據站點,用以保存和共享研究數據。以開放數據倉儲為例,截至2015年11月21日,僅在Re3data.org[18]注冊的開放科學數據倉儲就達到了1163個,并且以每周約10個新數據倉儲的速度不斷增加。用戶可通過訪問這些數據站點來獲取所需科學數據。依據不同的建設或管理者,開放數據站點主要有以下幾種。
3.1 國際組織的開放數據站點
作為開放數據運動的有力推動者,國際組織特別是大型的國際組織一般都建立了相應的開放數據站點,有些組織為了方便用戶查找本組織各成員單位的開放數據,還會建立統一的開放數據門戶以省去用戶逐個查找各個成員單位數據倉儲的麻煩,實現各類開放數據的一站式獲取,如聯合國(United Nations)、歐盟(European Union)等。這些站點的建立為用戶開放獲取各類科學數據,特別是涉及多個國家和地區的科學數據提供了一條不錯的途徑,它們收錄的數據不僅涵蓋地域面廣、涉及學科領域多,而且權威性也可以得到保證。表2列舉了世界上幾個重要國際組織的開放數據站點。

表2 國際組織的開放數據站點

(注:表中統計數據截至2015年11月21日。)
3.2 政府開放數據站點
政府開放數據站點是一個國家或地區政府統一對外發布數據信息的平臺和窗口,其數據主要來源于政府各個機構的調查、統計、觀測及研究等活動,數據全面、可靠且容易獲取,是查找一個國家或地區政府開放科學數據的理想途徑。這類站點主要可分為兩類:一類是政府數據統一開放門戶,另一類是具體政府部門建立的開放數據站點。
3.2.1 政府數據統一開放門戶
政府數據統一開放門戶又可分為兩種:一種是國家政府數據統一開放門戶,例如美國的Data.gov、英國的Data.gov.uk、法國的Data.gouv.fr、印度的Data.gov.in等,表3列舉了世界上一些主要國家的國家政府數據統一開放門戶;另一種是地方政府數據統一開放門戶,如美國加利福尼亞州的Data.CA.gov、芝加哥市建立的City of Chicago Data Portal、圣馬特奧縣政府建立的Data. smcgov.org等。

表3 世界上主要國家的國家政府數據統一開放門戶
美國政府的數據門戶網站(Data.gov)是政府數據統一開放門戶的典范,無論是資源數量、開放程度還是站點功能,都遠超其他國家同類站點。截至2015年11月21日,Data.gov可檢索的數據集已超過188955個,包括農業、商業、消費、生態系統、教育、能源、金融、海洋、科學與研究等14個主題,堪稱海量數據。為了幫助和引導用戶獲取相關數據,Data.gov還在其網站給出了查找和下載數據資源的具體方法,非常人性化[19]。
3.2.2 具體政府部門建立的開放數據站點
這些政府部門包括國家的統計部門、教育部門、科技部門、文化部門、衛生部門等。訪問這些政府部門建立的開放數據站點可以獲取該部門相關的科學數據。例如美國國家航空航天局(NASA)建立的NASA’s Data Portal[20];美國疾病控制與預防中心(Centers for Disease Control and Prevention)建立的Data.CDC.gov[21]等。這些數據站點是獲取某些政府部門科學數據的絕佳途徑。表4列舉了一些我國政府部門建立的開放科學數據站點。

表4 我國政府部門建立的開放科學數據站點
3.3 高校和科研機構的開放數據站點
如果說訪問政府開放科學數據站點是獲取政府科學數據的主要途徑,那么訪問高校和科研機構的開放數據站點就是獲取研究數據的主要途徑,因為高校和科研機構是主要的研究數據生產者,很多研究數據都是通過各國高校和科研機構的開放數據站點來存儲和發布的,這些機構包括各國高校、高校圖書館、高校實驗室、科學院、社科院、研究所以及研究協會等。每個國家都擁有眾多的高校和科研機構,且大多建立了開放數據站點,因此這類站點也是多不勝舉。例如世界頂級研究型綜合大學之一的康奈爾大學建立的CISER Data Archive[22],澳大利亞最大的國家級科研機構,同時也是世界上最大、最多樣化的科研機構之一的澳大利亞聯邦科學與工業研究組織(Commonwealth Scientific and Industrial Research Organization ,CSIRO)建立的CSIRO數據獲取門戶(CSIRO Data Access Portal)[23]、美國四大學術機構之一的國家科學基金會(National Science Foundation)資助建立的DataONE[24]、中國最高的學術和研究機構中國科學院建立的中國科學院數據云[25]和基礎科學數據共享網[26]、英國研究理事會重要成員之一的英國科學和技術設施理事會(Science and Technology Facilities Council)建立的CEDA環境數據分析中心[27]等。由于這類站點比較繁多,且各機構科學數據開放程度、數量難以比較,因此這里不再對具體的站點進行詳細論述。多數情況下,用戶只需登陸某個機構的官方網站便可找到相關開放數據站點的鏈接。
3.4 其他組織或機構的開放數據站點
除了以上所列出的機構外,還有很多由非營利性會員組織、出版社、基金會等其他類型的組織或機構建設管理的開放數據站點。限于篇幅,經過同類站點對比之后,這里僅選取收錄科學數據比較多的DataDryad. org[28]、Figshare[29]和Datahub[30]進行簡要列表介紹。

表5 DataDryad.org、Figshare和Datahub簡介
4.1 專門的開放數據倉儲注冊系統或目錄
如前文所述,近些年開放數據倉儲如雨后春筍般涌現,其數量越來越龐大、類型越來越多,用戶想要在如此復雜繁多的數據倉儲中找到自己所需的科學數據也變得愈發困難。因此,一些專門用于查找開放數據倉儲的注冊系統或目錄應運而生,例如Re3data.org、Dataportals.org[31]、Datalib[32]等,為用戶全面、準確地查找科學數據帶來了諸多便利。除此之外,很多政府或研究機構門戶站點也會建立類似的注冊系統或目錄,用于指引用戶和查找與本機構、本系統相關的開放科學數據,例如美國政府開放數據目錄[33]、美國能源部開放數據目錄[34]等。這里選取影響較大的Re3data.org和Dataportals.org進行介紹。
4.1.1 Re3data.org
Re3data. org建立于2012年秋,是一個由德國研究基金會資助的、涵蓋不同學科數據倉儲的全球性研究數據倉儲注冊系統,該系統旨在為研究人員、資助機構、出版商以及學術機構提供永久存儲和開放獲取相關研究數據的數據倉儲,以促進研究數據的獲取和共享。截至2015年11月21日,Re3data.org共收錄了1371個研究數據倉儲,其中1163個數據倉儲可開放獲取,所收錄的數據倉儲可按照主題、內容類型和國家進行瀏覽,并且以圖形的形式進行呈現,也可以進行在線檢索,具體到每個數據倉儲,用戶可以查看其主題、URL、內容類型、關鍵詞、倉儲類型等詳細信息。目前, Re3data. org正在與另一個重要的開放數據倉儲目錄Datalib.org進行合并,合并完成后,其功能將更為強大和完善。
4.1.2 Dataportals.org
數據門戶網站(Dataportals.org)又叫數據目錄網站(Datacatalogs.org ),是世界上最全面、最詳細的開放數據資源目錄,它是由一群來自世界各地的開放數據權威專家(包括一些國家、地區和地方的政府代表、世界銀行等國際組織的代表以及眾多的非政府組織代表)策劃建立的,由開放知識基金會(Open Knowledge Foundation)來管理和運行[22]。截至2015年11月21日,該門戶網站共收錄了世界各地的461個數據倉儲、數據倉儲注冊站點、目錄以及其他數據門戶網站等資源,包括聯合國數據目錄(UN Data)、歐盟開放數據(EU Open Data)、澳大利亞南極數據中心(Australian Antarctic Data Centre)等,并通過地圖的形式顯示各個開放數據倉儲的分布地點。每個資源項都有簡介和標簽,點擊資源列表右側的圖標按鈕可以查看該資源的具體描述信息,包括數據涉及范圍、出版者、狀態、所屬國家或語言、標簽、鏈接地址、API端口等。
4.2 綜合性的開放存取倉儲注冊系統或目錄
眾所周知,開放科學數據是重要的開放存取資源之一,因此除了上文介紹的專門收錄開放科學數據倉儲的注冊系統或目錄外,一些著名的綜合性開放存取倉儲注冊系統或目錄也會收錄大量的開放科學數據倉儲。例如“開放存取倉儲目錄”(The Directory of Open Access Repositories,OpenDOAR)[35]、開放存取目錄(Open Access Directory,OAD)[36]、“開放存取倉儲注冊”(Registry of Open Access Repositories,ROAR)[37]等。它們在收錄其他開放存取資源倉儲的同時,也收錄相當數量的開放科學數據倉儲,因此,查閱這些注冊系統或目錄也是查找科學數據的可行途徑之一。表6以OpenDOAR、OAD、ROAR為例,列舉了它們所收錄開放科學數據倉儲的情況。

表6 OpenDOAR、OAD和ROAR收錄開放科學數據倉儲情況
查閱開放數據期刊也是獲取科學數據的途徑之一。這些數據期刊不僅包括一些專門的科學數據期刊,如《科學數據》(Scientific Data)[38]、《中國科學數據》(China Scientific Data)[39],也包括某些特定學科領域的數據期刊,像《地球系統科學數據》(Earth System Science Data)、《生物醫學數據雜志》(Biomedical Data Journal)等。用戶可通過DOAJ、Open J-Gate等大型的開放存取期刊目錄來查找相關的開放數據期刊,表7列出了DOAJ收錄的一些不同學科的開放數據期刊。這里僅以《科學數據》和《中國科學數據》這兩個專門的科學數據期刊為例進行詳細介紹。

表7 DOAJ收錄的開放數據期刊
5.1 《科學數據》
《科學數據》(Scientific Data)由《自然》出版集團于2014年推出,用于描述有價值的科學數據集,是一個可開放獲取的同行評審期刊。該期刊主要出版數據描述符(Data Descriptor),它是一種為促進研究數據更容易地被發現、解釋和復用而設計的新的出版物形式,每個數據描述符都是由一篇描述數據集的文章和為最大限度地發現和復用數據而設計的結構化的、機器可讀的信息組成,它既可用來補充傳統研究論文,也可用于描述單個數據集[40]。用戶可通過訪問《科學數據》的官方網站來查找和下載科學數據,并可利用電子郵件、RSS等進行訂閱。
5.2 《中國科學數據》
《中國科學數據》(China Scientific Data)是由中國科學院主辦的數據論文在線發表期刊,于2015年創刊。該期刊致力于科學數據的開放、共享和引用,是目前中國唯一的專門面向多學科領域科學數據出版的學術期刊。主要收錄具有領域科學研究特色的數據論文,包括但不限于生命科學與醫學、地球系統科學、空間科學與天文學、物理學、化學化工、材料科學與工程、信息科學、社會科學等學科領域的基礎數據及數據產品,同時兼收高質量的數據科學評述以及數據觀點論文[41]。
《中國科學數據》出版平臺提供科學數據論文發布和相關數據服務。科研人員可通過該平臺提交數據論文以及相關數據集,經由同行評審通過后進行在線發布和共享,提供給更多用戶瀏覽。同時該平臺還提供數據論文搜索、數據預覽、數據集下載等服務。用戶可通過該出版平臺來獲取相關科學數據[42]。
截至2015年9月,全球市場占有率排名前四的綜合性搜索引擎分別為Google、Yahoo、Bing和百度[43],這些都是用戶比較熟悉的、甚至經常使用的搜索引擎,但是利用這些工具查找開放科學數據時需要運用一些檢索技巧并巧妙構造檢索式,因為綜合性的搜索引擎很難直接檢索到存儲在各個具體開放數據站點中的科學數據。如果直接檢索科學數據得到的結果較少或者不符合需求,用戶就需要改變檢索策略,放棄直接查找科學數據,轉而去檢索這些數據的存儲站點、數據倉儲注冊系統或目錄等,然后去登陸具體的站點或倉儲來間接查找和獲取科學數據。具體檢索式的構建如表8所示。

表8 不同檢索需求時的檢索式構建
除了上文提到的幾種主要途徑外,獲取科學數據的途徑還有很多:訪問學科庫和知識庫,因為許多學科庫和知識庫也會收錄一些科學數據,筆者在《論開放存取資源的收集策略》[44]一文中已介紹,這里不再贅述;利用維基百科查找“Open Scientific Data”、“Open Research Data”、“Open Data”、“Data Repository”、“Data Archive”、“Data Portal”等詞條,可得到很多站點資源;利用關聯網站,如一些科學數據網站的友情鏈接、相關鏈接等,可通過一個網站獲得大量的相關網站;通過社交媒體,一些名人、數據專家、數據愛好者會在其個人網站、Blog等媒體上分享少量科學數據;利用關聯數據或API來獲取等。以上都是獲取科學數據的可行途徑,但由于其利用價值有限或需要一定的技術基礎,因此,對于普通用戶而言,一般僅作為科學數據開放存取的輔助途徑。
總之,科學數據開放存取的途徑多種多樣,不同的獲取途徑有著不同的特點,且各具優勢和不足。比如利用數據檢索工具比較快捷、方便,但獲取的數據全面性卻不夠;訪問開放數據站點針對性比較強,卻通常需要逐個站點去查找,費時費力;查閱開放存取注冊站點或目錄可獲取的數據比較全面,但由于是間接查找科學數據,所以過程也比較繁瑣。所以用戶在具體操作時,可根據自己的使用習慣和需求選擇合適的獲取途徑。同時需要注意辨別數據來源和質量,選擇那些權威、真實和可靠的科學數據來為自己的科研服務。
(來稿時間:2016年1月)
1.陳傳夫.中國科學數據公共獲取機制:特點、障礙與優化的建議[J].中國軟科學,2004(2):8-13
2. Some JULIET Statistics [EB/OL].[2015-11-21].http:// www.sherpa.ac.uk/juliet/stats.php?la=en&mode=simple
3.2015 - The year of open data mandates[EB/OL].[2015-11-21]. http://figshare.com/blog/2015_The_year_of_open_data_mandates/143
4. NSF’S PUBLIC ACCESS PLAN: Today’s Data, Tomorrow’s Discoveries[EB/OL].[2015-11-21]. http://www.nsf. gov/pubs/2015/nsf15052/nsf15052.pdf
5. Open Government Plan3.5[EB/OL].[2015-11-21]. http:// www.nsf.gov/pubs/2015/nsf15094/nsf15094.pdf
6. Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020[EB/OL].[2015-11-21].http:// ec.europa.eu/research/participants/data/ref/h2020/grants_manual/ hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf
7. Impact, timescales and support[EB/OL].[2015-11-21]. https://www.epsrc.ac.uk/about/standards/researchdata/impact/
8.國務院關于印發促進大數據發展行動綱要的通知[EB/ OL].[2015-11-21]. http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm
9. DataCite Metadata Search [EB/OL].[2015-11-21].http:// search.datacite.org/u
10. Crossref Metadata Search [EB/OL].[2015-11-21]. http:// search.crossref.org/
11. Zanran[EB/OL].[2015-11-21]. http://www.zanran.com/q/
12. Voovle [EB/OL].[2015-11-21].http://voovle.csdb.cn/
13. Google Public Data Explorer [EB/OL].[2015-11-21]. https://www.google.com/publicdata/directory
14. Example Queries [EB/OL].[2015-11-21].http://search. crossref.org/help/search
15. About the Dataverse Project [EB/OL].[2015-11-21].http:// dataverse.org/about/
16. Harvard Dataverse [EB/OL].[2015-11-21].https:// dataverse.harvard.edu/dataverse/harvard
17. STUDIES[EB/OL].[2015-11-21].http://arc.irss.unc.edu/dvn/
18. re3data.org[EB/OL].[2015-11-21]. http://www.re3data.org/
19. Data.gov Search & Feedback [EB/OL].[2015-11-21]. https://www.data.gov/about#who
20. NASA’s Data Portal [EB/OL].[2015-11-21]. https://data. nasa.gov/
21. Data.CDC.gov [EB/OL].[2015-11-21]. https://data.cdc.gov/
22. CISER Data Archive [EB/OL].[2015-11-21]. http://ciser. cornell.edu/info/about.shtml
23. CSIRO Data Access Portal[EB/OL].[2015-11-21]. https:// data.csiro.au/dap/home?execution=e1s1
24. DataONE[EB/OL].[2015-11-21].https://www.dataone.org/
25.中國科學院數據云[EB/OL].[2015-11-21].http://www. csdb.cn/
26.基礎科學數據共享網[EB/OL].[2015-11-21]. http:// www.nsdc.cn/
27. Environmental Data Analysis [EB/OL].[2015-11-21]. http://www.ceda.ac.uk/
28. DataDryad.org [EB/OL].[2015-11-21]. http://datadryad.org/
29. Figshare [EB/OL].[2015-11-21]. http://figshare.com/
30. Datahub [EB/OL].[2015-11-21]. https://datahub.io/
31. About DataPortals.org [EB/OL].[2015-11-21]. http:// dataportals.org/about
32. Databib[EB/OL].[2015-11-21]. http://databib.org/ databib.php
33. Catalog.data.gov [EB/OL].[2015-11-21].http://catalog. data.gov/dataset
34. Energy.gov [EB/OL].[2015-11-21]. http://energy.gov/ data/downloads/open-data-catalogue
35. The Directory of Open Access Repositories [EB/OL]. [2015-11-21].http://www.opendoar.org/index.html
36. Open Access Directory [EB/OL].[2015-11-21]. http://oad. simmons.edu/oadwiki/Main_Page
37. Registry of Open Access Repositories [EB/OL].[2015-11-21]. http://roar.eprints.org/
38. Scientific Data [EB/OL].[2015-11-21]. http://www.nature. com/sdata/
39. China Scientific Data [EB/OL].[2015-11-21]. http://www. csdata.org/
40. About Scientific Data [EB/OL].[2015-11-21]. http://www. nature.com/sdata/about
41.《中國科學數據》成功獲批國內統一連續出版物[EB/OL]. [2015-11-21]. http://www.ecas.cn/yjsdt/201508/t20150827_4416884.html
42.關于《中國科學數據》出版平臺[EB/OL].[2015-11-21]. http://www.csdata.org/introduction
43. Desktop Search Engine Market [EB/OL].[2015-11-21]. Sharehttps://www.netmarketshare.com/search-engine-marketshare.aspx?qprid=4&qpcustomd=0
44.黃如花.論開放存取資源的收集策略[J].圖書情報工作,2008(12):6-8
examples, in the hope of providing some reference for users to search and obtain scientific data. These methods including using data search tools , visiting Dataverse repositories , visiting open data sites of relevant organizations or institutions, consulting the registration system or directory of open scientific data repository, consulting the registration system or directory of open access repository, consulting open access data journals and retrieving through the Synthetic Search Engines, etc.〔Key words 〕Scientific data Research data Open access Method
Methods of Open Access to Scientific Data
Huang Ruhua1Liu Long2Chen Meng3
( 1.Center for the Studies of Information Resources of Wuhan University; 2.School of Information Management of Wuhan University;3.Wuhan Conservatory of Music Library )
This paper discusses various methods of open access to scientific data detailedly with operating example
G25
*本文系中國科學技術信息研究所與武漢大學信息管理學院合作項目“科學文獻的語義功能識別與深度利用”研究成果之一。
黃如花,女,博士生導師,武漢大學信息資源研究中心教授;劉龍,男,武漢大學信息管理學院博士研究生;陳萌,女,武漢音樂學院圖書館館員。