999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)出版的實(shí)踐模式對比研究

2019-09-18 03:04:16韓露丁毅
知識管理論壇 2019年3期
關(guān)鍵詞:科學(xué)

韓露 丁毅

摘要:[目的/意義]科學(xué)數(shù)據(jù)出版是數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)的主要學(xué)術(shù)傳播方式,對于實(shí)現(xiàn)數(shù)據(jù)重用、科學(xué)驗(yàn)證具有重要的意義。[方法/過程]地球科學(xué)從原有的數(shù)據(jù)共享模式到目前的數(shù)據(jù)出版發(fā)生了巨大的變化。作者將數(shù)據(jù)出版分為數(shù)據(jù)期刊出版、數(shù)據(jù)倉儲出版、數(shù)據(jù)和論文聯(lián)合出版3種模式,對于每一種模式的實(shí)踐方法和關(guān)鍵要素進(jìn)行統(tǒng)計(jì)和對比,重點(diǎn)分析三種模式的優(yōu)劣、同行數(shù)據(jù)評議問題和地學(xué)數(shù)據(jù)出版中分層元數(shù)據(jù)的重要性。[結(jié)果/結(jié)論]通過研究,作者提出基于倉儲的出版便于融入科學(xué)數(shù)據(jù)管理過程,有利于數(shù)據(jù)重用,但是此類出版方式缺少同行評議;數(shù)據(jù)的同行評議應(yīng)該有別于學(xué)術(shù)論文,注重?cái)?shù)據(jù)在參與科研和產(chǎn)生再生性成果的過程中的重用性;元數(shù)據(jù)的分層描述對于地學(xué)大數(shù)據(jù)的保存和重用都具有重要意義。

關(guān)鍵詞:數(shù)據(jù)出版 ?數(shù)據(jù)倉儲 ?數(shù)據(jù)期刊 ?地學(xué)數(shù)據(jù)共享

分類號:G237.6

引用格式:韓露, 丁毅. 數(shù)據(jù)出版的實(shí)踐模式對比研究——以地球科學(xué)領(lǐng)域?yàn)槔齕J/OL]. 知識管理論壇, 2019, 4(3): 152-162[引用日期]. http://www.kmf.ac.cn/p/173/.

地球科學(xué)(以下簡稱“地學(xué)”)是一個數(shù)據(jù)科學(xué),但是由于數(shù)據(jù)采集難度大、空間范圍廣、儀器設(shè)備價值昂貴等問題,數(shù)據(jù)共享、獲取和重用一直都是地學(xué)研究的重要內(nèi)容。20世紀(jì)早期,人們采用穿孔卡片的方式來記錄數(shù)據(jù)。20世紀(jì)70年代,為實(shí)現(xiàn)地學(xué)數(shù)據(jù)的共享,多個國際組織先后成立,如世界數(shù)據(jù)中心(World Data Center,簡稱 WDC,2008年后被World Data System簡稱 WDS取代)、地球觀測組織(Group on Earth Observations, GEO)、地球觀測數(shù)據(jù)網(wǎng)(Data Observation Network for Earth)。1988年中國加入WDS并成立了9個數(shù)據(jù)中心,多數(shù)為地球科學(xué)領(lǐng)域的數(shù)據(jù)中心,如地震、地質(zhì)、地球物理數(shù)據(jù)中心[1]。2002年度科學(xué)數(shù)據(jù)共享工程啟動了“地球系統(tǒng)科學(xué)數(shù)據(jù)共享網(wǎng)項(xiàng)目”,建立了地球科學(xué)數(shù)據(jù)共享平臺[2]。但是這些數(shù)據(jù)中心和共享平臺的數(shù)據(jù)獲取往往受到限制,共享不活躍,甚至形成了數(shù)據(jù)孤島。褚云強(qiáng)等[3]對科學(xué)大數(shù)據(jù)的共享機(jī)制進(jìn)行了研究,提出缺乏數(shù)據(jù)共享的政策和機(jī)制是阻礙其發(fā)展的主要原因,而調(diào)動科研人員主動共享數(shù)據(jù)積極性的重要機(jī)制就是自下而上的科學(xué)數(shù)據(jù)出版。數(shù)據(jù)出版是近幾年由出版界和數(shù)據(jù)共享界共同提出的新概念[4],在開放科學(xué)的趨勢下,一些國家的資助機(jī)構(gòu)和國際組織紛紛出臺政策要求管理和共享研究數(shù)據(jù)。如美國NSF地學(xué)學(xué)部要求將完整的數(shù)據(jù)集、數(shù)據(jù)產(chǎn)品、軟件和集成整合數(shù)據(jù)必須在兩年內(nèi)可公開訪問[5]。由于數(shù)據(jù)中心要求用戶在使用數(shù)據(jù)時體現(xiàn)數(shù)據(jù)作者的貢獻(xiàn),學(xué)術(shù)期刊要求作者在發(fā)表文章時提供與科學(xué)結(jié)論相關(guān)的數(shù)據(jù),這兩種機(jī)制最終成為推動數(shù)據(jù)出版的共同動力。數(shù)據(jù)出版的核心是為數(shù)據(jù)引用提供標(biāo)準(zhǔn)的引用格式和永久訪問地址,使科學(xué)數(shù)據(jù)是可獲取、可理解、可評估、可使用的[6],與原有的數(shù)據(jù)共享相比,數(shù)據(jù)出版更加強(qiáng)調(diào)了數(shù)據(jù)重用的可能性以及數(shù)據(jù)被科研人員的認(rèn)可程度。德國是首個研究科學(xué)數(shù)據(jù)出版的國家,德國國家科學(xué)技術(shù)圖書館申請成為國際上首個科學(xué)數(shù)據(jù)DOI代理機(jī)構(gòu),并為很多原WDS數(shù)據(jù)中心的數(shù)據(jù)資源進(jìn)行了 DOI注冊[7],這些數(shù)據(jù)中心逐步開展數(shù)據(jù)出版實(shí)踐,數(shù)據(jù)出版已經(jīng)成為共享的新的形式。數(shù)據(jù)引用評價體系的建立,客觀反映了數(shù)據(jù)貢獻(xiàn)者的影響力,改善了原有的數(shù)據(jù)共享不活躍的狀況。我國的地學(xué)數(shù)據(jù)出版還在起步階段,與原有的數(shù)據(jù)共享形成了互補(bǔ)的態(tài)勢,中國地質(zhì)調(diào)查局已經(jīng)開展了數(shù)據(jù)的DOI注冊。地學(xué)領(lǐng)域的數(shù)據(jù)出版由于數(shù)據(jù)共享起步較早,在數(shù)據(jù)出版實(shí)踐中具有代表性,一些傳統(tǒng)的地學(xué)期刊論文很早就有將數(shù)據(jù)作為附件同時出版的先例,如《巖石學(xué)報(bào)》。筆者通過調(diào)研地學(xué)領(lǐng)域的各類數(shù)據(jù)出版模式的實(shí)踐方法,探討在地球科學(xué)領(lǐng)域數(shù)據(jù)出版中存在和亟待解決的主要問題。

1 ?地球科學(xué)領(lǐng)域數(shù)據(jù)出版的主要模式

自從數(shù)據(jù)出版的概念被提出后,一些WDS逐漸將原有的數(shù)據(jù)共享服務(wù)轉(zhuǎn)化為數(shù)據(jù)的存儲管理和出版服務(wù),注重?cái)?shù)據(jù)的發(fā)現(xiàn)、獲取、重用、回溯等。筆者主要檢索了re3data.org平臺中注冊的數(shù)據(jù)中心倉儲,其中地球科學(xué)領(lǐng)域已經(jīng)注冊的倉儲有647個,僅次于生物學(xué)領(lǐng)域的數(shù)據(jù)倉儲數(shù)量,是數(shù)據(jù)出版實(shí)踐為數(shù)較多的學(xué)科。筆者利用JCR(Journal Citation Reports),對地球科學(xué)下所包含的地質(zhì)、地球物理、地球化學(xué)、環(huán)境科學(xué)、地理、地球科學(xué)與多學(xué)科交叉的期刊進(jìn)行了查詢,同時參照科睿唯安的DCI(Data Citation Index)中地球科學(xué)領(lǐng)域的數(shù)據(jù)條目的出版源和期刊網(wǎng)站的介紹進(jìn)行了識別。JCR收錄的地球科學(xué)類數(shù)據(jù)期刊主要有三種:GeoScience Data Journal (簡稱GDJ)、Scientific Data (簡稱SD)、Earth System Science Data (簡稱ESSD)。我國于2014年發(fā)行了地球科學(xué)領(lǐng)域的數(shù)據(jù)出版平臺全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)(Global Change Research Data Publishing & Repository,GCRDPR),2017年該出版系統(tǒng)推出了《全球變化數(shù)據(jù)學(xué)報(bào)》。一些數(shù)據(jù)倉儲和聲望較好的學(xué)術(shù)期刊進(jìn)行合作,以期增加數(shù)據(jù)的影響力,實(shí)現(xiàn)學(xué)術(shù)論文和數(shù)據(jù)的互聯(lián)。在地球科學(xué)領(lǐng)域的數(shù)據(jù)倉儲中Pangaea出版的數(shù)據(jù)量較多,Elsevier的Science Direct和Scopus均與Pangaea倉儲進(jìn)行了聯(lián)合,實(shí)現(xiàn)學(xué)術(shù)論文和數(shù)據(jù)的集成出版。還有一類是將數(shù)據(jù)作為附件與學(xué)術(shù)論文一起出版,但是這類出版的主體依然是學(xué)術(shù)論文,本文不做討論。綜上所述,地學(xué)領(lǐng)域主要呈現(xiàn)的數(shù)據(jù)出版模式包括:

(1)數(shù)據(jù)期刊:將數(shù)據(jù)轉(zhuǎn)化為論文的形式進(jìn)行描述,發(fā)表在數(shù)據(jù)期刊中,通常與領(lǐng)域內(nèi)的數(shù)據(jù)中心或公共數(shù)據(jù)倉儲聯(lián)合實(shí)現(xiàn)數(shù)據(jù)集的存繳,數(shù)據(jù)論文的出版具有和學(xué)術(shù)論文相似的同行評議評審流程。

(2)基于倉儲的直接數(shù)據(jù)出版:通過數(shù)據(jù)倉儲發(fā)布數(shù)據(jù),部分由原來的數(shù)據(jù)共享平臺轉(zhuǎn)變而來,數(shù)據(jù)出版作為數(shù)據(jù)管理和共享的一種方式。

(3)學(xué)術(shù)論文和數(shù)據(jù)的聯(lián)合出版:數(shù)據(jù)和學(xué)術(shù)論文之間的互聯(lián)可實(shí)現(xiàn)數(shù)據(jù)和科學(xué)發(fā)現(xiàn)的精確關(guān)聯(lián)和驗(yàn)證。與上述兩種數(shù)據(jù)出版本質(zhì)的區(qū)別是出版的內(nèi)容不僅僅是數(shù)據(jù),還包括來自于數(shù)據(jù)的科學(xué)性發(fā)現(xiàn)等學(xué)術(shù)論文。目前,大多建立在出版社與數(shù)據(jù)倉儲平臺合作的基礎(chǔ)上,通過增強(qiáng)出版的形式實(shí)現(xiàn)論文和數(shù)據(jù)的關(guān)聯(lián)性出版與發(fā)布。

2 ?地學(xué)數(shù)據(jù)期刊

數(shù)據(jù)期刊與傳統(tǒng)的科研傳播中的學(xué)術(shù)論文的出版重點(diǎn)不同,主要是提供和描述數(shù)據(jù)集本身,通常不關(guān)注結(jié)論的科學(xué)創(chuàng)新性與否,出版的主要目的是提高數(shù)據(jù)的影響力,使科學(xué)數(shù)據(jù)能夠更多地被描述、解釋、重用。筆者對比了4種地球科學(xué)領(lǐng)域的數(shù)據(jù)期刊(見表1),各期刊的載文量統(tǒng)計(jì)見圖1,其中SD只統(tǒng)計(jì)了地球與環(huán)境科學(xué)主題下的載文量。

2.1 ?保證數(shù)據(jù)的可訪問性

在保證數(shù)據(jù)的可訪問性方面,所有的期刊都需要將數(shù)據(jù)提交到數(shù)據(jù)倉儲中進(jìn)行長期保存,并提供可持續(xù)引用的唯一標(biāo)識符,目前大多數(shù)倉儲都采用了DOI作為地址解析代理的標(biāo)準(zhǔn)。GDJ、SD、ESSD自身都沒有保存數(shù)據(jù)的倉儲,因此刊物列出了可提交數(shù)據(jù)的倉儲列表,在論文提交的過程中要同時選擇一個建議的倉儲保存數(shù)據(jù)。大部分?jǐn)?shù)據(jù)期刊都是利用re3data.org平臺中注冊的倉儲來選取建議提交的倉儲,或者選取與數(shù)據(jù)期刊內(nèi)容相符的國家級數(shù)據(jù)中心,這種出版模式需要出版機(jī)構(gòu)和數(shù)據(jù)保存管理機(jī)構(gòu)的合作,對數(shù)據(jù)的管理和數(shù)據(jù)論文的出版是由兩個獨(dú)立的系統(tǒng)協(xié)作完成的。但是GCRDPR與其他3種期刊略有區(qū)別,它本身是一個網(wǎng)絡(luò)出版的系統(tǒng),集元數(shù)據(jù)、實(shí)體數(shù)據(jù)、數(shù)據(jù)論文的出版于一體。首次提交數(shù)據(jù)后該出版平臺會根據(jù)元數(shù)據(jù)的質(zhì)量和數(shù)據(jù)描述判斷是否可以接受該數(shù)據(jù),如果接受再通知作者參照指南撰寫數(shù)據(jù)論文并分配DOI給數(shù)據(jù)集,然后進(jìn)入數(shù)據(jù)論文同行評議的流程。

2.2 ?數(shù)據(jù)論文的寫作規(guī)范

數(shù)據(jù)論文是對數(shù)據(jù)集內(nèi)容的增強(qiáng)性描述,不同學(xué)科領(lǐng)域?qū)τ跀?shù)據(jù)論文的描述維度各有差異,筆者將4種地學(xué)數(shù)據(jù)期刊對數(shù)據(jù)集描述的內(nèi)容框架進(jìn)行了匯總,共涉及9個方面: ? ? ? ?①數(shù)據(jù)集的有效訪問方式,比如提供DOI或者URI;②數(shù)據(jù)集的覆蓋范圍,包括時間和空間的覆蓋范圍;③數(shù)據(jù)集的格式信息,如數(shù)據(jù)本身的格式、編碼方法和編碼語言等;④數(shù)據(jù)集的授權(quán)許可,用于支持?jǐn)?shù)據(jù)集的合法使用;⑤項(xiàng)目信息,提供數(shù)據(jù)集的生產(chǎn)信息,如生產(chǎn)數(shù)據(jù)集的目的和資助來源;⑥來源信息,提供生產(chǎn)數(shù)據(jù)集的方法的描述信息,包括采用的工具、處理方法;⑦質(zhì)量信息,提供數(shù)據(jù)質(zhì)量的描述信息,如數(shù)據(jù)集的局限性和異常信息;⑧重用信息,提供數(shù)據(jù)集的使用方法描述,促進(jìn)數(shù)據(jù)集重用的可能;⑨對于數(shù)據(jù)引用的支持與規(guī)范。表2對比了4種期刊各自的內(nèi)容框架。ESSD沒有明確規(guī)定其描述的內(nèi)容要素,但是在發(fā)表數(shù)據(jù)論文的過程中編輯會建議作者去關(guān)注決定數(shù)據(jù)論文潛在價值的相關(guān)內(nèi)容,給出評議的指南,指南中包含的內(nèi)容與表2中列出的9個方面基本相同。《全球變化科據(jù)學(xué)報(bào)》沒有對數(shù)據(jù)論文的內(nèi)容做統(tǒng)一的規(guī)范,而是在元數(shù)據(jù)中進(jìn)行了規(guī)范。

2.3 ?同行評議與質(zhì)量控制

在同行評議方面,SD、GDJ和GCRDPR采用了與傳統(tǒng)學(xué)術(shù)期刊類似的同行評議流程,但是評議的內(nèi)容則更注重?cái)?shù)據(jù)版權(quán)、質(zhì)量。GCRDPR專門提供了一個評議內(nèi)容的模板,包含數(shù)據(jù)集的意義、質(zhì)量、學(xué)術(shù)相關(guān)性、作者的知識產(chǎn)權(quán)意識、數(shù)據(jù)的可獲取性共5個方面的內(nèi)容。ESSD與其他3種期刊略有不同,采用了兩段式的開放式同行評議,即作者提交論文初稿后將在網(wǎng)絡(luò)平臺上作為討論稿出版,然后經(jīng)過專家的評審后,被專業(yè)編輯評估,但不評估其科學(xué)內(nèi)容,僅對數(shù)據(jù)論文是否符合論文的撰寫要求、是否符合期刊的主題范疇進(jìn)行評估,并提出技術(shù)性的修改建議。論文在這個狀態(tài)將保持8周,期間可以進(jìn)行各種同行評價和討論等,每篇論文接受至少兩個專家的終審。在公開討論階段,作者需要回復(fù)各種評論并修改論文初稿,最后才能決定是否出版。對于數(shù)據(jù)論文的同行評議,出版界尚未有統(tǒng)一的標(biāo)準(zhǔn),在這種情況下這種兩段式的公開評議方式更有利于真正的數(shù)據(jù)使用者或?qū)W術(shù)同行提出較為準(zhǔn)確的意見。

3 ?基于地學(xué)倉儲的數(shù)據(jù)管理和出版服務(wù)

3.1 ?基于倉儲直接出版數(shù)據(jù)的要素

基于倉儲實(shí)現(xiàn)數(shù)據(jù)出版是將原有共享數(shù)據(jù)的方式轉(zhuǎn)變?yōu)槌霭婧蟪霈F(xiàn)的,目前各個領(lǐng)域沒有一個明確標(biāo)準(zhǔn)規(guī)定其應(yīng)具備的要素。J. E. Kratz [8]在對數(shù)據(jù)出版的調(diào)查中發(fā)現(xiàn)大多數(shù)研究人員更關(guān)注以下幾點(diǎn):數(shù)據(jù)是否有唯一標(biāo)識、是否可開放獲取、是否存放在一個倉儲中、是否具有正式豐富的元數(shù)據(jù)。自從re3data.org提供了對世界各國研究數(shù)據(jù)長期保存和管理的倉儲的注冊服務(wù)后,倉儲的建設(shè)得以規(guī)范,倉儲的影響力也得到了提升,一些出版商和期刊(如PeerJ、Springer和 Nature的Scientific Data等)都以re3data.org作為簡單的工具來識別適合的數(shù)據(jù)倉儲。筆者選取表1中的數(shù)據(jù)期刊推薦的數(shù)據(jù)倉儲進(jìn)行了對比,發(fā)現(xiàn)在數(shù)據(jù)出版方面具備的共同要素包含以下5個方面:

(1)為數(shù)據(jù)提供唯一標(biāo)識,保證數(shù)據(jù)具有一個固有地址可供訪問。

(2)提供數(shù)據(jù)提交編輯工具和進(jìn)行數(shù)據(jù)質(zhì)量控制。數(shù)據(jù)提交編輯工具包括對數(shù)據(jù)的提交、對數(shù)據(jù)說明的編輯、對元數(shù)據(jù)的編輯。數(shù)據(jù)質(zhì)量控制大多數(shù)是由數(shù)據(jù)管理員完成,保證上述提交和編輯的內(nèi)容的完整性和一致性。

(3)提供正式的數(shù)據(jù)使用許可聲明。倉儲不具有像期刊同樣的商業(yè)版權(quán),數(shù)據(jù)使用許可在一個開放的科學(xué)環(huán)境下對數(shù)據(jù)創(chuàng)建者和使用者提供雙重保護(hù)。為了避免在數(shù)據(jù)重用過程中的各類權(quán)益糾紛,需要提供一個數(shù)據(jù)使用許可聲明。

(4)提供正式的數(shù)據(jù)引用格式。數(shù)據(jù)的正式引用是重用數(shù)據(jù)實(shí)現(xiàn)數(shù)據(jù)定位的機(jī)制[9],T. E. Pronk 等[10]在博弈論框架下分析了共享和出版數(shù)據(jù)的影響因素,結(jié)果表明與政策規(guī)定相比,降低成本和增加引用等更具有激勵效果,即正式的引用對于提升科研人員出版的積極性具有促進(jìn)作用,引用是保障數(shù)據(jù)作者與管理者數(shù)據(jù)權(quán)益的一種有效方式。

(5)數(shù)據(jù)倉儲可開放獲取數(shù)據(jù)。數(shù)據(jù)可獲取是實(shí)現(xiàn)重用的前提,大部分提供數(shù)據(jù)出版服務(wù)的倉儲都是可開放獲取的,少數(shù)倉儲需要權(quán)限才能獲取數(shù)據(jù)。

作者在re3data.org中按照上述5個要素進(jìn)行了檢索,通過統(tǒng)計(jì)發(fā)現(xiàn)在開放獲取方面大部分倉儲都滿足,只有少數(shù)是分級開放的。在數(shù)據(jù)標(biāo)識符方面,目前有234個倉儲提供了此服務(wù),采用較多的標(biāo)識符為DOI、ARK、URI。其中101個倉儲采用了DOI,其他未提供此服務(wù)的倉儲多數(shù)是采用了外部公共倉儲的注冊服務(wù)來實(shí)現(xiàn)自身的數(shù)據(jù)管理。在數(shù)據(jù)提交編輯與質(zhì)量控制方面,與期刊不同的是,在倉儲中數(shù)據(jù)質(zhì)量控制由數(shù)據(jù)管理人員完成,屬于技術(shù)性的審查,不同于科學(xué)性的同行評議,這種技術(shù)審查的方式主要有兩種:①一部分倉儲的數(shù)據(jù)的專業(yè)性較強(qiáng),且與項(xiàng)目密切相關(guān),在這類倉儲的數(shù)據(jù)質(zhì)量控制流程中增加了與項(xiàng)目相關(guān)的同領(lǐng)域?qū)<襾眚?yàn)證數(shù)據(jù),如美國冰雪數(shù)據(jù)中心就采用了這種方式;②一部分倉儲支持倉儲的認(rèn)證標(biāo)準(zhǔn)并通過了認(rèn)證,其中支持認(rèn)證比較多的有WDS(世界數(shù)據(jù)中心)[11]、DSA(荷蘭的數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)發(fā)布的數(shù)據(jù)批準(zhǔn)印章)[12]和CoreTrustSeal[13] ,其中有48個倉儲屬于WDS。對于數(shù)據(jù)使用的聲明采用較為廣泛的是知識共享家族的CC0、CC-BY、CC-BY-SA許可協(xié)議[14]。對于正式的數(shù)據(jù)引用方面,由于數(shù)據(jù)出版起步較晚,國內(nèi)外尚無統(tǒng)一標(biāo)準(zhǔn),地學(xué)數(shù)據(jù)出版中較為廣泛參考的是RORCE11數(shù)據(jù)引用聯(lián)合聲明[15]和DataCite的出版與引用方案[16]。而在具體的應(yīng)用中,一些數(shù)據(jù)倉儲要求在發(fā)表學(xué)術(shù)論文使用數(shù)據(jù)的同時采用倉儲提供的正式標(biāo)引,還有一些數(shù)據(jù)倉儲要求在論文致謝中聲明數(shù)據(jù)的來源。前者多數(shù)為與期刊合作的數(shù)據(jù)出版服務(wù)倉儲,出版的數(shù)據(jù)大多是經(jīng)過挑選、處理后的成果性數(shù)據(jù);后者多用于國家級地學(xué)研究機(jī)構(gòu)下的數(shù)據(jù)中心,如美國的NOAA(美國國家海洋氣象局),USGS(美國地質(zhì)調(diào)查局)等,共享的數(shù)據(jù)多為大規(guī)模的原始采集數(shù)據(jù)或基礎(chǔ)地理數(shù)據(jù),共享方式除了數(shù)據(jù)出版,還包括FTP服務(wù)或者RESTAPI等。上述統(tǒng)計(jì)結(jié)果見圖2,在re3data網(wǎng)站注冊的倉儲僅有26%完全滿足上述5個要素。

3.2 ?基于科學(xué)數(shù)據(jù)管理過程的對比

數(shù)據(jù)出版與研究過程中的數(shù)據(jù)管理息息相關(guān),因此不存在絕對獨(dú)立的數(shù)據(jù)出版或數(shù)據(jù)管理平臺[17]。在re3data.org的地學(xué)領(lǐng)域數(shù)據(jù)倉儲中,提供數(shù)據(jù)出版服務(wù)較多的倉儲主要有以下3類:①公共的數(shù)據(jù)出版平臺;②地學(xué)領(lǐng)域的國際數(shù)據(jù)共享組織或數(shù)據(jù)中心,如WDS;③國家級的地學(xué)研究機(jī)構(gòu)所建設(shè)的數(shù)據(jù)匯交共享平臺。筆者對數(shù)據(jù)管理過程中與出版相關(guān)的內(nèi)容進(jìn)行了歸納,選取具有代表性的數(shù)據(jù)倉儲進(jìn)行了對比,如表3所示:

4 ?數(shù)據(jù)與論文的聯(lián)合出版

以Nature、Science 為代表的頂級學(xué)術(shù)期刊開始正式提出出版與論文相關(guān)數(shù)據(jù)的要求 , 并制定了相關(guān)的數(shù)據(jù)存繳和出版政策。但是真正將數(shù)據(jù)和學(xué)術(shù)論文聯(lián)合進(jìn)行出版的實(shí)踐較少,其中比較多的是出版領(lǐng)域和公共數(shù)據(jù)倉儲的深度合作,如Elsevier的Science Direct和Scopus均與Pangaea倉儲進(jìn)行了聯(lián)合,在提交學(xué)術(shù)論文的過程中要求作者將數(shù)據(jù)存儲在Pangaea倉儲中出版并獲得一個可訪問的鏈接地址,才能繼續(xù)進(jìn)入到學(xué)術(shù)論文的出版流程,數(shù)據(jù)和論文出版之間具有一定程度的制約。Elsevier平臺運(yùn)用Pangaea的關(guān)聯(lián)數(shù)據(jù)工具,可以直接獲得出版的數(shù)據(jù)。在Pangaea的數(shù)據(jù)平臺,數(shù)據(jù)出版后也提供了引用此數(shù)據(jù)的Elsevier出版論文的DOI,形成互聯(lián)。聯(lián)合出版對于論文質(zhì)量的控制、數(shù)據(jù)重用、科學(xué)結(jié)論的驗(yàn)證都具有重要作用,可提供學(xué)術(shù)論文和科學(xué)數(shù)據(jù)雙向透明化訪問。Y. Gil等[19]對于開放科學(xué)環(huán)境下的未來地球科學(xué)論文的出版方式進(jìn)行了探討,提出了未來科學(xué)論文將包括數(shù)據(jù)、軟件和可復(fù)制出版物多種形式,同時具備在開放科學(xué)和數(shù)字學(xué)術(shù)環(huán)境下的理想特征: ①在公共存儲庫共享數(shù)據(jù)、軟件和其他研究產(chǎn)品;②可使用開放許可;③元數(shù)據(jù)可用于描述數(shù)據(jù)、軟件和其他研究產(chǎn)品;④數(shù)據(jù)、軟件和其他研究產(chǎn)品都具有唯一的可持續(xù)標(biāo)識符;⑤可在文章中引用上面所有提及的數(shù)字資源。目前,尚未真正實(shí)現(xiàn)Y. Gil等人所提到的完全整合了所有形式學(xué)術(shù)成果的融合性出版,但是這種多形態(tài)的學(xué)術(shù)成果(論文、數(shù)據(jù)、軟件、其他數(shù)據(jù)產(chǎn)品等)的出版和開放獲取已經(jīng)成為未來出版領(lǐng)域的趨勢。

5 ?數(shù)據(jù)出版關(guān)鍵問題探析

5.1 ?3種出版模式在數(shù)據(jù)共享中的作用

上述3種出版模式在地學(xué)數(shù)據(jù)共享過程中所起到的作用有一定的差異,數(shù)據(jù)期刊的出版方式在學(xué)術(shù)傳播方面具有優(yōu)勢,數(shù)據(jù)論文的影響力較其他出版方式高,但是數(shù)據(jù)的獲取則需要通過數(shù)據(jù)倉儲實(shí)現(xiàn),這些倉儲均為與數(shù)據(jù)期刊合作或由期刊建議提交數(shù)據(jù)的倉儲,以這種方式出版的數(shù)據(jù)大多數(shù)是經(jīng)過挑選、處理、計(jì)算得到的數(shù)據(jù)集或者是數(shù)據(jù)產(chǎn)品,研究人員最關(guān)注的不是數(shù)據(jù)論文而是數(shù)據(jù)本身。通過倉儲出版的數(shù)據(jù)能夠直接融入研究數(shù)據(jù)的管理過程,縮短了數(shù)據(jù)發(fā)布的周期,有利于數(shù)據(jù)的獲取和重用,國內(nèi)外數(shù)據(jù)政策的出臺積極推動了開放科學(xué)和數(shù)據(jù)監(jiān)管,研究數(shù)據(jù)的管理必須要通過數(shù)據(jù)倉儲來實(shí)現(xiàn),此外大規(guī)模基礎(chǔ)數(shù)據(jù)集(如遙感、基礎(chǔ)地理等數(shù)據(jù))也可通過倉儲平臺的FTP服務(wù)或接口服務(wù)實(shí)現(xiàn)互操作。但是,大多數(shù)倉儲沒有學(xué)術(shù)性的同行評議,數(shù)據(jù)質(zhì)量控制大多數(shù)屬于技術(shù)性檢查與倉儲認(rèn)證。聯(lián)合出版集合了上述兩種出版的優(yōu)勢,對于驗(yàn)證科學(xué)結(jié)論、建立完整的學(xué)術(shù)研究軌跡非常重要,然而這需要出版商、圖書館或數(shù)據(jù)監(jiān)管部門、科研機(jī)構(gòu)等協(xié)同建立知識生態(tài)鏈。

5.2 ?數(shù)據(jù)出版的同行評議問題

同行評議是數(shù)據(jù)質(zhì)量控制的關(guān)鍵,對于數(shù)據(jù)出版來說同行評議雖然不是必須的,但是這種方式卻是增加數(shù)據(jù)可信度的黃金標(biāo)準(zhǔn)。然而目前在數(shù)據(jù)出版中缺少針對科學(xué)數(shù)據(jù)的同行評議體系。出版領(lǐng)域?qū)?shù)據(jù)論文大多數(shù)采用了與學(xué)術(shù)論文相似的同行評議方式來控制數(shù)據(jù)質(zhì)量,這種方式的優(yōu)勢在于利用原有的學(xué)術(shù)刊物的影響力帶動了研究人員對數(shù)據(jù)論文可信度的認(rèn)可。但是傳統(tǒng)的學(xué)術(shù)論文和數(shù)據(jù)論文所關(guān)注的重點(diǎn)不同,數(shù)據(jù)出版更注重?cái)?shù)據(jù)重用這一特點(diǎn),而學(xué)術(shù)論文更加注重科學(xué)發(fā)現(xiàn)的創(chuàng)新性。B. Lawrence[20] 等曾經(jīng)提出科學(xué)數(shù)據(jù)的同行評議通常從數(shù)據(jù)質(zhì)量、元數(shù)據(jù)質(zhì)量、其他通用因素3個方面開展評議。ESSD采用的兩段式的開放式同行評議,利用互聯(lián)網(wǎng)開放周期讓真正的數(shù)據(jù)使用者評判其數(shù)據(jù)集的質(zhì)量,數(shù)據(jù)用戶的反饋對于驗(yàn)證數(shù)據(jù)和論文內(nèi)容的一致性和數(shù)據(jù)質(zhì)量具有重要意義。此外數(shù)據(jù)評議的時間選擇也是非常關(guān)鍵的,屈寶強(qiáng)等提出隨著數(shù)據(jù)量以指數(shù)規(guī)模增長,可能更多會選擇出版后的同行評議[21]。出版后的評議形式包括針對出版數(shù)據(jù)的意見征集、數(shù)據(jù)使用度量和數(shù)據(jù)修改,可能對數(shù)據(jù)使用人員而言,更具可擴(kuò)展性。此外一些基于倉儲的數(shù)據(jù)出版也引入了同行評議的理念和方法,如美國冰雪數(shù)據(jù)中心,利用項(xiàng)目內(nèi)部專家對提交到該中心的數(shù)據(jù)進(jìn)行評議,由于評審專家具備相同的專業(yè)知識,了解數(shù)據(jù)重用的方法,對于數(shù)據(jù)質(zhì)量的控制具有一定的權(quán)威性。數(shù)據(jù)的評審應(yīng)該有別于傳統(tǒng)的學(xué)術(shù)論文,不能僅從數(shù)據(jù)論文的學(xué)術(shù)性的角度來篩選,而更應(yīng)該重視數(shù)據(jù)在參與科研和產(chǎn)生再生性成果的過程中的重用性、元數(shù)據(jù)的質(zhì)量、數(shù)據(jù)使用描述是否完整全面等問題。數(shù)據(jù)同行評議的專家需要具有相同的專業(yè)知識背景和使用同類數(shù)據(jù)的經(jīng)驗(yàn)。

5.3 ?地學(xué)數(shù)據(jù)出版中分層元數(shù)據(jù)的重要性

元數(shù)據(jù)主要用于描述數(shù)據(jù),幫助研究者實(shí)現(xiàn)數(shù)據(jù)重用,筆者調(diào)研的數(shù)據(jù)質(zhì)量控制都包含對元數(shù)據(jù)的檢查。在數(shù)據(jù)的實(shí)際應(yīng)用中,元數(shù)據(jù)是需要分層次描述的。首先,對于數(shù)據(jù)使用需求可分為數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)引用、專業(yè)數(shù)據(jù)描述3個層次。發(fā)現(xiàn)層通常采用DC核心元數(shù)據(jù)標(biāo)準(zhǔn),引用層主要采用或參考DataCite的元數(shù)據(jù)標(biāo)準(zhǔn),而專業(yè)數(shù)據(jù)描述較為復(fù)雜,地球科學(xué)領(lǐng)域元數(shù)據(jù)區(qū)別于通用元數(shù)據(jù)的最顯著特點(diǎn)是其數(shù)據(jù)本身具有的時空特性,地學(xué)領(lǐng)域常用的元數(shù)據(jù)標(biāo)準(zhǔn)有NASA的DIF、ISO19115、ISO19139、FGDC等,大多數(shù)據(jù)倉儲在專業(yè)元數(shù)據(jù)的描述上都采用或參考了以上元數(shù)據(jù)標(biāo)準(zhǔn),有的甚至還同時提供了多種標(biāo)準(zhǔn)的元數(shù)據(jù)。其次,地學(xué)數(shù)據(jù)的體量較大,基于數(shù)據(jù)組織的需求,應(yīng)該根據(jù)數(shù)據(jù)集顆粒度的大小提供多層次的元數(shù)據(jù)。筆者所調(diào)研的數(shù)據(jù)倉儲中,多數(shù)規(guī)定了單個數(shù)據(jù)集的大小不超過1-2G,而對于原始采集的數(shù)據(jù)來說可能遠(yuǎn)大于這個體量。如地震反射剖面數(shù)據(jù)是按照剖面上的接受器進(jìn)行組織的,遙感數(shù)據(jù)按照地球的經(jīng)緯度進(jìn)行網(wǎng)格化組織,整個研究的地理范圍可能包含了若干個數(shù)據(jù)集。Pangaea在出版大體量的反射地震數(shù)據(jù)時,將數(shù)據(jù)集拆解成若干個數(shù)據(jù)序列,賦予每個數(shù)據(jù)序列一個唯一的標(biāo)識符,這時既需要給每一個數(shù)據(jù)序列提供專業(yè)元數(shù)據(jù),同時也需要提供整個研究區(qū)域數(shù)據(jù)集的元數(shù)據(jù)信息。綜上所述在地學(xué)數(shù)據(jù)出版實(shí)踐中,元數(shù)據(jù)的分層描述對于數(shù)據(jù)的保存和重用都具有重要的意義。

6 ?總結(jié)與展望

從以上研究可以發(fā)現(xiàn),現(xiàn)有地學(xué)數(shù)據(jù)期刊的載文量呈現(xiàn)逐年上升的趨勢,說明數(shù)據(jù)出版逐漸被科研人員認(rèn)可與接受,這對于研究者積極地共享數(shù)據(jù)具有促進(jìn)作用。國內(nèi)外科學(xué)數(shù)據(jù)管理政策的出臺使得科學(xué)數(shù)據(jù)的保存與管理成為研究中必不可少的環(huán)節(jié),而數(shù)據(jù)出版與數(shù)據(jù)管理息息相關(guān),任何模式的數(shù)據(jù)出版都離不開數(shù)據(jù)倉儲。筆者提取了數(shù)據(jù)出版必要的5個要素,但是通過調(diào)研發(fā)現(xiàn)注冊在re3data中的地學(xué)倉儲能夠完全滿足這5要素的為數(shù)不多,這意味著大多數(shù)數(shù)據(jù)倉儲尚未具備完善的數(shù)據(jù)出版能力。學(xué)術(shù)論文和數(shù)據(jù)的聯(lián)合出版受到開放科學(xué)環(huán)境的限制,目前實(shí)踐較少。綜合調(diào)研的結(jié)果,筆者對其存在的關(guān)鍵問題進(jìn)行了探討,這對于我國地學(xué)領(lǐng)域中數(shù)據(jù)共享模式向數(shù)據(jù)出版轉(zhuǎn)變的實(shí)踐具有借鑒意義。

此外,地學(xué)數(shù)據(jù)出版具有自身的領(lǐng)域特點(diǎn),地學(xué)研究的過程通常被概括為3個階段:通過儀器采集數(shù)據(jù),對數(shù)據(jù)進(jìn)行分析和處理,通過創(chuàng)建研究方法生成數(shù)據(jù)產(chǎn)品和研究結(jié)論。在這3個階段中可能產(chǎn)生的數(shù)據(jù)包含:原始采集的數(shù)據(jù),數(shù)據(jù)讀取、轉(zhuǎn)換、可視化等軟件,由于創(chuàng)建新的數(shù)據(jù)處理或計(jì)算方法而產(chǎn)生的新的數(shù)據(jù)產(chǎn)品,融合多種數(shù)據(jù)及數(shù)據(jù)衍生物的出版對于地學(xué)領(lǐng)域的數(shù)據(jù)共享將是一個挑戰(zhàn)。

參考文獻(xiàn):

[1] 諸云強(qiáng), 朱琦, 馮卓,等. 科學(xué)大數(shù)據(jù)開放共享機(jī)制研究及其對環(huán)境信息共享的啟示[J]. 中國環(huán)境管理, 2015, 7(6):38-45.

[2] 王卷樂, 孫九林. 世界數(shù)據(jù)中心(WDC)回顧、變革與展望[J]. 地球科學(xué)進(jìn)展, 2009, 24(6):612-620.

[3] 諸云強(qiáng), 孫九林, 廖順寶,等. 地球系統(tǒng)科學(xué)數(shù)據(jù)共享研究與實(shí)踐[J]. 地球信息科學(xué)學(xué)報(bào), 2010, 2010(1):1-8.

[4] 吳立宗, 南卓銅, 王亮緒. 科學(xué)數(shù)據(jù)出版——促進(jìn)數(shù)據(jù)共享的一種新模式[J]. 中國科技資源導(dǎo)刊, 2014(5):72-78.

[5] EAR Division Data Sharing Policy [EB/OL]. [2018-12-18]. https://www.nsf.gov/geo/geo-data-policies/ear/ear-data-policy-apr2018.pdf.

[6] 何琳, 常穎聰. 國內(nèi)外科學(xué)數(shù)據(jù)出版研究進(jìn)展[J]. 圖書情報(bào)工作, 2014, 58(5):104-110.

[7] BRASE J, FARQUHAR A, GRUTTEMEIER H, et al. Approach for a joint global registration agency for research data[J]. Information services & use, 2009, 29(1):13-27.

[8] KRATZ J E, STRASSER C. Researcher perspectives on publication and peer review of data[J]. PLOS ONE, 2015, 10(2):e0117619.

[9] 李丹丹, 吳振新. 研究數(shù)據(jù)引用研究[J]. 圖書館雜志, 2013, 32(5):65-71.

[10] PRONK T E,WIERSMA P H,VAN WEERDEN A,et al. A game theoretic analysis of research data sharing[J].Peer J,2015(3):e1242.

[11] WDS[EB/OL].[2018-12-18].http://www.icsu-wds.org/organization/intro-to-wds.

[12] WATERMAN K J, SIERMAN B. Survey of DSA-certified digital repositories : report on the findings in a survey of all DSA-certified digital repositories on investments in and benefits of acquiring the Data Seal of Approval (DSA) [R]. ?Hague: Netherlands Coalition for Digital Preservation, 2016:19.

[13] CoreTrustSeal[EB/OL].[2019-01-12]. https://www.coretrustseal.org/about/.

[14] 黃如花, 李楠. 開放數(shù)據(jù)的許可協(xié)議類型研究[J]. 圖書館, 2016(8):16-21.

[15] Data Citation Synthesis Group. Joint Declaration of Data Citation Principles [EB/OL]. [2018-02-18].https://www.force11.org/group/joint-declaration-data-citation-principles-final.

[16] DataCite Metadata Working Group. DataCite Metadata Schema for the Publication and Citation of Research Data[EB/ OL].[2018-02-18]. http://schema.datacite.org/meta/kernel-4.0/doc/DataCite-MetadataKernel_v4.0.pdf.

[17] 王丹丹. 科學(xué)數(shù)據(jù)出版平臺的用戶測試研究[J]. 情報(bào)資料工作, 2017(6):58-63.

[18] National Aeronautics and Space Administration—Global Change Master Directory. Directory Interchange Format (DIF) Writers Guide[EB/OL].[2017-10-15]. http://gcmd.nasa.gov/add/difguide/.

[19] GIL Y, DAVID C H, DEMIR I, et al. Toward the geoscience paper of the future: best practices for documenting and sharing research from data to software to provenance[J]. Earth and space science, 2016, 3(10): 388-415.

[20] LAWRENCE B, JONES C, MATTHEWS B, et al. Citation and peer review of data: moving towards formal data publication[J]. International journal of digital curation, 2011, 6(2):4-37.

[21] 屈寶強(qiáng), 王凱. 數(shù)據(jù)出版視角下的科學(xué)數(shù)據(jù)同行評議[J]. 圖書館雜志, 2017, 36(10):71-77.

作者貢獻(xiàn)說明:

韓 ?露:論文相關(guān)的數(shù)據(jù)采集,數(shù)據(jù)出版關(guān)鍵問題的研究與論文撰寫;

丁 ?毅:數(shù)據(jù)倉儲研究和數(shù)據(jù)出版流程實(shí)踐。

Abstract: [Purpose/significance] Scientific data publishing is the main mode of academic communication for data-intensive scientific discovery, which is of great significance for data reuse and scientific verification. [Method/process] Earth sciences has undergone a great change from the data sharing model to the current data publishing. Current practices of data publishing can be divided into three modes: data journal publishing, data warehousing publishing, data and paper joint publishing. The author made statistics and comparison on the practice methods and key elements of each mode, and emphatically analyzed the advantages and disadvantages of the three modes, peer data review issues and the importance of hierarchical metadata in geoscience data publishing. [Result/conclusion] Through research, the author proposes that warehouse-based publishing facilitates integration into scientific data management process and facilitates data reuse. However, such publishing mode usually lacks peer review. Peer review of data should be different from academic papers and should focus on the reusability of data in the process of participating in scientific research and producing regenerative results. The hierarchical description of metadata is of great significance to the preservation and reuse of geoscience big data.

Keywords: data publication ? ?data repository ? ?data journal ? ?geoscience data

猜你喜歡
科學(xué)
點(diǎn)擊科學(xué)
走進(jìn)科學(xué)
走進(jìn)科學(xué)
點(diǎn)擊科學(xué)
點(diǎn)擊科學(xué)
點(diǎn)擊科學(xué)
走進(jìn)科學(xué)
科學(xué)大爆炸
科學(xué)
科學(xué)怪咖
主站蜘蛛池模板: 亚洲国产亚综合在线区| 久久成人18免费| 久久精品aⅴ无码中文字幕 | 国产小视频a在线观看| 欧美不卡视频一区发布| 亚洲日韩AV无码一区二区三区人| 色偷偷av男人的天堂不卡| 国产乱子精品一区二区在线观看| 国产精品视频导航| 免费人成在线观看视频色| 欧美精品二区| 亚洲综合精品香蕉久久网| 国产凹凸一区在线观看视频| 亚洲美女一级毛片| 啪啪永久免费av| 国产精品永久不卡免费视频 | 国产一区二区三区免费观看| 国产av剧情无码精品色午夜| 亚洲日本一本dvd高清| 乱系列中文字幕在线视频| 免费人欧美成又黄又爽的视频 | 2020精品极品国产色在线观看| 久久黄色小视频| 亚洲福利视频一区二区| 欧美中文字幕第一页线路一| 凹凸精品免费精品视频| 99视频在线精品免费观看6| 99热最新在线| 精品欧美视频| 日韩在线2020专区| 素人激情视频福利| 91精品国产自产在线老师啪l| 午夜少妇精品视频小电影| 少妇人妻无码首页| 欧美一级高清免费a| 无码一区二区三区视频在线播放| 国产黄网永久免费| 亚洲日韩AV无码一区二区三区人| 色偷偷综合网| 成·人免费午夜无码视频在线观看| 在线免费亚洲无码视频| 青草视频免费在线观看| 久久精品一品道久久精品| 中文字幕首页系列人妻| 成年女人a毛片免费视频| 国产高清无码麻豆精品| 色哟哟国产精品| 97国产成人无码精品久久久| 狼友av永久网站免费观看| 欧美日韩亚洲综合在线观看| 国产精品美女免费视频大全| 日本在线国产| 国产乱人视频免费观看| 欧洲日本亚洲中文字幕| 99久久精品无码专区免费| 最新国产高清在线| 熟妇丰满人妻av无码区| 欧美一区二区三区不卡免费| 精品無碼一區在線觀看 | 在线观看无码av免费不卡网站| 亚洲男人在线| 无码有码中文字幕| 国产成人精品男人的天堂下载| 亚洲一区二区三区国产精品| 国产99精品视频| 久久国产精品嫖妓| 国产欧美精品专区一区二区| 日韩精品亚洲人旧成在线| 99在线观看免费视频| 久久久久久久蜜桃| 不卡视频国产| 亚洲天堂视频在线观看| 亚洲大学生视频在线播放| 欧美精品1区| 国产无吗一区二区三区在线欢| 女人18毛片久久| 日本高清有码人妻| 国产精品片在线观看手机版 | 伊人久久婷婷五月综合97色| 久久免费看片| a天堂视频| 在线日本国产成人免费的|