999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

開放環境下的數據引用探析

2017-11-27 15:39:07李梅
河南圖書館學刊 2017年11期

李梅

關鍵詞:數據引用;科學數據;引用規范

摘要:文章對開放環境下國內外有關開放數據引用的研究文獻進行了系統梳理和總結,包括數據引用的發展歷程、數據引用的關鍵因素及其互動關系,在此基礎上進行分析與總結,并提出一些政策意見和建議。

中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2017)11-0128-03

隨著科技出版業的變革及開放運動的深入開展,科學數據開放獲取的基礎環境已逐步形成。海量的數據源及豐富的數據環境使研究人員得以便捷地發布、發現、訪問并獲取數據,如何規范地引用數據自然也受到科學界和出版界的極大關注。

科學數據引用是指提供數據參考的做法,類似于研究者為印刷型資源提供參考文獻的方式。數據引用是支持數據訪問、共享和再利用的一種重要方法。通過數據引用,降低科學數據發現和利用的壁壘,提高研究過程的效率和透明度,同時數據與出版物的有效鏈接將有助于學術出版形式的創新,促進跨學科研究,降低科研成本,驗證并創造新的研究成果。

1數據引用的發展歷程

20世紀60年代末期,科學界成立了第一個科學數據檔案庫,設計者開始關注科學數據的獲取、存儲、格式和信息檢索[1]。之后,數據引用的理論和實踐不斷發展,大致經歷了四個階段(見表1)。

1.1數據可描述與檢索階段

該階段的發展集中在引文的作用以促進描述和信息檢索。比較典型的是Archive系統,Dodd[2]建議參照美國書目參考標準ASBR,以系統一致的方式來描述數據集,其核心原則是通過作者、題名和版本字段來描述信息。

1.2數據可訪問及獲取階段

受美國科學基金會NSF資助,Altman等[3]開發了第一個開源和開放獲取出版的數據系統Virtual Data Center,即虛擬數據中心。該中心通過聯邦機構支持持續訪問并獲取研究數據,數據引用集成到虛擬數據中心,每個數據集被分配一個永久標識符和地址,并支持所有的研究數據都能被引用,而且這些引用應當具有有效的外部鏈接,即具有網絡可獲取性。

1.3數據可驗證及再現階段

該階段數據引用與出版生態系統有了更廣泛的整合,其核心原則是引用應當支持驗證數據可鏈接及支持被引用數據的再現。最具代表性的是Dataverse Network系統,其被哈佛大學用作數據發布的基礎平臺,有數以百計的研究人員和機構通過該系統發布數據。

1.4與學術研究系統可集成階段

該階段重在用標準化的方式集成數據引用與學術研究。例如,Data Dryad、Figshare供科研人員分享科研數據的平臺,科睿唯安(原湯森路透知識產權與科技事業部)推出數據引文索引(Data citation index)。另外,美國國家科學總院(The National Academics)、國際科技數據委員會(CODATA)、數據引用綜合組(the Data Citation Synthesis Group)等組織經過多年努力,使人們認識到數據包括數據引用是研究出版物不可缺少的一部分,要求數據倉儲機構/出版平臺提供持久鏈接以保證數據的長期可訪問性。

2影響數據引用的關鍵因素

2.1政策和機構基礎設施

隨著科學研究逐漸向數據驅動型發展,越來越多的國際科學組織認識到獲取、重用數據可以促進研究的高效性和有效性,提高公眾的投資回報。科研資助機構、研究人員、政策制訂者、出版商、數據管理者等,提倡建立數據集的相關基礎設施,完善基礎設施機制。如:數據政策、數據管理、起源追蹤、永久標識符、元數據和引用協議等。

數據引用的前提是數據共享,在數據共享的基礎設施和服務方面,協同合作非常重要。如:科學技術數據委員會(The Committee on Data for Science and Techonlogy, CODATA)、世界數據系統(World Data System,WDS)和科學數據聯盟(Research Data Alliance, RDA)于2015年3月達成協議[4],協議要求CODATA關注宣傳、政策和流程,WDS關注數據供給和管理,RDA關注自下而上的數據共享工具和技術支持。政策制定方面,最為重要的是相關法律法規的建設,以此營造一種良好的外部環境。

2.2技術基礎

數據引用的技術基礎專注于處理數據的基礎設施、系統及標識符。如:XML歸檔系統、RDF(Resource Description Framework)和數據庫、永久標識的使用、定義框架和本體發布數據、創建數據庫倉儲及提供對數據的訪問等。其中粒度問題、版本控制和唯一標識符是關鍵影響因素。

2.2.1粒度問題。引用粒度水平代表了數據的可重復性和可檢索性。引用可以是數據集、數據集中的一個子集,也可以是一個特定記錄集。引用系統應當允許多層粒度的引用,適用于數據、數據集或記錄集的粒度應因上下文信息、不同規模和類型的數據等實際情況而不同。如:一組由圖像組成的數據集,圖像離開上下文環境仍能使用,而在特定時間點的大氣測量數據集離開了上下文就會毫無意義,這時就應給予不同類型的標識符。DCC指出,數據引用粒度以滿足研究者需求為準,如有不準確的地方,則需要在文章中引用數據的地方,寫明引用數據集的細節信息[5]。

2.2.2版本控制。在數據的生命周期中可能會存在多版本的數據引用,如果動態數據集的變化過大或過于頻繁,則難以追蹤管理。好的版本控制可以解決諸如多版本系統的數據更新、同一數據集中引用多層粒度的問題,可以記錄和跟蹤數據的修改歷史,可以使數據得以協作處理和共享。

2.2.3唯一標識符。數據引用唯一標識性,要求數據引用應當擁有一個機器可以識別的、全球唯一的、能夠被廣泛使用的可持續方法。隨著唯一標識符方案的相繼推出,出現了諸如數字對象標識符(DigitalObjectIdentifier,DOI)、統一持久資源定位符(Persistent Uniform Resource Locator, PURL)和文檔資源鑰匙持久標識符架構(the Archival Resource Key, ARK)等。這些方案提出了將唯一標識符與可引用的數據集建立映射關系,從而創建一組相關的元數據(如作者、版本、URL)用于引用數據。唯一標識符是數據引用的關鍵因素,但由于數據對象本身具有的多樣性、動態性及邊界模糊性,給標識符的分配帶來了一定的困難,如何從根本上解決這一問題,還要冀希望于新技術的出現。endprint

3數據引用關鍵因素間的互動

科學數據的引用元素與傳統基于文獻的引用具有其相似性,但又因科學數據獨特的屬性而不盡相同。解決數據引用的核心問題是諸如粒度、版本、唯一標識符等技術規范問題,而數據引用規范的制訂又會受到數據出版、共享政策等因素的制約。筆者把政策和機構基礎設施歸屬于外部環境因素,良好的外部環境因素可以有效地促進數據引用及技術的發展,而技術的發展又可以影響環境及文化建設。從二者互動的關系看,環境和技術是一種相互影響,又相互促進的關系。

3.1縱向維度

從縱向維度看,開放數據不僅僅只是數據發布的過程,還包括數據發布之后的存儲、管理、引用等,供除數據提供者之外的研究人員或者組織機構下載、分析、再利用,以及引用數據。規范的數據出版應包括數據提交、同行評議、數據發布和永久存儲、數據引用、影響評價等五個階段[6]。Koppenol等建立了開放數據的實踐模型:數據引用與追溯、數據互操作、數據的無限制復用及數據語義互聯四個階段[7]。在開放數據的每個階段中,良好的政策引導及共享機制,加上唯一標識符、版本控制等技術手段的實施,將促進數據共享的意愿及數據引用的良性發展。

3.2橫向維度

數據引用涉及多重利益相關者,受到多維因素的影響。許多學者從多角度對數據引用進行分析或是構建模型、提出框架構想。張麗麗[8]從數據的時間屬性出發,立足數據的全生命周期,剖析數據引用過程中的數據擁有者、出版商、用戶、整合者、監管者的角色特征及相互關系與影響,認為靈活多樣的選擇數據引用規范方法,需要更多地關注數據相關利益者的行為特征,以有利于數據引用的可持續發展。

3.3兼顧縱橫維度

在數據出版周期的各個節點,制定政策方的各主體旨在創設一種數據引證文化,建立數據共享機制、數據使用和復用機制、評價及獎勵機制,從環境的角度對數據的獲取、復用及引用產生影響;而數據引用的參與者、技術和利益相關者之間動態地對數據引用政策施以挑戰,影響環境及文化建設。

4結語

基于以上對開放環境下數據引用的關鍵因素進行梳理和總結,筆者認為推進數據引用的發展可以從環境和技術兩個方面加強,即健全發展數據引用相關機制和推進數據引用行為的規范化。環境方面,政府應當建立與數據引用相關的法律法規,要完善科研評價和人才激勵機制;圖書館、數據中心、科研機構要加強對數據發布、共享及保存機制的規范要求,建立規范的管理機制。技術方面,數據發布/存儲機構在發布數據時,應提供數據引用示范供使用者參考,或對使用者給出足夠詳細的數據屬性描述信息(如唯一標識符及訪問地址)。

參考文獻:

[1]Bisco RL. Social Science Data Archives Technical Considerations [J].Social Science Information,1965(3):129-150.

[2]Dodd S.A. Bibliographic reference for numeric social science data feles: suggested guidelines[J]. Journal of the Association for Information Science & Technology,1979 (2):77-82.

[3]Altman ML, Andreev M. Diggory, G. King, S. Verba, et al. A digital library for the dissemination and replication of Quantitative Social Science Research The Virtual Data Center[J]. Social Science Computer Review,2001(4):458-470.

[4]CODATA. International organizations form partnership to increase the benefit of research data for society[EB/OL]. [2016-10-10]. https://www.eurekalert.org/pub_releases/2015-03/rda-iof030915.php.

[5]Ball A, Duke M. How to cite datasets and link to publications[EB/OL]. [2016-11-03]. http://www.dcc.ac.uk/resources/how-guides/cite-datasets/.

[6]張靜蓓,任樹懷.科研數據出版模式、流程及引用策略研究[J].圖書情報工作,2015(9):21-25.

[7]Koppenol P , Divisional A. Open data in a big data world[J].Chemistry International, 2016(2):17.

[8]張麗麗,黎建輝.數據引用的相關利益者分析[J].情報理論與實踐,2014(7):44-47.

(編校:馬懷云)endprint

主站蜘蛛池模板: 亚洲成a∧人片在线观看无码| 亚洲天堂网视频| 日本91在线| 在线国产综合一区二区三区 | 国产精品三区四区| 女人一级毛片| 成人自拍视频在线观看| 五月婷婷亚洲综合| 国产97公开成人免费视频| 亚洲无码视频图片| 国产乱人免费视频| 国产拍揄自揄精品视频网站| 亚洲丝袜第一页| 亚洲人成影院在线观看| 国产黑丝一区| 香蕉视频在线观看www| 国产第一页屁屁影院| 亚洲中文字幕av无码区| 国产成人免费视频精品一区二区 | 欧美成一级| 久久精品女人天堂aaa| 国产福利一区二区在线观看| 夜夜操国产| 九色最新网址| 亚洲男人天堂2020| 国产三级毛片| 夜夜操国产| 亚洲欧美日韩中文字幕在线| 又爽又大又黄a级毛片在线视频| 国产亚洲现在一区二区中文| 青青热久免费精品视频6| 91久久精品国产| 国产午夜人做人免费视频| 亚洲黄色成人| 波多野结衣爽到高潮漏水大喷| 国产91线观看| 尤物成AV人片在线观看| 国产主播一区二区三区| 超清无码一区二区三区| 国产精品黑色丝袜的老师| 日韩欧美国产中文| 91娇喘视频| 中文字幕无码av专区久久| a毛片免费在线观看| 亚洲AV无码不卡无码| 2020国产精品视频| 国产十八禁在线观看免费| 动漫精品中文字幕无码| 欧美在线三级| 永久免费无码成人网站| 色播五月婷婷| 国产黄在线观看| 国产极品粉嫩小泬免费看| 四虎影院国产| 乱人伦99久久| 狂欢视频在线观看不卡| 国产一区二区人大臿蕉香蕉| 亚洲av无码久久无遮挡| 99在线视频精品| 日本免费a视频| 97免费在线观看视频| 青青草原偷拍视频| 婷婷在线网站| 中文字幕人妻无码系列第三区| 欧美成人在线免费| 亚洲无码精彩视频在线观看| 美女啪啪无遮挡| 亚洲乱码在线播放| 天堂成人在线| 狠狠色狠狠综合久久| 色综合成人| 91福利一区二区三区| 亚洲大尺码专区影院| 久久精品无码专区免费| AV在线麻免费观看网站| 99久久婷婷国产综合精| 国产精品福利导航| 国产精品亚欧美一区二区| h视频在线播放| 婷婷六月综合网| 国产黄网永久免费| 在线观看av永久|