999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ISLI標準的科技文獻和科學數據的關聯

2021-01-05 06:27:50李欣怡姜恩波劉春江中國科學院成都文獻情報中心中國科學院大學經濟與管理學院
圖書館理論與實踐 2020年5期
關鍵詞:關聯科學科技

朱 江,李欣怡,姜恩波,劉春江,向 彬(.中國科學院成都文獻情報中心;2.中國科學院大學經濟與管理學院)

1 ISLI簡介與應用現狀

ISLI即國際標準關聯標識符(International Standard Link Identifier),ISLI國際標準《ISO 17316:2015信息與文獻——國際標準關聯標識符(ISLI)》[1]于2015年5月15日正式發布,這是我國新聞出版界主導制定的第一部國際標準。與單一對象標識符不同,ISLI不以標識和識別單一對象為目的,而是主要用于標識兩個實體之間的關聯關系,并不改變實體的各種屬性和標識,[2]其表現形式是一個帶有關聯信息(元數據)的標志碼,以創建實體之間的關聯,實現多個實體的關聯、共同呈現等目的。這些實體可以是圖文音像、數據、知識元等具有不同細粒度和表現形式的信息與文獻領域內的所有具體實物,也可以是地理位置坐標、時間點等更為抽象的事物。[3]ISLI關聯模型包括源、目標和兩者之間的關聯三個要素。[4]

關聯關系是文獻與信息領域不同類別、屬性、細粒度實體之間尚待進一步挖掘與實現的寶貴資源,有著重要的現實意義。ISLI的提出、完備與推廣對于定義相關實體間的關聯關系有重要作用。①穩定可靠。在ISLI標準框架下,各實體就如同一個個 “零部件” ,通過ISLI編碼實現彼此間共性主題的關聯,同時各實體仍可保持其個體獨立性,因為ISLI標準并不改變實體的獨立形態及其原本功能。也就是說,依托ISLI標準構建的關聯關系不會因為實體所處的倉儲系統或其他客觀環境的變化而失效。②原理簡潔。不同于以識別和標識單一對象為目的的標識符,ISLI的關注點在于使用ISLI編碼體系創建兩個實體之間的關聯關系,一旦編碼標準的細節制定成熟完備,便可快速、低成本地盤活現存資源,以關聯推進新的資源價值產生。③拓展靈活。在ISLI標準的編碼方案中,關聯字段所包含的數字編碼的長度和結構均可由注冊機構根據應用對象的分類和需要進行自定義,[4]ISLI標識符的編碼結構采用了定長但不限長的十進制數字編碼及相對自由的編碼要素語法規則,因此,ISLI編碼體系中的關聯字段具有良好的可擴展性。

ISLI標準源自我國的多媒體印刷讀物(Multimedia Print Reader,MPR)標準,[5]ISLI/MPR被視為ISLI標準最初的典型應用,并成功在國內外出版領域得到認可與推廣。[6]隨后,ISLI標準積極探索與更多領域的融合模式,并在知識關聯服務(Knowledge Linking Service,KLS)、增強現實(Augmented Reality,AR)出版、插畫等領域逐步形成ISLI/KLS[7]、ISLI/AR[8]、ISLI/WIS[9]等應用。國家新聞出版廣電總局數字出版司于《新聞出版業 “十三五” 科技發展規劃總體思路》規劃中明確表示 “要大力推進ISLI標準在國內外的產業應用” 。[10]2018年5月,中國ISLI注冊中心與中國科學院計算機網絡信息中心就新聞出版與物聯網標識的元數據共享開展合作,[11]這意味著ISLI的推廣落地將在非新聞出版領域有所突破。

2 科技文獻和科學數據的關聯

科技文獻是學者向社會展現其科研成果的重要途徑之一,而科研過程中產生的科學數據實則與科研結果保持著同等重要的位置,其如同 “證據” 一般詳實地記錄著科研結果的推導過程,一些科學數據也已成為科研成果的重要表現形式之一??萍嘉墨I與科研數據間關系可謂緊密。隨著認識的提高和技術的突破,人類進入了大數據時代,科學研究不可避免地也有了新的延伸方向:數據在科研中的地位逐漸重要,數據密集型科學作為科學探索的新的第四范式隨之產生。[12]加之開放獲取浪潮的不斷推動,人們對于科技文獻中相關科學數據的可獲取性呼聲日益高漲,諸如GBIF、DataStaR、OTA之類的數據倉儲平臺應運而生。目前,有學者基于數字對象唯一標識符(DOI)、元數據等角度對科學數據和科技文獻的關聯展開了研究。[13,14]ISLI標準的出現為實現科技文獻和科學數據的標準化關聯提供了新的解決方案,同時也有利于提升兩者間關聯關系的穩定性和復用性。

以科學數據原創性和獨立性為標準,可將科學數據分為科技文獻內科學數據和科技文獻外科學數據。[15]前者指在某項科研過程中具體產生的原始科研數據,與科技文獻內容完全整合在一起,通常以表格、數字、圖像等格式呈現,此類科研數據并未被單獨存儲,而是依附于科技文獻,文獻本身即為此類科研數據的天然載體,對這一類科研數據通常以文獻引用代替數據引用;后者是指與科技文獻分離、獨立存在的科學數據,通常來自于特定數據倉儲平臺的科學數據集和數據記錄。目前,還出現了以刊載和發行規范化科學數據為主要目標的數據出版物,如數據期刊和數據論文,這種類型的科學數據可作為直接引用源。

科技文獻、科學數據的關聯形式多樣、類型復雜,主要的關聯形式有以下三種。[16]①硬關聯。一篇科技文獻與它在特定數據倉儲平臺提交的科學數據集之間的關聯,呈現一對一或一對多的關系。這種關聯是有意識的、人為的關聯,主要實現科學數據與其來源科技文獻形式上的關聯。②軟關聯。一篇科技文獻與它引用的科學數據集或主題、內容相關的科學數據集之間的關聯,大多數情況下是一對多的關系。這種類型的關聯是從某一特定內容出發,將與該內容相關的多方科技文獻和科學數據進行集成,可為用戶參考提供便利。但這種關聯尚不成熟,準確性有待考證。③其他關聯。一篇科技文獻與在出版、傳播過程中由編輯或同行科技工作者添加的其他科學數據集或解析工具之間的關聯等。上述關聯均可利用ISLI模型實現。

科技文獻和科學數據并非最小的關聯單位,可將其解構成細粒度更小的知識單元。如果把獨立的單篇科技文獻和獨立的單個科學數據集看作 “資源” ,把科技文獻和科學數據集中更小的知識單元看作 “知識” ,則可將科技文獻、科學數據集之間的關聯劃分為四種類型(見表1)。根據上述關聯類型,可在ISLI標準元數據集的基礎上對關聯類型元數據項、關聯對象及取值范圍進行擴展,同時對ISLI關聯編碼體系進行定義。

3 科技文獻和科學數據關聯的ISLI元數據集擴展

3.1 ISLI標準元數據集的擴展

(1)關聯類型的擴展。在ISLI標準元數據集的基礎上,對科技文獻和科學數據集的關聯類型元數據項進行擴展,劃分為上述的四種類型,并預留進一步擴展的空間。

(2)關聯對象的擴展和規范。科技文獻具有諸如論文、圖書、研究報告等多樣的表現形式,而科學數據分為原始性基礎數據與按照不同需求加工后的數據集和相關信息。不同的科技文獻和科學數據之間的關聯位置、層級、程度不可能千篇一律。因而對于關聯對象而言,其取值范圍、取值標準和校驗方法亟需得以擴展與規范,以便區分與囊括不同類型和細粒度的關聯對象,打破載體和介質的屏障,直接進入內容資源層建立一套具有統一規則的、完整的關聯關系。

表1 科技文獻與科學數據集的關聯類型

(3)關聯行為元數據項的擴展和作用。實體間存在目的不同的關聯行為,可參照Subject-Action-Object(SAO)的語義表達結構理念,在ISLI關聯的 “源” 和 “目標” 中間增加一個關聯行為元數據項,其作用相當于SAO中的 “A” ,以便對龐大的關聯編碼進行聚類。關聯行為元數據項的取值可根據實際應用不斷擴展,以適應不斷創新、變化的關聯行為。

3.2 命名實體的抽取及KOI標識的建立

出于對海量實體及實體種類 “身份” 管理的需求,需要對 “有意義” 的實體進行唯一性標識,并通過識別、抽取命名實體和創建實體唯一標識符實現對實體的準確性、系統性管理。①明確命名實體的命名規則及組織、保存和更新規則,以便對不同類別的實體進行有效歸類、檢索,明確實體邊界,便于機器學習,實現對命名實體的自動抽取、命名、保存和更新。②建立KOI(知識對象標識符)標識。ISLI關聯的是 “源” 和 “目標” 兩個實體,雖然ISLI標準規定 “源” 實體一般是確定的, “目標” 實體可以是確定的也可以事后確定或建立,但 “源” 和 “目標” 作為實體,除了實體名稱外,一般還應建立一個唯一標識符。獨立的單篇科技文獻和獨立的單個科學數據集可被視為粒度較粗的 “資源” 層面,該層面現已存在數字對象標識符(DOI)作為唯一標識符。但對于科技文獻和科學數據集中的知識實體(或知識單元)還尚未建立統一且被廣泛使用的唯一標識符體系,在此可借助KOI[7]對系統內抽取出來的知識實體(或知識單元)進行標識和存儲。由于KOI尚無公認的標準,因而只能在一定范圍內解析使用。

4 科技文獻和科學數據關聯的ISLI編碼體系設計

ISLI編碼由十進制數字構成,分為服務字段、關聯字段和校驗字段。參照相關文件,[4]一個ISLI編碼的形式如圖1—圖3所示(連字符 “-” 及 “ISLI” 并不構成標識符的組成部分,只為便于閱讀)。服務字段的編碼一般為6位,由ISLI注冊中心(ISLI RA)分配;關聯字段的編碼長度可變,具體長度、結構由ISLI RA根據應用需求進行定義,如果分段,一般可細分為前置編碼和后置編碼兩部分;校驗字段的數值(校驗碼)由ISLI系統依據規則自動計算。[4]

圖1 圖書、音像制品ISLI編碼字段結構

圖2 連續出版物ISLI編碼字段結構

圖3 以互聯網傳播的音頻內容產品ISLI編碼字段結構

在科技文獻和科學數據關聯服務中,假設服務字段為 “200000” ,關聯字段的前置編碼為10位數字,容有100億個碼段,可在不擴容情況下供100億個獨立的科技文獻或科學數據集使用;后置編碼為5位數字,容有10萬個無重復的編碼,除去用于標識1個科學文獻或科學數據集和它的元數據之間關聯的 “00000” 這個特定的ISLI標準標志碼外,還有99,999個ISLI標準編碼可用于標記該實體與該實體內部的知識單元、外部其他實體(包括外部其他科技文獻、科學數據集及其包含的知識單元)的各種關聯,并使用經過擴展的ISLI標準元數據集來表示各種復雜的關聯。

如 “10+5” 的關聯編碼字段容量不足,還有根據實際需要增加關聯編碼字段的長度,變成 “10+6” 或 “12+6” 等形式,以容納更多的關聯編碼。

為了更加具體地說明科技文獻和科學數據的關聯是如何基于ISLI標準來實現的,特舉例如下。論文A根據 “2018年成都市日降水量觀測記錄表” 匯總了一張 “2018年成都市月降水量統計表” KOI(a),并與已獲得DOI(B)的論文B中的 “2018年武漢市月降水量統計表” KOI(b)進行了比較。論文A發表后獲得DOI(A), “2018年成都市日降水量觀測記錄表” 按要求提交到數據倉儲平臺,獲得DOI(a);將DOI(A)的ISLI關聯編碼的前置編碼定為 “1000000001” ,DOI(a)的ISLI關聯編碼的前置編碼定為 “1000000002” ,而后置編碼按一定的編碼段或流水號順序分配的話,則可形成最基本的關聯和ISLI關聯編碼(見表2)。相應地,對于DOI(B)、KOI(b)來說,也可以采取類似的方法,將它與科技文獻及其他科學數據集的關聯標識出來。

表2 基于ISLI標準的科技文獻與科學數據集的關聯

將上述ISLI編碼及其元數據存儲到科技文獻和科學數據關聯服務系統中,并提交給ISLI注冊服務中心,即可在ISLI服務系統的支持下實現ISLI編碼的解析和服務。

5 結論

對于科技文獻和科學數據關聯中存在的 “源” 和 “目標” 細粒度不同、關聯類型多樣等問題,ISLI標準以其穩定可靠、原理簡潔、可拓展性強等較為獨特的優點提供了一種角度新穎的解決途徑。在科技文獻和科學數據關聯的具體實踐中,以標識符定義被關聯對象之間的關聯關系,有利于快速發現并精準定位到所需的高品質內容,同時也使得科技文獻和科學數據之間的引用與考證變得更加容易。應全面總結科技文獻和科學數據關聯的類型,并借鑒ISLI標準的其他典型應用案例,完善基于ISLI標準的科技文獻和科學數據關聯標準,以充分展現科技文獻和科學數據的關聯。

猜你喜歡
關聯科學科技
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
科學大爆炸
小小藝術家(2019年6期)2019-06-24 17:39:44
科技助我來看云
奇趣搭配
科技在線
智趣
讀者(2017年5期)2017-02-15 18:04:18
科學
科技在線
科技在線
科學拔牙
主站蜘蛛池模板: 久久免费成人| 国产一区二区三区在线观看免费| 美女视频黄频a免费高清不卡| 日韩国产 在线| 亚洲一区二区三区中文字幕5566| 日韩免费毛片视频| 国产性爱网站| 日本午夜在线视频| 蝌蚪国产精品视频第一页| 久久99国产精品成人欧美| 欧美精品二区| 精品久久久久久中文字幕女| 男人天堂亚洲天堂| 99热这里只有精品2| 亚洲中文字幕日产无码2021| 国产亚洲现在一区二区中文| 无码日韩精品91超碰| 日韩少妇激情一区二区| 欧美日本在线| 国产精品网址在线观看你懂的| 色视频国产| 色国产视频| 91在线无码精品秘九色APP| 日本免费精品| 呦视频在线一区二区三区| 爆乳熟妇一区二区三区| 日韩av在线直播| 国产精品2| 欧美一区精品| 极品私人尤物在线精品首页| 在线播放真实国产乱子伦| av在线人妻熟妇| 波多野结衣一区二区三区AV| 婷婷成人综合| 狠狠久久综合伊人不卡| 国产成人精品日本亚洲77美色| 免费精品一区二区h| 国产自在线播放| 97se亚洲综合在线| 日韩资源站| 亚洲人在线| 国产欧美视频在线| 成人免费黄色小视频| Jizz国产色系免费| 亚洲区视频在线观看| 亚洲美女一区二区三区| 天天激情综合| 免费国产在线精品一区| 中文天堂在线视频| 午夜国产小视频| 国产精品亚洲αv天堂无码| 美女免费精品高清毛片在线视| 国产情侣一区| 亚洲中文字幕无码mv| 伦精品一区二区三区视频| 在线观看欧美国产| 欧美一区日韩一区中文字幕页| 欧美人在线一区二区三区| 日韩精品成人网页视频在线| 91青草视频| 99久久国产综合精品女同| 天天综合网在线| 亚洲Av激情网五月天| 一本一道波多野结衣一区二区| 亚洲aⅴ天堂| 久久久久久久久亚洲精品| 亚洲免费黄色网| 国产亚洲精久久久久久无码AV | 精品国产免费观看一区| av无码久久精品| 一级福利视频| 久久性妇女精品免费| 亚洲激情99| 婷婷色在线视频| 伊人久综合| 欧美伦理一区| 一级高清毛片免费a级高清毛片| 青草娱乐极品免费视频| 18禁影院亚洲专区| 国内精品视频在线| 四虎免费视频网站| 国产99在线|