999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于實體-關系模型的標準元數據關系研究

2023-12-05 12:55:53趙青青
標準科學 2023年3期
關鍵詞:關系

趙青青

摘 要:本文梳理了編目學中“關系”的發展歷程,結合實體-關系模型,分析標準文獻包含的實體、屬性,并基于實體間的關聯關系和屬性關系,開展標準元數據關系研究,同時提出下一步應用方向,包括加強實體關系抽取技術研究、構建標準標簽集、開展知識鏈接研究等。

關鍵詞:標準元數據,實體-關系模型,實體,關系

DOI編碼:10.3969/j.issn.1674-5698.2023.03.002

1 引 言

在現代漢語詞典中,“關系”的第一個基本解釋是“事物之間相互作用、相互影響的狀態”。“關系”在編目學中一直占有重要作用,編目學中“關系”更多被稱為“書目關系”,是界定兩個及以上書目實體以某種方式發生關聯所產生的特定關系[1]。

在編目學研究史上,人們對書目關系的研究經歷了漫長的過程,在這個過程中產生了很多編目條例,其中書目關系隱含在各種編目條例中。1980年,國際圖聯(簡稱“IFLA”)出版的UNIMARC標準中,首先將MARC元數據的書目關系概括為垂直關系、平行關系、年代關系。在關系發展歷程中,西方編目界學者不斷對書目關系進行理論擴充,20 01年,Barbara B. Tillett女士基于各種編目條例,對書目關系做了更細致與深層次的揭示,提出了7種完整且彼此獨立的書目關系,即描述關系、整體/部分關系、附屬關系、連續關系、共有特性關系、等同關系、衍生關系[2],為未來書目關系的建立提供了理論基礎。

傳統的書目關系多以文獻為基本揭示單位,隨著用戶需求的不斷深入,文獻資源的知識單元也逐漸朝著細粒度的方向轉移,而書目關系揭示方式也必須符合用戶的深度需求[3]。1998年,IFLA正式推出《書目記錄的功能需求》(簡稱“FRBR”),首次拓寬了書目關系的研究范圍。FRBR借鑒數據庫開發中常用的“實體-關系”模型(簡稱“E-R模型”),通過描述書目數據中實體和實體間的關系,建立起書目記錄之間、書目記錄內部各著錄字段之間的關系。FRBR打破了傳統的書目記錄之間彼此獨立沒有關聯的現象,隨著FRBR研究及實踐的深入發展,世界由此進入基于E-R概念模型進行資源描述與組織的新階段[4]。

2 基于實體-關系模型的標準元數據關系分析

2.1 概述

1976年,E-R模型由美籍華人陳品山博士(PeterChen)提出,E-R模型通過圖形化的方式展現數據庫設計概念,為數據需求分析提供一條結構化的途徑[5]。在編目界,IFLA基于E-R模型,打破固有思維,重新定位與解析書目關系。本文也將基于E-R概念模型進行標準元數據關系分析。

E-R模型有3個基本元素,即實體、屬性、關系。實體是客觀存在的具有共同特征的一類事物的集合。實體是可以區分的,可以是人、事、物,或抽象的概念,也可以是屬性值;屬性是實體的性質和特性,是從不同方向或維度上對實體全方位的揭示和描述,屬性的定義以實體為基礎,是實體內部與外部特征的提煉和歸納。

關系是實體之間相互影響、相互作用的關聯狀態。實體關系分為兩種,一種是實體間的關聯關系,一種是實體的屬性。當關系是實體間的關聯關系時,其本質是對實體之間存在的顯性或隱性關聯特性的有效揭示,這種關聯關系體現在“實體-關系-實體”三元組模型內;當關系是實體的屬性時,其本質是對實體的性質和特性進行的全方位描述和揭示,這種關聯關系體現在“實體-屬性-屬性值”三元組模型內。上述兩種三元組模型是知識網絡最基本的構成要素,實體或屬性值是知識節點,關系或屬性是知識關聯。

由E-R模型可知,識別屬性和關聯實體是元數據關系分析的首要任務。識別屬性是通過對實體內在特征和特性的描述,使資源能被用戶檢索到;關聯實體則是通過對實體之間外在關系的描述,使資源相互聯系,從而幫助用戶推薦和提供更多的相關資源。

2.2 識別實體與屬性

對于標準元數據而言,實體是用戶所關注的關鍵元數據的描述。用戶感興趣的、可進一步進行知識關聯的標準元數據實體包括標準文獻、人/機構、標準主題、標準分類、標準術語、適用范圍、核心技術內容等。因此,結合標準文獻結構特征和標準元數據種類,將進行關系分析的標準元數據實體劃分為標準文獻、人/機構、主題、分類、術語、適用范圍、核心技術內容等七大類,每類實體分別具有各自的屬性和屬性值。由表1可知,一種實體的屬性可以成為單獨的實體,例如:標準文獻的屬性人/機構、主題、分類、術語等可分別成為單獨的實體[6]。標準元數據的關系包括實體與實體之間的關系、實體與實體的屬性值之間的關系。

2.3 關聯實體

2.3.1 實體與實體之間的關系

根據“實體-關系-實體”三元組模型,此時關系是對實體之間存在的各種顯性和隱性關系的揭示。根據表1確定的實體,基于FRBR概念模型書目關系分析方法,實體和實體的關系包括標準文獻實體之間的關系、標準文獻實體和其它實體之間的關系、其他實體之間的關系。

(1)標準文獻實體之間的關系

標準文獻實體之間的關系,包括代替關系、采用關系、引用關系、共有特性關系、衍生關系、等同關系、相關關系。

代替關系:代替關系即年代關系,是標準文獻區別于其他科技文獻最重要的特性,標準文獻的動態更新特點決定了新版標準文獻會代替舊版標準文獻。代替關系分為完全代替和不完全代替。

采用關系:采用關系是標準文獻特有的關系,指把國際標準或發達國家/地區標準中先進標準的內容不同程度地納入到新制定的標準中。采用關系包括等同采用、修改采用兩類。

引用關系:標準文獻的引用關系和其他科技類文獻的引用關系類似,即在當前標準中提及或描述另一標準的內容,并列出出處。標準的引用分為規范性引用和資料性引用。規范性引用指引用的文件內容構成了引用它的文件中必不可少的條款;資料性引用指引用的文件內容構成了有助于引用它的文件的理解或使用的附加信息,以參考文獻形式列出。

共有特性關系:兩個標準文獻雖然不直接相關,但擁有共同特性,例如:由相同起草人起草、由相同起草單位起草、由相同歸口單位歸口管理,擁有相同主題,或者屬于相同標準分類等。

衍生關系:當前我國部分國家標準同步發布了外文版,一件標準文獻可能同時存在中文版和英文版。同時一件標準文獻可能發布修改件、補充件、勘誤等,對原標準文本進行修改、補充、勘誤等。因此標準文獻的翻譯版、修改件、補充件、勘誤件與原標準文獻之間形成衍生關系。

等同關系:隨著信息技術的發展和普及,各種類型的數字資源也隨之不斷增加,標準文獻的載體形態除了傳統的印本文獻外,還包括PDF電子版,未來還可能包括XML格式標準;因此內容相同、載體形態不同的文獻之間具有等同關系。

相關關系:除上述關系外,若兩個標準文獻的某些特性之間具有上下位關系、相關關系等,則標準文獻之間相應形成相關關系。

(2)標準文獻實體和其他實體之間的關系

1)標準文獻實體和人/機構實體之間的責任關系標準文獻實體和人/機構實體之間是責任關系,包括起草人和標準文獻之間的起草關系,起草單位和標準文獻之間的起草單位關系,提出單位和標準文獻之間的提出單位關系,歸口單位和標準文獻之間的歸口單位關系。

2)標準文獻實體和主題、分類、術語等實體之間的主題關系、分類關系、術語關系標準文獻實體和主題、分類、術語等實體之間是主題關系、分類關系、術語關系,主題關系描述標準文獻實體的內容,分類關系描述標準文獻實體所屬的ICS分類和CCS分類,術語關系表明術語來源于標準文獻,標準文獻涉及相關術語。

3)標準文獻實體和適用范圍、核心技術內容等實體之間的整體/部分關系標準文獻實體和適用范圍、核心技術內容等實體之間是整體/部分關系,標準文獻實體是整體,適用范圍、核心技術內容是來源于整體的部分。同樣,核心技術內容和其組成部分章標題、條標題、技術內容是整體/部分關系;章標題和條標題是整體/部分關系。

(3)其他實體之間的關系

1)人/機構實體的相互關系

標準文獻通常由多個起草人、起草單位共同參與起草,這些起草人之間形成合作關系,起草單位之間形成合作關系。由于標準文獻未標注起草人和起草單位的對應關系,因此起草人和起草單位之間不存在成員關系。

2)主題、分類、術語等實體的相互關系,包括同一關系、上下位關系、相關關系主題、分類、術語等實體的相互關系,可以借鑒敘詞表詞間關系的類型。敘詞表詞間關系包括同一關系、上下位關系、相關關系。同一關系指兩個概念的外延全部重合,可以相互替代;上下位關系是概念間的等級關系,概括性較強的詞語叫做上位詞,特定性較強的詞語叫做下位詞;相關關系是除同一關系、等級關系之外的一種語義相關關系,相關關系復雜多樣,包括交叉關系、矛盾關系、對立統一關系型、因果關系、本質與現象關系等[7]。

若兩個標準文獻實體的主題、分類、術語等是同一關系,則標準文獻實體間屬于共有特性關系;若兩個標準文獻實體的主題、分類、術語等是上下位關系、相關關系,則標準文獻實體間屬于相關關系。

3)其他實體的相互關系

人/機構、主題、標準分類、術語、適用范圍、核心技術要素等實體之間的交叉關系,在標準文獻領域還有待進一步揭示,故此處不予深入分析。上述兩個實體之間的關系都是雙向可逆的。

2.3.2 實體與實體屬性值之間的關系

根據“實體-屬性-屬性值”三元組模型,此時屬性充當著關系類型的角色。由于每類實體對應的屬性眾多,因而每類實體本身及其屬性值便可構成關聯網絡的知識節點,實體和實體的屬性值之間的連線即為兩者的關系,三者構成一個基本的知識單元。因此屬性是知識網絡構建過程中的關鍵節點,是不同于實體之間關聯關系的重要紐帶。

標準文獻是最高層級的實體,根據表1,以標準文獻為實體、標準文獻的屬性為例,標準文獻與其屬性的關聯網絡模型如圖1所示。

不同標準文獻實體之間通過相同的屬性值進行關聯,形成共有特性關系。例如:多個標準文獻具有相同的起草人、起草單位、CCS分類號、ICS分類號、主題詞、關鍵詞等,形成同屬性關聯網絡(如圖2所示)。

2.4 關系整合

通過整合標準文獻實體、屬性、關系,得到完整的標準元數據關系表(見表2),其中標準文獻元數據涵蓋了標準文獻的外部特征和內容特征。

3 標準元數據關系應用方向

3.1 加強實體關系抽取技術研究,開展標準知識圖譜應用

標準元數據關聯網絡的構建基礎是標準文獻實體、關聯關系的抽取、建立與維護。定義好標準文獻實體、屬性和關聯關系后,需要通過人工或半人工、自動的抽取方法抽取標準文本中所包含的各類實體關系,并將其映射到知識圖譜的實體關系表達上[8]。對于有清晰規律的標準文獻實體或屬性,比如:標準號、起草單位、采用、代替等,可以采用基于規則的機器標注方法;對于沒有清晰規律的標準文獻實體,比如:標準中技術指標,通常采用有監督的機器學習,通過邀請領域專家對標準對象進行人工標注,后續開展有監督的機器學習模型訓練,并不斷優化完善模型。

3.2 開展標準標簽集構建研究,促進標準文獻知識開發和利用

標準標簽集是描述標準全文內容和元數據,分析標準層次結構和技術要素的工具,通過XML等結構化通用標記語言,定義標準前言、引言、主體等層次以及標準章節條、列項、圖、表、公式等技術要素的標簽和屬性定義,構建通用的標準信息模型[9]。對于PDF格式的標準文獻,通過OCR處理后,提取標準文獻的文本內容,將標準文本內容與標準標簽集進行匹配關聯,可以實現傳統PDF電子文檔轉化為XML格式,進而批量獲取相關實體、關系和屬性[10],實現標準文獻的知識關聯,為后續進一步開發和利用標準文獻奠定基礎。

3.3 開展基于關聯關系的知識鏈接構建研究

知識鏈接是通過知識對象之間特有的屬性和關聯關系,將離散的知識聯系起來的過程[11]。知識關聯是知識鏈接的基礎,在進一步明確不同標準元數據之間的關聯關系后,通過建立知識鏈接,可以構建統一的知識體系結構。標準文獻之間通過作廢代替關系、引用關系、采用關系等形成聯系,也可以通過起草人、起草單位等同一性,或者標準分類、主題、術語等上下位關系、相關關系形成相互滲透、相互作用、相互聯系的知識集合。揭示了知識的關聯關系后,用戶可以通過知識鏈接,最大限度地獲取相關知識,從而實現智能檢索、知識導航、知識服務等目標。

4 結 語

厘清標準元數據的關系是開展標準知識服務的底層支撐。本文的標準元數據是基于標準文獻的共性結構提出,并未包括最核心的標準指標元數據,同時標準元數據之間的相關關系還比較寬泛,還需根據具體問題情境,進一步細分優化。下一步,可以借助信息化手段,建立標準元數據的關聯,實現元數據關系在標準知識服務中的實踐應用。

參考文獻

羅翀, 李菡. 解析RDA中的關系描述[J]. 數字圖書館論壇,2014(06):55-62.

高紅. 書目關系的綜合研究[J]. 圖書情報工作, 2006(09):108-112.

成全, 許爽, 鐘晶晶. 館藏資源元數據語義描述及關聯網絡構建模型研究[J]. 情報理論與實踐, 2015, 38(04):124-129.

成全, 許爽. 館藏資源元數據的關聯網絡結構探析:面向FRBR解構的視角[J]. 圖書情報工作, 2014, 58(12):124-129.

魯嘯, 龔 ,魏晨, 等. 基于E-R模型的情報服務案例庫研究[J]. 情報雜志, 2019, 38(01):36-40+22.

王青. 基于元數據的書目關系擴展研究[J]. 情報雜志, 2012,31(09):92-97.

劉華. 敘詞表國際標準的修訂及其對基于知識組織的術語服務的影響[J]. 圖書情報工作, 2012, 56(22):21-25.

趙偉, 張覽, 望俊成. 標準文獻知識圖譜構建的模型設計與集成方法[J]. 情報工程, 2021, 7(06):58-66.

汪爍, 盧鐵林, 尚羽佳. 機器可讀標準--標準數字化轉型的核心[J]. 標準科學, 2021(S1):6-16.

楊躍翔, 涂新雨, 劉文玲. 標準文獻知識圖譜構建與應用研究[J]. 數字圖書館論壇, 2022(06):22-30.

曾建勛. 知識鏈接的構建方式研究[J]. 圖書情報工作, 2010,54(12):32-35+77.

猜你喜歡
關系
課程與教學的關系與整合
人間(2016年26期)2016-11-03 18:11:51
當代大學生戀愛觀淺析
新常態下高校會計監督與會計服務關系探究
商業會計(2016年15期)2016-10-21 08:25:02
公司治理結構與環境會計信息披露關系實證分析
探究企業財務會計與管理會計的結合
淺論企業文化建設中加強黨建工作的措施及其創新
施工項目管理與項目成本控制關系的分析
保加利亞媒體:飯局是中國搞定“關系”場所
環球時報(2014-06-25)2014-06-25 14:36:51
新西蘭旅游界惡補“關系”開發中國商機
環球時報(2013-09-15)2013-09-15 10:02:41
主站蜘蛛池模板: 91精品国产情侣高潮露脸| av一区二区三区在线观看| 亚洲综合在线最大成人| 国产一级毛片yw| av一区二区三区在线观看 | 免费国产一级 片内射老| 精品国产污污免费网站| 亚洲无码91视频| 国产jizz| 国产精品污污在线观看网站| 性69交片免费看| 国产成人a在线观看视频| 真人高潮娇喘嗯啊在线观看| 亚洲狼网站狼狼鲁亚洲下载| 在线观看国产精美视频| 东京热av无码电影一区二区| 日韩无码黄色| 国产一级一级毛片永久| 亚洲中文字幕av无码区| 国产毛片高清一级国语| 色吊丝av中文字幕| 久久精品无码专区免费| 欧美97色| 狠狠色丁香婷婷综合| 国产在线一区视频| 天堂久久久久久中文字幕| 婷婷五月在线| 亚洲第一av网站| 亚洲中文字幕手机在线第一页| 99这里只有精品免费视频| 国产黄色片在线看| 国产美女人喷水在线观看| 五月婷婷中文字幕| 亚洲精品日产AⅤ| 99久久精品免费看国产免费软件| 伊人久久福利中文字幕| 天天激情综合| 丁香婷婷久久| 久久精品国产999大香线焦| 亚洲乱伦视频| 色婷婷在线播放| 999精品色在线观看| 亚洲综合国产一区二区三区| 精品欧美视频| 久久精品最新免费国产成人| 国产91视频观看| 欧美无专区| 亚洲综合18p| 亚洲 欧美 中文 AⅤ在线视频| 国产在线91在线电影| 一级爆乳无码av| a级毛片免费网站| 亚洲毛片一级带毛片基地| 人妻91无码色偷偷色噜噜噜| 国产手机在线小视频免费观看| 一级片免费网站| 国产经典三级在线| 国产精品成人一区二区| 国产第一页亚洲| 日韩国产黄色网站| 97视频在线观看免费视频| 欧美特黄一级大黄录像| 欧美一级在线| 亚洲一区二区约美女探花| 国产乱人激情H在线观看| 92精品国产自产在线观看| 国产美女自慰在线观看| 亚洲天堂久久| 久久精品只有这里有| 爱做久久久久久| 亚洲日本精品一区二区| 亚洲精品视频免费| 日韩精品亚洲人旧成在线| 国产男女XX00免费观看| 老熟妇喷水一区二区三区| 91热爆在线| 国产最新无码专区在线| 亚洲欧美成人在线视频| 久久综合一个色综合网| 自拍偷拍欧美| 亚洲国产成人精品无码区性色| 色网站在线免费观看|