摘 要:本文通過討論互聯網時代下規范控制的現實意義,分析了語義描述與關聯在人名規范中的應用現狀。分析了關聯集成思路和形成基礎語義描述詞匯集之間的關系,對比中國機讀格式,并以此為例,闡述了其發展的展望和建議。
關鍵詞:規范控制 人名規范 語義描述 關聯探討
現階段的開放性關聯不單單與技術相關,還與開放政策管理有著極為緊密的聯系,需要分步實施,是規范數據依托于自身的開放,與其余規范數據集成操作,從而構成開放網絡數據的組成。實際應當分為以下幾個階段:其一,數據語義描述的規范;其二,和其余規范文檔的互操作,分布式集成或者將VIAF作為中樞;其三,開放規范與書目數據,將其引入同步周期當中,對關聯機制的改造升級有著極大的必要性。其四,集成廣泛互聯網資源,這是較為長遠的目標。本文運用現存規范的著錄規則與機讀格式,設計出中文人名規范數據語義描述詞匯集合。以往規范著錄準則比較注重標目的唯一性與可識別性,并未綜合考量其標目的利用程度,在選擇標目附加成分的過程中會集中體現,包括順序方面的選取。比如,生卒年為首要選擇的附加成分,國別、性別、職業、活動領域如果出現生卒年不詳,亦或是標目重復,可以根據上述順序擇一作為附加成分。這樣一來能夠充分的揭示這一中文人名,使相關應用的開展更為順利。
一、人名規范的語義描述與關聯描述
以往所設計出的機讀規范格式主要目的是對書目進行標準化的檢索。在實際工作當中,國家圖書館對附加成分有著較大的使用力度與范圍,這與文中規范人名予以描述的目標相符。所以,在對規范數據MARC格式子字段與中字段開展語義描述的過程中,詳細語義描述5XX與2XX中的附加成分子字段。
將FRAD和FRBR的實體分層與面向的對象當做重要思想,深入了解人名規范數據關聯集成理念,對現階段人名規范語義表征方式進行研究,結合人名特征,運用RDA第二組元素集、FOAF、OWL、SKOS這一系列詞匯集,在框架RDF之中對人名規范數據語義詞匯進行定義,從而能夠和以往機讀格式進行對比。文中在對語義描述定義的過程中,需要對現存的標準描述詞匯集進行有效利用,在特殊情況當中,需要對已有詞匯進行精細劃分,杜絕新詞匯的出現。以下結合數種詞匯特征,以及它們的實用性,進行深入的研究。
其一,在對個人實體信息進行描述,或者對實體間伙伴關系進行描述的過程中,FOAF能夠發揮有效的作用,能夠對人際關系進行描述。在FOAF規范當中,foaf:name能夠對人姓名進行定義,它的取值運用簡易文本字符來進行定義,與面向對象概念建模觀念有所出入。
其二,SKOS將概念作為中心,能夠合理的區分出詞匯與概念,能夠配合FOAF來規范人名,從而使人名能夠一致化與概念化的連接,對于詞匯語言的別名,能夠采取skos-XL來擴展。
文中采取概念化的方式來定義人名。將名稱規范數據當做整體,運用VIAF本體當中所定義的viaf:authorityScheme當做skos:ConceptScheme的子類。在對人名規范數據進行語義描述的過程中,都具備相應的skos: inScheme。如此,任意語義描述詞匯能夠通過現存的描述規范進行連接,不會導致難以集成關聯數據的情況發生。RDA第二組元素對家族、團體、人名等實體屬性關系進行了一定的描述,能夠直接性的予以采用。
由于人物名稱有著非常復雜的種類,不僅包括藝名、筆名、網絡昵稱、曾用名,我國人名還包括縊名、號、字,并且有著極為龐大的數量。比如,在規范記錄的過程中,魯迅先生就有一百多個別名。現階段社會所存在的人物都有一定的獨特性,一系列的別名也只存在詞匯方面的關聯,不包含對語義關系的定義需求。此外,因為單單意味著同一名任務所擁有的詞匯之一,因此相互之間并不具備直接性的關聯性。所以,文中skosxl:altLabel屬性之下對別名類型進行細分。在SKOS推薦準則當中,并不具備實際的skosxl: labelRelation關系類型,可以使用DC元數據限定詞dcf:description來對該別名類型進行指明。除過關聯化規范數據,還應當實現規范數據對互聯網信息源進行優化,可以通過正反操作來進行實現。
二、建議與展望
對以往機讀規范格式準則與著錄準則進行參考,結合定制擴充對數據語義描述詞匯集合來進行規劃,對人名規范數據語義描述以及開放關聯具備一定的可實施性,也需要為其余規范數據類型提供可以參考的方案,這樣能夠在術語資源庫當中融入更龐大的數據,在今后可以運用更加豐富的術語應用服務。依托于規范數據MARC格式來設計語義詞匯描述,因為世界范圍內在選取附加成分標目的過程中,往往運用簡潔明了的理念,針對責任者的附加信息,往往運用注釋的方式來展現,因此將子字段亦或是子彈當做粒度來轉化語義,勢必會導致部分語義信息出現損失,很難進行相應應用于展示的開展。本文認為,在規范中文人名的過程中,不僅需要對標目的唯一性與可識別性進行綜合的考量,還需要站在客戶利用的層面上進行深入的分析。例如,需要全面的著錄與解釋附加成分,包括學科、職業民族、活動領域、國別、性別等,從而使人名規范的效用得到充分的發揮,這樣也會對相關應用的有效開展提供重要的數據支撐。
參考文獻:
[1] 郝嘉樹,王廣平. 中文人名規范的語義描述與關聯探討[J]. 圖書情報工作,2012,56(14):47-51.
[2] 石燕青. 中文個人人名規范文檔共享研究及語義化探索[D].山西大學,2016.
作者簡介:朱燕(1980~),女,湖北潛江人,博士在讀,講師,研究方向:漢語言文字學。