999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中文名稱規范文檔與VIAF共享問題分析

2018-03-19 17:21:35胡媛
河南圖書館學刊 2018年2期

胡媛

關鍵詞:中文名稱規范文檔;VIAF;共享

摘要:在信息技術不斷發展的過程中,我國圖書館對規范控制也從以往的獨立模式慢慢轉向合作模式。因為不同國家之間的圖書館規范文檔在形式方面存在較大差異,因此,實現不同成員庫信息資源共享逐漸成為協作規范控制工作的重要內容。文章通過構建中心式模型,對我國不同成員館數據庫中規范文檔進行整合,并且探討了中文名稱規范文檔與VIAF共享的方式,以期為中文名稱規范文檔與VIAF共享工作提供一定幫助。

中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2018)02-0111-03

1背景

在互聯網技術不斷發展的過程中,網絡逐漸滲透到人們生活中的各個領域,也使規范文檔擁有更為廣泛的來源,且規范文檔種類不斷增加。規范文檔儲存于各個機構之中,而且各個機構所擁有的資源既存在一定重復,又有一定差別,其所采用的數據組織形式同樣存在一定差異,導致大量且分散的異構數據很難得到利用,也在很大程度上影響到名稱規范文檔的進一步發展。基于用戶需求而言,現階段互聯網的現有組織形式無法滿足用戶逐漸深化的數據需求。在數字化環境下,圖書館的信息資源除了包含大量紙質信息資源,數字信息資源所占的比例不斷增加,互聯網信息數據的數量呈幾何式增長。而對于信息資源急劇增加的問題,各機構應當采取一定的方法,對不同機構相對分散的信息資源進行整合,確保目前名稱規范所包含的信息更加豐富,從而可以更加準確地對同名記錄加以區分,而且還能對不同的對象所對應的同一資源加以集中,確保用戶在信息資源檢索過程中能夠更加快速、準確以及便捷,有效地提升查全率[1]。不同機構應構建相應的共享機制,可以對相關主題信息資源進行整合處理,從而顯著降低冗余信息數量,為用戶提供更加清晰和全面的信息結構。

2影響中文名稱規范文檔與VIAF共享的要素

2.1編目規則

不同機構會結合自身情況編制出相應的編目規則,作為編目過程中的參考標準,各個機構依照制定的相應標準,將相關信息資源通過規范方法完成著錄工作。不同編目機構采用的著錄規則存在較大差異,而且著錄規則相對較多,不同的著錄規則之間也存在一定差異。著錄規則主要包含AACR2、西文文獻著錄條例、中文文獻編目規則、FRBR、FRAD、ICP及RDA等。現階段,國際上不同組織與機構之間已開展廣泛合作,而且不少組織及機構開始在其所使用的規范文檔里添加一些中文字段,極大地促進了中文名稱規范文檔共享范圍的進一步擴大。然而,還有很多地區的編目組織及機構在開展著錄工作時采用的規則有所差異,其中包含的中文字段具體位置以及對應功能均有所不同,導致在信息資源共享的過程中存在較大阻礙。對于著錄款目工作而言,《中國文獻編目規則》將主要的款目全部取消,目前我國目錄體系里的一些書名信息、著錄信息以及主題信息等還處于分離狀態,而且不同款目信息間也不存在主要、次要的區別。但是,在AACR2以及《西文文獻著錄條例》之中,由于西歐各國存在一些多款目字典式目錄,且一直沿襲自己的編目習慣,現在依舊保留了主要款目。在進行著錄過程中,AACR2相關要求更為嚴格,其中替代順序以及優先級別等均有非常嚴格的規定,能夠確保開展著錄工作時更加精準。而由于我國圖書版權頁面里含有相對多的信息,《中國文獻編目規則》把圖書的版權頁面以及書名頁面并列作為編目工作的信息來源,但是沒有將二者所對應的優先順序加以說明。而從表目的具體形式來看,二者均含有主體信息以及附加信息,但是各個國家在進行名稱的表達方面有著一定差異,特別是在附加信息之中,更是存在相對大的不同[2]。

2.2數據元素

與名稱實體存在一定的關聯性,除去名稱實體所對應名稱之外的一些信息均稱為數據元素,FRAD將數據元素認定為名稱實體所對應的屬性。當記錄信息達到相應規模以后,便會產生非常多的同名實體記錄,而用戶在進行信息檢索的過程中就容易產生混淆。在名稱主體的標目信息中,數據元素是極其關鍵的內容,進行信息匹配時一般將其當作名稱附加信息,以確保各個名稱主體能夠被更為準確地區分開來。通常,數據元素包含兩種類別,一是性別信息、生卒信息、民族信息及籍貫信息等,二是學科信息、專長信息以及職業信息等,前者屬于名稱主體所對應的自然屬性,而后者屬于名稱主體所對應的社會屬性。現階段,在進行附加信息的選擇過程中不論采取何種方式,都不能構建出統一的標準,但是人們逐漸形成了一個共識,即將生卒信息當作最主要的匹配信息,要是不能獲取到生卒信息,或是生卒信息較難確認時,則再考慮采用其他信息作為主要匹配信息[3]。在具體的應用過程中,我國的國家圖書館以及CALIS一般采取加入關鍵詞或者是加入學科信息的方式,對相同人物名稱加以區分,如張三(化工)、張三(酒店管理)等。不過,采用這種形式對不同人的名稱進行區分的過程中同樣會產生兩個問題:第一,在選用區分信息的過程中主要受到人為因素影響,而且大部分區分信息都是編目人員通過推斷獲得的,相關信息表述無法達到非常精確的要求,使相同領域中一些相似的學科極易出現混淆。第二,即使加入區分信息,在一些情況下也無法確定名稱主體的具體身份,這樣極易導致數目信息發生連接錯誤的問題,同時還會導致用戶在信息檢索過程中更加困難。對于相同名稱的不同人物進行區分的過程中,數據元素選擇是極為重要的,其會在很大程度上影響名稱規范文檔的質量。不過,現階段數據元素相關規范依舊存在一定的不足,各機構應當不斷加以完善。

3中文名稱規范文檔與VIAF的共享

VIAF將各個國家權威的文檔進行匹配以及連接,同時把不同類型的文檔加以分組處理,產生對相同實體進行描述的記錄合集,并且將這一合集當作相應實體的權威記錄,其中含有該實體存在一定差異性的各種名稱信息。現階段,我國在數據源規范方面擁有一定的基礎條件,國家圖書館規范數據庫的相關記錄在近幾年得到了極大的增長,同時能夠實現信息的共享,也為中文名稱規范文檔和VIAF實現數據共享創造了條件。而要想實現和VIAF之間的信息共享,需要對中文名稱文檔進行規范,構建信息更為全面以及規范的文檔數據庫。

3.1中文名稱規范文檔的構建

在中文名稱規范工作方面,我國內地和臺灣地區還沒有建立統一標準。2000年,由國家圖書館、HKCAN、CALIS以及臺灣漢學研究中心共同構建了中文名稱規范數據庫,不過其所應用的具體模式仍然是不同機構獨立構建數據庫,借助于網絡平臺實現信息共享,該方式屬于較為簡便的分布式信息共享模式。不同機構進行信息的收集以及數據庫建設已經趨于成熟,但不同機構間的互聯性相對較差,具體使用的格式以及規范都有一定差異,僅采取數據匹配的方法容易導致查全率偏低等問題的產生。同時,不同機構在進行信息更新時未能同步完成,所以,當采用分布式信息共享模式時,怎樣確保信息成果得到更好地共享還有待進行深入研究。

3.1.1模型構建。由于我國圖書館領域不同機構在進行數據庫建設過程中基本上都是獨立建庫,因此我國需要構建相應的機制,確保不同機構之間可以實現信息共享。目前,中文名稱規范數據庫能夠完成聯機查詢工作,但在信息交互過程中仍然存在一些問題。筆者采用中心式模型,構建基于客戶機/服務器的多館中心鏈接,構建相應的中心數據庫,而成員庫包含我國各個名稱規范庫,具體模型見圖1。用戶在進行信息檢索的過程中,得到的結果為不同數據庫間的數據整合信息。構建完整且系統的中心數據庫,將不同機構中的數據庫進行鏈接,數據信息的描述內容含有簡體、繁體、英文以及拼音等不同形式,各個成員庫只是從中心庫讀取相關數據信息,但不能修改中心庫的數據信息。當用戶需要進行信息檢索時,無論采取哪種方式都可以檢索到中心數據庫包含的信息,確保實現信息資源的共享。而不同成員庫可以對機構內部數據庫加以修改,并且修改行為可以實時體現在中心庫。

3.1.2名稱標目以及功能字段。由于各個機構所采用的標目選用規則有所差異,因此,采取更為適宜的標目以及功能字段,可以確保用戶在信息檢索過程中擁有更高的查全率以及查準率。依照名稱規范記錄具體狀況,同時參照各個機構的名稱規范文檔,筆者得出完整的名稱規范文檔應當包含的信息(見圖2)。在標目選擇過程中,各個機構因為自身的編

目背景以及文化的不同,采用的原則同樣有所差異。例如,北京大學圖書館在進行標目的選擇過程中,會將《辭海》里所包含的名稱當作規范標目優先選用,或是將具有較高權威性的工具書里的翻譯姓名當作標目。而香港地區基本上都是根據國外的數據源進行套錄,并且在這一過程中盡可能維持源數據不變。因此,在規范標目的選取過程中,各機構要盡可能采用人們知曉的名稱作為標目。規范標目包含的內容包括個人名稱以及附加成分,其中附加成分通常含有個人生卒信息、性別信息以及民族信息等。由于生卒信息以及性別信息等均為個人的自然屬性信息,因此其擁有更高的穩定性以及精確性。在附加信息中,通常采用的附加信息均為個人自然屬性信息,如VIAF中魯迅的個人名稱規范標目是“100$alu,Xun,$d1881-1936”。

3.2完成與VIAF的共享

VIAF屬于一種虛擬文檔,而完整的文檔依舊儲存于不同成員庫中,同時各個成員庫之間形成相互鏈接,一些權威數據經由OAI協定,利用服務器設備在不同的成員庫之中抽取相關數據并完成數據的匹配。在構建中文名稱規范文檔之后,各機構應當接著完成與VIAF的共享工作。VIAF能夠為所有的實體分配所對應的ID,如VIAF為李白所分配的ID為108725426,不同文章中的實體利用特定ID進行鏈接。OCLC提供能夠讓用戶進行下載的數據集合,大部分信息結構屬于聚類結構形式,聚類信息集合本質上屬于中樞—發散式模型,中心為一個個人名、地名等,采用發散方式與VIAF成員庫中對應的概念資源進行鏈接,在鏈接時可以利用FOAF(Friend-of-a-Friend)詞匯表中的foaf:focus。不同的成員館都會采用各自的方式對名稱實體加以描繪,而且所有的記錄均指向VIAF中所包含的唯一的URI。

4結語

在規范控制領域中,中文名稱規范控制是極為重要的內容,而只有對我國目前所擁有的名稱規范數據進行整合才能確保有效地控制名稱規范,才能為中文名稱規范文檔與VIAF共享提供可靠的基礎保障。

參考文獻:

[1]陳辰,王璐,郝曉雪,等.語義化人名規范文檔建設探索[J].圖書館論壇,2017(10):1-6.

[2]王瑞云,賈君枝.中文個人名稱規范記錄的實體匹配與聚簇[J].國家圖書館學刊,2017(2):79-86.

[3]崔春,畢強.虛擬國際規范文檔(VIAF)項目進展[J].圖書情報工作,2014(6):129-134.

(編校:崔萌)

主站蜘蛛池模板: 99热这里只有成人精品国产| 天天综合网亚洲网站| 欧美亚洲欧美区| 午夜欧美在线| 国产精品丝袜视频| 呦系列视频一区二区三区| 午夜毛片免费观看视频 | 无码高潮喷水专区久久| 国产精品人成在线播放| 日韩欧美中文字幕在线韩免费| 色婷婷在线播放| 国产精品亚洲va在线观看| 午夜免费视频网站| 99精品免费在线| 国产成人AV男人的天堂| 日本精品αv中文字幕| 亚洲成在线观看| 久久亚洲美女精品国产精品| 亚洲AⅤ波多系列中文字幕| 999精品色在线观看| AV熟女乱| 精品国产自| 亚洲成a人片| 日本高清有码人妻| 亚洲AV无码乱码在线观看裸奔| 久久久久国产一级毛片高清板| 国产乱子精品一区二区在线观看| 国产女人水多毛片18| 午夜a视频| 成人免费一区二区三区| 国产丰满大乳无码免费播放| 毛片a级毛片免费观看免下载| 亚洲欧美不卡| 国产一级做美女做受视频| 亚洲黄网视频| 香蕉久久国产超碰青草| 97国内精品久久久久不卡| 国产成人免费手机在线观看视频 | 99在线视频精品| 午夜日b视频| 色综合五月婷婷| 成人在线天堂| 成人国产精品网站在线看| 欧美亚洲一区二区三区导航| 永久成人无码激情视频免费| 黄色网址免费在线| 97超碰精品成人国产| 91福利免费视频| 国产成人亚洲欧美激情| 亚洲黄色成人| 日本免费新一区视频| 91破解版在线亚洲| www中文字幕在线观看| 无遮挡国产高潮视频免费观看| 婷婷午夜天| 日韩中文无码av超清| 三区在线视频| 免费无码AV片在线观看国产| 国产毛片不卡| 在线看AV天堂| 国产99精品久久| 日韩精品一区二区三区swag| 亚洲视频免| 国语少妇高潮| 毛片免费试看| h视频在线观看网站| 毛片免费观看视频| 中日韩欧亚无码视频| 久久亚洲综合伊人| 亚洲第一精品福利| 欧美日韩在线成人| 中文字幕在线观| 亚洲第一精品福利| 久久伊人久久亚洲综合| 精品国产www| 色偷偷一区二区三区| 99久久国产自偷自偷免费一区| 少妇露出福利视频| 国产精品原创不卡在线| 久久久久久久久亚洲精品| 欧美翘臀一区二区三区| 韩日午夜在线资源一区二区|