[分類號]G254
作為書目著錄格式,MARC側(cè)重于可以獨立理解的記錄,聚合了概念作品及其物理載體的信息,并使用字符串作為標(biāo)識符,例如名稱、責(zé)任者、主題等。眾所周知,因與編目規(guī)則的緊密結(jié)合,MARC目前難以被替代。書目描述框架BIBFRAME是以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ)的書目框架,自2012年發(fā)布起,就被定位為取代MARC的新編碼模式。其目標(biāo)首先是支持現(xiàn)有的海量MARC數(shù)據(jù)向BIBFRAME轉(zhuǎn)換,然后再創(chuàng)建新數(shù)據(jù),保證轉(zhuǎn)換數(shù)據(jù)和新建數(shù)據(jù)在Web上實現(xiàn)交換、發(fā)布和共享3。BIBFRAME不是將所有的信息整齊地捆綁為一個“記錄”,或者在多個“記錄”之間重復(fù)信息,BIBFRAME模型的建立很大程度上依賴于資源(作品一作品、作品一實例、作品一機構(gòu))之間的關(guān)系4。可以預(yù)見的是,BIBFRAME對于圖書館而言,將是其進(jìn)入更大數(shù)據(jù)網(wǎng)絡(luò)的切入點。
古籍是歷史的見證,是圖書館藏書的重要組成部分,古籍的裝幀、文字、著作方式、印刷、分類、結(jié)構(gòu)、版本、載體等都和普通圖書有很大的不同。圖書館目前處于向知識服務(wù)轉(zhuǎn)型的過程中,需展開構(gòu)建古籍知識庫并提供知識服務(wù)等相關(guān)研究。隨著近年來數(shù)字圖書館的建設(shè),古籍大多以MARC格式存儲于圖書館中,國家數(shù)字圖書館工程曾推出《國家圖書館古籍元數(shù)據(jù)規(guī)范與著錄規(guī)則》和文化行業(yè)標(biāo)準(zhǔn)(WH/T66-2014)《古籍元數(shù)據(jù)規(guī)范》5,雖然其簡單易用、可擴(kuò)展,且具有互操作性,但是對于古籍不同版本的聯(lián)系和古籍知識的進(jìn)一步描述不夠細(xì)致與規(guī)范。而MARC著錄得較為詳細(xì),一般都會有題名、卷數(shù)、責(zé)任者、版本源流、內(nèi)容附注、分類以及收藏單位等。因此,對于古籍書目數(shù)據(jù),筆者仍用相對繁瑣的MARC來映射BIBFRAME,并選擇BIBFRAME2.0作為基礎(chǔ)框架,對由MARC21轉(zhuǎn)換的RDF描述展開分析,對基于BIBFRAME的古籍書目框架進(jìn)行擴(kuò)展討論。
1古籍MARC與BIBFRAME映射
BIBFRAME詞匯是描述資源的關(guān)鍵,如同MARC格式有一組已定義的元素和屬性,BIBFRAME詞匯表也有一組已定義的類和屬性。一個類標(biāo)識了BIBFRAME資源的一種類型(類似MARC字段),屬性作為一種進(jìn)一步描述BIBFRAME資源的方法(類似MARC的子字段),更具體地標(biāo)識了概念的各個方面。
中文機讀目錄CNMARC與西文機讀目錄MARC21有諸多字段的不同,在古籍的映射和轉(zhuǎn)換過程中,仍需作為參考和借鑒。筆者將書目數(shù)據(jù)中的字符串作為實體對象,根據(jù)映射設(shè)計將MARC中的字段映射到BIBFRAME的類和屬性,同一個類的屬性關(guān)系可能映射到MARC不同功能塊的字段。古籍的定義、名稱、MARC字段與BIBFRAME的類和屬性之間的映射如表1所示。
2 基于BIBFRAME的古籍書目框架討論
2.1古籍書目框架核心類及屬性BIBFRAME2.0核心模型中有三大類:作品、實例、單件,實體關(guān)系為“作品一實例一單件(WII)\"三層模型。但古籍書目框架中類和相關(guān)屬性的提取,以及相互之間的關(guān)系較難確定。夏翠娟等提出了中文古籍書目框架的“作品—版本一單件 + 注釋 + 分類”的‘ 3+2 \"模型,這種模型很好地適應(yīng)了古籍聯(lián)合目錄的內(nèi)容結(jié)構(gòu),方便定義古籍的各概念屬性,且對于某一種作品增加了不同的版本及單件。因篇幅所限,僅簡單列出基于此模型的古籍書目框架的核心類及屬性描述,如表2所示。

古籍書目框架的模型和詞表建立后,對古籍書目MARC進(jìn)行數(shù)據(jù)解析和提取,為實體對象賦予URI并構(gòu)建關(guān)聯(lián)關(guān)系,通過MARC和BIBFRAME相互轉(zhuǎn)換的編輯器,實現(xiàn)古籍書目數(shù)據(jù)RDF的發(fā)布與檢索。BIBFRAME記錄可以由MARC轉(zhuǎn)換而來,通過對MARC格式的數(shù)據(jù)進(jìn)行解析,將“記錄一字段一子字段一值”的結(jié)構(gòu)解析為BIBFRAME\"類一屬性—值\"的結(jié)構(gòu)。

2.2古籍書目MARC格式比較
筆者通過匯文文獻(xiàn)信息服務(wù)系統(tǒng)對古籍《古今文范》進(jìn)行檢索,得到此書的CNMARC和MARC21記錄。對于古籍書目的描述,CNMARC和MARC21的具體字段與子字段大多是不相同的。例如以下幾點:(1)隨著古籍表現(xiàn)形式的變化,CNMARC中200字段的結(jié)構(gòu)形式也是多樣化的,而對應(yīng)MARC21中的245字段,只在第一指示符取“1”,提供題名附加款目。2)CNMARC的205字段有多個子字段注明版本及責(zé)任說明,MARC21的250字段只有“amp;a版本說明”及“ Sb 版本說明其余部分”。(3)CNMARC有305字段著錄版本與書目史,而MARC21都將其放入“500一般性附注”。(4)CNMARC的相關(guān)題名字段有510、512、513、514、515、516、517,分別著錄了并列題名、封面題名、附加題名、卷端題名、逐頁題名、書脊題名等,而MARC21對應(yīng)的只有一個246字段“變異題名”。由上可知,CNMARC較之MARC21,能更好地描述中文古籍書目。
2.3古籍書目BIBFRAME描述
因目前沒有CNMARC與BIBFRAME直接轉(zhuǎn)換的開源工具,筆者選擇美國國會圖書館轉(zhuǎn)換工具(https://id.loc.gov/tools/bibframe/compare-id/full-rdf)對古籍《古今文范》MARC21進(jìn)行BIBFRAME轉(zhuǎn)換。但轉(zhuǎn)換后的RDFXML篇幅太長,故筆者挑選RDF描述的主要部分進(jìn)行分析。
(1)標(biāo)識符說明。
(2)題名、版本、載體與責(zé)任說明。轉(zhuǎn)換后的著錄沿用MARC21里的繁體中文,規(guī)范名用漢語拼音,其中 xml :lang屬性用來定義當(dāng)前作品語種。
(3)附注項說明。古籍刻本有原刻、翻刻、重刻區(qū)別以及官刻、家刻、坊刻等不同,通常都只著錄為刻本,如有需要,在附注項中另外說明。目前國會圖書館的BIBFRAME記錄是將版式、出處、載體形態(tài)及摘要等都放在附注類進(jìn)行描述。
(4)實例及單件的說明,單件描述的是館藏信息。
(5)電子資源說明。
2.4討論
由上可知,在MARC記錄中,字段、子字段的值只是一個字符串,而在BIBFRAME中,是以URI來標(biāo)識每個類的不同屬性,基本格式為“ , RDF文件中盡可能地包括了更多由URI所標(biāo)識的任何資源。其中,BaseURI為域名,如上述RDFXML記錄中的\"http://id.loc.gov/\";Type為書目或規(guī)范記錄類型,如上述RDFXML記錄中的\"vocabulary\"\"resources\";ID作為可以唯一識別記錄的符號[],如上述RDFXML記錄中的“19067078”等。訪問URI可以獲得請求所指定的返回結(jié)果信息,這些用一定格式編碼的結(jié)構(gòu)化信息可被隨時讀取和處理[]。
BIBFRAME的優(yōu)勢在于數(shù)據(jù)被公布、分享在網(wǎng)絡(luò)上,數(shù)據(jù)之間富含語義鏈接,可以實現(xiàn)古籍書目數(shù)據(jù)的關(guān)聯(lián)化發(fā)布,并且“一次編目,全球共享\"[0]。但是古籍的內(nèi)容和外在形式本就紛繁復(fù)雜,需要根據(jù)細(xì)節(jié)研發(fā)出相應(yīng)的規(guī)則與模型。例如,在上述記錄的RDFXML中,對于古籍的描述是在實例中強調(diào)版本,對于版式、校注、源流簡介等都是通過附注類和屬性予以說明。由此可見,由MARC21轉(zhuǎn)化的BIBFRAME未能很好地描述與揭示古籍部分字段的內(nèi)容。因此,以CNMARC編目的古籍書目數(shù)據(jù)如何實現(xiàn)BIBFRAME轉(zhuǎn)化,目前亟需統(tǒng)一的規(guī)則指引和技術(shù)工具的支持。
3結(jié)語
綜上所述,BIBFRAME的出現(xiàn)使書目信息資源具有唯一性和共享性,讓讀者無論何時何地都可以通過互聯(lián)網(wǎng)來引用該作品的書目信息,實現(xiàn)書目聯(lián)合編目系統(tǒng)四通八達(dá)。并且,多年來BIBFRAME一直在不斷更新。例如,美國國會圖書館于2022年6月27日成功舉辦了BIBFRAME研討會,會議上國會圖書館專家深入非拉丁領(lǐng)域,修改并處理了MARC字段存儲的非拉丁文數(shù)據(jù),展開了更多相關(guān)研究[12]。而古籍作為我國書目文獻(xiàn)領(lǐng)域的一個特殊且重要的部分,隨著現(xiàn)代信息技術(shù)的發(fā)展,也應(yīng)跟上BIBFRAME的步伐,實現(xiàn)其特色文獻(xiàn)的語義揭示,并在網(wǎng)絡(luò)中被關(guān)聯(lián)和使用。
參考文獻(xiàn):
[1]朱美華.關(guān)聯(lián)數(shù)據(jù)時代的BIBFRAME2.O[J].數(shù)字圖書館論壇,2018(3):47-52.
[2] 朱華,歐陽寧.BIBFRAME2.0變化的微觀研究[J].新世紀(jì)圖書館,2022(1):37-41.
[3] Bona.BIBFRAME是什么?[EB/OL].[2023-05-27].https://zhuanlan.zhihu.com/p/337575385.
[4]武妹含.基于BIBFRAME的中文書目數(shù)據(jù)語義化研究[D].保定:河北大學(xué),2017.
[5]葛紅梅,徐晶晶.基于DC的古籍元數(shù)據(jù)評述[J].蘭臺世界,2015(26):33-34.
[6]夏翠娟,許磊.中文關(guān)聯(lián)書目數(shù)據(jù)發(fā)布方案研究[J].數(shù)字圖書館論壇,2018(1):8-16.
[7]劉江榮,肖明.基于書目框架(BIBFRAME)的書信本體構(gòu)建研究[J].圖書館實踐與理論,2020(5):61-66.
[8]夏翠娟,林海青,劉煒.面向循證實踐的中文古籍?dāng)?shù)據(jù)模型研究與設(shè)計[J].中國圖書館學(xué)報,2017(6):16-34.
[9]楊靜,楊崢,蔣蓓蓓.BIBFRAME2.0的模型特點及其未來應(yīng)用場景展望[J].圖書館研究與工作,2022(8):41-46.
[10]吳桐.中文CNMARC書目數(shù)據(jù)BIBFRAME化研究[D].武漢:華中師范大學(xué),2018.
[11] 夏翠娟.面向語義網(wǎng)的書目框架(BIBFRAME):功能需求及實現(xiàn)[J].大學(xué)圖書館學(xué)報,2014(6):61-69.
[12]Library of Congress.BIBFRAME June 2O22 Update Fo-rum [EB/OL].[2023-06-01].https://www.loc.gov/bib-frame/news/bibframe-update-an2o22.html.
王軍男,1980年生。博士,副教授,副院長。研究方向:大數(shù)據(jù)分析。
歐陽寧女,1980年生。碩士,副研究館員。研究方向:數(shù)字圖書館。
(收稿日期:2023-11-16;責(zé)編:鄧鈺。)