


摘 要:文章對Marva編輯器進行研究,介紹其產生的時代背景,并從編輯器特點出發,深入闡釋其對于BIBFRAME進入實施階段的重要意義,以期為我國編目工作從MARC過渡到BIBFRAME提供參考借鑒。
關鍵詞:BIBFRAME;Marva編輯器;編目;實施測試
中圖分類號:G254.362文獻標識碼:A 文章編號:1003-7136(2023)06-0063-07
A Cataloging System for the BIBFRAME Era:A Preliminary Inquiry into Marva Editor
YANG Enyi
Abstract:This paper researches on Marva editor, introduces the background of its production, and from the characteristics of the editor, explains its significance to the implementation stage of BIBFRAME, in order to provide reference for the transition of China′s cataloging work from MARC to BIBFRAME.
Keywords:BIBFRAME;Marva editor;cataloging;implementation test
0 引言
進入數字時代以來,統治編目世界長達50多年的機讀目錄格式(Machine Readable Catalog,以下簡稱:MARC)越發不適應新時期元數據工作的需求。2008年,美國國會圖書館(Library of Congress,以下簡稱:LC)在報告中提出,MARC格式已經過時,圖書館需要一個新的目錄格式,以適應新的環境[1]。在此背景下,2011年5月,LC發起“書目框架行動”,以期轉變現有觀念,重新設計一個以網絡為中心、隨時隨地相互關聯的全新書目環境[2],BIBFRAME由此誕生。2013年,BIBFRAME 1.0本體和模型發布,采用資源描述框架(Resource Description Framework,以下簡稱:RDF),定義了作品(creative work)、實例(instance)、規范(authority)和注釋(annotation)四個核心類。2016年,LC發布BIBFRAME 2.0本體,將核心類精簡為三個:作品、實例和單件(item),進一步解決了與IFLA圖書館參考模型(IFLA Library Reference Model,以下簡稱:IFLA LRM)和《資源描述與檢索》(Resource Description and Access,以下簡稱:RDA)的兼容問題[3],同時對類和屬性進行了大幅調整,從1.0模型中的53個類,289個屬性,變為2.0模型中的186個類,197個屬性。2021年6月,LC發布BIBFRAME 2.1本體[4],新增“聚合器”(hub)等7個類,屬性增加至209個。
伴隨著BIBFRAME的研發和更新,BIBFRAME的應用測試工作也同步開展。2015年9月至2016年3月,LC開始對BIBFRAME實施測試,即BIBFRAME先導計劃第一階段。在這一階段,共有44名LC編目員參與測試,采用BIBFRAME 1.0詞表,使用1.0版BIBFRAME編輯器(BIBFRAME Editor,以下簡稱:BFE),測試人員同時創建MARC 21和BIBFRAME兩種格式的記錄[5]。2017年6月,在總結第一階段成果和經驗的基礎上,先導計劃進入第二階段,并一直持續至今。此階段一開始參與測試的編目員有60名,2019年6月之后增加到120名,同時吸納了LC的海外辦事處參與[6]。在這一階段,LC已完成了MARC數據向BIBFRAME的轉換。2018年,LC已經將1800萬條MARC記錄和120萬條名稱—題名或統一題名記錄轉換為1900萬作品記錄、2400萬實例記錄、2260萬單件記錄,編目員可以在與實際工作場景基本無異的環境中進行測試[7]。與此同時,BIBFRAME的推廣也取得可喜進展。根據LC網站上的應用注冊信息[8],目前已有17家機構參與了BIBFRAME的測試和實施,參與范圍已超出北美地區,尤其是得到了歐洲圖書館的積極響應。
編輯器對BIBFRAME的實施至關重要,LC先導計劃的目標之一便是對編輯器進行測試、評估、升級。在第一階段結束后,編目員對BFE提出了諸多建議。進入第二階段,LC為進一步推動測試工作,滿足先導計劃愈加龐大的參與者群體的需求和推進BIBFRAME 100計劃的需要,于2019年底至2020年初,同SAMHNG公司建立合作關系,讓該公司與參與先導計劃的LC編目員進行深入合作,開發新一代BIBFRAME編輯器[9]。
新一代編輯器的開發工作于2020年年中正式開始;2021年年中,編輯器開始試運行[8];10月,LC員工投票為新一代編輯器選定了名字“Marva”,以紀念亨麗埃特·阿夫拉姆(Henriette D.Avram, 1919—2006),她在20世紀60至70年代領導了LC的MARC開發工作,被稱為“MARC之母”。Marva是Avram的鏡像單詞,象征著阿夫拉姆在編目界經久不衰的影響力[10],也體現了MARC和BIBFRAME一脈相承的關系。試運行開始后,開發者根據實際工作的需求,一直對Marva進行調試、穩定化和開發新特性的工作。目前,Marva已更新至0.12.0版本。
Marva的前端基于瀏覽器構建,對互聯網用戶開放,任何人都可通過“https://bibframe.org/marva/editor/”訪問和試用,數據暫時存儲于LC本館服務器之上。同上一代BFE一樣,Marva仍然以配置文件為基礎[8],為編目員提供根據資源類型劃分的模板功能。但相比之下,Marva更加易用且美觀,各項功能的集成度更高,信息的展示更加合理,更符合編目工作的實際需求。本文試從Marva的使用入手,闡述該編輯器的特點,從中分析其在BIBFRAME實施和未來編目工作轉型中的意義,以期為我國今后的BIBFRAME實施工作提供借鑒。
面向BIBFRAME時代的編目系統:Marva編輯器初探1 Marva編輯器的特點Marva構建的初衷是為了更好地實現BIBIFRA-ME,因此,在設計中徹底貫徹了BIBFRAME 2.0模型的思想,呈現出編目內容元素化、編目對象層次化、書目數據關聯化的特點。
1.1 編目內容元素化
相比于Aleph等傳統的圖書館信息系統編目模塊,Marva最直觀的差別在于字段的“消失”,編目員面對的不再是字段、子字段,取而代之的是以表單形式呈現的“元素”。這實際上反映了MARC時代和BIBFRAME時代對數據形式的不同層次的要求。
字段是MARC時代局限性的產物。MARC誕生于20世紀60年代,遠在互聯網出現之前,其設計初衷是讓機器能夠“讀取”原本存在于卡片目錄之上的信息,而并非讓機器“理解”這些信息。因此,MARC設置不同的字段作為“路標”,指引機器讀取存放在字段標識符之后的數據。用數字和字母替代文字,標識字段和子字段的意義,則是為了節約當時十分昂貴的儲存空間。這樣的設計邏輯顯然已不適應當前對信息揭示和數據關聯的要求。
元素則是BIBFRAME的必然要求。在互聯網時代,要滿足圖書館界對書目數據的需求,就需要實現從“機器可讀”到“機器可理解”的跨越。為實現這一目標,BIBFRAME采用了關聯數據的標準框架,即RDF的主語、謂詞和賓語三元組。RDF在客觀上把一份完整的書目信息分割為多條陳述句,每一條陳述句對應一項書目信息的內容,比如“實例X的正題名是YYYY”“作品Z的主題是AAAA”等。因此,將編目內容轉變為元素,填充至這些陳述句或三元組中,是最適合RDF架構的形式。
Marva充分落實了這一理論框架,將RDF陳述句轉變成表單形式,其中主語和謂詞由系統模板確定,賓語則由編目員補充。以與作品相關的行為者為例,按照RDA規則,編目員需要記錄與作品相關的行為者名稱和行為者與作品的具體關系[11]。Marva根據資源的具體形式,通過模板將“與作品相關的行為者”具體化為“創建者”,并以表單形式呈現,如圖1。編目員通過搜索相關受控詞表(LC名稱規范文件和LC關聯數據服務中的關系說明語),選擇正確的形式,即完成了兩項元素的記錄。
1.2 編目對象層次化
層次化是Marva與其他傳統編目系統的另一個重大區別。自《書目記錄的功能需求》(Functional Requirements for Bibliographic Records,FRBR)誕生以來,編目界就一直在探索書目記錄的分層揭示。但在AACR2和MARC時代,編目規則和格式標準主要針對載體表現層資源,缺少對作品和內容表達層實體屬性和關系的宏觀揭示[12],MARC也只是把各項元素以事先確定的單層結構簡單地羅列出來[13],無法完美地支持層次化的信息展示。
Marva則在視覺和邏輯上忠實呈現了BIBFRAME 2.0的作品—實例—單件三層模型。在Marva的編目實踐中,編目員一般需要為編目對象依次建立作品層、實例層和單件層的記錄。在編目過程中,每個層級相關的元素劃分清晰,并用顯著不同的顏色和圖標進行區分,各層級在工作流中所處的位置也有明顯的區別,編制完成后的完整記錄同樣用不同顏色加以區別,層次分明。對于已存在作品層記錄的實例,比如同一作品的不同版本,編目員只需在作品之下新建實例記錄;對于復本的操作也類似,只需在實例之下創建新的單冊記錄。同樣的書目數據,在Marva中呈現的效果與在MARC中迥然不同。以Gilbert B所著的A Personalist Philosophy of History為例,其書目信息在MARC和Marva中的顯示效果分別如圖2和圖3所示(因Marva完整記錄較長,為顯示方便,僅截取局部以供展示之用)。可以看到,原本混雜在MARC記錄各種位置的不同層級的元素,在Marva中得到了結構化的三層顯示。
層級化的顯示方式實現了不同層級資源的聚合化,這是打造新一代發現系統的根本,也是實現IFLA LRM中“探索”用戶任務的基礎。“探索”是IFLA LRM定義的五個用戶任務中較為特殊的一個,是“最具開放性的”,能夠讓用戶在不同的資源實體間“建立意想不到的聯系”[14]。層級化的顯示將下層實體的不同實例聚合到同一上層實體之下,為用戶在查找和選擇時提供了更加多元的可能性,其中有的實例可能是用戶事先并不知曉的,由此便可以為用戶提供意想不到的聯系。比如,用戶在搜索“紅樓夢”時,可能只會想到紙質版圖書,但通過層級化顯示的搜索結果可以將《紅樓夢》的各種形式資源都聚合在一起,其中既包括常見的各類印本圖書,也可能包括以DVD為載體的電視劇、京劇,或以在線資源為載體的有聲書等,由此便讓用戶有了意外的發現。此外,BIBFRAME 2.1本體發布之后,新增的“聚合器”核心類也在Marva中得到了體現。聚合器是一種抽象資源,充當兩個作品之間的橋梁[15],Marva為其提供了單獨的記錄創建入口和模板,同樣用不同的顏色和圖標進行區分,由此形成了聚合器—作品—實例—單件四個層次。在LC的實驗中,聚合器可執行三個功能:作為主題、作為相關作品以及作為RDA意義上的作品[14]。通過聚合器,用戶既可以搜索到感興趣作品的評論作品,還能發現同一作品的不同語言版本和同一語種下的不同版本。因此,聚合器的引入讓作品層實體之間的聯系更為密切和多元,對探索任務的支持也更加完備。
1.3 書目數據關聯化
用Marva編制的書目數據本身就是關聯數據,這是通過Marva的后端,即RDF/XML語言實現的。對于內部數據,Marva會為每個資源實體賦予URI,作品、實例、單件三者通過“有實例”(hasInstance)和“有單件”(hasItem)的關系相關聯,而每個實體的屬性,比如作品的題名、實例的尺寸、單件的排架地等,則通過注釋信息表達。同時,Marva也與外部數據,主要是LC發布的關聯數據服務相關聯,以建立資源實體與其他實體之間的關系,這些實體同樣也具有URI。比如,前文所舉例子中的創建者Gilbert B屬于BIBFRAME LC拓展本體中的“首要責任者”類,關系術語由LC關系說明語“author”確定,于是,Gilbert B本人便與例子中的作品層實體產生了“是……的作者”關系,而Bennett Gilbert本人的名稱形式則由LC名稱規范文件確定,其本人與所選的名稱形式(Gilbert, Bennett Bruce, 1952—)為“有命名”的關系。
在數據關聯的基礎之上,Marva還實現了數據的集成化。對于鏈接到外部關聯數據的元素,Marva提供了一站式信息顯示。例如,當編目員需要查詢LC名稱規范文件或LC主題規范數據時,Marva就會自動跳轉顯示界面,顯示查詢選項的具體信息,編目員據此進行篩選判斷,如圖4和圖5所示。整個操作無需跳轉到其他數據庫,也無需手動切換界面。
2 Marva編輯器對實施BIBFRAME的意義
2.1 Marva是BIBFRAME走向成熟的標志
在Marva試運行后不久,2021年9月,LC在歐洲BIBFRAME研討會上宣布“BIBFRAME 100”計劃,即100%的編目員每周5天只用BIBFRAME編目,不再同時創建MARC記錄,并列舉了實現這一計劃的前置條件,其中就包括“一個新的編輯器”[16]。這說明,Marva的功能性和穩定性已足夠保證一定數量的編目員穩定、大規模地創建BIBFRAME數據,Marva實際上已成為LC推動BIBFRAME測試和實施工作的強有力保障。
反過來看,Marva的穩定運行也是以多方面準備工作為基礎的。在Marva試運行之前,LC就已經進行了近五年的BIBFRAME測試,積累了足夠的第一手反饋信息,這為Marva的開發提供了寶貴的經驗。此外,MARC數據向BIBFRAME數據的大規模轉化工作、LC開放關聯數據的拓展、軟件平臺和數據庫的開發和升級,都是Marva從“能用”變得“好用”的關鍵??梢哉f,Marva的成熟是BIBFRAME系統性努力的成果,標志著BIBFRAME真正跨入了應用的階段。
2.2 Marva預示了編目員工作的轉型
Marva為我們窺探下一代編目工作提供了一扇窗口。從Marva的設計邏輯和呈現風格可以看出,編目員的工作性質和內容同MARC時代相比已發生了很大變化,編目員需要實現從記憶式的編目向理解式的元數據創建的跨越。
一方面,元素化的編目方式卸下了編目員的記憶負擔,讓編目員更加關注編目內容本身。在MARC時代,編目員需要機械地記憶大量字段、子字段、指示符、分隔符的意義和用法,這無疑是編目員巨大的記憶負擔。編目員時常需要停下來查詢各種字段和子字段的用法,這就阻礙了編目工作流暢地進行。Marva將編目內容元素化之后,編目員無需機械記憶三個數字一組的字段;同時,借助關聯數據的一體化,編目員也無需記憶額外的受控詞表,只需在系統提供的選項中進行甄別選擇。編目員可以將注意力完全集中于元內容的創建和對資源信息的揭示。今后,編目員需要面對的問題更多的是這個元素如何記錄,而不是這個信息應該放在哪個字段。
另一方面,編目員需對指導元數據創建的各項規則有更深入的了解和全景式的理解。Marva的元素化和層次化編目方式意味著書目數據的粒度更細,結構化程度更高,無形當中要求編目員對指導元數據創建的各種規則有更深入的了解。比如,在記錄行為者和資源實體之間的關系時,編目員需要對不同層級的資源實體所對應的責任關系有充分的了解,對關系說明語有較為全面的認識,這樣才能做出準確的判斷。
2.3 Marva為我國實施BIBFRAME提供了借鑒
Marva的開發和應用對我國實施BIBFRAME是一個很好的借鑒,既指明了未來BIBFRAME實施的趨勢,更點明了我國實施BIBFRAME所面臨的挑戰。
第一,編輯器是BIBFRAME實施之本,前期的測試也都會圍繞編輯器展開。編目員上手創建BIBFRAME數據的入口必然是一個功能完善、系統穩定的編輯器。Marva是LC長期測試、更新、改進的結果,滿足的是LC編目工作的要求。無獨有偶,由斯坦福大學等美國6所研究型大學主導的關聯數據項目LD4P在進入第二階段后也開發了自己的編輯器Sinopia[17],這說明,編輯器需要按需定制。而鑒于我國復雜的編目環境,單純的拿來主義可能與我國的編目環境并不契合,實施BIBFRAME需開發適合我國編目環境的編輯器。
第二,BIBFRAME的實施需要跨部門、跨機構的合作,實施BIBFRAME需建立跨部門協調機制。LC的經驗表明,BIBFRAME的測試并非只是編目部門的工作,還需要技術部門等多部門的協作。測試環境的搭建、數據庫的維護、編輯器的開發、歷史數據的轉換等工作都是跨部門甚至跨機構合作的結果。從LC的實踐來看,參與BIBFRAME測試的除了與編目直接相關的部門外,還包括網絡開發與標準辦公室,動態圖像、廣播與錄音部,政策、培訓與合作項目部,甚至還包括LC在海外的辦事處等。BIBFRAME在我國的落地實施自然也需要各方的協作和聯動。
第三,BIBFRAME的實施需要大量的培訓工作。由BIBFRAME帶來的,通過Marva展現出來的編目工作轉型需要編目員徹底轉變思路,這種轉變是一個漸進過程。編目員自身需要主動適應變化,但更重要的是圖書館界需要向編目員提供扎實有效的培訓。此外,BIBFRAME作為數據模型,雖然理論上獨立于任何內容規則,但國際上應用BIBFRAME的實例幾乎采用的都是RDA。因此,從融入國際圖書館社群,復用國外已創建好的BIBFRAME數據的角度來看,在我國實施BIBFRAME也意味著同步實施RDA。所以,培訓工作要涵蓋數據格式和元數據內容規則兩方面。實際上,LC參與先導項目的編目員都事先經過了BIBFRAME和RDA培訓,對BIBFRAME模型和RDA規則都有相當程度的掌握。我國在實施BIBFRAME前的培訓將是一項系統性工程,涉及培訓材料的編寫、師資隊伍的建設、人員時間的協調等諸多方面。
參考文獻:
[1]Working Group on the Future of Bibliographic Control.On the record:report of the library of congress working group on the future of bibliographic control[R/OL].[2022-09-22].https://www.loc.gov/bibliographic-future/news/lcwg-ontherecord-jan08-final.pdf.
[2]Library of Congress.Bibliographic framework as a web of data:linked data model and supporting services[R/OL].[2022-09-16].https://www.loc.gov/bibframe/pdf/mar cld-report-11-21-2012.pdf.
[3]王景俠.書目格式的關聯數據化發展及其啟示:從MARC 到BIBFRAME[J].圖書館雜志,2016,35(9):50-56.
[4]編目精靈.BIBFRAME本體2.1版發布(4層確認)[EB/OL].[2022-09-18].https://catwizard.net/posts/20210 625164233.html.
[5]BIBFRAME pilot(phase one—Sept.8,2015-March 31,2016):report and assessment[EB/OL].[2022-09-19].https://www.loc.gov/bibframe/docs/pdf/bibframe-pilot-phase1-analysis.pdf.
[6]BIBFRAME training at the Library of Congress[EB/OL].[2022-09-18].https://www.loc.gov/catworkshop/bibf rame/.
[7]MORRIS S R.BIBFRAME:the way forward at the Library of Congress[J].IFLA metadata newsletter,2018,4(1):15-18.
[8]Library of Congress.BIBFRAME 2.0 implementation register[EB/OL].[2022-08-29].https://www.loc.gov/bibf rame/implementation/register.html.
[9]Tale of two editors:sinopia[EB/OL].[2022-09-11].htt ps://www.casalini.it/bfwe2021/web_content/2021/prese ntations/nelson_miller.pdf.
[10]MORRIS S R.News from the Library of Congress[J].IFLA metadata newsletter,2021,7(2):19-23.
[11]RDA toolkit-related agent of work[EB/OL].[2022-09-18].https://access.rdatoolkit.org/Content/Index?exter nalId=en-US_ala-31ea511f-ce06-3adc-a598-f550 44a75 e9c.
[12]朱青青.FRBR 化的應用現狀及編目環節的應對策略[J].圖書館雜志,2017,36(2):46-50,55.
[13]LEE S.A Faceted Data Model for Bibliographic Integration Between MARC and FRBR[J].Journal of information science theory and practice,2013,1(1):69-82.
[14]
IFLA library reference model: a conceptual model for bibliographic information[EB/OL].[2022-08-11]. htt ps://repository.ifla.org/bitstream/123456789/40/1/ifla-lrm-august-2017_rev2091712.pdf.
[15]Proposal:new class-bf:hub#75[EB/OL].[2022-08-16].https://github.com/lcnetdev/bibframe-ontology/iss ues/75.
[16]MCCALLUM S.BIBFRAME 100 at the Library of Congress[EB/OL].[2022-09-21].https://www.casalini.it/bf we2021/web_content/2021/presentations/mccallum.pdf.
[17]LD4P2 project background and goals[EB/OL].[2022-08-17].https://wiki.lyrasis.org/display/LD4P2/LD4P2+Pr oject+Background+and+Goals.
作者簡介:
楊恩毅(1988— ),男,碩士,館員,任職于國家圖書館。研究方向:知識組織、信息資源建設。
收稿日期:2022-10-10