鄒美辰
(江蘇第二師范學院圖書館,江蘇 南京 211200)
新型書目框架是由傳統書目框架發展而來的,具體是指突破傳統書目框架的限制,構建書目數據之間的關聯,使書目數據能夠融入網絡環境的更加開放和包容的書目框架。新型書目框架即美國國會圖書館于2011年5月首次提出的,為圖書館重新設計和完成的書目框架——BIBFRAME[1]。BI BFRAME不僅是當前圖書館書目格式的替代品,而且是現在和未來書目數據描述的基礎。它能夠使圖書館融入更廣泛的信息社會,成為真正意義上的書目數據中心和互聯場所。從卡片目錄的出現到新型書目框架的提出,書目格式的發展可以劃分為3個階段。第一階段圖書館采用的主要是卡片目錄格式,并且開始出臺一系列的國際性編目規則。第二階段主要采用機器可讀目錄(Machine Readable Cataloguing,簡稱 MARC)格式,它為圖書館積累了大量的原始數據資源。之后隨著關聯數據的出現,圖書館又開始借助關聯數據技術實現書目數據關聯化,建立與其他資源的關聯。第三階段是新型書目框架BIBFRAME的提出,書目世界觀開始發生根本性變革。MARC格式由于無法與語義網的基本標準兼容,開始受到根本性的質疑和挑戰,逐漸成為制約書目數據向前發展的最大障礙。建立一個能夠取代MARC格式的更加開放和包容的新型書目框架是時代發展的必然趨勢。
書目數據最早采用的是1861年由美國哈佛大學圖書館首創的卡片目錄格式。卡片目錄格式一直在圖書館服務工作中發揮著巨大作用。隨著卡片目錄的出現,圖書館界開始出臺一系列的國際性編目規則來指導卡片目錄的編制。例如基于“巴黎原則”的《英美編目條例》第一版(Anglo-American Cataloguing Rules,簡稱 AACR1)和《國際標準書目著錄》(International Standard Bibliography Description,簡稱ISBD),它們對于早期的編目工作有十分重要的指導作用。但隨著時間的發展,卡片目錄的不足開始逐漸暴露出來,所占空間大、文獻信息量小以及檢索速度慢。因此當計算機技術出現之后,圖書館界就開始著手研究能夠用于計算機批量處理的新一代書目格式。
經過大量的研發試驗,美國國會圖書館于1966年1月推出了《標準機器可讀目錄格式的建議》,即MARC-1格式,并在此基礎上于1967年提出MARC-2,即目前所有機器可讀目錄格式的母本。1969年初MARCⅡ格式磁帶正式發布,成為圖書館界的革命性產品[2]。之后,由于各個國家語言和編目特點的不同,又研發了不同版本的MARC 格式,如USMARC、CANMARC、UKMARC、CNMARC等。MARC格式為書目數據在計算機內的記錄和交換提供了通用的句法,圖書館的業務工作正式走向機器自動化時代。1972年,ISO 2709格式發布,它定義了一種通用的記錄結構,包括記錄頭標區、地址目次區、數據字段區和記錄分隔符,所有的MARC記錄都可以通過ISO 2709格式進行交換,具體的記錄結構如圖1所示[3]。

圖1 ISO 2709記錄結構
隨著MARC格式的正式發布,編目規則也進行了相應修訂,并于1978年發布了修訂后的《英美編目條例》第二版(Anglo-American Cataloguing Rules 2,簡稱AACR2)[4]。自從MARC格式出現后,圖書館的信息系統和書目記錄處理就都基于MARC格式存在,編目規則AACR和書目格式MARC伴隨著圖書館的編目工作走過了很多年,為圖書館積累了大量的原始數據資源。但隨著網絡環境的發展,MARC格式在結構和語義方面的不足日漸明顯。MARC格式的局限性具體表現在以下幾方面:首先MARC格式不具備可擴展性,例如無法對封面和評論等內容進行編碼。其次MARC格式無法構建書目記錄之間的關聯,無法在網絡環境當中得到充分利用。最后MARC格式由于ISO 2709格式的設計問題無法與其他數據格式,如XML格式等進行交換。MARC格式的局限性促使傳統書目框架開始尋求轉變。
1998年,國際圖聯(International Federation of Library Associations and Institutions,簡稱 IFLA)出版了一份名為《書目記錄功能需求》(Functional Requirements for Bibliographic Records,簡稱 FRBR)的研究報告,其首次為扁平結構的書目數據建立了層次關系,并且采用了“實體—關系”模型對書目數據中各實體進行分析。FRBR將書目數據抽象為三組實體,分別為智力和藝術創作的成果(作品、內容表達、載體表現、單件)、智力和藝術內容的創作者(個人、團體)以及智力和藝術創造的主題(概念、物體、事件、地點),三組實體之間存在的關系如圖2所示。FRBR對沿襲了一個多世紀的編目理論提出了挑戰,打破了書目數據之間彼此獨立沒有關聯的狀況,使書目資源彼此關聯起來,拉開了書目控制領域新階段的序幕。之后,IFLA還于2009年和2011年分別出版了另外兩個相關報告,分別為《規范數據功能需求》(Functional Requirements for Authority Data,簡稱 FRAD)和《主題規范數據功能需求》(Functional Requirements for Subject Authority Data,簡稱 FRSAD)。

圖2 FRBR三組實體之間的關系
隨著數字時代的到來,基于傳統組織方式的書目數據逐漸成為一個信息孤島,圖書館中大量有價值的信息和知識被快速更新的互聯網資源所湮沒,沒有發揮其應有的價值,圖書館界急需一種新的技術手段來解決上述問題。2006年7月,Tim Berners-Lee首次提出了關聯數據的概念,即構建數據之間的關聯,形成一個能被計算機理解的數據網絡,從而將現存的信息孤島整合成一個巨大的數據庫[5]。這一概念的提出為書目數據的發展提供了新的契機,將書目數據發布為關聯數據,實現書目數據關聯化成為了各個圖書館打破資源壁壘的共識。書目數據關聯化雖然沒有從本質上改變圖書館采用MARC格式編目的現狀,但仍然具有非常重要的指導作用。它為書目控制領域新階段的發展指明了方向,推動了新型書目框架的建立。
通過上述兩個階段的研究,為滿足數字環境下資源描述與檢索的新要求,英美編目條例修訂聯合指導委員會(Joint Steering Committee for Revision of AACR,簡稱JSC)開始試圖制定最新的國際編目規則。資源描述與檢索(Resource Description and Access,簡稱RDA)以統一的國際編目原則聲明(Statement of International Cataloguing Principles,簡稱ICP)為綱領,以傳統的AACR2為基礎,以現代的FRBR和FRAD概念模型為框架,創造性地提供了一套更為綜合、能覆蓋所有內容和媒介類型資源的描述與檢索的原則和說明[6]。RDA的編制始于1997年JSC舉辦的“AACR原則與未來發展國際會議”,會上提議將AACR2進一步國際化,擴展到更廣泛的范圍內使用。2009年,RDA編制完成。2010年6月,RDA工具套件(RDA Toolkit)正式發布,標志著RDA的正式誕生。同年11月,RDA活頁印刷版出版。在此之后,RDA又進行了一系列的更新,并于2012年4月和2013年7月發布了第一次和第二次更新版[7]。

表1 RDA各部分主要內容
RDA借鑒了FRBR和FRAD中的實體,包括作品、內容表達、載體表現、單件、個人、團體、家族、概念、物體、事件和地點。RDA的內容分為導言、10個部分、附錄、術語表和索引,其中10個部分的主要內容如表1所示。
編目規則從AACR到RDA的變化反映了書目世界觀的根本性變革。RDA最突出的特點就是將書目數據劃分為各種實體,然后對實體屬性及實體間關系進行描述,非常符合語義網環境下的資源描述方法[8]。在RDA發布之后,很多機構都開始陸續開展了對RDA的測試工作,以便將理論研究推進到實踐化進程當中。2008年5月到2010年12月,美國國會圖書館、美國國家農業圖書館和美國國家醫學圖書館對RDA進行了聯合測試[9]。2011年6月,RDA的測試報告正式發布。在這次測試當中,MARC格式的局限性開始暴露出來,其設計缺陷無法發揮RDA的最大效用,MARC格式開始受到根本性的質疑和挑戰。

第六部分 記錄個人、家族和團體的關系第1 8章 記錄與資源相關的個人、家族和團體關系的一般規則第1 9章 與作品相關的個人、家族和團體第2 0章 與內容表達相關的個人、家族和團體第2 1章 與載體表現相關的個人、家族和團體第2 2章 與單件相關的個人、家族和團體第七部分 記錄概念、物體、事件和地點的關系第2 3章 記錄作品主題的一般性規則第八部分 記錄作品、內容表達、載體表現和單件之間的關系第九部分 記錄個人、家族和團體之間的關系第2 4章 記錄作品、內容表達、載體表現和單件之間關系的一般性規則第2 5章 相關作品第2 6章 相關內容表達第2 7章 相關載體表現第 2 8 章 相關單件第2 9章 記錄個人、家族和團體之間關系的一般性規則第3 0章 相關個人第3 1章 相關家族第3 2章 相關團體第3 3章 記錄概念、物體、事件和地點之間關系的一般性規則第十部分 記錄概念、物體、事件和地點之間的關系第3 4章 相關概念第3 5章 相關物體第3 6章 相關事件第3 7章 相關地點
為了徹底改變圖書館利用MARC格式編目的現狀,美國國會圖書館于2011年5月發起了書目框架轉換行動。2013年初,BIBFRAME的完整模型及具體元數據方案發布[10]。之后通過相關實驗以及專家建議,美國國會圖書館開始對BIBFRAME進行修改,并于2016年4月發布了新型書目框架——BIBFRAME 2.0,其數據模型如圖3所示[11]。

圖3 BIBFRAME 2.0數據模型[11]
BIBFRAME采用了關聯數據的思想,其目的就是使書目數據能夠在圖書館內部和外部發揮最大的價值。它不僅僅是MARC格式的替代品,還為書目數據融入更廣闊的互聯網環境帶來了巨大的潛力和可能性。模型包括3個核心類,分別為作品(Work)、實例(Instance)和單件(Item)。作品是一個抽象的實體,反映編目資源的概念本質,其屬性包括責任者、語種和主題等。實例是作品的具體化表現,一個作品可能包含一個或多個實例,實例的屬性包括出版者、出版地點、出版時間和出版類型等。單件則是實例的一個實際副本,其屬性包括存放地點、排架號和條形碼等。除此之外,該模型還定義了其他與核心類有關的關鍵概念,分別為代理(Agents)、主題(Subjects)和事件(Events)。代理是指通過作者、編輯、畫家、攝影師、作曲人和插畫師等角色與作品或實例產生關聯的人、組織和權限等。主題是指與作品相關的概念,這些概念可以是主題、人物、地點、時間表達、事件、作品、實例、單件和代理等。事件則是指對作品內容中某些事件的記錄。
BIBFRAME2.0總共包括186個大類,190個屬性。其中,17個類有子類信息。BIBFRAME2.0將屬性劃分為17個類別,分別為通用屬性(General Properties)、類別屬性(Category Properties)、題名信息(Title Information)、作品標識信息(Work Identification Information)、作品描述信息(Work Description Information)、主題術語和分類信息(Subject Term and Classification Information)、實例描述聲明(Instance Description Statements)、實例標識信息(Instance Identification Information)、實例描述信息(Instance description Information)、載體描述信息(Carrier Description information)、單件信息(Item Information)、類型信息(Type Information)、編目資源關系—通用(Cataloging Resource Relationships-General)、編目資源關系—特性(Cataloging Resource Relationships-Specific)、編目資源關系—詳 細(Cataloging Resource Relationships- Detailed)、代理信息(Agent Information)和管理信息(Administration Information)[12-13]。
在BIBFRAME發布之后,國外的主要機構都在積極推動新型書目框架的應用和實施。在BIBFRAME 1.0版本推出后,美國國會圖書館、德國國家圖書館、大英圖書館、喬治·華盛頓大學圖書館、普林斯頓大學圖書館、聯機計算機圖書館中心(Online Computer Library Center,簡稱 OCLC)和美國國立醫學圖書館就利用其館藏參與了BIBFRAME的測試[14]。此外,圖書館系統服務商VTLS還推出了支持新型書目框架的Open Skies平臺[15]。科羅拉多大學也進行了相關實驗研究,在Redis圖書館服務平臺上實現了從MARC21記錄到BIBFRAME實體的轉換[16]。之后,在BI BFRAME 2.0版本中,伊利諾伊大學厄巴納—香檳分校圖書館完成了從都柏林元數據到BIBFRAME 2.0的7829項轉換,并通過與開放數據集進行關聯增強了圖書館的數據發現[17]。匈牙利國家圖書館將其整個在線目錄以BIBFRAME的格式發布到了語義網中,并建立了與 BNF、ISNI、LC NAF、VIAF 和Wikidata等外部數據集的鏈接[18]。
新型書目框架符合時代發展的趨勢,能夠滿足圖書館適應網絡環境的需求,將傳統格式的書目數據轉換到新型書目框架中,成為圖書館界面臨的重大課題。目前,國內有很多機構和學者針對新型書目框架的理論和應用進行了相關研究。在當前環境下,新型書目框架的實施還面臨著很多難點。
目前國內已有很多關于新型書目框架理論和應用的相關研究,涉及新型書目框架實施的各個步驟。層次識別作為實施過程中的關鍵問題,已經引起了學者的關注。鄒美辰對新型書目框架的層次識別進行了研究,涉及作品層、實例層和單件層[19]。胡小菁等對CNMARC書目記錄作品層次轉換方法進行了總結和實踐[20]。但由于書目記錄的質量參差不齊,層次識別不可避免地需要不同程度的人工干預,普適性需要進一步提高。元數據互操作作為實施過程中不可缺少的一環,也受到了廣泛關注。國內有很多關于CNMARC與BIBFRAME相互映射及轉換的相關研究。吳貝貝采用元數據映射方法,形成了CNMARC書目記錄與BIBFRAME詞表的映射表[21];周小萍通過元數據映射及轉化方法,嘗試了在CNMARC字段與BIBFRAME 2.0類及屬性之間建立映射[22]。但目前還沒有統一的映射方案和自動轉換工具。對于數據的發布,夏翠娟和許磊對中文關聯書目數據發布方案進行了研究,該研究只是對中文關聯書目數據發布方案的初步探索,還存在很多不足[23]。最后是利用BIBFRAME提供服務的一些實踐項目,包括上海市圖書館開發的基于BIBFRAME模型的家譜知識服務平臺[24],夏立新等應用BIBFRAME構建的科技報告語義可視化服務平臺[25]等。
新型書目框架的實施是一項十分復雜的工作,面臨很多難點。基于國內新型書目框架的理論和應用現狀,實施難點主要包括三部分:一是數據基礎存在質量問題,例如著錄字段缺失、著錄字段錯誤、著錄字段混用、著錄形式不一致和規范文檔缺失等;二是相關采編人員的素質和技能有待提升,需要轉變傳統觀念;三是在新型書目框架的實施過程中,需要在層次識別、元數據互操作和轉換工具開發等一系列問題上進行技術突破,目前還沒有成熟的解決方案。新型書目框架的實施需要圖書館相關參與方共同合作,還有很長的路要走。
新型書目框架實施過程中面臨的難點主要包括三部分,下面將分別針對這三部分提出相應建議。
2.3.1 重視書目數據的質量問題,對著錄條例和編目規則進行重新修訂
當前書目數據存在很多質量問題,這些質量問題給新型書目框架的實施帶來了很大障礙,例如層次識別中無法實現字段的精確匹配。因此今后應該對書目數據的質量問題予以重視,對著錄條例和編目規則進行重新修訂,并建立相關規范文檔,解決書目數據存在的著錄字段缺失、著錄字段錯誤、著錄字段混用、著錄形式不一致和規范文檔缺失等問題。
2.3.2 通過相關培訓和課題培養新型書目框架下的采編人員
BIBFRAME對于圖書館而言是新事物,BI BFRAME的實施需要培養大量采編人員。雖然目前很多業務都可以通過自動化系統完成,但人員仍然是圖書館各項業務和流程的關鍵因素。書目數據在應用BIBFRAME之后,編目方式發生了根本改變,對采編人員提出了較大挑戰。因此,需要通過相關培訓和課題幫助采編人員提升專業技能,轉變傳統觀念,從關聯的角度出發理解書目記錄,在關注書目記錄的存儲、管理和維護的同時,對外部數據集進行分析和評估,拓展圖書館資源的利用范圍。
2.3.3 對新型書目框架實施過程中的各個步驟展開全面研究
新型書目框架的實施可以大致分為6個步驟,具體流程如圖4所示,包括層次識別、元數據互操作、開發編輯器及轉換工具、數據發布、建立SPARQL端點以及利用新型書目框架提供服務。針對各個步驟的具體建議如圖4所示。

圖4 新型書目框架的實施流程
①按照BIBFRAME的層次結構設計符合書目數據特征的層次識別算法。BIBFRAME將書目數據按照層次結構劃分,改變了傳統MARC格式的扁平結構。這種方式可以更好地展示書目關系,加強書目數據之間的關聯。為了實現書目數據的逐層聚集,可以按照BIBFRAME的層次結構設計符合書目數據特征的層次識別算法。在這個過程中,最重要的就是對各層次的具體內涵和書目關系進行分析,必要時還要在應用層次識別算法的同時進行一定的人工干預。
②利用元數據映射的方法實現兩種元數據方案的互操作。MARC和BIBFRAME作為兩種不同書目世界觀指導下的書目框架,分別有各自的元數據方案。為了實現兩種元數據方案的互操作,可以采用元數據映射的方法。在元數據映射的過程中,除了將MARC字段、子字段和指示符與BIBFRAME的核心類和屬性進行對應轉換外,還需要通過相關詞表進行規范控制,同時解決語義相關問題。MARC與BIBFRAME的元數據映射是一項龐大而復雜的工作,需要循序漸進地推廣。
③以開源軟件為基礎開發符合實際需求的BIBFRAME編輯器及轉換工具。目前,國外已經發布了一系列有關BIBRAME的開源軟件,例如美國國會圖書館網站上提供的配置文件編輯工具、記錄檢索工具、BIBFRAME編輯器以及MARC至BIBFRAME轉換工具等[26]。MARC至BIBFRAME轉換工具同時包含比較服務和轉換服務兩個功能,通過比較服務可以對比轉換前和轉換后的數據準確性和完整性,通過轉換服務則能夠實現書目記錄從MARC格式至BIBFRAME格式的自動轉換。為了實現數據格式轉換,可以利用這些開源軟件進行二次開發,在利用已有先進技術的同時減少開發成本,開發出符合實際需求的BIBFRAME編輯器及轉換工具。
④通過學習前沿技術實現數據發布,并在此基礎上開發新一代圖書館系統。BIBFRAME的技術門檻較高,完全應用語義萬維網,涉及互聯網和圖書館領域的多項前沿技術,傳統圖書館系統很難滿足其需求。因此圖書館的技術和開發人員需要認真學習有關數字圖書館協議、規范和查詢語言等方面的技術,開發適合新型書目框架的新一代圖書館系統。目前很多系統開發商和平臺提供商都在開發相應的服務平臺,例如Intota、VTLS和Open Skies等。
⑤利用新型書目框架實現各類型和各機構的資源整合,轉變傳統資源組織觀念,提供一體化服務。BIBFRAME的通用性和普適性較強,它試圖建立一個獨立于編目規則的可以容納各類型和各機構資源的書目環境。因此,圖書館應該轉變傳統資源組織觀念,實現“大資源”組織。利用BIBFRAME強大的包容能力實現各類型和各機構的資源整合,為用戶提供一體化服務。圖書館整合的資源類型,除了傳統的圖書、期刊等資源,還應包括各種網絡資源和多媒體資源。此外,圖書館還要努力實現與檔案館和博物館等機構的資源整合。
新型書目框架是在經歷卡片目錄格式和MARC格式等階段后成形的。根據目前的理論和應用現狀,筆者分析了實施過程中的難點,并提出了相應建議。新型書目框架的實施難點主要集中在數據質量、人員技能和技術突破等方面。新型書目框架消除了圖書館與外界的壁壘,使書目數據更加開放、更加共享,新型書目框架是時代發展的必然趨勢。