作者簡介:苗青(1980-),女,館員,碩士,研究方向:文獻資源建設,發表論文2篇。·業務研究·
〔摘要〕從傳統的印刷品到電子圖書以及隨處可見的網絡資源,各種信息正以排山倒海之勢闖入我們的生活,本文通過對數字復合出版環境下自動編目情況的簡要概述,試圖分析這一新環境對圖書館編目工作的影響,進而提出對圖書館在新環境下擴展編目對象的思考。
〔關鍵詞〕數字復合出版;自動編目;網絡資源的組織;藏品揭示;編目
DOI:10.3969/j.issn.1008-0821.2014.03.029
〔中圖分類號〕G25434〔文獻標識碼〕A〔文章編號〕1008-0821(2014)03-0135-04
Discussion on the Library Develops Cataloging
Objects in Digital Publishing EnvironmentMiao Qing
(Shanghai Library,Shanghai 200031,China)
〔Abstract〕From the traditional print to electronic books and ubiquitous network resources,all kinds of information with the avalanche of power into our life.In the article,through a brief overview of the automatic cataloging in digital composite publishing environment,trying to analyze the impaction on library cataloguing work,and then thinking of expanding cataloging objects in the new environment.
〔Keywords〕digital composite publishing;automatic cataloging;network resources organization;collection revealing;cataloging
2008年4月,國家數字復合出版系統工程在多方努力下正式啟動。該工程的推出將在很大程度上增加數字文獻的館藏比例,減少了圖書館文獻資源的電子化成本以及對版權問題的過分擔心。但與此同時,我們也要看到,基于自動編目基礎上的數字復合出版系統工程,在為圖書館界提供機遇的同時,也帶來了一定的挑戰。本文試圖從編目對象的角度對這一問題進行分析和探討。
1數字復合出版系統及其對圖書館編目工作的影響
11數字復合出版和自動編目的概況
數字復合出版系統工程是在對ECIP和自動編目的研究過程中擴展誕生的,是新聞出版總署在數字出版方面的第1號工程,以實現一種信息多種傳播,信息處理、出版發行能夠在一個系統里完成。如圖1:
圖1數字復合出版系統〖〗
自動編目從根本上改變了編目模式,變圖書館的“描述性編目”為出版社的“標識性編目”,即在圖書印前電子文本上進行編目處理。具體操作是對其中的屬性數據進行標識,而不是描述[1]。從源頭規范了數據生產,改變了信息生產的無序狀態,有利于文獻信息資源的有序整合。文獻編目工作也不再由圖書館的采編部門來完成,而是前移至上游出版社在文獻產生的過程中自動生成。
12數字復合出版對圖書館編目工作的影響
網絡化的今天,當人們的閱讀方式正發生著悄然變化的時候,圖書館仍然在從事著以紙本文獻為主的編目工作,而這一工作也即將面臨數字出版的沖擊:
(1)文獻產生過程中的自動編目替代了文獻產生后依據文獻實體的客觀性著錄;
(2)針對“描述性編目”的理論不再適用,自動編目需要提出一套自己的編目理論,而這一理論是否適合圖書館對文獻的組織要求我們尚不明確;
(3)圖書館的編目工作將逐漸淡出或消失,隨之一同流失的是編目工作人員對文獻的組織能力和經驗。
此外,信息技術的發展、Web20技術的產生、讀者閱讀習慣的變化、各種手持閱讀器、移動閱讀的興起,都讓我們在面對信息資源如此龐大的社會有些不知所措。而數字復合出版系統作為出版系統而言處理的只是已經或即將正式出版的文獻著作,面對各種復雜的信息還無法做到全面整合和揭示。因此,從圖書館界出發,在面臨傳統文獻編目工作前移至出版社的情況下,我們是否可以考慮擴大編目對象,將隨處可見的網絡資源納入我們編目(或者說組織)的范圍內。這樣不但能加強圖書館編目工作者對各種信息的組織能力,也可以滿足用戶對信息有效使用的需求。
2圖書館編目對象的拓展
隨著社會進步和讀者個性化的發展,傳統圖書館已從對文獻的加工發展為對信息的組織,進而爭取達到知識管理的層次。從文獻的分類編目到信息組織再到信息資源管理,就是一個對傳統分類編目工作不斷擴大、更新與升級的過程[2]。
21對網絡信息資源的獲取和組織
在今天科技水平日新月異、個性不斷張揚的世界中,各種網絡信息資源呈幾何倍數增長,與此同時,伴隨著網絡信息資源動態變化性的特點,網絡新聞、電子郵件、博客等各種類型的網絡信息資源瞬間產生也瞬間消失,因此也提出了對網絡信息資源選取、序化的問題。
211網絡信息資源的獲取
在解決網絡資源選取問題上,各種搜索引擎應運而生,如傳統的通用搜索引擎Yahoo!、Google、百度等。但基于傳統搜索引擎無法搜索到深層網絡(Deep Web)信息的原因,深層網絡爬蟲技術逐漸興起并在實踐中得到大量應用,取得一定成效[3]。所謂網絡爬蟲,又稱網絡機器人。英文名有Spider、Crawler、Bots、Robot、Wanderer等,是一個自動提取網頁的程序,是搜索引擎的重要組成部分[4]。網絡爬蟲能夠自動獲取使用者所需資源,使用起來相對容易。相比之下,對網絡信息資源的組織序化則是目前我們需要研究的重點問題。
212網絡信息資源的組織序化
網絡有著如此豐富的“館藏”資源,因此必須建立一個通用的、合理的、規范的網絡信息資源著錄規則,這就要求在信息加工過程中引入編目理念,深化對網絡信息資源的組織。對網絡信息資源的組織是指采用一定的方法與模式,按照一定的原則將因特網上某一領域大量的、分散的、雜亂無章的、良莠不齊的信息通過搜索、評價、篩選、分析、標引、著錄、排序等手段加工處理,使其形成一個有序的、便于用戶獲取與利用的信息系統的過程[5]。
在對網絡資源組織方法的研究上,谷麗萍提出用傳統文獻組織方法組織網絡資源,即使用元數據為網絡信息資源著錄提供最基本的著錄項;將分類法思想引入網絡信息服務系統中;將主題詞引入搜索引擎中作為查找的關鍵詞等[6]。目前,越來越多的學者將注意力轉移到利用元數據對網絡資源乃至其他不同載體形式的信息資源進行描述和組織方面。從20世紀90年代至今,世界各國就已先后制定出數十種具有一定影響的描述性元數據,根據其用途不同、對象不同、行業不同又可劃分為不同的類型。萬變不離其宗,王松林老師在其《信息組織與編目規則》中提到:“無論是今天的信息組織還是以往的文獻編目,它們的信息組織在組織機制上是一致的”[7]。從另一角度來說,無論是利用傳統的MARC格式還是現代不同種類的元數據,我們對各種載體的信息進行描述、揭示、組織的目的是相同的,即實現圖書館這一人類文化遺產保存機構的收集信息、組織信息和傳遞信息的職能。
endprint
雖然早在21世紀初一些專家學者就已經開始了對網絡資源組織的研究,但筆者通過對維普中文期刊全文數據庫1989-2009年的數據進行檢索,檢索格式采用布爾邏輯運算符“and”,關鍵詞為“網絡資源”和“組織”,檢索到相關文獻只有181篇。可見,圖書館界對網絡資源組織的研究還處于初級階段,實踐應用不足,我們應將數字出版對圖書館編目工作的沖擊和挑戰轉化為圖書館界擴大編目對象、深化信息組織的動力。
22對珍貴稀有藏品的揭示
2008年美國國會圖書館出具的《書目控制的未來報告》中曾建議“將稀有和僅有資料的發現工作作為優先考慮的工作。優化稀有和僅有資料的編目工作,重視更廣的覆蓋范圍和更多資料的存取,而不是全面揭示一些資料而對其他資料不予揭示。建立可行的和靈活的編目實踐,反映用戶的需求和有限資源的現實。共享這部分資料的元數據。”[8]隨后,世界各國對圖書館、博物館和檔案館三館合作方面的研究和實踐逐漸興起。2009年IFLA大會也將教育與培訓專業組的征文主題定為“圖書館及文化機構專業人員在文化遺產領域發揮的作用:為圖書館、檔案館、博物館(ALM)整合而教育”[9]。由此可見,圖書館、博物館和檔案館的合作是近兩年來圖書館界的一個熱點問題。同時,也為我們擴展編目對象提供了一個新的可能性。
221博物館和檔案館對數字化的需求
博物館、圖書館和檔案館三館作為國家的科學文化事業機構,擔負著收藏、保管人類文化遺產、提供信息服務的重任,這一共同的使命也讓三館合作建設成為可能。
但相比圖書館文獻的數字化比例及其開放程度,博物館和檔案館由于其藏品和文獻的珍貴性及保密性等一些其他原因,對數字信息資源的建設和開放存取的程度不能令用戶滿意。據國家檔案局網站統計,我國2007年開放檔案比2006年同比增長181%,到2008年1月1日,我國各級各類館藏檔案開放率已達1/3,雖已取得顯著進步,但30%的開放率仍不能滿足用戶需求[10]。
而蓬勃發展的數字圖書館運動無疑反映了將圖書館、檔案館、博物館館藏資源聯合起來互為補充的思想,舉兩個例子:美國加利福尼亞在線檔案館(OAC,Online Archive of California)[11]和歐洲數字圖書館、博物館和檔案館[12]。這些項目的進行使得用戶能夠直接獲取三館的數字化資源,但是獲取這些數字化資源的前提是對在線數字化資源進行組織描述。而對三館館藏描述的互操作性、檢索點的一致性是目前三館面臨的主要挑戰。
2223館合作的出發點
目前,圖書館、博物館和檔案館面臨著同樣的問題,即力求館藏資源為用戶所知、為用戶獲取,甚至是通過聯合資源發現的方式來達到這個目的。與此同時,“純粹的”館藏——也就是,完全由圖書構成的館藏,或者全部是藝術品的館藏——正變得越來越罕見。即使一所小型圖書館也能夠采購一筆豐富的館藏,包括替代圖書的視頻資料、藝術品、物質文化產品、或自然歷史的遺跡樣本。為了滿足用戶對于一站式信息檢索的需求,文化機構必須做好準備,明智地采用各種類型的元數據標準,并且找到辦法,將不同的數據元素、常規的描述方法融合為一個和諧的整體。因此,相對于著錄標準的統一而言,三館對檢索點描述和規范記錄方面的協調才是合作能夠持續并推進的一個很重要的因素。
3在擴展編目對象時可能存在的問題
對圖書館而言,擴展編目對象并不簡單意味著轉變館藏資源建設政策,只是在圖書館面臨傳統編目工作流失的背景下,為圖書館的編目工作尋找新的發展契機。因此,我們在對網絡信息資源和檔案館、博物館館藏資源進行分析下,綜合目前國內外的信息資源組織情況,對實際操作中將會存在的問題進行簡單說明。
31網絡資源內容的選取
雖然我們可以利用深層網絡爬蟲對所需資源進行搜尋,但具體在要獲取哪些資源的問題上還需要結合本館的特點和館藏資源的建設方向進行綜合分析,例如,對某一領域內專家博客的收藏、對涉及某一內容的相關新聞的選擇等,這些都需要圖書館的采訪人員能夠在新環境下對讀者的閱讀習慣進行深層認知和分析:哪些信息讀者喜歡從印刷型的文獻上獲取;哪些信息讀者喜歡從網絡上獲取等。并據此來確定圖書館網絡信息資源建設的方向和重點。
32統一標準的問題
單從圖書館領域來說,對文獻著錄標準的規范控制就是編目界一直在探討的問題。在圖書館與博物館、檔案館開展合作的過程中,該問題更是亟待解決和研究的重點。
(1)一些已開展的試驗性合作項目表明,合作中首先要明確的是各館在著錄方面的分歧,例如,藝術名信息中采用的是詞首字母大寫方式,而英美編目條例規定句首字母大寫。雖然,我們并不一定要求對這些著錄規則進行統一,但作為編目工作者來說要對這些差異有所認識。
(2)上文強調過的對檢索點的描述和規范記錄的統一問題。三館合作的目的之一便是能夠通過一個平臺將博物館的珍貴藏品、檔案館的檔案資料和圖書館有關的文獻資源整合起來,方便用戶對信息資源的檢索和使用。因此,在數字圖書館發展迅速和三館檢索入口統一的背景下,通用標準的使用對各種文化遺產機構來說很有必要。
33深化對元數據的研究和應用問題
元數據在很多情況下被視為20世紀末、21世紀初編目的同義詞。伴隨著各種載體文獻的出現,元數據在對資源描述和揭示方面的重要性日漸凸顯。若按對象分類,描述性元數據具體可分為描述數字文獻的元數據、描述數字圖像的元數據、描述博物館藏品的元數據和描述特殊資源的元數據等。 描述性元數據的特點是“跨行業”,這體現在所形成的記錄上,每條記錄都是在對采用的數據值和數據內容標準精心思考后得以完成的。
目前,元數據編制的一個新趨勢是將描述(即“編目”)視為一個合作、擴充的過程,而不是一個僅僅獨立在一家機構的單獨一個部門開展的活動。在數字資源時代,元數據編制在很多情況下能夠而且的確應該是一項合作開展的工作,也因此需要我們對其進行更加深入的研究和開發。
34加強編目員對相關知識的學習問題
近年來,編目員面臨一種挑戰,需要描述不斷變化中的資源——像是一直變化中的網絡資源,或是定期更新的在線出版物。針對這些類型資源的元數據記錄會時常更新以反映其最新版本。與傳統的對某一專著文獻的描述反映一成不變的情況不同,21世紀的編目員不再是簡單的信息著錄員,他要有能力使元數據編制成為一種行之有效的工具,要對各種標準的精心研究、整合利用,將文獻編目工作延伸到各行各業、各個領域和環節上。
4結束語
在網絡化的今天,圖書館面臨的編目對象已不再僅僅局限于印刷型文獻和電子圖書方面,圖書館、博物館、檔案館的試驗性合作已經開展,對信息資源的揭示已深入到實體藏品層面。而對網絡資源和實體藏品的信息組織則是數字復合出版系統所不可及的。因此,如何保持圖書館編目工作不流失則成為今后我們需要關注的重點。
參考文獻
[1]陳源蒸.論“標識性編目”[J].數字圖書館論壇,2007,(6):36-40.
[2]高紅.抓住機遇迎接挑戰把我國文獻編目工作推向深入——第一屆全國編目工作研討會大會總結發言[C]∥21世紀的信息資源編目.北京:北京圖書館出版社,2006:8.
[3]曾偉輝,李淼.深層網絡爬蟲研究綜述[J].計算機系統應用,2008,(5):122-125.
[4]劉金紅,陸余良.主題網絡爬蟲研究綜述[J].計算機應用研究,2007,24(10):26-29.
[5]謝曉專.網絡信息資源組織模式研究[J].圖書情報工作,2006,(1):64-67.
[6]谷麗萍.論用傳統文獻組織方法組織網絡資源[J].文獻信息論壇,2009,(1):42-43.
[7]王松林.文獻編目與編目原則[C]∥21世紀的信息資源編目.北京:北京圖書館出版社,2006:1-7.
[8]美國國會圖書館書目控制的未來報告[EB/OL].http:∥www.1oc.gov/bibli0graphic-future/news/draf-report.html,2007-11-30.
[9]2009年國際圖聯大會將在意大利米蘭召開[EB/OL].http:∥www.tedala.gov.cn/cmsfile/2009-3-5/1236217128951.htm,2014-01-15.
[10]陸懿琦.檔案館與圖書館信息資源服務比較研究[J].蘭臺世界,2009,(2):10-11.
[11]美國加利福尼亞在線檔案館[EB/OL].http:∥www.oac.cdlib.org/,2014-01-15.
[12]歐洲數字圖書館、博物館和檔案館[EB/OL].http:∥www.europeana.eu/,2014-01-15.
(本文責任編輯:馬卓)
endprint