黃 婧 吳英梅
摘要主要圍繞北師大圖書館京師文庫全文數據庫的建設實踐展開。首先簡要闡明文庫建設背景,在調研國內其他高校文庫數據庫建設實踐基礎上,明確京師文庫全文庫建設力圖實現的功能。重點針對全文庫建設實踐的難點與特色功能進行了介紹。最后提出了關于全文庫建設的下一步發展設想。
關鍵詞高校文庫特色數據庫京師文庫
“京師文庫”,全稱“北京師范大學文庫”,“建立于2002年,是北師大圖書館迎接百年校慶的重要項目之一”。京師文庫作為展示北師大學術科研成果的重要窗口,收錄了自建校(1902年)以來的校友及目前在校師生的各類文化、學術作品。在圖書館與學校各方的努力和支持下,文庫已有相當數量的藏書規模。為了更好地利用京師文庫,北師大館于2006年開展了文庫圖書的數字化工作,并于2008年完成了京師文庫全文數據庫(以下簡稱“全文庫”)的設計與實施工作,同年10月正式向讀者推出。全文庫的建設不僅延伸了京師文庫閱覽室的功能,更加便利了讀者對文庫圖書的閱讀,同時對文庫的繼續豐富與發展也起著積極的促進作用。
在實施全文庫的建設過程中,為了能夠滿足讀者全方位的信息需求,對全文庫頁面進行了充分的考慮和周詳的設計。盡管全文庫建設的主要目的是為讀者提供文庫藏書的電子版全文閱讀,但圍繞這一核心內容,必需的和可拓展的功能還有很多。此外,由于文庫自身的屬性與特點,也決定了其在數據庫建設上與一般專題庫之間存在著差異,以及在不同圖書館之間存在的共通性。因此在全面考慮全文庫頁面功能與特色之前,對國內主要高校的文庫數據庫進行調研是一項非常必要的工作。
1國內調研
通過網上調研發現,國內很多高校均在本館的主頁中建設了揭示文庫內容的模塊。據不完全統計,“在我國的680所具有本科授予權的高校圖書館中,有25個省市96所大學圖書館創建了高校文庫,其中56個圖書館在其主頁上設有文庫欄目”。但從網絡文庫的內容來看,各館的建設速度與質量參差不齊。多數館僅對文庫實體閱覽室的工作內容進行了網絡延伸,頁面停留在藏書介紹及贈書相關事宜的宣傳等內容上;有些館則做了進一步的工作,將文庫藏書的書目信息以頁面列表或可下載的表格文件形式放在網上。通過建設數據庫為讀者提供詳盡信息揭示的圖書館有清華大學、北京交通大學、中央財經大學、中國人民大學、中國農業大學、南京師范大學、武漢大學、首都師范大學等,并不十分多見。文庫數據庫的內容基本以書目數據為主,僅中國農業大學、武漢大學和首都師范大學實現了部分文庫論著的全文電子化。盡管文庫數據庫建設的內容與形式還很有限,但有些數據庫的設計也較具特色。
對于已建庫的高校館,其建設情況大致可分為以下兩種情況。
1,1
與館藏書目數據庫(以下簡稱OPAC)結合
此種情況如清華大學的清華文庫、北京交通大學的校友文庫、中央財經大學的教師文庫等。其中清華文庫和北京交通大學的校友文庫均沒有對文庫藏書的書目進行單獨的數據庫建設,中央財經大學的教師文庫則在建設簡要書目數據庫的基礎上利用OPAC的數據資源作為其詳細書目信息的補充揭示。
清華文庫中的“文庫藏書目錄”專欄列出4000余冊教師、校友著作,“讀者在文庫藏書目錄中點擊所需圖書,即自動連接到圖書館INNOPAC系統”,獲得書名、作者等相關的詳細信息。但讀者獲取到的僅為書目信息列表,還不能對其進行檢索。北京交通大學則直接以OPAC子庫的方式對校友文庫的書目信息進行揭示,并可直接利用OPAC系統的檢索功能來滿足讀者對此子庫的其他深入檢索需求。中央財經大學的教師文庫,首先建設了一個簡要的書目信息數據庫,讀者可對書目信息進行檢索。當讀者點擊題名時,系統可通過URL傳遞系統號參數直接定位到館藏書目數據庫相應的MARC記錄,讀者可在此頁面對書目的詳細信息進行查看。
1,2獨立建設
此種情況如中國人民大學文庫、中國農業大學教師文庫和南京師范大學教師專著查詢系統等。三所學校的圖書館均建設了獨立完整的文庫圖書數據庫,主要以書目信息為主,并對數據庫的導航、檢索及具體的信息揭示都作了較為周詳的實現。
其中人大的數據庫通過瀏覽檢索、“獲獎著作”等欄目反映了人大文庫7500余種本校教師、校友著作的收集情況”。其數據庫最主要特色是著錄了文庫圖書贈書者的所在機構。讀者除了通過中圖法一級類目檢索外,還可以通過點擊機構名稱瀏覽在此機構工作的校友贈與的全部圖書,同時數據庫中關于圖書的細節還增加了對贈書者的揭示,讀者可通過姓名查看該贈書者贈與的全部圖書。南京師范大學的教師專著查詢系統除了圖書的分類導航與檢索外,增加了“熱門點擊”與“最新加入”兩個模塊,讀者通過這兩個內容可直接了解數據庫的更新與利用情況。而中國農業大學的教師文庫中則更像一個初步的機構知識庫。該庫對教師的論文與著作成果進行了整合,并對教師及其所在機構的相關信息進行了揭示,同時還設有提交作品的功能模塊。但由于該庫尚處建設初期,數據量較為有限,庫中現有成果以論文為主,專著數據相對較少。
通過對國內高校館文庫數據庫的調研,可以看到,盡管各館根據自己的需求建設的數據庫多種多樣,但仍有很多共同之處。一是瀏覽與檢索功能。在檢索方面,考慮建設數據庫,檢索功能必不可少。在瀏覽方面,從各館的建設經驗可以看到,除了針對圖書設置分類導航外,還應考慮對校友及其所在機構的導航,因為文庫的建設離不開教師及相關機構的主動參與,數據庫對于贈書相關主體的揭示在一定程度上可以促進和推動文庫實體建設的深入開展。二是圖書信息的揭示。多數館均在圖書信息揭示的過程中保留了對OPAC的關聯,這主要考慮了為讀者提供跨平臺服務的便利,增加讀者對于新數據庫的使用體驗。三是數據庫更新內容及相關熱點的揭示。在為讀者提供資源的同時,也利用數據庫的功能為讀者提供了相關的更為深層次的服務內容。
2功能定位
鑒于以上考慮,并結合北師大館資源的實際情況,初步擬定了全文庫待實現的主要功能。對全文庫除了設置必要的檢索點并保留與OPAC記錄的關聯功能外,以下兩點是在實現該庫的過程中主要考慮的特色所在。
首先,在導航方面,除了依據《中圖法》設置圖書分類導航外,也希望實現對贈書者相關信息的導航。但是由于北師大館在收集文庫贈書時,對于贈書者的具體信息及相關情況還沒有較為詳盡的記錄或信息存檔,因此在這一點上實現起來稍顯困難。考慮到其中大部分贈書者均捐贈了自己的著作成果,此外雖然也有一些代親屬或師生進行的捐贈但數量不多,因此可以認為贈書者主要還是以作者本人為主,采用作者進行導航可以在一定程度上彌補贈書人信息的缺失。同時還可以通過圖書作者所在的機構或單位進行導航。就此基本確定了京師文庫
全文庫的頁面導航,即以圖書分類、作者姓名、作者機構進行圖書導航。
其次,在檢索結果的頁面陳列方面。從調研情況來看,各館主要以書目簡要信息的文字描述為主,除了人大文庫外,尚沒有看到其他館有對圖書封面的揭示。由于北師大館文庫所藏圖書主要為1949年以后出版的圖書,其封面主要以彩色為主,考慮到封面炫麗的色彩可以在一定程度上增加頁面對讀者的吸引力,因此決定將圖書的封面進行發布,同時展示的內容還包括圖書的題名、作者、出版項等信息。
3重點與難點
盡管已經確定了全文庫有待實現的具體功能,但由于資源本身的原因,在實現過程中,仍存在著各種困難,很多問題仍需在實現過程中作具體分析與解決。
3,1發布平臺
由于京師文庫電子圖書的發布格式為djvu圖像,因此對于全文圖像的發布主要考慮通過現成的CADAL項目本地發布系統來實現,但是考慮到此系統對于圖書的導航功能及信息揭示方面尚存在一定的不足,無法滿足讀者的需求,鑒于TRS系統平臺對信息的深層次揭示的功能,因此決定采用TRS系統平臺進行書目層面的信息揭示。即將TRS系統與CADAL本地發布系統相結合,書目信息通過TRS系統平臺進行展現,全文數據庫采用CADAL本地發布系統為讀者提供全文瀏覽,書目信息與全文數據用電子圖書的ID號實現關聯鏈接。
3,2分類導航
盡管《中圖法》歷經修改完善,目前已是第四版,但由于圖書事業的發展日新月異,《中圖法》仍有一些類目與目前的實際情況不相適宜,此外由于北師大的學科特色,即以教育學科、心理學科及其他一些基礎學科為主,所以文庫收集的主要成果也明顯帶有這方面特點,本校特色學科方面的藏書數量明顯要多出其他學科。因此在具體設計圖書的分類導航時,沒有完全照搬《中圖法》的類目,而是采取了以中圖法一級大類作為基本分類標準,并對二級類目進行了簡要刪減的做法,力求圖書的分類類目與電子圖書的實際情況相契合,并以下拉菜單方式展現二級類目,為讀者提供更為方便和簡潔的導航功能。
3,3作者導航
作者姓名導航的設計是整個數據庫實現的特色,同時也是最困難,耗時最長的工作。盡管每本圖書的作者姓名均可在書目信息中抽取,但對于京師文庫藏書來說,針對與本校相關的作者姓名進行導航才是必要的。因此全文庫的作者姓名導航,實際上針對的僅僅是那些具有本校相關學習或工作經歷的作者,這在一定程度上也可以視為贈書者姓名導航。
如此一來,就需要對每本圖書的作者進行核對,即確定其是否曾在本校工作或學習過。工作人員在作具體核對工作時,利用了網絡上一切可利用的信息資源,如學校人事處的教職員工清單,圖書扉頁中保存的贈書人的留言信息,圖書前言或后記中出現的作者相關經歷介紹,學校、院系所及作者本人的主頁,網絡搜索引擎,中國期刊網中的作者機構信息等等,最終從近6000條作者數據中確定了1600余位本校相關的作者姓名,同時在核對過程中也搜集到了作者的主頁、在本校的相關經歷等信息內容,這些內容大大豐富了全文庫的作者姓名導航。
目前通過已經實現的作者姓名導航,讀者可點擊進入作者姓名列表,點擊相應拼音首字母后即可察看相應姓名列表,進一步點擊某位作者的姓名后,就可察看到包括作者的主頁鏈接、作者在本校相關的任職機構及作者在本校的簡要經歷等內容的頁面,同時在頁面的下方嵌入了以作者姓名對全文庫進行搜索的成果列表,讀者可在此頁面直接對其感興趣的成果進行閱讀,至此實現了全文庫中本校作者的姓名導航。
3,4封面揭示
由于京師文庫圖書封面的發布有利于讀者確認圖書,并起到美化頁面效果的作用,因此在數據庫的頁面對電子圖書的封面予以揭示,這就涉及圖像抽取與處理等相關工作,力求不增加網絡傳輸負擔。
為了實現較好的頁面效果,同時便予圖像處理,封面圖像選用了電子圖書的原始掃描圖像(黑白為tiff格式,彩色為jpg格式),由于每冊電子圖書以獨立的文件夾方式存在,因此需要對全部電子圖書的第一張封面圖像進行批量拷貝抽取,在對每張圖像進行重新命名后,集中于服務器發布路徑下專門存放圖書封面的文件夾中,并通過對圖像進行壓縮處理,大大節省了網絡傳輸帶寬,力求不影響讀者瀏覽與檢索的速度。
3,5教材標識
京師文庫作品中含有大量教材內容,對于教材的揭示有利于將來進一步擴展數據庫的相關功能,因此利用從OPAC中抽取的相關教材記錄,通過圖書的唯一標識即館藏號進行了匹配,將全文庫中屬于教材的圖書進行了字段標識,同時保留了記錄中所含的獲獎信息字段,以待今后有進一步需求時對教材進行獨立發布或揭示。
4下一步建設
目前,京師文庫全文庫的基本功能已得到了實現,并已面向校園網內讀者發布,鑒于文庫圖書所涉及的知識產權問題,數據庫將全文瀏覽的權限設置在館內電子閱覽室范圍內。此全文庫目前已收錄電子圖書5392冊,今后還將隨著京師文庫紙本數量的增加而陸續增加,以保證文庫藏書的版本與電子版基本保持一致。從數據庫的使用來看,初步實現了當初的建設目的,便利了讀者對于京師文庫圖書的閱讀。但是隨著讀者需求與提供服務的深入,今后全文庫的建設與發展仍有待進一步完善。
4,1功能完善
目前對于本校院系所等相關機構的導航還沒有實現,由于機構名稱變更較為頻繁,很多細節問題無法確定,這在一定程度上給機構名稱的導航帶來了困難。另外,對于作者相關信息的揭示也還有很多工作可以進行,如進一步將作者的相關學術方面的信息尤其是作者的著作信息及獲獎信息等收集完整并進行揭示,將作者的學術論文整合進來等等。
4,2基于總分館模式補充館藏
在文庫圖書的征集方面,還應進一步制定完善的制度來保障文庫圖書征集工作的順利進行。目前從實際工作來看,主要以作者自愿捐贈為主,以主館采編部門及文庫管理部門的補充為輔。
在今后的工作中,還可以在總分館的模式下,借助總館與分館在資源調度方面的相互協調優勢,充分發揮分館的積極性與主動性,將文庫圖書的征集工作列入分館部門的日常工作內容之一。分館作為連接總館與學校各院系之間的紐帶,與各院系之間存在著密切的關系,無論是在人際方面還是在地理位置上,分館的館員們在完善京師文庫圖書的征集方面具有非常便利的條件,同時全文庫的建設也為館員的征集工作提供了已有圖書數據與相關的作者數據,各分館的館員可以此作為圖書征集依據,對京師文庫藏書進行更具針對性的直接補充。
高校文庫是記載學校科研活動和學術水平的“集體檔案”,從長遠發展來看,僅作為成果展示,無法發揮資源的最大利用價值,必須通過數據庫的功能挖掘其潛在價值。一方面,全文庫可在一定程度上作為本校機構知識庫發展的重要基礎,在完善相關的數據收集與整理工作后,深入擴展其他相關的功能,如增加成果提交和個性化相關模塊等,北師大館也將逐步完善和實現自己的機構知識庫相關功能,從而實現為讀者提供系統化深層次的信息服務,并助力北京師范大學的教學與科研工作;另一方面在文庫藏書相對完整的情況下,“通過對文庫資料及其著者相關因素進行評價鑒別、整合優化、統計分析,形成跨學科、跨專業研究的參照體系,為圖書館調整館藏資源建設、確定服務方向提供量化依據”。此項工作同時也將對掌握學校的整體科研情況起到重要作用,為確定學校科研方向和結構,引進人才等提供依據。