姚 舜,鮑 靜
(1.湖南圖書館,湖南 長沙 410011;2.安徽省圖書館,安徽 合肥 230002)
近年來,國家加大了對地方特色資源建設的投入,湖南圖書館也將本地區特色資源庫建設作為數字資源建設的重點。經過多年的積累,湖南圖書館已經建成了“湖南近代人物數據庫”“湖南地方戲劇資源庫”“湖南非物質文化遺產資源庫”“湖南紅色記憶多媒體資源庫”“湖南古村鎮數據庫”“湖南少數民族風情資源庫”等多個地方特色資源庫。目前這些資源庫已經向互聯網用戶免費開放,為讀者了解湖南和研究湖南文化提供豐富的資料。然而,隨著自建資源庫數量和記錄條數的增加,原有基于TRS WAS平臺開發的特色資源庫系統所存在的問題也日益顯現出來。
為了資源展示的豐富,湖南圖書館在展示頁面中大量引入了相關資源的展示,這極大影響了頁面打開速度。
網站的URL地址過長、頁面中插入了大量iframe窗口、瀏覽器兼容問題,這些問題影響網站推廣和搜索引擎優化。
這主要表現在以下幾個方面:①資源庫字段多。自建資源庫中元數據字段少的有20余個,多則有50多個。②精確關聯造成了工作量大。著錄人員對資源庫的相關人物、相關研究對象等字段進行錄入時,必須對所錄入的資源非常了解,并且不能錄錯,如果錄錯必須先將字段清空再重新錄入。③圖片錄入麻煩。目前WAS平臺無法實現圖片的自動加水印和自動生成不同尺寸圖片,需要工作人員利用其他工具對圖片進行批處理。
TRS WAS原本是用于檢索平臺的搭建,在展示功能上比較簡單。湖南圖書館為了將資源庫展示得更豐富,進行了大量的JS腳本的開發,這對技術人員的技術水平有很高的要求。
湖南圖書館于2008年開始進行自建資源庫建設,由于當時國內缺乏自建資源庫的元數據標準,使得湖南圖書館在建設資源庫時對字段的設置和著錄有一定“隨意性”。這幾年,國家圖書館對自建資源的元數據收割有一定的規范要求,而湖南圖書館的元數據還不能完全滿足國家圖書館的標準。
筆者調研了國內省級圖書館和副省級圖書館,得到24家圖書館回復。其中有8家使用TRS元數據平臺,有8家使用TPI(清華同方),有4家圖書館使用CDICM(中國數字圖書館有限責任公司),還有4家使用的是其他系統。具體見表1、表2。

表1 國內部分圖書館使用平臺調研統計
表2為常見的兩款軟件平臺(TRS和TPI)基本信息統計,通過對兩款軟件的功能比較發現,兩款軟件都能完成圖書館自建資源庫的建設。

表2 常見軟件平臺(TRS和TPI)分析
TRS(WCM+WAS)在用戶體驗和頁面展示方面更有優勢,包括錄入人員的錄入字段形式多樣,有多選框、文本框、下拉框等;錄入人員對圖片的處理更方便快捷;另外在頁面展示上更方便,可以根據不同欄目進行不同風格展示,而且這個過程能夠自己完成,不需要公司定制開發。TRS的缺點是需要兩套平臺完成特色資源庫的建設,錄入采用WCM元數據平臺,全文檢索采用WAS系統,兩者之間還要通過數據網關完成數據傳輸,會產生“檢索延遲”現象。
TPI的優勢在于對原始資源的文字加工標引,特別是對PDF文件中文字的識別,十分方便。另外,TPI錄入平臺與檢索平臺公用同一資源庫,不需要網關進行數據傳輸,也不會有“檢索延遲”的現象。缺點是文字錄入和模板方面功能不足。
我們建議將本館自建資源庫遷移到TRS(WCM+WAS)平臺上,原因有:①TPI在數據錄入和模板修改方面比較麻煩。現有自建資源庫的欄目展示方式、建庫方式TPI很難實現。②3個網站、5個自建資源庫都在TRS平臺下,可以實現網站與自建資源庫之間元數據的引用。并且減少系統維護量。③網站和自建資源庫數據的統一檢索無須第三方平臺支持。
TRS元數據平臺是國內用得比較多的自建特色資源庫平臺,其可用于圖書館對自建資源元數據的錄入和發布。該平臺可以將資源按照模板要求發布成靜態頁面,極大提高頁面訪問速度,這有利于網站推廣,并且該平臺能自動生成后臺錄入頁面,可減輕資源庫開發人員的工作量。
湖南圖書館原有TRS WCM平臺為6.0版本,需要升級到TRS WCM 7.0版本才能支持元數據平臺。除此以外,WCM 7.0與WCM 6.0相比還具有以下功能:①平臺、選件一體化升級。也就是說一份安裝介質,通過注冊碼控制選件數目。②應用功能易于擴展和定制。文檔列表、文檔編輯頁面、文檔可視化編輯器支持自定義。③支持更多的插件和功能模塊。如元數據模塊、微博內容的管理模塊、專題制作、嘉賓訪談、績效考核、移動門戶等。④其他功能。界面調整,支持IE 10,處理速度優化,安全性加固,支持拖拽,可視化的模板設計等。
TRS元數據平臺:用于元數據錄入和頁面發布。
TRS WAS平臺:用于檢索功能的實現和檢索結果展示。
TRS網關:用于將元數據平臺的數據傳輸到WAS平臺。
從現有4個特色資源庫中,按新的元數據規范和定義,分別遷移出8類數據,對應組成8個基礎元資源庫,即索引庫、人物庫、文獻庫、圖片庫、音視頻庫、項目庫、機構庫、實物庫。也就是將4個特色資源庫的人物整合成人物元數據,文獻整合成文獻元數據,圖片整合成圖片元數據,音視頻整合成音視頻元數據,非遺項目放入項目庫,其他資料整合成索引元數據。整合完成后再將元數據引用到不同的特色資源庫欄目中進行展示,不同欄目之間的關聯關系通過“相關度”進行關聯。這種做法的目的是實現元數據著錄與前臺展示的分離。
原則:①標準化元數據字段。②簡化關聯方式,錄入人員不用著錄“關聯字段”。③規范圖片的錄入方式和一條記錄多頁的錄入方式。④取消現有的flash版權保護方式,采用PDF文件進行保護。
優點:①同一條元數據可以引用到不同特色資源庫中進行展示。②能較好地解決當前自建資源庫存在的問題。③取消手動關聯,錄入效率將大大提高。
缺點:關聯精度會降低。相關聯的內容可能會存在將重名、相似名的內容關聯進來。如:人物庫的相關人物會把同名同姓的人關聯在一起。戲劇庫的劇種關聯可能會把“湘劇”和“衡陽湘劇”的關聯在一起。
3.4.1 檢索功能設計
根據不同用戶的檢索習慣,系統提供普通檢索和高級檢索兩種方式。
3.4.1.1 普通檢索功能。普通檢索是類似谷歌和百度搜索引擎的快速檢索方式,可以降低用戶使用門檻,讓檢索變得簡單。該檢索方式會對這4個資源庫內所有有檢索意義字段進行全文檢索,從中匹配與檢索詞相關的記錄,并按照相關度的高低依次展示給用戶。每個資源庫的每個頁面左上或右上角可以直接使用該檢索功能。
3.4.1.2 高級檢索功能。高級檢索提供資源庫、題名、關鍵詞、人物、時間、摘要、全文等多字段的組合檢索,讓用戶能更精確地檢索到所需信息。
3.4.2 前臺頁面設計
①前臺展示樣式和內容基本按照現有內容,但現有展示方式將會改變,如人物庫三級頁面的相關邊欄展示將改為鏈接的方式,不再列出具體條目。再如人物庫的親屬關聯可能無法像現在的形式展示。②重新制作所有前臺頁面的發布模板,這需要對原有模板進行梳理,再對全部置標進行更改,關聯的欄目需要在外網WAS上重新建立頻道和模板。
筆者提出的特色資源庫的建設思路是:構建具有通用性的基礎元資源庫,采用通用的細覽發布模板,靈活組配發布成不同的資源庫,并建立統一的特色資源檢索平臺。該方式充分保留已有特色資源庫的建設成果,同時大幅提高資源庫加工的效率。另外,還適用未來更多特色資源庫建設的要求。