杜 亮 王 芳
(1.沈陽航空工業學院,遼寧 沈陽 110136;2.沈陽體育學院圖書館,遼寧 沈陽 110102)
杜 亮 男,1978年生。碩士,畢業于東北師范大學傳媒學院圖書館學專業。館員,期刊部主任。發表論文5篇,完成校級課題1項。
王 芳 女,1979年生。碩士,畢業于東北師范大學傳媒學院圖書館學專業。館員,發表論文8篇。
隨著圖書館數字化的日益發展,特色數據庫已經成為各高校圖書館數字化建設的重要組成部分。每所高校都有自己的辦學特點和重點學科,高校圖書館也會在相應的學科方向上形成較為豐富的文獻館藏。針對這類重點學科進行特色數據庫建設,既可以促進圖書館對信息資源進行深加工,提高服務質量,增強該學科對教學、科研的重點扶持力度;又可以使圖書館更開放地面向社會,提高館藏資源利用率,增強該學科在國內及行業中的影響力。2009年沈陽航空工業學院圖書館開始應用TPI系統,建立本校的航空特色數據庫,在實際工作中取得了一定的成績。
TPI系統是專業的文檔管理系統,提供全文檢索、電子書制作、文檔統一轉換、元數據標引、文檔分類管理、內容動態發布等功能,實現對文本、圖像、音頻、視頻等各種類型資源的管理,可廣泛應用于數字圖書館特色庫建設、數字檔案館建設和各種類型的文檔管理系統。TPI系統是基于非結構化文檔管理而開發的大型智能內容管理系統。該系統以FTS(即全文檢索服務器)為核心,采用流行的B/S瀏覽器的檢索方式和先進的C/S架構,能夠同時管理文字、圖片、多媒體等信息,并提供全文檢索服務,支持網頁的動態發布。該系統是一套基于網絡平臺用于知識倉庫創建、生產、管理、維護和發布的工具軟件系統[1]。
TPI系統為圖書館的特色數據庫建設提供了一套全面的解決方案,它包括全文檢索服務器程序、電子圖書制作、元數據加工、內容發布、數據轉換、遠程教育等子系統。TPI系統的核心是KBASE檢索服務器,它實現了信息的組織、存儲與檢索;電子圖書制作、元數據加工實現了原始文獻資料的數字化和組織;內容發布、檢索網關和TPI檢索服務器共同實現了資源發布。
TPI系統的主要性能和突出特點是完全兼容現階段普遍使用的MARC標準,支持Z39.50服務,完全兼容最新的Dublin Core標準,支持XML文件格式,支持最新的OAI協議,支持最新的METS協議,支持11種CALIS元數據模板,支持統一認證和單點登錄。先進的安全機制、電子圖書的制作、檢索手段的豐富、支持動態實時信息的處理,實現了流水線控制;可以利用COM組件實現二次開發。由此可見,該系統的性能可以滿足自建特色數據庫的要求,依托該平臺進行航空特色數據庫的建設是可行的。
選題是特色數據庫建設的關鍵,也是資源建設方向定位的重要環節。根據本校作為東北地區唯一一所航空院校的實際情況,確定選擇此專題作為數據庫建設的目標。建設航空特色數據庫的總體規劃是:一方面對本館及東北地區的航空文獻紙本資源進行搜集、開發與整合;另一方面對有關航空方面各種格式的網絡文獻資源進行挖掘與整合,最終將這些文獻資源進行數字化加工處理,劃分成若干個子庫,統一在同一檢索平臺,在WEB服務器上發布。實現目錄檢索、分類檢索、主題檢索和全文檢索,實現讀者網上輕松閱讀和下載。達到和CALIS成員館一樣,統一標準、分散建設、共建共享的預期目標。首先確定建庫信息源的種類,包括圖書、期刊、圖片、會議論文和網絡資源等載體類型;然后對收集到的文獻進行篩選、整理和組織,以確保數據庫中文獻的含金量。篩選、整理和組織文獻的過程是知識管理的過程,這一過程關系到整個數據庫的質量,需要在學科專家的建議和指導下,由專業人員和圖書館建庫人員共同來完成。
航空科學是一門專業性極強的科學,它包含航空基礎理論及試驗、飛機構造與設計、航空發動機、航空儀表、航空設備、飛行控制與導航、航空材料、航空制造工藝、各類型航空器、航空燃料及潤滑劑、航空飛行技術、航空港、機場及其技術管理、航空系統工程等內容[2]。數據庫建設就是按照以上學科體系來收集、篩選、整理、組織相關有學術價值和利用價值文獻信息資源,再將這些文獻信息按其知識體系劃分為不同的知識塊(即數據庫子庫),最終組成知識倉庫。劃分不同知識塊的過程也為以后建立數據庫的信息導航與檢索分類奠定了基礎。航空特色數據庫由以下5個子庫組成:航空書目信息子庫、航空期刊信息子庫、航空圖片信息子庫、航空會議論文信息子庫、航空網絡資源信息子庫。
具體步驟:第1步,安裝TPI系統后,啟動CPS管理工具,在工具欄上選擇新建數據庫。第2步,選擇數據庫模板,系統會提供各種不同定義的模板類型,根據創建航空數據庫的需要,選擇書目、期刊、圖像、會議論文和網絡資源模板。第3步,給數據庫命名,輸入數據庫信息。第4步,定義字段信息,選擇不同的數據庫模板類型,會有不同的字段信息,用戶可以直接使用該模板的字段,也可以根據自己的需要添加或修改字段信息。第5步,設置數據庫的發布選項和數字對象的命名方式。
3.3.1 紙質文獻的數字化
沈陽航空工業學院圖書館積累了豐富的有關航空方面的圖書、期刊、會議論文、圖片、畫冊,利用E-BOOK電子圖書制作專用工具,通過書頁掃描、掃描圖像處理、OCR識別處理、書頁壓縮打包等工序,快速生產電子圖書,對轉化過來的電子圖書,還可以利用該系統軟件對圖像的灰度、傾斜度、比例、顯示等進行加工、處理,生成PDF文件,并以PDF文件格式導出。
3.3.2 網上信息資源搜集
TCP/IP與檢索服務器連接,通過有效設置可以自動采集網上航空方面的信息資源,可以實現信息的分布式加工,采取可視化操作。TPI系統的信息采集系統RIC,是對Internet進行信息監視、挖掘、抽取的一個系統,通過智能網頁分析器,根據館員的預定,自動定時對相關網站或網頁實時分析,將返回的結果放入全文檢索庫FTS中。館員只要預先設置所要采集的網站或網頁參數,設置所要采集的媒體類型,設定采集任務的自動啟動時間、信息更新周期,還可以選擇采集策略:深度優先,還是廣度優先,RIC系統就可以自動采集網上信息。
入庫的記錄要經過數據加工,才能最終發布到網上。數據加工包括數據標引、分類和檢查3方面內容。
3.4.1 數據標引
在特色數據庫建設中,標引和分類的工作量通常很大,有些數據庫的數據量達到十幾萬條,可將這些標引工作分配給不同的用戶,以方便快速地進行多人并行工作。首先,由“管理員”啟用“元數據加工工具”中的“分配任務”功能,將入庫的原始數據分配給各“標引員”,該工具支持Word文檔、HTML文件、TXT文件以及PDF格式文件的標引。標引員可直接從原文中拖選需要的內容,操作簡單、直觀。如果元數據信息在入庫時已經十分完整,就不再需要手工標引程序。
3.4.2 數據分類
TPI利用可視化的操作界面實現數據分類的全過程。該模塊在預制了標準的中圖法分類體系同時,也允許用戶自定義分類體系。用戶可根據自身需要創建相應的導航樹結構,將庫中的記錄進行分類,以方便數據的管理和訪問。TPI系統數據庫制作工具DMT可以對數據自動分類,同時根據用戶選定的分類體系自動生成相應的導航樹,在導航樹的基礎上用戶只需將記錄拖到相應的結點,系統就可以記錄相應的分類號??紤]到每個讀者會有不同的檢索習慣,為了方便讀者使用,可考慮多種分類標準,如中圖法分類和學科分類等。
3.4.3 數據檢查
對入庫數據的真實性和準確性要進行質量控制?!皺z查員”在得到了任務之后,逐條對數據的字段信息和數字對象進行審核。若標引信息準確無誤,則把該條記錄標記為“記錄正確”;若信息不符合要求,則標記該條記錄為“標引錯誤”,并且在彈出的“錯誤信息”窗口中輸入錯誤原因,以便繼續修改。數據檢查是數據庫管理中重要的一環,對建立數據庫起到了質量保障作用。
數據處理完畢,使用TPI系統中“內容發布工具”的“Web發布向導”功能進行數據庫網上發布的相關配置。通過該向導可以實現以下功能:①設置數據庫的版權信息,這些內容將被顯示在網頁上。②選擇數據庫發布模板。根據數據庫內容的不同,TPI系統預制了與之相對應的不同形式和不同特點的發布模板:CNKI期刊風格、Google風格、EI風格、OCLC風格、圖片風格等。支持用戶基于數據庫字段的個性化發布定制。③確立檢索點,指定字段屬性。在這一環節中,哪些字段可以作為檢索點,概覽頁面顯示的字段,細覽頁面顯示的字段都將被逐個確定清楚。④配置個性化的初級和高級檢索界面。每頁顯示記錄條數,文字的字體、字號、字形和顏色、背景圖片、檢索命中文字的屬性等都可以進行個性化的配置。
TPI系統具有用戶權限管理、數據庫維護、統計等功能,可實現數據庫的引入、刪除、清空數據庫、數據更新、索引數據庫、數據庫備份等功能。用戶管理模塊包括“用戶”、“角色”兩個模塊。在用戶管理模塊里可以對檢索者進行IP限制、賬號限制、時間限制和訪問數據庫權限限制。未經授權的用戶無法進行相應的操作,而角色管理模塊則確定了系統管理員、數據庫管理員、普通用戶等,該功能非常適合對不同讀者的管理,既確保了系統的安全又方便了數據庫管理。另外,TPI系統提供了數據庫備份功能,系統管理員可以根據數據庫服務特點,選擇定時自動備份和隨機手動備份方式,及時地把數據備份到另一臺網絡服務器中,以防不測。
利用TPI系統建設高校特色數據庫已經成為當代圖書館數字化建設的重要內容,運用TPI系統自建數據庫,使整個建庫工作更加靈活、簡便、系統化、智能化。只要我們認真了解和學習掌握TPI系統功能,結合本館資源的具體狀況,突出特色,所建成的數據庫就會受到師生的歡迎。
[1]清華同方.清華同方信息資源建設與管理系統技術白皮書,2008.
[2]中國圖書館分類法編輯委員會.中國圖書館分類法[M].北京:北京圖書館出版社,1999.