龍國華
(四川交通職業技術學院圖書館,四川 成都 611130)
龍國華 男,1980年生。本科學歷,館員。研究方向:數字化圖書館建設。
目前,國內圖書館的網絡信息資源大部分是通過購買各個商家的數據庫以及檢索平臺,來滿足自身對數字資源的需要,這種完全依賴于商業數據庫的現象越來越嚴重。信息資源共享平臺完全受控于各個商家,商家在建設之初一再表示的確定性、穩定性,隨著商家平臺的發展與完善,商家的共享平臺綁定越來越多的圖書館,信息資源共享平臺對于各高校來說是一個不明確的因素。
比較有實力的高校圖書館需要什么數字信息資源,就買什么數字信息資源。相對于這些高校館,還有一些高職、高專館,資金、技術、人力都相對欠缺,很難需要什么就購買什么,在這種情況下,建立信息資源共享平臺,可以緩解很大一部分圖書館信息短缺的現象。構建高校圖書館的信息資源共享平臺,一方面,通過信息資源共享體系的統籌規劃,對文獻信息資源的采購進行館際協調,確立各館的藏書體系,分工協作,盡量減少書刊重復采購現象,可提高圖書館經費的購買能力。另一方面,館際互借成本遠遠低于購書價格,圖書館在不支出大量經費的同時就能增加大量數字館藏,從數量到種類都能極大地豐富本館館藏,節省大量經費。高校圖書館的資源共享建設已經擺在我們面前,建設數字信息資源共享平臺,是解決目前高校圖書館資源共享的最好方法。在高校圖書館領域內構建信息資源共享平臺,每個參加共享計劃的高校圖書館可以利用其他成員館的館藏。同時,通過資源共享體系也豐富了每個館可利用的文獻信息資源種類,保證了文獻信息資源學科品種的穩定性和全面性。
利用文獻信息資源共享平臺,通過統一檢索、數據庫共享等方式,各成員館的館藏資源可獲得更多的用戶。尤其是大量處于閑置狀態的資源可能獲得充分的利用。例如:一些財經類高校以財經類學科為主,理工類學科數字資源規模較小,資源利用率較低,但是共享體系內的理工類高校圖書館的理工類數字資源比較豐富。財經類高校的理工科讀者可以通過資源共享平臺,充分地利用理工類高校的數字資源,做到“有其讀者就有其資源,有其資源就有其讀者”,用戶的信息需求獲得了更好的滿足。各館數字資源利用率也大大提高,圖書館能夠獲得更大的社會效益和經濟效益。
“資源共享、利益互惠”應該成為驅動各高校圖書館發展所追求的目標。要保持目標的一致性,首先要加強各高校圖書館間的資源采集規劃銜接,防止雷同和重復建設。注重資源布局的梯度和分工,發揮優勢,形成產業鏈,增強產業聯動效應。但是在實際運作中,各高校圖書館由于各自在發展規模、水平、管理模式、人力和財力資源以及發展目標等方面存在較大的差異性,主要表現在利益和要求上的不平衡。同時,各高校館作為獨立的組織個體,為適應社會需求,總是在不間斷地改變著自身的生存和發展方式。為此,各高校館有必要隨時對各館狀況和發展目標進行定期檢查,以確保目標的協調一致。同時,各館必須及時考慮各種變化因素,平衡各種利益與要求,確定共同的發展目標,形成和保持一致的目標。
圖書館的信息資源建設與該館館藏、院校類別、招生對象、學科專業、人才培養、科研項目、教學需求、資金設備等實際緊密結合起來,走具有自身特色的數字化館藏的發展道路。同時,還可探索走館藏與開發結合起來的路子,創辦具有各館特色的電子刊物、電子專藏、電子題庫等,實施館藏與開發信息資源互補,雙輪驅動,從而加快信息資源特色建設,不斷完善特色信息資源的服務體系。每個高校圖書館都能夠清楚地擬定自身藏書的特色以及在共享平臺藏書結構中的地位,并且在已有特色的基礎上按照分工進一步鞏固和發展特色,那么各館就能在整體上形成優勢互補的良好局面。各館在特色館藏方面的合作,不僅可以優化圖書館的特色服務,而且能夠大幅度提高讀者對圖書館的滿意率。
信息資源共建共享,實現的方式只有一條路可走,建設一個資源共建共享的平臺,通過平臺來實現數字信息資源的共建共享。平臺的任務是提供一個方便、快捷的信息傳遞方式,讓各成員館的讀者能輕松地檢索和取得所需信息。
數字信息資源共享平臺應對區域中心圖書館、各成員圖書館和數據庫商的各種異構數字資源進行整合,為用戶提供一種更好的整合檢索服務,從而提高資源的利用率。
各館資源數據庫有各種不同的數據模式,它們之間可能存在著各種差異和沖突。為了給多數據庫用戶提供透明的訪問接口,需要在共享平臺的全局層屏蔽這些差異,但又不能簡單地通過修改局部模式來解決,因為共享平臺要保證各成員數據庫的自治性,以保證那些建立在各自數據庫之上的原有應用程序仍然能夠繼續運行。通常的辦法是在共享平臺中構造一個全局模式,這一全局模式是由各參與的成員數據庫中的局部模式經過一定的模式變換得到的。
各圖書館有不同類型的數字資源,并有其不同的數據存儲格式、訪問方法和檢索界面,有的部署在本地,更多的分布在異地和國外。共享平臺旨在針對這些異構數字資源為用戶提供一種更好的整合檢索服務,從而提高資源的利用率。
共享平臺能夠對分布在本地和異地的各種異構資源提供統一的檢索界面和檢索語言。共享平臺提供全方位的檢索方式,不僅支持布爾檢索、相關度檢索、全文檢索,還支持多種檢索運算符以及組合檢索(檢索表達方式中混用全文和字段模式)、位置檢索、英文詞根檢索,能夠為專業用戶提供特別的檢索服務。
利用數字信息資源共享平臺,管理員能對各種信息資源的訪問進行限制、監控、統計、計費等處理。管理員可自行制定有關資源的訪問策略,以便更好地提高資源的利用價值。
共享平臺提供了基于異構系統的跨庫檢索服務,用戶可按學科、數據庫名稱、文件同時檢索多個平臺上的多種資源,輸入一個檢索式,便可以看到多個數據庫的查詢結果,并可進一步得到詳細記錄和下載全文。與此同時,讀者也可選擇單個數據庫,針對某種具體資源進行個性化檢索。
向用戶提供統一的查詢界面,將用戶的查詢要求轉化為不同數據源的查詢表達式,并發地查詢本地和局域網上的多個分布式異構數據源,并對查詢結果加以集成,在經過去重和排序等操作后,以統一的格式將結果呈現給用戶。共享平臺能夠減輕用戶學習檢索不同數據源的負擔,并發檢索,能節省用戶的檢索時間,結果集成,大大方便了用戶的瀏覽和選擇。
數字信息資源檢索涉及到統一檢索用戶界面和檢索功能設計、異構數據庫的互操作、查詢結果處理中的信息融合等問題。基于元數據的檢索系統要充分發現各個源數據庫的共性,同時要兼顧不同數據庫的差異性,讓用戶可以選擇使用特定數據庫的獨特檢索功能。
各數字信息資源提供商一般都提供了Web檢索頁面,利用這些文獻資源數據庫系統提供的Web客戶端訪問接口檢索界面,提取共性部分,構建統一檢索界面,針對用戶在統一檢索界面中輸入的查詢條件,利用多線程技術同時構造針對各個數據庫系統的查詢表單數據,用Get方法或者Post方法提交,獲取并分析返回的結果數據,返回的結果數據一般都是頁面格式或者XML格式,根據所對應特定標簽或者標志來分析處理以及合并目標數據,這些目標數據包括題名、作者、出版日期、摘要等元數據以及獲得的元數據:條目數目、全文超鏈接等,最后將處理結果呈現給用戶,實現了統一檢索的目的。這種方法適用于所有提供了Web查詢檢索訪問的數據庫,不同的數據通過中間件的語言整合,不需要源數據庫系統做出任何修改,具有廣泛的適應性,并且實現起來難度不大。
如果各個文獻資源數據庫系統都開發符合某種標準的接口,并且制訂了通過網絡訪問這種接口的標準,那么,統一檢索系統就可以方便地訪問這些數據庫系統,從而為用戶提供統一的檢索界面。為此,可以利用現有協議以支持統一檢索,也出現了專門用于實現統一檢索的協議。
各館有各種不同的數據庫,查詢方式和數據結構大不一樣,建立統一數據庫檢索語言,把異構數據庫的互操作、查詢等信息融合,把用戶的檢索語言轉換為統一數據庫檢索語言,再把統一數據庫檢索語言轉換成各種不同數據庫的檢索語言,把數據從數據庫中提取出來。
綜合上述分析,結合目前計算機語言發展與國內高校圖書館的現狀,數字信息資源共享平臺基于.NET語言來實現,由以下4個模塊組成,即用戶端模塊、中間件模塊、數據訪問模塊和安全控制模塊。
在客戶端設計各圖書館的選擇復選框以及所包含的數據信息資源庫,根據用戶的需求可以自主地選擇需要檢索哪些圖書館以及哪些數據庫,這樣可以提高用戶的查準率以及檢索時間。根據設計要求,用戶在網頁中填好相應的檢索信息,點擊“檢索”按鈕就可以提交信息。為了保證用戶提交信息的完整性和準確性,在網頁中嵌入.NET語言,以html和aspx的結合方式實現網頁,用來初步檢驗用戶提交的信息,然后通過http協議向中間件模塊發送用戶提交的信息。檢索得到的結果通過http協議發送服務器,返回信息顯示在檢索頁面。
使用.NET技術對用戶端提交的數據進行解析、分解、優化,轉換成不同類型數據庫檢索語言。數據集成系統通過中間件將各數據源的數據集成起來,通過各數據源的包裝器對數據進行轉換使之符合該模式。用戶提出查詢時不必知道每個數據源的接口,中間件并不提供存儲數據的功能,數據存儲在局部數據源中。用戶的查詢命令通過查詢分解器進行分解,并將其轉換為基于各局部數據源模式的查詢。然后其查詢執行引擎通過各數據源的包裝器將結果抽取出來,并由中間件將子查詢返回的數據綜合起來得到查詢結果返回給用戶。
把提交的數據轉化成數據庫的檢索語言,從數據庫中提取數據。由于ADO.NET傳送的數據都是XML格式的,因此任何能夠讀取XML格式的應用程序都可以進行數據處理。ADO.NET是一組用于和數據源進行交互的面向對象類庫,通過ADO.NET訪問數據庫,不僅可以方便地連接數據庫,而且可以對用戶屏蔽異構數據庫系統的差異,用戶不需要了解不同數據庫系統的差異就可以方便地取得需要的數據。事實上,接受數據的組件不一定要是ADO.NET組件,它可以是基于一個Microsoft Visual Studio的解決方案,也可以是任何運行在其他平臺上的應用程序。
整個系統的實現,離不開對各個過程進行有效的安全控制,安全控制做得好與壞,關系到整個系統的使用效率,甚至影響到整個系統的成敗。實現安全控制可采用以下方法:
加裝防火墻以及代理服務器,保護數據服務器的安全。安裝一臺Web代理服務器,用戶提交的檢索請求通過Web代理服務器向服務器進行檢索,服務器把檢索結果返回Web代理服務器,然后返回用戶的檢索頁面。在服務器所在局域網內安裝一臺代理服務器,一般情況下,這臺代理服務器沒有出現在檢索與服務過程中,使其在網絡中隱身,只有當管理人員需要維護與更新服務器時,通過遠程激活這臺服務器,讓這臺服務器在遠程管理人員的控制下,從而控制其他的數據服務器。
利用.NET的各種選項卡,加強身份認證,不同用戶分配不同權限,根據用戶不同使用偏好來分配數據庫的使用權限,控制用戶對數據庫的檢索與使用。限制IP地址,對參加建設共享平臺的圖書館訪問互聯網出口IP地址進行綁定,以及對那些需要使用本平臺的用戶IP地址綁定,防止外來潛在危險的攻擊,防止盜用身份,特別是管理員的身份。
對傳遞過程中的數據進行加密,可為需要結構化數據安全交換的應用程序提供數據傳遞安全的保障。
[1]劉甲學,馬海群.基于OGSA的數字信息資源共享平臺研究.圖書情報知識,2008(4).
[2]龔成清.基于.NET的異構數據庫查詢系統的設計.武漢職業技術學院學報,2009(1).
[3]許鑫,蘇新寧.高校數字資源整合平臺研究.現代圖書情報技術,2005(9).
[4]文南生,龍國華.關于四川省高職院校圖書館聯合體構建的思考.圖書館理論與實踐,2009(12).