臧國全 牟佩 韓璟瑤
(鄭州大學信息管理系,河南 鄭州 450001)
CALIS認為,“學科導航是以學科為單元對因特網的相關學術資源進行搜集、評價、分類、組織和有序化整理,并對其進行簡要的內容揭示,建立分類目錄式資源組織體系、動態鏈接、學科資源數據庫和檢索平臺,發布于網上,為用戶提供網絡學科信息資源導引和檢索線索的導航系統”[1]。由此可見,構建“圖書情報學”學科導航的主要目的是將分散在因特網上圖書情報學科的學術信息資源加以集中,并進行有序化處理,方便本學科用戶快速全面地獲取所需信息資源,了解本學科研究前沿領域和發展動態,實現信息共享。
國外方面,最早的圖書情報學科導航出現在1996年的歐洲DESIRE一期工程中,該工程將“圖書情報學”作為選題之一,收集整理并集中展示歐盟范圍內圖書情報教育培訓機構、有關該學科的學會協會以及各種學術會議。之后,有代表性的有四:①萬維網虛擬圖書館中的“Information and Libraries”選題[2],該選題是目前為止圖書情報學界影響最大、搜集網絡資源最全、用戶最多的導航型虛擬圖書館,但最大的缺憾是以外文信息(尤其是英文)為主體,中文信息資源甚少;②公共圖書館網站中的“圖書館”網絡導航,該類導航搜集的資源大多是各類圖書館的主頁、信息鏈接的列表以及公共領域的信息服務項目,甚至還包括有關圖書館使用的商業軟件、多媒體資料、電子期刊和圖書等,但這類導航的最大不足是收錄的學術信息資源太少;③高等學校圖書館網站中的學科導航,比如,華盛頓大學圖書館網站中“圖書情報學”學科導航[3]設有 Articles、Books、e -Journals、Dissertations等7個欄目,同時提供與圖書館員對話、評論等功能,但這類導航也僅有英文資源;④圖書情報學教育機構網站中的學科數據庫鏈接入口,例如美國佛羅里達州立大學信息學院網站中設置的圖書情報學有關的數據庫鏈接(如books in print、ACM digital library 等鏈接),但這類鏈接要實現真正訪問數據庫,還必須通過注冊等方式。
國內方面,學科導航的研制始于1999年,目前為止,學科導航的系統化建設集中在CALIS中心發起組織的、由眾多高校圖書館參加立項實施的各個學科領域。針對圖書情報學科導航,建設機構有三:①高校圖書館,如北京大學圖書館的新學科導航數據庫中建立了“圖書檔案學”專題[4](包括圖書館學、情報學、檔案學、信息管理等二級學科),但收錄的僅為包含有該學科的數據庫入口,而北京大學圖書館原建的“圖書情報學網絡資源導航”已經因缺乏維護導致多數鏈接失效,信息滯后;②高校的相關院系,如武漢大學信息管理學院的圖書情報學學科導航[5],該導航較為健全,但信息收錄不全面,有待完善;③公共圖書館,如國家圖書館的圖書館學信息門戶[6],該網站建設新穎,標簽設置獨特,但資源建設有待豐富。
由上可知,目前國內外“圖書情報學”學科導航建設的主力軍是圖書館等信息機構和圖書情報教育機構,并且已經初具規模,被廣大用戶使用。但是,也存在一些問題,主要表現在信息資源收錄不完整,要么是語種方面,要么是類型方面,要么僅為數據庫的鏈接。因此,從滿足用戶需求角度,探討建立一個比較完整的圖書情報學科導航是非常必要的。
圖書情報學科網絡資源的數量很難進行精確統計,筆者通過國內外幾個常用的搜索引擎進行了調查(見表1)。雖然通過搜索引擎進行檢索調查還存在不足,調查可能不全面,但表1數據至少可以表明,圖書情報學網上信息資源已經初具規模。因此,從信息資源保障角度,構建圖書情報學科導航是完全可行的。

表1 因特網上圖書情報學信息資源檢索結果(檢索日期為2012年2月21日)
2.1.1 利用網站直接訪問
這種方式分為兩種:①網站直接訪問,通過平時收藏或者友情鏈接等訪問瀏覽特定網頁來獲得所需信息,例如在查找圖書情報專業電子期刊時,可以直接登錄中國知網(http://www.cnki.net/),進入“中國學術期刊網絡出版總庫_特刊”,點擊“文獻分類目錄”——“信息技術”——“圖書情報與數字圖書館”,就可以找到相關期刊。②通過圖書情報學專業網站訪問,屬于此類的網站主要有:e線圖情、中國圖情網、圖書情報學科信息門戶等。
利用網站直接訪問方式具有查找目的性突出、內容針對性強、檢索結果準確度高、質量有保障等優點。但這種方法的檢索范圍十分有限,覆蓋面小,難以實現學科導航建設所要求的“盡可能全面收集相關網絡信息”目標。
2.1.2 通過搜索工具進行檢索
搜索工具的檢索方式有二:分類檢索和關鍵詞檢索。前者的一個示例是,在Yahoo的主題目錄下點擊“library and information science”類目,之后在這一類目下又細分為Education(42)、Events(4)等,其中每類后面括號注明的是站點數。后者的一個示例是,搜索引擎幾乎都提供關鍵詞檢索功能。
通過搜索工具進行檢索的方式操作簡單,運用多個檢索工具能達到較高的覆蓋率,有利于實現學科導航建設的目的。但是,這種方法的最大缺憾是檢索結果的信息質量參差不齊,且一般命中文獻的數量非常龐大,給內容篩選和甄別帶來很大困難。
鑒于上述兩種方法的優缺點,在建立“圖書情報學“學科導航時,綜合采用了直接訪問和搜索工具兩種方式進行相關信息資源的收集。
2.2.1 信息篩選
信息的篩選是將搜集來的信息進行去重、質量控制、URL的有效性甄別等操作,目的在于獲得高質量的網絡信息資源。信息搜集來源于多個渠道,從不同渠道中獲得的信息資源勢必存在重復現象,根據我們的實踐,這種重復現象很嚴重,所以必須去掉重復的網頁網站。由于因特網上信息資源質量參差不齊,在出版發布之前幾乎沒有一個類似傳統信息資源的質量控制過程,所以,對于去重處理后的網頁網站必須進行人工質量鑒定,去除質量低下的,保留質量高的。由于因特網是一個動態網絡,網頁網站隨時都有可能更新和刪除,所以必須對收集的URL進行有效性鑒別,去除無效的URL,保留有效的URL。
2.2.2 信息著錄
信息的著錄是對收集的網絡信息資源進行內容描述和格式描述。我們建立的學科導航對收集的每件信息資源的著錄項目包括:網頁網站的標題、網址、內容簡介、關鍵詞、國別及站點的類型。其中:
(1)標題,是用戶選擇瀏覽網頁網站的主要判斷依據。
(2)網址,是用戶瀏覽原始網頁網站的鏈接入口,對于由于鏡像等原因導致相同網頁網站產生多于一個網址的,采取同時著錄方式,各網址間用一定的分隔符隔開,這樣可以方便用戶選擇。
(3)內容簡介,也是用戶判斷是否需要進一步調出原始網頁網站進行詳細瀏覽的主要依據之一,本導航中的內容簡介除指明其覆蓋面外,還指明了收錄材料的起始時間、更新周期等。
(4)關鍵詞,是學科導航實現詞匯控制的方法,也是向用戶提供關鍵詞檢索的前提,本導航采用人工關鍵詞標引方式,保證標引質量,這也是檢索效率要遠遠高于一般搜索引擎的原因。
(5)國別及類型,是網頁網站的來源地區和類別,為用戶提供國別和類別的輔助選擇檢索之用。
2.2.3 信息組織
信息組織是依據導航所設計的分類表對收錄的網頁網站進行歸類的過程。本導航設計的分類表是一個主題分類表,簡單實用,具體包括下述7個一級類目,每個一級類目又劃分為若干個二級類目:
(1)網絡電子圖書。這是因特網上一種常見的學術信息資源。它具有出版發行周期短、“修訂”及時、內容相對系統全面、成熟可靠等特點。網絡電子圖書的一般來源有三種:現有紙介質圖書數字化后上網、原有的封裝型電子圖書上網和直接在網上出版發行的圖書。本類目收錄的圖書按照語種排列,分為中文、英文和其他語種三種,同語種的按照字母順序排列。
(2)網絡電子期刊。這也是因特網上一種常見的學術信息資源。網絡電子期刊出版周期短,報道速度快,刊載內容多,因而成為因特網上學術信息的重要來源。網絡電子期刊大致可分為兩種:(a)傳統期刊的網絡版。目前世界上大多數比較著名的印刷型學術期刊也通過因特網出版其網絡版;(b)純網絡型期刊。因特網上出現了大量的專門在WWW上出版的電子期刊,由于它不出版印刷版,因此通過因特網獲得這類信息成為了唯一的途徑,比如《Digital Library Magazine》[7]。為了用戶瀏覽的方便,本導航將根據期刊提供內容的詳略程度來劃分二級類目,包括提供題錄的期刊、提供文摘的期刊、提供全文的期刊。
(3)高校圖書情報學院系或專業。本類目收錄國內外所有設有圖書情報學專業的高校網址,并按國家分類。
(4)國際組織與地區組織。包括從事圖書情報領域的研究機構、實驗室、學術團體(學會、協會等)、相關產品的推廣機構等。本類目收錄的內容劃分為國際組織和地區組織兩部分,其中國際組織按字母順序排列,地區組織首先按國家,然后按字母順序排列。
(5)圖書館與情報機構。本類目收錄的圖書情報機構按國家地區排列,不同國家地區的按照類型來排列。
(6)學術會議。本類目收錄的這類信息可分為兩類,一是學術會議通知(包括征文通知),二是學術會議論文集。學術會議通知的生命周期很短,一旦過期就失去了存在的價值,應及時從虛擬圖書館中刪除。會議論文的學術性較強,內容新穎,往往反映了某一學術領域國內外的最新發展狀態,是研究人員了解和關注該領域學術研究水平和動向的重要信息來源。
(7)個人主頁。圖書情報學科已經出現了不少著名學者,其中有些已在因特網上開設了自己的個人網站,記載聯系方式、主要的出版著作和論文、主要的研究領域、研究經歷等個人簡介和在研項目及進展情況。本類目收錄的內容按照國別排列。
本導航系統包含前臺展示頁面與后臺數據庫兩個部分。實現過程包括三個步驟:前臺展示頁面的設計、后臺數據庫的設計以及數據庫訪問接口程序的設計。其中前臺展示頁面截圖見圖1。

圖1 “圖書情報學”學科導航前臺展示頁面
本學科導航系統采用了目前應用較為廣泛的ASP技術,生成動態、高效、易于交互的web網頁和基于web的服務器應用程序。展示頁面采用dreamwaver網頁制作工具,后臺數據庫采用SQL server,數據庫訪問接口程序包括前臺用戶信息瀏覽、檢索系統和后臺管理維護系統三個部分。前臺展示頁面整體上采用了框架技術,將分類表類目與檢索結果分開展示,用戶瀏覽簡潔明了。分類表組織采用了層疊式導航方式。
該學科導航提供六大功能:
(1)提供圖書情報學網絡信息資源的整合功能。將分散無序的因特網上的圖書情報學科信息資源進行有序化組織,便于用戶查詢利用。
(2)提供分類檢索以及檢索結果分頁瀏覽功能。
(3)提供關鍵詞檢索與組合檢索,以及檢索結果分頁瀏覽功能。
(4)提供信息資源快速在線更新(追加、刪除、修改)功能。減少維護成本,提高系統中網絡信息資源更新的及時性。
(5)提供用戶交互功能。對錯誤的鏈接和“死鏈接”進行修改、編輯或刪除,增添新的網絡資源,為用戶與系統管理員提供一個交互接口,提高學科導航系統的質量,增加收錄信息資源的完整性與準確性。
(6)提供檢索結果的導出功能。對檢索結果,系統提供了以純文本和超文本兩種格式進行導出的功能,增加了信息內容組織加工的靈活性。
無論采用何種搜索方式,想要完全搜集到因特網上所有圖書情報學信息資源是不可能的,不僅是因為任何一種搜索工具的網頁網站索引率目前都達不到100%(實際上,據報道,目前搜索工具中網頁網站的最高索引率也只有30%左右),更主要的還是因為目前的搜索工具無法搜索到因特網上的數據庫。實際上,因特網上存在大量的數據庫,并且絕大多數是商業化的(如DIALOG系統[8]包含的所有數據庫),這些數據庫包含的信息量非常大,甚至不少于網頁網站包含的信息量,學科導航中怎樣將這些數據庫的信息資源收錄進去,將是一個研究課題。
因特網的快速發展導致網上信息資源更新的速度也愈來愈快,在實現本導航中,我們就遇到了部分早期查找的資源鏈接已經失效。因此,如何保證鏈接的有效性是衡量導航建設質量的重要指標之一。可能的解決辦法有兩種:一是編制一個程序實現自動檢驗鏈接的有效性;二是通過管理人員進行人工周期性地檢查鏈接。
一方面是因為導航研制者使用和熟悉的語種限制,另外一方面可能是因特網的信息鴻溝(又稱數字鴻溝)所致。但是,只有盡可能全面地收錄各種語言出版或發布的圖書情報學科的網絡信息資源,本學科導航才有使用價值。這也是本導航建設重點關注的地方。
圖書情報學是一門綜合性學科,交叉了諸多學科,比如計算機、管理學、語言學、心理學等,因此,在信息資源收錄范圍方面,的確存在一些模糊之處。我們認為,導航是為用戶使用的,而不是搞學科范圍界定的,所以全面收錄一切相關信息資源,包括各類交叉研究的資源,是學科導航建設的一項基本規則。
雖然目前已有不少學科建立了導航,但到目前為止還沒有一個行業規范,包括最基本的收錄信息的類型、分類表的編制原則、著錄事項的選擇原則、元數據的配置類型、軟件的功能、界面模板設計與檢索性能等。規范的缺失可以使得不同學科導航建設各抒己見,各自發揮,這雖然實現了個性化的理念,但缺乏規范的建設質量是無法得到保障的。因此,制定學科導航的建設規范應該引起業界的重視。
[1] CALIS.CALIS重點學科導航庫建設之元數據規范.[2011 -11 -01].http://wenku.baidu.com/view/c634e36da98271fe910ef941.html.
[2] The www virtual library.Information and Libraries.[2011 -12 -20].http://vlib.org/InformationManagement.
[3] UW.University of Washington.[2012 -01 -09].http://www.washington.edu/.
[4] 北京大學圖書館.圖書檔案學學科導航.[2012-01 - 09].http://www.lib.pku.edu.cn/portal/portal/media-type/html/group/pkuguest/page/new_sub_nvgt_db.psml.
[5] 武漢大學信息管理學院.學科導航.[2012-03-01].http://sim.whu.edu.cn/xuekedaohang/xkdh.php.
[6] 國家圖書館.圖書館學信息門戶.[2012-01-01].http://navi.nlc.gov.cn/WEB_GT/.
[7] D -Lib magazine.[2012 -02 -19].http://www.dlib.org.
[8] DIALOG.Wlecome to DialogWeb.[2011 -12 -01].http://www. dialogweb. com/servlet/logon?Mode=1.