[摘 要]論述了學科信息導航系統的設計目標、開發(fā)環(huán)境、系統功能與特點,并從技術角度對該系統實現的關鍵性技術:智能采集和核心問題作了說明。
[關鍵詞]重點學科;信息導航系統;智能采集;數據庫建設
DOI:10.3969/j.issn.1008-0821.2010.08.014
[中圖分類號]G250.74 [文獻標識碼]A [文章編號]1008-0821(2010)08-0055-04
Design and Implementation of Professional Subject Information Guidance SystemLi Bin
(Library,Henan University of Technology,Zhengzhou 450001,China)
[Abstract]The paper expounded the design goals,the conditions of projecting,the function and characteristic of professional subject information guidance system.In addition,the paper introduced some important technologies and means in system designing.
[Keywords]professional subject;information guidance system;intelligent acquisition;database construction
Internet已成為人們獲取信息的一個重要途徑,網上的信息以極快的速度不斷的增長和變化,斯坦福大學教授Paul Saffo曾經說過:“未來既不屬于內容創(chuàng)造者,也不屬于渠道傳播者,而是屬于控制了過濾、查詢和使信息變得有意義的人,只有借助于他們,我們才能在廣闊的空間中遨游。”在信息極端泛濫的網絡時代,在紛繁蕪雜的信息中,網絡信息對于電腦來說實際上都是無意義的0、1而已,只有當它呈現給用戶時才表現為信息,并為人們實際使用時才表現為知識,但是因為數據信息的語義無關性、學科知識的機器不可知性和不可管理性,查找對自己有用的信息成為一個難題。借我一雙慧眼——信息導航系統,使用戶避免了網上漫無邊際的查找與長時間的等待,提高了信息的實用性。信息導航系統對信息進行信息的智能分析、聚合、傳送,信息導航系統實現了信息整合和快速傳遞。開發(fā)建設的重點學科導航系統、全面地收集并報道國內外行業(yè)及其相關行業(yè)的科技信息、市場信息,能為本學科的教學科研、全國行業(yè)提供優(yōu)質文獻信息服務。
1 系統開發(fā)理論基礎
學科信息導航系統是以學科為單元對館藏和互聯網上的相關學術資源進行搜集、評價、分類、組織和整理,并進行簡要的內容揭示,建立組織體系、資源數據庫和檢索平臺,為讀者提供導航的系統[1]。學科信息導航系統是深層次的信息咨詢服務,也是網絡資源開發(fā)和虛擬館藏建設的重要組成部分,更是建設數字圖書館的不可缺少的。導航系統在專業(yè)信息內容構建、提高用戶檢索速度和質量等方面有著重要的作用,是對信息服務質量深層次的提升。
河南工業(yè)大學圖書館依托學科優(yōu)勢和專業(yè)特色,一直重視重點學科文獻的收藏。充分發(fā)揮館藏專業(yè)資源的系統性、完備性和實用性,開發(fā)一個具有通用價值的,用戶可自行定制信息的重點學科導航系統平臺,全面地收集并報道國內外學科行業(yè)及其相關行業(yè)的科技信息、市場信息,并使用先進的數據采集方法,建立覆蓋學科領域核心資源、選擇性覆蓋相關學科核心資源的導航系統,構造一個較完整的學科網絡資源知識網格系統,給用戶提供方便快捷、切實有效的網絡導航。
2 系統設計
2.1 系統規(guī)劃
(1)導航系統平臺的計劃與需求分析。
(2)導航系統平臺的原理設計。
(3)導航系統平臺的數據庫設計。
(4)導航系統平臺的源碼設計。
(5)導航系統平臺的發(fā)布與測試。
(6)學科信息數據的采集與導入。
(7)導航系統平臺的鑒定和使用。
2.2 總體設計
系統的總體設計是基于微軟ASP.NET 2.0技術的基本架構。采用了模塊化的分層設計,使系統具有較大的通用和擴展性。導航系統總體結構設計包括:數據資源層、數據采集層、導航管理層、服務層[2]。
2.2.1 數據資源層
包括館藏有關圖書、期刊、專業(yè)數據庫和目前互聯網中普遍存在的專業(yè)信息資源。
2.2.2 數據采集層
數據采集有3種方式:(1)回溯整理館藏有關期刊及圖書。(2)定期地利用Google、Baidu、Yahoo、Sohu、InfoSeek等搜索引擎和專業(yè)數據庫,輸入選定的檢索詞進行檢索采集。(3)設定專業(yè)學科網站,配置規(guī)則,利用自動采集系統,提取相關專業(yè)數據信息。
2.2.3 導航管理層
包括以用戶需求為導向,根據采集后的數據特征,進行篩選、過濾、審核、分類、存儲和發(fā)布等數據庫管理和用戶管理等。
2.2.4 服務層
提供信息瀏覽、檢索、WAP和RSS服務。
4層之間相互協作,分別承擔數據資源來源、加工、管理和服務4個方面的任務[3]。其總體結構設計圖如圖1所示。
3 數據庫設計
后臺數據庫結構設計的完備性是實現導航系統各項功能的重要基礎。后臺數據庫結構應滿足用戶需求,同時應保證處理效率。學科信息導航系統的主要數據庫有:文獻數據庫、網絡資源數據庫、管理用戶信息庫、信息用戶注冊庫[4]。上述數據庫結構如表1所示:
表1 后臺數據庫結構表
文獻數據庫結構網絡資源數據庫結構管理用戶信息庫結構信息用戶注冊庫結構字段名字段類型字段名字段類型字段名字段類型字段名字段類型記錄ID自動編號記錄ID自動編號記錄ID自動編號記錄ID自動編號題名文本網址名稱文本用戶名文本用戶名文本責任者文本網絡地址文本密碼文本密碼文本責任者機構文本簡介文本權限級別文本權限級別文本關鍵詞文本關鍵詞文本單位名稱文本真實姓名中文摘要文本資源類型文本聯系電話文本通訊地址中文刊名文本語種文本E-MAIL文本聯系電話文本issn文本啟用日日期E-MAIL文本年日期工作量數值啟用日日期期數值費用余額數值頁數值有效賬戶邏輯全文文本
3 系統功能
(1)創(chuàng)建、發(fā)布和管理的平臺,采用ASP.NET 2.0進行分層開發(fā),具有靈活的產品架構、嚴密的安全性、優(yōu)秀的擴展性和伸縮性;平臺具有強大而完善的功能體系,包括:學術信息、展會信息、科研機構、協會組織、專利成果、標準規(guī)范、專家學者、市場產品、專業(yè)期刊、圖書評介、留言板、信息采集、問卷調查、友情鏈接、網站統計、用戶管理、WAP、RSS、模板管理、數據庫管理等近20個模塊。其中每個模塊又包含若干個子模塊,整個系統由各個功能子模塊緊密結合而成,構建出強大和完善的功能體系。
(2)系統收集國內外學科及相關行業(yè)的科技信息,并根據項目要求,錄入期刊論文、圖書、標準、學術信息等,數據庫覆蓋的文獻類型較為全面。建成后的學科信息導航系統既能反映出我國學科工業(yè)技術成長和發(fā)展的全過程,又能反映該領域內國際國內前沿學術動態(tài)。
(3)智能化的信息采集系統,可以直接深入到站點及其網頁的所有內容,將網頁中的有效數據采集出來(而不僅是網頁或鏈接),并保持數據之間的邏輯關系。例如對一個外部學科信息站點,采集系統可以將每個學科信息的標題、正文、作者、日期等信息單獨采集出來,分別作為字段存儲在系統中,并無縫組合形成自身的網站信息。可以對采集項目進行各種參數設置,如項目名稱、采集網站、編碼選擇、指定采集數量、采集順序、采集簡介、分類設置等等相關信息。可以自由添加各種采集過濾規(guī)則,對采集信息中不需要的信息或代碼進行自動過濾,以提高采集質量。可以自由添加各種采集排除規(guī)則,包括文本、數字、時間等字符類型,還可以選擇采集不含有或含有相關字符的內容信息。可以查看到所有的歷史采集記錄,包括所有的采集成功記錄及失敗記錄,可以對全部失敗記錄和成功記錄進行批量刪除,還可以對全部采集歷史記錄進行清空。自動采集系統工作原理圖如圖2所示:
圖2 自動采集系統工作原理圖
(4)系統提供了快速強大的搜索功能,能根據文章標題、內容、作者、錄入者等類別的關鍵字快速查找到您所需要的信息。
(5)系統提供對WAP和RSS的全面支持,使各類終端用戶都可訪問網站。WAP瀏覽器功能可以使網站的信息訪問在手機用戶群中的得到延伸,用戶可以通過手機隨時登陸網站了解最近發(fā)布的信息,管理員則可以通過WAP登陸系統后臺隨時審核新近提交的數據,實現網站的隨身管理。支持不同信息資源站點間的內容共享,形成信息交流網站群。
4 技術特點
4.1 采集智能化
系統自動采集系統對目標網站內容進行網頁鏈接提取、網頁正文提取、數據格式結構化等流程,抽取正文后需根據規(guī)則,對采集信息的標題、來源、作者、時間、類型進行封裝,形成統一的結構化數據。然后對結構化后的信息進行篩選、過濾、分類等整序和優(yōu)化工作,最后是存儲發(fā)布。學科信息導航系統實現了信息采集的的智能化,從而大大減輕了學科館員的信息搜集的勞動強度,特別是重復勞動,只要設定好相關檢索詞,范圍大小,學科信息導航系統能自動實現相關學科信息的采集,深入到站點及其網頁的內容,將網頁中的有效信息采集出來,并保持信息之間的邏輯關系。學科館員只要做好信息的審核入庫,這樣既把學科館員從繁瑣的重復勞動中解放出來,從事更深層次的信息開發(fā),又保證學科信息的高質量。
4.2 注重時效性
由于信息時效性的存在,信息資源的價值會隨著時間的推移而降低,所以我們在建設信息導航系統時要注重時效性。對收錄資源要進行細致的篩選、分類、評定,要特別注重收錄最新、前沿的相關信息。對那些最有價值、最具特色的核心文獻資料要做全文錄入,體現其核心學術價值。對于一些較少學術價值的資源,可做摘要或題錄錄入。這樣既可以節(jié)省數據庫的空間,又能滿足不同層次的檢索需要。同時全面支持WAP和RSS,最新的信息可以以最快的速度到達讀者手中,WAP和RSS技術具有私密性、垃圾信息屏蔽、易于訂閱和個性化信息聚合等優(yōu)點,并能縮短與讀者之間的信息延遲[5]。在圖書館學科信息導航系統應用中優(yōu)勢明顯。
4.3 系統安全性高
系統有著周密的安全策略和攻擊防護,全面防止各種攻擊手段,有效保證系統的安全。系統在用戶資料存儲和傳遞過程中,對密碼全部進行MD5不可逆加密處理,有效保證系統及用戶資料的安全。系統編寫了單獨的上傳組件,系統提供安全的管理認證碼設置功能,可使管理員進入后臺時除了輸入用戶名、密碼、驗證碼外,還要輸入設置存放在ASP文件中自定義的安全管理認證碼,以確保網站系統的安全。系統實行分級管理,將各部門人員分別設置成不同權限的管理員,并可以單獨設置其管理權限。每個管理員都有獨立的后臺管理界面,利用系統提供的安全性功能來實現用戶的身份認證和對資源的訪問授權。管理員登錄、黑客攻擊、越權操作、日常操作等都記錄在案,并提供給超級管理員查詢。
4.4 突出行業(yè)特色性
所謂“特色”,就是“高水平”,就是“非我莫屬”,“舍我其誰”,真正做到“人無我有、人有我優(yōu)、人優(yōu)我特”[6]。高等院校具有科技文獻資源方面的優(yōu)勢,不僅印刷版專業(yè)文獻系統完備,而且數字化資源量也極為豐富,各類中、外文文獻數據庫配套齊全[4]。高校圖書館的資源建設是為全校的教學、科研、生產服務的,而高校的學科建設又是面向行業(yè)、依托行業(yè)、服務于行業(yè)的,特色專業(yè)是高校的優(yōu)勢專業(yè),是行業(yè)人才的基地,在教學和科研方面均起到行業(yè)龍頭的作用。所以,圖書館面向特色專業(yè)的需求去開發(fā)數據庫,就是面向整個行業(yè)的需求。立足行業(yè)特色促圖書館的全面發(fā)展,以點帶面,通過建設行業(yè)信息導航系統促進高校圖書館的館藏建設,保證其文獻資源建設圍繞本校的學科、專業(yè)配置,重點保證特色專業(yè)和重點學科的需求。豐富與特色專業(yè)配套的文獻資源,全面反映該專業(yè)領域技術成長和發(fā)展的全過程,充分展示國內外該專業(yè)最新學術動態(tài)和科技水平。同時能通過利用信息導航系統服務特色行業(yè),加強學校與行業(yè)的交流,宣傳了學校、宣傳了專業(yè),提高了學校在行業(yè)中的知名度,擴大了圖書館在社會上的影響。信息導航系統服務以其創(chuàng)新性、實用性和有效性為企業(yè)的生產經營創(chuàng)造了經濟效益,給企業(yè)增添了活力,從而為行業(yè)的創(chuàng)新發(fā)展提供了信息保障。從而實現高校與行業(yè)的雙贏。因此,信息導航系統的建設一定要突出行業(yè)特色性,只有立足行業(yè)特色促發(fā)展才能服務特色行業(yè)鑄輝煌,只有特色的才是最有價值的,最具競爭力的。
5 結 語
高校圖書館作為我國現代信息產業(yè)的重要組成部分,處在社會信息化浪潮的前沿,其網絡化、數字化發(fā)展迅猛。圖書館經過傳統圖書館階段、自動化圖書館階段后,正在進入建立有序的信息空間、實現真正意義上信息資源共享為目標的數字圖書館階段。對高校圖書館來說,在這一社會信息化的急劇變革時期,如何充分利用信息技術和豐富的館藏資源,為教學科研服務,為地方經濟建設服務,是高校圖書館文獻信息工作面臨的巨大挑戰(zhàn)。建設信息導航系統是高校館應對這種挑戰(zhàn)的重要措施之一。只有將導航范圍確立在更加精煉的學科知識層上,精確控制導航的范圍,縮短導航步驟,才能提高用戶的信息獲取量和檢索效率[7]。信息導航系統建設是一項長期的系統工程,只有長期積累,才能保證信息導航系統的權威;只有不斷更新,才能保證信息導航系統的可持續(xù)發(fā)展。因此,信息導航系統建設必須立足行業(yè)特色,服務特色行業(yè),打造一個方便、高效的采集平臺,快捷、人性化檢索平臺,促進高校圖書館和特色行業(yè)的共同繁榮發(fā)展。
參考文獻
[1]徐佳寧,卞麗.我國高校“網絡資源學科導航系統”建設現狀調查分析[J].大學圖書館學報,2001,(3):56-59.
[2]胡昌平.面向用戶的信息資源整合與服務[M].武漢:武漢大學出版社,2007:245-247.
[3]胡昌平,陳果.網絡環(huán)境下區(qū)域農業(yè)信息集成設計及其服務推進[J].情報雜志,2009,(5):147-150.
[4]張會田.基于WEB的個性化網絡信息集成服務系統設計與實現[J].情報學報,2004,(1):27-31.
[5]周志峰.基于RSS的高校圖書館學科信息導航系統研究[J].現代情報,2008,(11):67-69.
[6]闕本旭.CALIS高校信息導航系統建設及實踐[J].圖書館論壇,2006,(3):14-16.
[7]裘江南,姚永祥.基于XTM的政務門戶知識關聯導航系統模型研究[J].情報學報,2007,(2):260-265.