包敬海
[摘要]如今,人們對網絡的依賴性越來越強。然而,網絡過載現象越來越嚴重,給學生管理工作者快速、準確地找到自己所需的信息帶來極大不便。采用網絡蜘蛛和Tag技術,構建一種學生管理工作個性化服務系統。利用網絡蜘蛛遍歷互聯網相關站點、搜集信息,并將用戶最需要的信息進行推送,滿足用戶對學生管理信息的需求。
[關鍵詞]個性化 網絡蜘蛛 Tag 搜索引擎 學生管理
隨著網絡的快速發展,一方面,人們對從網絡中獲取信息的依賴程度越來越大;另一方面,網絡中的信息爆炸式增長,也給人們快速、準確地找到自己需要的信息帶來越來越大的困難。傳統搜索引擎缺乏個性化的局限性日益突出,難以滿足學生管理工作者的需求。采用網絡蜘蛛和Tag技術,構建學生管理工作個性化服務系統,將最有用的信息向用戶進行推送。
一、傳統搜索引擎存在的難題
根據中國互聯網絡信息中心(CNNIC)2009年7月公布的《第24次中國互聯網絡發展狀況統計報告》可知,國內網民數量和網絡普及率保持高速增長,84.3%的網民認為互聯網是其最重要的信息渠道。對于廣大學生管理工作者,借助網絡尋找相關信息,提高管理水平,成為一項重要的任務。
但是,要在網絡的海洋中快速、準確地尋找到最有用的信息,并不是一件簡單的事情。通常,人們借助Google、百度等搜索引擎進行檢索。但是,由于網絡中信息數量增長過快,信息過載日益嚴重。信息過載指的是由于信息過多過雜,超出了人的處理能力,造成人們無法有效萃取出想要的信息的一種狀態。
信息過載發展迅速,嚴重影響人的工作效率。例如,2005年,在Google中關于“搜索引擎”的結果只有262萬條;到了2007年,筆者統計的結果為750萬條;而到了2009年7月,則高達3220萬條。在數以千萬計的檢索結果中,混雜著無數與用戶真實意圖并不相關的內容,使得用戶越來越難以快速找到真正滿足自己需求的內容。
其實,不同職業、年齡、愛好的用戶,對同一個要檢索的關鍵字要表達的意思是不一樣的。用戶檢索“jaguar”時,根據其興趣,所表達的意思是完全不一樣的。例如,動物、戰斗機,或者足球隊,等等。傳統的搜索引擎不能僅僅從關鍵字返回所有的結果,而應該根據用戶的職業、愛好等特點,向用戶提供滿足其個性化需求的一種信息服務,實現個性化服務。
二、學生管理工作個性化服務的需求
學生管理是一項繁瑣的工作,同時也責任重大,一旦出現意外事情,都會給學校、學生和自己帶來危害。因此,特別需要借助個性化服務系統不斷更新觀念,充實知識,提高教育學生的能力。
首先,學生管理工作者需要關注的問題還是比較多的,例如,安全、學習、就業、法律法規等。其中的細節很多,需要工作者盡量多掌握各方面的知識。其次,學生管理工作者需要不斷從網絡中獲取新信息,更新自己的管理理念,適應社會的發展。再次,學生管理工作是一項需要常抓不懈,如果沒有不斷充實新的實例,僅僅靠強調和空談理論,學生很難聽進去,效果不理想。而如果根據網絡中的相關新聞實例進行講解,分析起來更具體、更深刻,有的放矢自然能讓學生產生的共鳴。
因此,從網絡中獲取相關信息非常重要,教育工作者對此也有迫切的需求。
三、學生管理工作個性化服務系統的設計
根據教育工作者對學生管理工作信息的需求,針對網絡過載的難題,可以通過建設學生管理工作個性化服務系統的方法來解決。其思路為:收集網絡中的新聞,過濾掉無關信息,將相關信息分類存儲,并向用戶推送,實現個性化服務。
首先,不管哪個搜索引擎要收集網絡中的網頁,都需要使用網絡蜘蛛 (也稱為網絡爬蟲)沿著一定的開始路徑、按照一定的爬行算法去掃描互聯網,把爬行到的網頁收集到數據庫中。其工作原理如圖1所示。

當然,網絡中信息太多,要進行比較全面地掃描,只有Google等技術力量和硬件條件都比較雄厚的企業才能實現。但是,如果針對某個IP段或網站進行爬行,要求并不是很高。因此,筆者將該系統定位于爬行地方論壇、門戶網站的新聞欄目。這樣,既可以獲取全國各地可靠性較高的信息,操作性也較好。
然后,利用各種算法,將數據庫中的信息進行過濾。網絡蜘蛛搜集到的信息,很多是重復的,只保留權威性較高的即可。其次,對于那些與學生管理工作無關的,可以通過與Tag比較并排除。Tag(標簽、書簽)是一種采用平行的、可以自定義的詞匯來對一個信息文檔進行分類或表達。自Web2.0開始后,Tag的應用越來越廣泛。例如,新聞分類、論壇專題化、網址站點、博客等各個領域。在該系統的Tag條目中,用戶可以根據自己的需求自行添加。例如,“網癮”、“網友”、“詐騙”等。系統將相關信息貼上Tag以后,自然方便用戶進行查詢。如果服務器性能不高,可以只保留新聞標題、鏈接地址和Tag,這樣能讓系統運行更順暢。
最后,用戶進入系統時,系統根據用戶定制的興趣,把相關信息向用戶推送,實現個性化服務。同時,用戶還可以修改定制的內容,并可以提交對該新聞的態度(如圖2所示),幫助系統進行分析、排序,提供更好的服務。

四、結束語
利用網絡蜘蛛對地方論壇、門戶網站的新聞欄目進行搜集信息,通過與系統的Tag進行比較,清除無關信息,并對信息進行分類。最后,根據用戶定制的興趣,將最有用的信息向用戶推送,實現對學生管理工作者的個性化服務。
參考文獻:
[1]CNNIC.中國互聯網絡發展狀況統計報[EB/OL].
[2] David Bawden,Clive Holtham,Nigel Courtney.Perspectives on information overload.Aslib Proceedings,1999,51(8):249.
[3]黃國景.元搜索引擎個性化搜索的研究與設計[D].蘇州大學碩士論文,2005.
[4]曾春,邢春曉,周立柱.個性化服務綜述[J].軟件學報,2002,(10).
[5]司姣姣.Tag的發展研究[J].山東圖書館學刊,2009,(1):66-70.
基金項目:廣西教育廳科研項目(200708MS073)。