999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

校園內網搜索引擎構建的必要性分析

2012-01-01 00:00:00魯屹華
科技資訊 2012年2期


  摘要:分析了當前通用搜索引擎的原理和體系結構,研究了通用搜索引擎在應用于校園網信息檢索時無法完整準確的不足之處以及校園Web信息的特點,總結了校園網搜索引擎應該具有特性以及建設的必要性。
  關鍵詞:校園內網搜索 搜索引擎
  中圖分類號:TN915 文獻標識碼:A 文章編號:1672-3791(2012)01(b)-0013-02
  隨著我校的不斷發展,學校越來越重視數字化校園的建設,并迅速步入了信息化高速發展的階段。隨著學校校園網的不斷完善,這就要求給廣大師生提供一個良好的信息化教學、科研和管理平臺。目前,校園網資源正變得日益豐富,如何更全面、更準確地獲取最新、最有效的信息已經成為我們把握機遇、迎接挑戰和獲取成功的重要條件。通用搜索引擎如百度、谷歌(google)雖然都提供了大學搜索的服務來實現對部分高校校園網范圍內的網頁搜索,但是其存在一些問題,如更新周期過長,對校園內網信息無能為力等,因此,設計高校信息資源的專業搜索引擎,對于高校信息資源的共享以及提高信息資源的利用率就顯得非常有必要。
  1 通用搜索引擎的體系結構及現狀分析
  在互聯網發展初期,網站相對較少,信息查找比較容易。然而伴隨互聯網爆炸性的發展,普通網絡用戶想找到所需的資料簡直如同大海撈針,這時為滿足大眾信息檢索需求的專業搜索網站便應運而生了。
  1.1 搜索引擎的體系結構
  搜索引擎技術是由信息檢索IR(Information Retrieval)技術發展而來,是IR技術在Web上的擴展,信息檢索技術研究信息的表示、存儲、組織和查詢。現代意義上的全文搜索引擎是指以一定的策略搜集互聯網上的信息,在對信息進行組織和處理后,為用戶提供檢索服務的系統。它具備三大特點:事先下載信息,對信息進行事先組織,實時進行檢索。搜索引擎也是信息檢索(Information Retrieval)這門學科的典型應用。搜索引擎主要由搜索器、索引器、檢索器和用戶接口四部分組成,其體系結構如圖1所示。
  
  1.2 通用搜索引擎的發展現狀
  目前按照信息搜集方法和工作方式的不同,搜索引擎系統分為三大類。
  (1)目錄式搜索引擎:以人工方式進行主體歸納和分類,由人工形成信息摘要,并將信息歸類于事先確定的分類目錄中。信息大多面向網站,提供目錄瀏覽服務和直接檢索服務,用戶可將查詢限定在某一目錄范圍下進行。該類搜索引擎因為加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、信息不全面、信息更新不及時。這類搜索引擎的代表是:早期的Yahoo、Magellan等。
  (2)機器人搜索引擎:是面向網頁的全文檢索服務。由一個稱為爬蟲(spider)的機器程序以深度優先(或廣度優先)策略自動地在Internet中搜集信息,將搜集到的信息存入數據庫并由索引器為其建立索引,由檢索器根據用戶的查詢請求檢索索引庫,將相對應的查詢結果返回給用戶。該類搜索引擎的優點是不需人工干預、信息量大、更新及時,缺點是返回信息過多,有很多無關信息,用戶必須從結果中進行篩選。這類搜索引擎的代表是Google、Baidu等。
  (3)元搜索引擎:元搜索引擎不對Web進行遍歷分析,也沒有自己的數據,而是將用戶的查詢請求同時向多個搜索引擎遞交,然后將各搜索引擎返回的結果進行合并、去重,重新排序統一處理后,返回給用戶。這類搜索引擎的優點是能夠在短時間內提供相對全面和準確的信息,缺點是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類索引擎的代表是MetaCrawler、InfoMarket等。
  2 校園內網搜索引擎構建的必要性分析
  校園網可以看作以學校為單位的內聯網(intranet),它與互聯網(internet)是同質的。但是由于應用環境、網站構建以及鏈接結構方面的不同,對搜索引擎來說,校園網與公用互聯網有著多方面的區別。對于校園網的搜索引擎而言,其目標是關注校園網信息的所有用戶,校園網搜索引擎的目的是盡可能的收集本校園網的信息,區別與通用的搜索引擎要搜索整個互聯網的目的,校園網搜索引擎需要做到對信息收集的“小而全”。而且校園網搜索引擎應該做到易于開發,部署簡單,實現成本低。在功能需求上,無論是在校的師生還是想了解校園信息的其他人員可以通過校園網WWW服務器進行信息的檢索,從而迅速的通過網絡得到校內各部門提供的各種信息。
  2.1 校園網Web信息的特點
  隨著校園網建設的迅速發展、信息化管理時代的到來以及共享網絡信息資源的快速增長,校園網內的信息正在以驚人的速度增加著。截止目前,我校網絡中心存儲的信息量至少在200G左右,這還不包括分散在各個校區各個學院的信息量。雖然校園網有如此之多的好處,但是,網上資源分布在校園網的各個角落里,用戶無法及時準確的找到自己需要的信息,這使得校園網上的資源被孤立了起來,全校師生在茫茫網海中迅速定位有價值的信息變得比較困難。
  構建校園內網搜索引擎的必要性分析。
  (1)通用搜索引擎信息量大,信息更新緩慢,采用競價排名機制。
  (2)對于校園內網的某些信息無法檢索。
  (3)隨著學校的不斷發展,學校越來越重視信息化建設,校園網信息量的急速增長,也使得全校師生迅速獲取到有價值的信息越來越困難。
  2.2 校園網搜索引擎的特性
  (1)網站集中校園網網站一般集中在一個或幾個IP地址段內,網站之間的鏈接稀疏,由于分射由不同機構和個人進行維護和管理,有些網站很難從其它網站的鏈接到達;網站的重要性與網站規模不成正比,例如新聞和論壇類網站的網頁數量多并且鏈接較密,而教學和管理部門的網站則相反。
  (2)信息二義性少校園網網站中的信息,基本上是描述本學校的內容,對于某些特殊的詞語,不像在互聯網上,有其自己的語境,不會出現二義性。
  (3)異構文本格式的網頁比例高互聯網上常見的網頁通常有靜態網頁(文件后綴為

主站蜘蛛池模板: 国产69精品久久| 亚洲天堂网站在线| 亚洲免费三区| 五月天久久综合| 嫩草在线视频| 国产真实乱了在线播放| 中文字幕欧美日韩高清| 国产麻豆91网在线看| 波多野结衣中文字幕一区二区| 日韩少妇激情一区二区| 伊人久久久久久久| 三上悠亚精品二区在线观看| 97精品国产高清久久久久蜜芽| 亚洲人成亚洲精品| 成人韩免费网站| 久久久久久久久18禁秘 | 久久黄色小视频| 亚洲免费播放| 免费观看三级毛片| 一级做a爰片久久免费| 久久这里只有精品23| 婷婷激情亚洲| 国产一区自拍视频| 亚洲美女AV免费一区| 2022精品国偷自产免费观看| 动漫精品中文字幕无码| 国产福利一区视频| 精品夜恋影院亚洲欧洲| 狠狠色狠狠色综合久久第一次| 四虎永久免费地址在线网站| 婷婷成人综合| 狠狠色丁香婷婷| av在线人妻熟妇| 亚洲精品波多野结衣| 青青国产在线| 午夜三级在线| 国产粉嫩粉嫩的18在线播放91| 熟女成人国产精品视频| 国产无套粉嫩白浆| 日本国产一区在线观看| 扒开粉嫩的小缝隙喷白浆视频| 亚洲香蕉久久| 欧美成人h精品网站| 欧美亚洲综合免费精品高清在线观看 | 亚洲国产理论片在线播放| 国产精品一区二区在线播放| 国产女人喷水视频| 国内精自视频品线一二区| 热99精品视频| 欧美在线网| 亚洲Aⅴ无码专区在线观看q| 国产区免费| 亚洲男人的天堂久久精品| P尤物久久99国产综合精品| 麻豆精品视频在线原创| 国产精品密蕾丝视频| 精品少妇人妻av无码久久| 欧美福利在线| 欧美成人亚洲综合精品欧美激情| 成人va亚洲va欧美天堂| 福利姬国产精品一区在线| 久久黄色毛片| 2021国产在线视频| 久久综合婷婷| 亚洲不卡影院| 伊人久久婷婷五月综合97色| 中文字幕免费播放| 国产91麻豆视频| 午夜国产大片免费观看| 国禁国产you女视频网站| 国产精品亚洲一区二区三区z| 久久99国产乱子伦精品免| 欧美亚洲香蕉| 久久久久久久久18禁秘| 操美女免费网站| 日本少妇又色又爽又高潮| 日本午夜精品一本在线观看| 不卡色老大久久综合网| 3344在线观看无码| 亚亚洲乱码一二三四区| 97se亚洲综合在线韩国专区福利| 四虎国产永久在线观看|