□王妙婭
網盤即網絡硬盤,是目前非常流行的在線文件共享方式。很多人會把自己搜集的軟件、游戲、資料、視頻、動漫、電影、音樂、PDF電子書等等都放在網盤上,這些由千千萬萬網民上傳的內容組成了一個非常巨大的資源寶庫,并且其中的優秀資源越來越多,特別是一些論壇、博客推薦的資源大多保存在網盤中。但是網盤服務網站通常不提供檢索功能,通用網絡搜索引擎“Google”、“百度”也沒有對網盤資源進行專門的索引,檢索效果不理想,往往出現信息紛雜、良莠不齊、陳舊過時等問題,為此專門針對網盤進行搜索的工具——網盤搜索引擎應運而生。本文在對網盤和網盤搜索引擎進行簡要介紹的基礎上,重點分析和比較了國內外17個知名網盤搜索引擎的性能,并以五星制進行了評分,希望對用戶選擇網盤搜索引擎提供參考,同時通過對比發現國內網盤搜索引擎的不足及原因,對國內網盤搜索引擎的發展進行了思考。
網盤,又稱網絡磁盤、網絡空間、網絡U盤、網絡優盤等等,是一些網絡公司推出的在線存儲服務,向用戶提供文件的存儲、訪問、備份、共享等文件管理功能[1]。擁有網盤的用戶可以把重要的資料上傳到網盤永久保存,不用擔心因電腦硬盤、U盤等儲存器問題而致資料丟失,還可以隨時隨地方便地提取使用。免費網盤的可用空間較少,一般對文件大小、下載速度、存放時間等進行限制;收費網盤具有速度快、安全性能好、容量高、允許大文件存儲等優點,適合有較高要求的用戶。網盤的盈利模式主要是廣告以及收取高要求用戶的存儲費。同時網盤通常以每千次下載給上傳文件用戶一定報酬的方式吸納優秀資源。
電子郵箱所提供的附件功能是最早的網絡硬盤,隨著網絡技術的發展及人們對網絡存儲需求的提高,近年來,涌現出一大批專業提供網盤服務的營運商。國內知名的網盤有Rayfile(飛速網盤)、Namipan(納米盤)、Damipan(大米盤)、115網盤、Brsbox、dbank(數據銀行)、163盤(易盤)、Qiannao(千腦盤)、Ziddu(香港),Xun6(香港)等。國外知名的網盤有 Rapidshare、Megaupload、Mediafire、DepositFiles、Hotfile、Filefactory、Uploaded、4shared、Easy-share、Zshare、Badongo等,其中Rapidshare和Megaupload是老牌網盤,深受國內用戶喜愛。
網盤服務大都沒有提供搜索功能,用戶要從網盤找到某一個文件一般有4種途徑:(1)有該文件的提取碼(每一個上傳成功的文件有唯一一個提取碼)或具體鏈接地址,缺點是在文件上傳者沒有公布該提取碼或鏈接地址的情況下,他人不可能通過此途徑找到該文件。(2)直接通過搜索引擎搜索(如Google、百度、搜狗等),缺點是需采用關鍵詞匹配、“site:”限制檢索等較專業的搜索方法,用起來比較麻煩,檢索效果不理想,并且不是每個人都知道這些方法。(3)通過資源分享論壇查找資源(如RayFile資源論壇、下載圈、網盤資源共享地帶51pan等),缺點是一次只能在一個論壇中查找資源,往往不能保證找到有效資源。(4)通過專用網盤搜索引擎查找,解決了上述三種途徑的缺點,其特點是方便快捷,一次可以搜索多個網盤,有豐富的功能選項,大大節約了用戶查找特定文件的時間。
網盤搜索引擎的類型非常多,國內目前活躍的網盤 搜 索 引 擎 有 找 文 件 (http://www.zhaofile.com)、網盤精靈(http://www.files2me.com)、盤搜(http://www.pansou.com)、搜 網 盤 (http://www.souwangpan.com)、網盤下載資源搜索中心(http://www.wangpan8.com)、飛 速 網 盤搜 (http://www.feisuso.com)、網盤搜搜(http://wpsoso.com/new.html)等。國外網盤搜索引擎數以百計,更是多種多樣,如針對Rapidsharede搜索引擎就有百余個[2]。知名的國外網盤搜索引擎有Rapidshare Search Engine(http://www.filesearch.gr/)、Megadownload (http://www. megadownload.net/)、Filestube(http://www.filestube.com/)、Filecrop(http://www.filecrop.com/)、Rapidlibrary(http://rapidlibrary.com/)、JetDL(http://jetdl.com/)、 Uprius (http://uprius.com )、Sharedigger(http://sharedigger.com/)、Sharedirectory(http://sharedir.com/)、Uvrx (http://www.uvrx.com/)等。本文以上述7個國內網盤搜索引擎和10個國外網盤搜索引擎為調查和研究對象。
搜索的網盤數量和類型決定了網盤搜索引擎可搜資源的范圍。國內網盤搜索引擎中找文件、網盤精靈和盤搜不僅搜索國內網盤還搜索國外網盤,特別是網盤精靈能夠搜索至少4個國內網盤和34個國外網盤,其他國內網盤搜索引擎搜索網盤總量在4-16個之間,如表1所示。在調查的10個國外網盤搜索引擎中,Rapidshare Search Engine是專門搜索Rapidshare的搜索引擎,Megadownload和Filecrop是專門搜索Rapidshare與Megaupload的搜索引擎,其他網盤搜索引擎可搜索的網盤總數在5-55個之間,并且均為國外網盤。可見國外網盤搜索引擎中除了針對老牌網盤Rapidshare和Megaupload的專門搜索引擎外,能夠搜索的網盤數量普遍較多,但都沒有將國內網盤納入搜索范圍,這與國內網盤起步較晚,影響力還不夠大有關。同時由于國外網盤不支持中文文件名上傳文件,導致用戶使用國外網盤搜索引擎時輸入中文字串往往沒有檢索結果,如筆者用“活著”、“瑞星”在采用自有搜索技術的國外網盤搜索引擎中檢索時均沒有檢索結果,這必定影響國內用戶對國外網盤搜索引擎的使用。當然,對掌握了搜索技巧的用戶另當別論,如將“活著”、“瑞星”分別轉換為字串“huozhe”、“rixing”即搜索出關于電影《活著》和軟件“瑞星”諸多結果。

表1 檢索結果量評分
檢索結果量是受搜索引擎所搜索的網盤數量、網盤類型、搜索技術等共同影響的反映搜索引擎性能的一項重要指標。為了比較各搜索引擎的檢索結果量,統計了各搜索引擎對“活著”、“瑞星”、“Kaspersky”、“yesterday once more”四個字串檢索結果量①檢索結果量統計于2010年11月10-16日,均是在所有可以搜索的網盤中同時檢索的結果量。如果搜索引擎沒有該功能,如“盤搜”,是對國內網盤和國外網盤分別檢索結果量的和。另外,Sharedirectory的檢索結果量是包括鏈接失效文件、結果不聚類狀態下的檢索結果量(高級檢索選項中不勾選“hide deleted files”和“group files”);“網盤下載資源搜索中心”和“網盤搜搜”每次檢索最多返回100個結果。的平均值,即表1中的“平均檢索結果量”。國內網盤搜索引擎的檢索結果量普遍較少,均不超過200,遠遠低于國外網盤搜索引擎大多超過1000的檢索結果量,并且國外網盤搜索引擎中多采用自有搜索技術,檢索結果的準確度也更高。可見與國外網盤搜索引擎相比,國內網盤搜索引擎的有效檢索結果量比較低。為了更直觀地比較檢索結果量,給出“檢索結果量星級”,標準是“平均檢索結果量”99個以下為2星,100-999個結果為3星,1000-4999個結果為4星,5000個結果以上為5星。如表1所示,國外的網盤搜索引擎“檢索結果量星級”為4星以上的有6個,其中Filestube的平均檢索結果量最多,達9855.50個,而國內的網盤搜索引擎“檢索結果量星級”均在3星以下,特別是網盤精靈的檢索結果量與其標注的可搜38個網盤很不相稱。
目前國內外網盤搜索引擎采用的搜索技術有兩種類型,一是采用Google自定義搜索技術對特定的網盤資源進行搜索,二是采用自有搜索技術,有自己的蜘蛛程序,到互聯網上各個資源發布站點、博客、論壇等抓取共享文件信息,收錄到自己的數據庫,當用戶搜索時從自己的數據庫中查找資源,這種類型的網盤搜索引擎往往提供較高相關度的結果[3]。筆者調查的7個國內網盤搜索引擎中只有網盤精靈采用自有搜索技術,其他均為Google自定義搜索技術。而國外網盤搜索引擎中只有Rapidshare Search Engine、Sharedigger和Uvrx采用Google自定義搜索技術,其他均為自有搜索技術。可見國內網盤搜索引擎提供商技術研發力量及資金投入都遠遜于國外網盤搜索引擎提供商,當然給用戶的搜索體驗也是完全不可比擬的,后者往往搜索速度更快,搜索結果的準確性更高,如表2所示。
表2中“平均檢索時間”是各搜索引擎針對“活著”、“瑞星”、“Kaspersky”、“yesterday once more”四個字串檢索結果量對應檢索時間的平均值。采用自有搜索技術的網盤搜索引擎檢索時間通常在數十微秒左右,其中國內的網盤精靈搜索速度最快,只有6.7個微秒,而采用Google自定義搜索技術的搜索時間通常為數百微秒,如國內的盤搜,國外的Sharedigger等。由于搜索時間都在一秒以內,對終端用戶的使用影響不大,因此,“搜索速度星級”僅給出3個星和5個星兩個等級。對于不顯示搜索時間的搜索引擎根據其采用的搜索技術給定星級。

表2 檢索速度和準確度評分
檢索結果是否準確是用戶選擇搜索引擎的一項重要指標,通過上述檢索結果的分析,發現采用Google自定義搜索技術的搜索引擎是對整個來源網頁進行匹配檢索,準確度差;采用自有搜索技術的搜索引擎中,Filecrop、Rapidlibrary、網盤精靈是對檢索結果來源網頁的網頁標題和網頁中的文件名進行匹配,準確度較高;其余自有搜索技術的搜索引擎是對檢索結果來源網頁中的文件名進行匹配,準確度非常高。為此,“準確度星級”分別給出2星、4星和5星三個等級。
搜索引擎是否吸引用戶,除了衡量檢索結果量、檢索速度和準確度,還要看其功能是否強大和實用,功能差別較大的搜索引擎在其他性能相當的情況下,其實現的信息挖掘結果會有較大區別,這很大程度上影響用戶找到需要的文件。筆者通過對17個搜索引擎的調研,列出表3所示的11個功能,并對每個搜索引擎的相應功能打分,總分為100分。各個功能及給分標準說明如下:
(1)“檢索限制”和“結果排序”是用戶找到所需文件的常用功能,也是多數搜索引擎具有的基本功能,滿分各15分。檢索限制有網盤、文件類型和大小限制三種類型,具有一種類型檢索限制的給5分,兩種給10分,三種給15分。Filestube、Rapidlibrary和網盤精靈分別有三種檢索限制方式。檢索結果排序方式有相關度、文件名、大小、下載次數(有的搜索引擎為“受歡迎程度”,即popular指標)、文件上傳日期、來源頁面鏈接地址(Source site)六種類型,具有一種排序方式的給5分,兩種或三種排序方式的給10分,四種以上排序方式的給15分。Filecrop、Filestube、Sharedirectory分別有四種結果排序方式。
(2)“鏈接檢查”、“分組聚類”和“類似文件推薦”是方便用戶進一步找準、找全文件的重要功能,但有這些功能的搜索引擎不多,為了不拉大各搜索引擎功能總分差距,滿分僅給10分,有則給滿分,沒有則為零分。其中鏈接檢查是避免網盤中一些已經刪除的資源而搜索引擎仍給出檢索結果的一項實時鏈接檢查功能,只有Filecrop和Sharedirectory有該功能;分組聚類功能是在檢索結果中將同一文件的不同部分聚合在一起列出,如將《一人一首成名曲》(港臺版)8個CD的不同下載地址聚合在一起,而無論它們來自哪個網盤,只有JetDL有該功能;類似文件推薦是針對每一個檢索結果列出與其相關的其他文件,方便用戶進一步擴展檢索,只有Megadownload和Rapidlibrary有該功能。
(3)“高級檢索”應該是網絡搜索引擎的常設功能,但所調研的網盤搜索引擎中有高級檢索功能的只有Sharedirectory和Filestube,并且其作用是將上述功能整合在一起供用戶選擇(Filestube的高級檢索還提供了邏輯組配關鍵詞功能)。為了不拉大各搜索引擎功能總分,滿分僅給10分,有則給滿分,沒有則為零分。
(4)“檢索推薦”是指搜索引擎為沒有明確檢索目的的用戶推薦檢索的資源,包括數據庫最近新增資源、用戶最新搜索資源(包括當月、當天搜索內容甚至幾秒前的搜索內容)、熱搜資源三種類型。具有該功能的搜索引擎比較多,滿分為10分,具有一種檢索推薦功能的給4分,兩種給7分,三種給10分。
(5)“界面語言”、“用戶注冊”、“地區檢索”、“AJAX應用”是對用戶檢索結果影響不大的功能,可以稱其為附加功能,各給5分,有則給滿分,沒有則為零分。關于界面語言,對于提供一種界面語言的給1分,四種以內界面語言的給3分,五種以上界面語言的給5分,其中Uvrx和Filestube分別提供了包括中文在內的8種語言和7種語言;用戶注冊指搜索引擎為用戶提供注冊以及附加功能,如檢索定制功能,只有Sharedirectory和FilesTube具有用戶注冊功能。地區檢索功能指用戶可以選擇文件所在服務器的所屬國別或地區,只有Filecrop為用戶提供了包括中國在內的21個地區選擇檢索。AJAX即“Asynchronous JavaScript and XML”,是時下流行的創建交互式網頁應用的網頁開發技術[4],應用AJAX的搜索引擎的所有操作都在一個頁面上,用戶能夠獲得更好的搜索體驗,只有Sharedirectory和搜網盤應用了AJAX技術。
表3中“檢索功能總分”是上述11個檢索功能的得分和,最高為57分,最低為6分,總體得分不高是因為上述的很多功能僅在個別搜索引擎中存在。根據“檢索功能總分”給出了各個搜索引擎的“檢索功能星級”,標準是19分以下為1星,20-29分為2星,30-39分為3星,40-49分為4星,50分以上為5星。國外網盤搜索引擎中獲得4星以上的有5個,其中Filestube和Sharedirectory檢索功能最強,而國內網盤搜索引擎中只有網盤精靈勉強獲得2星,其他均為1星,可見國內網盤搜索引擎的功能普遍很弱。
對網盤搜索引擎各項性能的分析與比較為其綜合性能評分提供了條件,如表4所示,“各性能得星和”是檢索結果量星級、檢索速度星級、準確度星級和檢索功能星級得星之和。由于對搜索引擎各項指標的打分標準均為筆者自行設定,有的是粗略給分,其科學性有待商榷,為此以4分為一星,將“各性能得星和”轉化為五星制,以“綜合星級”作為對各搜索引擎的最終性能得分。Filestube、Sharedirectory、JetDL、Rapidlibrary為5星級網盤搜索引擎,推薦用戶使用,特別是Filestube,其各項性能均達到5星級。國內網盤搜索引擎中網盤精靈由于采用自有搜索技術在檢索速度、準確度方面高出一籌,檢索功能也不是很差,成為國內唯一的4星級網盤搜索引擎。

表3 檢索功能評分

表4 綜合評分
通過前述的分析與比較,總體上看國內網盤搜索引擎的各項性能與國外網盤搜索引擎差距都比較大,原因主要兩個,一是多數搜索引擎沒有開發自有搜索技術,導致檢索速度慢、準確度差、檢索功能單一;二是以國內網盤資源為主要搜索對象,而國內網盤由于起步晚,多數沒有給上傳文件者提供獎勵政策或獎勵幅度沒有國外網盤高,使得國內網民將很多優秀資源上傳到國外網盤上,導致國內網盤資源不夠豐富,公布的資源鏈接少,搜索引擎的檢索結果普遍較少。
國內網盤資源的豐富不是短時間能實現的,而國外網盤資源由于政策原因很多無法訪問,為此國內網盤搜索引擎提高性能的突破口在于開發自有搜索技術,提高搜索結果的準確度,豐富和完善搜索功能。此外,要盡量擴大可搜索的網盤資源范圍,特別是要密切關注國內可以訪問的國外網盤,隨時將其納入搜索范圍,提高檢索結果量。筆者相信,通過上述改進,國內網盤搜索引擎憑借其中文界面優勢、支持中文字串檢索以及4億中國網民的基礎,必將得到良性發展。
1 百度百科:網盤.[2010-11-03].http://baike.baidu.com/view/71279.htm.
2 Rapidshare搜索引擎.RapidShare & 網絡硬盤觀察站.[2010-11-08].http://www.rsfan.net/2010/02/rapidshare-search-engine/.
3 Martin.5Rapidshare Search Engines.[2010-11-08].http://www.ghacks.net/2008/01/04/5-rapidshare-search-engines/.4 百 度 百 科:Ajax.[2010-11-16].http://baike.baidu.com/view/1641.htm.