●劉 莎(武漢大學 信息管理學院,武漢 430072)
“長尾理論”是網絡時代興起的一種新理論,由美國人克里斯·安德森提出。“長尾理論”認為,由于成本和效率的影響,過去人們只能關注重要的人或重要的事,如果用正態分布曲線來描繪這些人或事,人們只能關注曲線的“頭部”,而將處于曲線“尾部”、需要更多的精力和成本才能關注到的大多數人或事忽略。然而在網絡時代,由于關注的成本大大降低,人們有可能以很低的成本關注正態分布曲線的“尾部”,關注“尾部”產生的總體效益甚至會超過“頭部”。
“長尾理論”在百科全書編輯領域的意義,就是讓每個人都成為網絡百科全書的編撰者,將存在于每個人大腦中的知識積累起來,聚沙成塔,集腋成裘,形成一件輝煌的文化產品。從百科全書編撰的要求來說,需要掌握盡可能多的知識,并隨時進行更新。但是在過去,由于人力、物力的種種限制,無法動員所有的專家都參與編撰工作,更無法動員全社會都來參與,也無法進行及時更新。互聯網的普及為全社會都參與百科全書的編撰提供了可能。[1]
作為一種借助外力的新模式,“眾包”以成本低、見效快等特點,已展現了無比廣闊的發展前景。它以網絡之同,求個體之異,因此,眾包模式強調的是在網絡的每個節點上,發揮草根個體的能動性和創造性。[2]
眾包理論的一個典型應用就是維基百科。維基百科獲得了內容貢獻者的認同與歸屬感,而后者又自然成為了維基百科的代言人與傳播工具。[3]按照維基百科的約定,它是一個百科知識的網上集合,是完全免費的。這種方法可以應用到一切與知識相關的領域。根據這種新型網絡百科全書的特性,可以將其稱為是一種全民參與的“協作型”網絡百科全書。
網絡百科是針對傳統印刷型百科全書而言的,是指伴隨著互聯網技術、現代電子信息技術、信息存儲技術的迅猛發展而誕生的一種新型工具書或者稱之為新型信息組織模式。網絡百科總體分為三大類:
(1) 傳統紙質版百科全書的網絡版。紙質百科(如《大英百科全書》) 和網絡百科,一個號稱“專業”,一個號稱“草根”,各有優劣。我們既不能否認紙質百科具有網絡百科無法比擬的權威性、專業性和系統性,也必須承認網絡百科也有讓紙質百科永遠無法同步的新知識、檢索速度和知識容量。兩者的差別可以從撰寫者(前者是精英式寫作群體,后者是草根式寫作群體)、涵蓋的知識范圍(前者具有系統性,但不能包羅萬象;后者沒有圍墻,取之不盡)、知識的權威性和專業性(前者嚴謹權威,后者水平參差)、知識的實效性(前者具有滯后性,后者實時更新)、版權保護意識(前者重原創,版權保護嚴格,后者多引用,版權保護不嚴格)、閱讀成本(前者價格較貴,后者進入壁壘低)等幾個方面看出。[4]
(2)集成型網絡百科全書。它包括兩種形式,一種是多種百科全書的集成整合網站,如知識在線(Http://www.Db66.com),集成了旅游百科、音樂百科、國家百科等13個百科全書的所有網站,提供關鍵詞檢索,另一種是以某一知名百科全書為基礎并整合其他資源作為輔助。此類型百科全書,既保留了原有百科全書的權威性、科學性與內容特色,又集成了其他工具書,同時對網絡資源進行篩選與提供,如不列顛在線 (BritannicaOnline)。[5]
(3) 開放型網絡百科全書。它是指使用維基(WiKi)技術提供“共同創作”環境的網上免費百科全書,典型應用即為維基百科,它提供了一個知識共享和協作創新的平臺。維基百科的這種信息自組織模式開拓了網絡信息組織的新途徑,具有兼收并蓄和中立、開放的用戶與內容、用戶的協作共享與互動、信息的自組織管理與完善等特點。[6]
學科分類組織模式是以學科門類作為用戶檢索瀏覽百科知識的框架,使相同學科的文獻信息集中在一起,將用戶所需信息按類匯總,便于集中同一門類下的信息。如中國大百科全書網絡版(http://202.112.118.40:918/web/index.htm)將印刷版各卷分成哲學社會科學、文學藝術、文化教育、自然科學、工程技術五大類,又在其下設置了二級類目,只要點擊其中某一卷,即可對其進行分類瀏覽。這種信息組織模式很容易讓用戶鳥瞰全貌、觸類旁通,起到物以類聚的效果,最終搭建一個系統性很強的知識分類框架。
但同樣顯而易見的是,學科分類組織模式將同一事物同一主題的信息分隔開來,即把從不同學科研究同一對象的文獻信息分散在各知識門類中。如用戶如果要查找“茶葉”與“茶馬互市”就必須要分別在農業類和經濟類中查找,很容易導致用戶在網頁切換過程中的“網頁迷航”。
此模式的網絡百科代表有:
(1) “網上百科全書”(http://www.encyclopedia.com)。Encydopedia是互聯網上主要的免費百科全書,提供給用戶取自哥倫比亞百科全書(第7版) 的57000多篇及時更新的文章。網站首頁上有research categories,意即歸類檢索,展開的頁面中既可以進行分類檢索,也可以進行字順檢索。
像encyclopedia這類的集成網絡百科檢索網站正是將網絡上紛繁復雜的信息資源進行分類匯總,力圖通過這種一站式的檢索入口將相關信息一網打盡,是網絡百科的未來發展趨勢。
(2) “EncyclopidiaBritannica大英百科全書”(http://www.britannica.com/):英國不列顛百科全書(Britannica) 的聯網服務不但包括了不列顛百科全書印刷版本的詞條,還提供了許多附加文本說明。網站首頁左側列出了 History&Society、Arts&Entertainment、Travel&Geography等七大類常用熱點主題檢索詞。Britannica首頁標題欄的browse欄點擊可以進行連續兩級細化的字順瀏覽檢索,同時還提供按主題和按著者的Biographies瀏覽檢索。以設定目標進行字順瀏覽檢索時,點選十分方便,檢索的頁面上方還有一個列表框將該網頁的信息分層進行鏈接,只需要在列表框中選擇想看的標題,頁面就可以自動跳轉到對應部分,對于文字信息量大的頁面瀏覽十分便利。
由上可知,分類瀏覽提供從學科角度查找文獻信息的線索,字順瀏覽提供按事物檢索文獻信息的途徑,二者結合,相互補充,這種分類與字順組織相結合的信息組織模式集直觀性和系統性于一體,很好地滿足了用戶多樣化的檢索需求。
然而網絡的不斷發展為用戶提供了更加便捷的檢索途徑,無論是分類檢索還是字順檢索,都要求用戶選用與后控詞表中的類目名或敘詞完全匹配的語詞,否則檢索結果還是與用戶初衷相去甚遠。如在encyclopedia中檢索potato和yam,二者的中文翻譯分別對應漢語的土豆和洋芋,實際是同一事物的學名和俗名,然而網站檢索結果并沒有將二者進行參照鏈接,造成事實上的知識孤立點。
此模式的網絡百科代表為“維基百科”(http://wikipedia.jaylee.cn/)。提起維基百科,它幾乎成了網絡百科的代名詞,它的開放式詞條編輯模式和協作化的創作環境讓它在用戶心目中的地位親切而平等。
維基百科的首頁上只有普通檢索的入口,網頁左側提供有分類索引和主題索引。試從分類索引中查找“魯迅”詞條,結果沒有找到。需要說明的是,維基百科的詞條并不完整,所以出現這樣的情況也不是沒有可能。又從主題導航進入查找“魯迅”詞條,在“近代啟蒙思想家”下有魯迅的鏈接。同樣在首頁的檢索框中以“魯迅”作為關鍵詞進行檢索,結果與主題導航中的詞條相同,并且該條解釋第一行就明確地用“周樹人”進行標引,很好地解決了這種多入口檢索詞的規范問題。從這個例子一方面可以看出維基百科對事物的分類和主題劃分是不規范的,往往摻雜著詞條創建者的個人認識,很容易導致檢索者在檢索過程中的偏差。另一方面,通過主題詞進行的檢索一定要在后臺配置某種分類或主題詞表作為后控詞表,將自然語言的語詞與庫中的正式語詞進行參照匹配,使得同一事物的不同名稱指向統一的結果,以求檢索結果更接近用戶的信息需求。
通過對數量眾多的網絡百科的調查分析,現將其歸類統計如下表所示。從表中可以看出,三種類型的網絡百科在信息組織模式上并不是單一地采用一種固定方式,而是基于方便用戶的原則,綜合利用多種信息組織方式,力求從傳統的中規中矩的條條框框中跳出來,開拓出一條具有獨特信息組織模式的特色化道路。同時,開放型網絡百科全書在整個調查的19個網站中占了一半以上,也很有力地說明了未來網絡百科的發展將朝著更加開放協作的方向前進。

表 網絡百科的調查統計
(1)質量參差不齊。印刷版百科全書一般是由權威的專家學者編輯,由著名的出版機構出版發行,其嚴謹性、知識性是不容質疑的。而網絡百科全書不像傳統百科全書那樣經過嚴格審核,因此它的權威性和聲譽度不夠,內容也良莠不齊,有的有拼寫錯誤,有的信息真假難辯,有的甚至會出現一些未經考證的內容。
(2)動態易逝。網絡百科依托互聯網,因此網絡的一些弊端也會被遺傳甚至放大從而影響網絡百科的穩定性,如傳輸線路、網絡病毒、黑客攻擊、系統升級、網站變更等都會對保存其上的網絡百科的內容產生或大或小的影響。網絡的動態和知識海洋的湮沒不聞很容易造成網絡百科內容和形式的動態與易逝,而且網絡安全問題在網絡百科中同樣令人擔擾。
(3)檢索技術發展瓶頸。由于漢字的特殊性,使得在國外發展成熟的檢索技術不能很好地移植到國內,尤其是漢字分詞技術遲遲得不到有效解決,造成國內漢字檢索平臺發展受到限制。網絡百科的宗旨在于通過檢索為用戶提供所需信息,因此檢索技術的進一步發展成為了網絡百科獲得突破的瓶頸。
(4)形式單一。類別與層次的不同,決定了百科全書內容的寬窄、深淺,條目的長短及價格的高低,這種差異性最終都是為了滿足不同類型、不同層次用戶的信息需求。調查發現,不列顛百科全書針對不同目標用戶,分為公共圖書館版、學校版、學術研究版。公共圖書館版又可分為成人版、兒童版。不同的版本在網站內容、界面設計、語言風格等方面有很大的差異。然而,和EB處于同一水平的中國大百科全書網絡版并沒有實現版本的系列化,網站形式單一,內容編排刻板。
(5)分散獨立。現在幾乎重要的百科全書都建立了自己的網絡百科,各類網絡百科站點的數量已達數百種之多,它們一方面為用戶提供了查找百科信息的入口,但也帶來了信息爆炸的隱憂,有必要對網絡百科進行資源整合。
對各類百科全書進行數據整合,建立統一異構數據庫系統的跨庫檢索將使網絡百科全書用戶得到更大的方便與實惠。因為,跨庫檢索系統可向用戶提供統一的檢索接口,將用戶的檢索要求轉化為不同數據庫的檢索表達式,并發地檢索多個異構數據庫,對檢索結果加以整合,在經過去重和排序等操作后,以統一的格式將結果呈現給用戶,提高查全率與查準率,并減少了重復信息的干擾。但是,如何處理知識產權問題卻是其面臨的首要問題。[7]
(1)多元化。除了綜合性與專門性網絡百科全書外,現在還出現了一種類似于搜索引擎的百科全書,亦稱元式網絡百科全書。用戶只需鍵入要查找的名詞術語,它就會從所收錄的詞典、百科全書資料庫中搜集有關的資料,并能注明出處,極大方便了研究人員。它自身不產生任何資料,但是它可以向讀者提供所需的各種資料,而且比任何單個的百科全書和詞典都要全面。未來各類型的網絡百科全書在共存共榮的同時,更該著眼于多元化的發展方向。
(2) 無償免費服務。1994年《不列顛百科全書》提供互聯網上的查詢業務,標志著世界上第一套網絡百科全書問世,此后世界上各種百科全書紛紛涌現。[8]期間,《不列顛百科全書》曾試行過收費,但是在遭到用戶的強烈抵制后即宣告恢復無償服務。目前互聯網上的百科全書多為免費服務,部分特殊的服務項目會酌情收費,但今后網絡百科的發展方向無疑會是無償服務。
(3)協作化編纂。近來網絡百科中一種全新的編纂方式正在風靡業界——Wiki協作化編纂。如維基百科已經成為全球發展最快和最大的內容開放的百科全書,已經成為網上最受歡迎的參考資料查詢網站,它已經從一個大百科全書演變成了一個綜合性網絡媒體。雖然協作化編纂可能引發網絡百科的嚴謹性不夠,易導致依賴癥,也會使客觀中立的編纂原則遭受沖擊,甚至引起知識產權問題,但是隨著技術和法律的完善,它一定會克服自身的諸多不足,成為未來網絡百科的主流編纂方式。[9]
(4)合作共贏。網絡百科的合作化趨勢表現在兩個方面:一是有多個機構合作完成并有統一機構維護管理的百科網站,如知識在線網站的管理模式;二是百科全書與其他網站合作,如《中國大百科全書》與著名的門戶網站新浪合作推出了基于智慧型互動搜索技術的新浪搜索引擎“愛問”(iAsk,www.iAsk.com)。為了增加“愛問”的權威性,2005年8月3日,“愛問”攜手中國大百科出版社,正式推出了“中國大百科在線搜索”服務。
網絡百科經歷了初始階段的迅猛發展,正在漸漸地進入一個平穩有序競爭的時期。從總體上看,各種網絡百科的宏觀結構極為相似,少則以一個主題詞檢索作為入口,多則以某種紙質百科全書作為后臺提供分類索引、主題索引、字順索引,輔以各種各樣的特色服務用來吸引用戶的注意力,激發用戶的好奇心,普及大眾百科知識,追求一種知識性寓于趣味性的學習模式,企圖寓教于樂,讓知識的獲取與學習不再是一件枯燥乏味的差事。這樣一種新生的知識產生、信息組織的事物具有強大的生命力,它將圖書館學的傳承知識、啟迪民眾的使命發揮的淋漓盡致,為其指出一條光明的道路。
[1]楊谷.“長尾理論”與網絡百科全書的啟示[N].光明日報,2007-06-03(6) .
[2]張玉鳳.“眾包模式”對科技傳播的革新[J].科技傳播,2010(2):42-44.
[3]劉勇.“眾包式”營銷 [J].商界評論,2010(2):52-54.
[4]劉金雙.紙質百科全書PK網絡百科全書[J].出版參考,2007(10):13.
[5]黃蓮芝.淺析網絡百科全書[J].河北科技圖苑,2008(5):88-90.
[6]賈玉文.網絡百科全書的發展及其意義[J].大學圖書館學報,2002(6):35-38.
[7]馬葉香.網絡百科全書的應用與發展趨勢[J].情報探索,2008(4):43-45.
[8]嚴貝妮.網絡百科全書的使用初探[J].情報科學,2005(7):1016-1018.
[9] Marina Trkman,Peter Trkman.A wiki as intranet:a critical analysis using the Delone and McLean model[J].Online Information Review,2009 (6):1087-1102.