摘 要 本文簡單回顧了我國數字化辭書的發展歷程,簡要介紹了數字化辭書的特點,著重對國內數字化辭書目前存在的問題進行了評述,對辭書出版所面臨的數字化沖擊進行了分析。
關鍵詞 辭書 數字化 問題 沖擊
當下,全球化、信息化浪潮勢不可當。從內容產業來看,以互聯網為代表的數字技術正在改變我們生產、生活、消費(包括信息消費)的傳統做法。在辭書領域,這一變化也很明顯。雖然數字化辭書的基礎依然是辭書(或內容)而不是數字化技術,即“內容為體,數字化為用”,但如果我們在辭書內容的提供、加工、更新、傳播等一系列的過程中不研究、不運用數字化技術,那么,辭書內容的生產、傳播必然就會游離于時代潮流之外,處于一種被動的狀態,傳統辭書在教育領域、大眾市場的作用和份額就會降低、弱化,甚至可能會被替代。在無情的市場經濟面前,固守即意味著退縮。因此,在傳統出版與數字出版的融合已成為現代出版趨勢的背景下,如何避免數字出版的沖擊,分享數字出版的成果,應該成為我們關注的焦點之一。
一、我國數字化辭書的發展歷程及代表性作品
在我國,數字化辭書大約出現在20世紀90年代中期,起初多以軟件的形式出現,同時,也出現在手持設備(如掌上電子詞典、PDA、手機等)上,并且迄今不衰;90年代中后期光盤版的數字辭書也盛行一時,但由于遭受盜版等原因,現已式微;2000年以來,隨著互聯網的普及,網絡版工具書逐漸興起,成為大型數字化辭書的主要類型。
國內數字化辭書的類型主要有:
網絡版辭書,這是使用時通過互聯網來控制數據傳送的數字化辭書。如《漢語大詞典》(網絡版2.0)、《中國大百科全書》(網絡版)、《辭海》(網絡版1.0)等。
軟件版辭書,這是以軟件形式發行,使用過程中不通過互聯網傳送數據的數字化辭書,如《漢語大詞典》(光盤版1.0)、《中國大百科全書》(光盤版)、《兒童辭海》(光盤版)、“金山詞霸”等。
手持設備版辭書,這是各種類型的掌上電子詞典,也包括儲存在手機等手持設備中的數字化辭書。
在上述類型的數字化辭書中,目前最值得關注的是一些大型的網絡版工具書。這主要是因為這些數字化辭書均出自名門,來自我國著名的工具書出版社,系二次出版,在內容的權威性、釋文的經典性、條目的完備性等方面都具一流的水準。較具代表性的有:《中國大百科全書》(網絡版);上海世紀出版集團易文網的“工具書在線”,包括《中華文化通志》(網絡版)、《漢語大詞典》(網絡版)、《辭海》(網絡版)、《<中央日報>標題索引》等;商務印書館的“工具書在線”(測試版),包括《新華寫字字典》、《新華正音詞典》、《新華拼寫詞典》和《中華人民共和國地名大詞典》等。
二、數字化辭書的特點
與傳統的印刷本辭書相比,數字化辭書主要具有下列特點。
1.更多的檢索、查詢手段
除了與傳統紙質工具書一樣的常規檢索手段(如分類檢索,按拼音、筆畫檢索)外,數字化工具書還具備其他一些極為有效的檢索、查詢功能,如通配符檢索,邏輯表達式檢索,全文檢索,還可根據內容制作特殊的檢索方法,如《漢語大詞典》中對漢字作“通假”等關聯的檢索,就是一個很典型的例子。
2.支持多媒體
數字化工具書具備多媒體處理能力,這也是其頗具吸引力的一個方面。在數字化工具書中,人們除了能夠像使用傳統的紙質工具書那樣,得到以文字、圖像為表現形式的信息外,還能得到通過聲音、動畫、視頻等多種媒體元素來表現的信息,而工具書中的許多條目正是需要通過這些媒體元素才能獨特地、完整地、更好地為讀者提供相關的信息。如重大歷史事件條目,音樂作品條目,物理、化學、生物條目中的原理演示等內容,都不是僅靠文字、圖片就能夠完美表現的。從技術上講,數字化辭書對音頻、視頻、動畫等均可支持,但目前我們還很難看到像微軟公司所出《Encarta百科全書》那樣比較理想地支持多媒體表現的大型數字化辭書。究其原因,筆者認為,主要與投入大而產出小有關。目前國內的數字化辭書大都屬“二次出版”,只對內容作技術上的加工,而很少再花人力、物力去重新制作或采集多媒體資源,因為這項工作投入巨大,但回報并不理想。
3.支持互動,更新快捷方便
大多數人認為,互聯網是一個大眾媒體,面向的是大眾,但也有少數專家認為互聯網是一個個性化的媒體,是小眾媒體,更是唯一的互動媒體。筆者認為,后者抓住了事物的本質特征。與圖書、報紙、廣播、電視相比,互動性是網絡媒體的鮮明特征。如何利用網絡媒體的這一特性,讓關心辭書的大眾貢獻出自己的意見,參與內容的提供(實踐證明,在個別條目上,讀者掌握的信息會比專家更多、更正確),以利辭書的更新、修訂,這一問題值得探討。筆者認為,利用網絡媒體的互動性,數字化辭書至少能為將來的在線工具書編纂平臺打下基礎,如《辭海》網絡版增加“評論”功能就是一種嘗試。眾所周知,印刷本《辭海》的修訂周期較長,投入很大,更新的時間跨度大(10年)。如能在《辭海》(網絡版)中注意吸收新的資料,會對《辭海》的修訂大有裨益;同時,讀者查閱《辭海》也能了解到更多、更新的信息。如有關冥王星失去行星地位的資料,吸收到網絡版中十分方便,但在紙質書中必須等到出下一個版本才能作修訂。因此,通過論壇、博客等形式吸引讀者提供素材,最后由專家審定(在未審定前則作為資料供讀者查閱、參考),對保證工具書的常用常新,實現修訂的持續性有很強的實用價值:讀者看到的都是最新的修訂版,此時,網絡版就不再是紙質版的附庸,而成了紙質版的基礎。網絡版和紙質版各有各的讀者市場,兩者能共同為形成良好的辭書出版產業結構和產業鏈作出貢獻。
另外,即使讀者互動的信息不是提供內容,而是提出問題或質疑,也對辭書出版者有很大幫助,因為通過網絡這一渠道,把產品和用戶(讀者)聯結了起來。從產品營銷的角度看,這對提高產品的質量、擴大產品的影響等會有重要作用。
三、數字化辭書目前存在的問題
數字化辭書在發展的同時,也存在著一些明顯的不足,如:產業鏈的培育與整合(包括產業鏈之間的利益分配)還未合理形成;與紙質辭書相比,數字化辭書還未形成成功的商業模式,產業的規模依然較小;市場的接受度(讀者的閱讀習慣)還不高;版權保護還有待于進一步加強;研制、開發過程中缺乏相對統一的標準,在界面、外字字庫等方面往往大家各搞一套,等等。這些問題的外在表現之一,就是數字化辭書魚龍混雜。具體表現為:
1.有些作品制作時研發重心更多地偏向軟件功能而不是辭書內容
表現為注重新技術的運用和收詞數量的堆積,忽視內容的正確性、實用性和科學性。請看一個實例。在一本橋牌書中有如下一段文字:
Obviously the bidders and doublers believed a pass was not forcing. The two passers were Eric Rodwell and the late Teddy Lightner. Peter Nagy wasn’t sure,nor was moderator,Bobby Wolff.
上述文字中的“moderator”一詞,在“金山詞霸”中僅一個義項:
moderator (音標略) n. 緩和劑
這一解釋顯然與原文不符。如果我們到《新英漢詞典》(世紀版)中查這個單詞,就會發現該單詞有4個義項:
moderator n. 1仲裁人;調解人 2(集會、會議或討論會等的)主席;議長;[宗](基督教長老宗)教政組織的首腦 3(英)(劍橋大學教學榮譽學位考試的)主考人 4[核]減速劑,慢化劑‖moderatorship n. 仲裁人的職權,主席的職權
其中第一個義項符合原文的語境。毫無疑問,“金山詞霸”在這個條目上存在著“義項缺失”這一重大缺陷。
2.有的數字化辭書提供的知識十分蕪雜
隨著“維基(Wiki)百科全書”編寫模式在網絡的流行,由網民參與編寫百科全書的做法得到了很多互聯網經營者的青睞,但在這一模式下編寫出的“百科全書”,其所提供知識的正確性很難把握。如在號稱“全球最大開放式中文百科全書”的“百度百科”中,“足球”條介紹的知識有足球的起源、漢代蹴鞠石刻、第一個因踢球名垂史冊的人、史上第一份首發名單、最早的著名球星、現代足球的誕生,林林總總近萬字,但從頭至尾,卻沒有一段文字集中、概要地介紹足球是一項怎樣的運動(如“比賽分兩隊,每隊十一人,球員主要用足踢球或用頭頂球。比賽90分鐘,分上下兩半時。以將球射入對方球門多者為勝”等信息)。
3.版權曖昧不明
有些數字化辭書版權曖昧不明,內容甚至有抄襲之嫌。
目前,網上流傳著一個叫“漢語大辭典”的軟件(注意,不是《漢語大詞典》),據開發者介紹,該軟件包含成語詞典一本(可查成語48700條)、字典一本(可查漢字20973個)、百科詞典一本(可查詞語377590條),另有中華詩詞大全、歇后語大全、燈謎大全、同義反義別名詞典、名言詞典、古文詞典等內容。
顯然,這些內容的編寫依靠個人的力量是無法實現的。那么,這些內容在匯集過程中,版權是否會有問題,不免令人生疑。例如,在該軟件中,“中國式摔跤”條目前面一大部分文字與《辭海》同名條目內容就十分接近。
中國式摔跤 摔跤運動之一。古稱角力、抵角、相撲、爭跤等。常用方法有背、別、挑、纏、揣(原文如此,當作“踹”——筆者按)、踢、擰、摟、彈、搿、插閃、抱腿、勾腳等,以將對手摔倒為勝,比賽分三局,每局三分鐘。此外還有中國民族形式的摔跤,如蒙古族摔跤、朝鮮族摔跤、藏族摔跤、維吾爾族摔跤等。——“漢語大辭典”
中國式摔跤 中國民族形式的摔跤運動。比賽按體重分十個級別,在10米見方的場地上進行。常用方法有背、別、挑、纏、踹、踢、擰、摟、彈、搿、插閃、抱腿、勾腳等,以把對手摔倒為勝跤,按勝跤質量評定3、2、1分。每場賽兩局,每局3分鐘,以得分多者為勝。若比賽終止時間未到而一方得分已超過對手10分,該方為勝。中國各地區各民族也有不同的摔跤,如蒙古族摔跤、藏族摔跤、維吾爾族摔跤等。——《辭海》
盡管如此,“漢語大辭典”對《辭海》的摘錄也有不全面的地方,如沒有介紹“按勝跤質量評分,以得分多者為勝”的情況,而且最后一句話“此外還有中國民族形式的摔跤”則將“中國民族形式的摔跤”排除在“中國式摔跤”之外(正確的表達應該是將蒙古族摔跤、藏族摔跤、維吾爾族摔跤等包含在“中國式摔跤”這一概念里)。
再看一個“百度百科”中的例子:
道員 職官名。明初布政司、按察司因轄區大而事繁,布政司的左右參政、參議分理各道錢谷,稱為分守道;按察司的副使、僉事分理各道刑名,稱為分巡道。此為道員稱謂之始。至清乾隆間裁去世參政、參議、副使、僉事等職,專設分守道與分巡道,多兼兵備銜,管轄府、州,乃成為省以下府、州以上的高級行政長官。別稱“道臺”、“觀察”。《官場現形記》第三四回:“八點鐘一位客到,乃是這里有名的一位道臺叫做‘磕頭道臺’。”又第九回:“王觀察信上言明,是奉了東撫之命,前往東洋考察學務。”東撫,指山東巡撫。——“百度百科”
道員 明初布政、按察二司以轄區廣大,由布政司的佐官左右參政、參議分理各道錢谷,稱為分守道;按察司的佐官副使、僉事分理各道刑名,稱為分巡道。此為道員稱謂之始。清乾隆時裁參政、參議、副使、僉事等名稱,專設分守、分巡道,多兼兵備銜,管轄府、州,成為省以下府、州以上的高級行政長官。清代簡稱“道臺”,又設督糧、鹽法等道,清末更在各省設置巡警、勸業二道,各司其專職。北洋政府時曾分一省為數道,設置道尹。——《辭海》
兩者前半部分的文字幾乎完全一樣(百度百科中“至清乾隆間裁去世參政”衍一“世”字),而“又第九回”以下的文字,已與“道員”無涉,也犯了內容“蕪雜”之病。
4.內容輾轉抄襲
由于一些數字化辭書(軟件)的開發者(尤其是個人)版權意識比較淡漠,往往將別人的東西隨便拿來使用,因此,數字化工具書(軟件)內容被輾轉抄襲的現象屢見不鮮。
下面是網絡版成語詞典中的一個條目:

我們在不同的網站可以看到與其相同的內容。現略舉數例:
金石網 www.kingsnet.biz
東方法眼 www.dffy.com
成語詞典 www.chengyu.org
網絡中國 life.httpcn.com
四、要重視辭書出版所面臨的數字化沖擊
盡管互聯網上數字化辭書(軟件)的問題不少,但不容否認的是,互聯網對辭書(包括紙質辭書和由正規出版機構出版的數字化辭書)的沖擊很大,應當引起辭書界足夠的重視。目前,這種沖擊主要表現在兩個方面。
1.以互聯網為典型代表,信息提供的渠道更多
借助于搜索平臺,目前互聯網上的各種網站、網頁已經成為很多人(包括不少專業工作者)了解信息、釋疑解難的平臺。“內事不決問老婆,外事不決問Google”(仿《三國演義》孫策臨死前對其弟孫權所言:“內事不決問張昭,外事不決問周瑜”)被選為2005年十大網絡名言之一,就是這種沖擊的形象概括。辭書,特別是百科類辭書、專科類辭書是否有被互聯網替代的可能,值得我們關注。
2.互聯網上的百科全書興起,對辭書出版(知識供應)形成了沖擊
作為一種互動媒體,互聯網很容易成為一個聚集信息和知識的平臺,因此,完全由網民編寫、更新并供網民免費瀏覽的百科全書也逐漸出現,目前在全球范圍內最具影響的是維基(Wiki)百科(http:∥www.wikipedia.org)。
維基百科發軔于20世紀90年代中期,經過十年的發展,維基百科已被認為是目前世界上最大的百科全書,到2005年底,共有82種語言版本,詞條總數已經接近200萬個,并且正以每月7%的幅度增加,每月的頁面點擊量達到25億次。對此,不少人歡欣鼓舞,正如互聯網剛興盛時有人高呼“全民出版”或“個人出版”的時代到來了那樣,目前,也有一部分人認為全民編寫詞典時代已經到來。
但是,用專業的眼光來看,那種全民編寫辭書的舉動實際上是十分危險的。前《不列顛百科全書》副總裁和主編羅伯特·麥克亨利(Robert McHenry)在2004年對“維基百科”有一個尖刻甚至貌似惡毒的評論,他認為,使用維基百科這樣全民編寫的百科全書如同在上公共廁所:“如果它可能臟得顯而易見,你就會處處小心;但或許它看上去相當干凈,因此你會被一種錯誤的安全感所麻痹。顯然你無法明確知道,誰在你之前用過了廁所。”
有人認為,羅伯特·麥克亨利的這番言辭,是因為維基百科全書與《不列顛百科全書》構成競爭使然,但實情卻是:如果沒有相當程度的判斷力,用戶就根本無法判斷在類似“維基百科”這樣的全民百科全書中獲得的知識是真還是假;而如果用戶能夠作出準確的判斷,那還需要去查工具書嗎?這真是一個類似于“第二十二條軍規”的黑色幽默。
知識作為人類文化的精髓,顯然不應該被壟斷。同時,我們也應該看到,知識的提供歷來是一種專業化的技能,從來都是由專業化的隊伍來提供(否則,就不應該有教師、醫生、律師等職業),才能保證科學性、準確性。因此,如果普通大眾獲得的知識是真偽難辨的,互聯網上良莠不齊的信息讓人難以辨別其優劣,而人們還對這種情況一味稱贊、夸耀,那么在知識供應上的“劣幣驅逐良幣”現象,便會發生、擴大。這才是最令人擔憂的。
目前,經濟全球化、全球信息化的浪潮席卷而來,每個人都面臨著“全球信息化”或“信息全球化”的挑戰。作為辭書工作者,“全球信息化”需要我們考慮用信息化技術來發展我們的辭書事業,而“信息全球化”則使我們面臨的競爭更為殘酷(因為有更多的內容提供商出現)。面對新的環境、新的對手,應該如何應對,這個大問題值得每一個關心辭書事業的人去探索、解決。
(上海數字世紀網絡有限公司 上海 200001)
(責任編輯 王慧敏)