摘 要 文章主要探討電子詞典的定義與分類,并針對各種不同類別的電子詞典列舉典型案例及其發展,試圖厘清電子詞典的概念及各種電子詞典的現狀,作為電子詞典進一步研究的基礎,供詞典行業從業者包括作者、編輯、內容提供商、平臺提供商、硬件生產商等參考。
關鍵詞 電子詞典 硬件類電子詞典 軟件類電子詞典 詞庫
說到電子詞典,可以說是廣大讀者耳熟能詳的一個詞語,但是究竟什么是電子詞典,恐怕很多人并沒有一個明確的概念。價值數百乃至數千元的快譯通、卡西歐是電子詞典,那么收錄詞典數據并可以在電腦或其他設備上查詢的一張光盤、一個App算是電子詞典嗎?如果答案是肯定的,那么一個可以查詢單詞釋義的網頁,乃至微信公眾服務號,又可以算是電子詞典嗎?
正如詞典是圖書的一種,所謂的電子詞典,應該說是屬于電子書中比較特殊的一類。關于電子書,有人給出了這樣的定義: 電子書是一種結構化的字節的組合,它可以被保存到CDROM或者其他存儲媒介中,也可以通過網絡傳輸,它的最終設計目標是能夠通過某種硬件和軟件的結合體得以瀏覽,從而閱讀,這種軟硬件的結合體可以是終端,可以是個人電腦上安裝的Web瀏覽器,也可以是新型的電子書閱讀器。(聶華2005)電子詞典具備電子書所有的特性,在此基礎之上還有一些不同于一般圖書的特點。例如詞典的功能不僅僅是瀏覽閱讀,或者說主要不是瀏覽閱讀,還有更重要的查詢功能,也就是它作為工具書的屬性,這一點反映在電子詞典上,也造成了電子詞典不同于一般電子書的特征。
筆者查閱了相關文獻有關電子詞典的各種定義,并從自己的感受出發,認為以下定義比較符合實際情況: 各種面向普通用戶的電子詞典(以下簡稱“電子詞典”)指以硬盤、光盤、磁盤或芯片等作為存儲介質,并借助微型處理器及相關計算機、網絡等技術將信息呈現于個人電腦、個人數字助理機、微型芯片電子詞典、電子書閱讀器、智能手機、平板電腦等終端屏幕上供普通用戶使用的詞典。(戴遠君,徐梅2014)需要說明的是,本文所探討的電子詞典,不包括用于機器翻譯與自然語言處理的機讀電子詞典。
按照這個定義,除了擁有實體的卡西歐等袖珍電子詞典之外,光盤、App都可以算是電子詞典,而網頁和微信公眾號,只要所存儲和提供查詢的是經過正式出版和授權的詞典數據,也可以算是電子詞典。當然,如果網頁和微信公眾號所傳播的僅僅是個人或集體的、未經正式出版的作品,就不能算是電子詞典了。簡而言之,電子詞典就是一種利用計算機及相關技術把信息呈現于屏幕上的工具書。(Hartmann & James2000)其基本原理是把用文字、圖形、圖像、聲音、活動圖像等媒體形式表達的信息內容轉化為二進制數字編碼,并利用磁、光、電可相互轉換的原理,儲存在磁、光、電介質上,使用時通過逆向的解碼過程將數字編碼還原成原媒體形式的信息。如果拋開載體不論,我們發現,電子詞典實際上是由語言數據、相關語料和語言處理技術構成的超文本語言文字信息框架。以實質而論,電子詞典包含了關于語言應用的普通知識和形式化語言處理技巧,是一個機器可讀的自然語言知識庫。(章宜華2013)只要符合這樣的實質,光盤也好,App也好,其他形式也好,都只是外在的表現形式。這些各不相同的外在形態,也正好體現了電子詞典各種不同的類別。
通常,電子詞典大致分為兩類。分別是硬件類電子詞典與軟件類電子詞典。
一、 硬件類電子詞典
所謂硬件類電子詞典,是詞典數據存儲在特定的芯片中,只能用制造商開發的硬件設備進行查詢的電子詞典。軟件在這里是被固化在硬件設備之中的,一般來說系統沒有多少可以自定義的空間。這也是人們通常理解中的電子詞典,包括快譯通、文曲星、卡西歐等眾多品牌。內置了詞典數據的點讀筆也可以算是這一類電子詞典。值得一提的是,在2010年橫空出世的辭海悅讀器,是由出版機構推出的內置詞典數據的閱讀器。(余傳詩2010)因為其詞典數據除了該硬件之外不能用其他方式讀取和利用,從定義上來說也屬于硬件類電子詞典。
二、 軟件類電子詞典
除了必須使用特定硬件的芯片型電子詞典,還有更多電子詞典并不需要專門的硬件設備,而是可以在個人電腦、平板電腦、手機、通用電子閱讀器等設備上進行查詢及各種操作,可以稱為軟件類電子詞典。
這類詞典還可以依據不同的分類方法進一步細分。
(一) 按照設備(平臺)的不同分類
按照支持設備的不同,可以分為個人電腦詞典、手機詞典、平板電腦詞典、電子閱讀器詞典等,當然也有跨多個平臺的電子詞典。
這些詞典更可進一步細分為本地詞典和網絡詞典,前者不需要聯網即可實現閱覽和查詢,后者則必須聯網方可實現。
在本地詞典中,還可以按照存儲介質的區別進一步分類,比如個人電腦詞典中曾經單獨列為一類的所謂光盤電子詞典,典型的有《微軟書架系列詞典》(Microsoft Bookshelf)、《牛津英語詞典》(Oxford English Dictionary)、《廣辭苑第六版DVDROM版》等。但其實這樣的分類沒有太大的意義,因為這些詞典當時發行的時候雖然采取了光盤的形式,但一方面大多可以通過安裝程序將全部內容拷貝至硬盤,使用時可以脫離光盤;另一方面隨著存儲介質的進化,現在還采用光盤形式發行的已經越來越少了。如果說有光盤電子詞典這個種類,似乎還可以有存儲卡電子詞典、移動硬盤電子詞典、下載型電子詞典等。并且,不少光盤還可以將詞庫安裝至手機等移動設備,就更加難以分類了。
網絡詞典則是本地沒有詞典數據,必須聯網方可查詢的電子詞典。這類詞典也可以分為兩類: 一類是帶有專用程序的,可以通過專用程序連接網絡數據庫,例如韓國Naver詞典,可以在手機上安裝相關App直接查詢,當然使用時必須聯網。另一類則是沒有專用程序的網頁形式,看上去似乎更為簡陋,每次使用必須通過瀏覽器登錄網頁,不如專用程序方便。當然若要為其定制一個專用程序,也并不是一件難事。
(二) 按照是否需要另行安裝分類
根據詞典是否需要用戶手動安裝的不同,可以分為不需要安裝的內置型電子詞典和需要另行安裝的自定義電子詞典。
內置型電子詞典是個人電腦或其他設備系統自帶的詞典程序,不需要使用者另行安裝。這種詞典在各種便攜設備上比較常見,往往與系統深度結合,使用起來特別方便。例如iOS中文系統內置了《現代漢語規范詞典》和《牛津英漢漢英詞典》等詞典,使用者不必進行任何設置,即可在任意程序中選擇中文或英文文本,在選中后出現的菜單中選擇“定義”,即可查詢到該詞的中英文釋義。如果使用者為系統添加日語輸入法,則內置詞典會自動增加《Super大辭林》《Wisdom英日日英詞典》等日語相關詞典。又如Kindle設備自帶了《現代漢語詞典》《現代漢英詞典》《現代英漢詞典》等11部官方詞典,可以在閱讀任何圖書時即時查詢。在個人電腦上,Word也有自帶的詞典,雖然第一次使用可能需要安裝,但也可以算作內置型詞典之一。
而自定義電子詞典則是系統本來沒有的,使用者必須另行安裝詞典程序。例如帶有安裝程序的光盤詞典、可在軟件商店免費或付費下載的App等。這也是現在一般意義上所謂的電子詞典軟件的概念。其實對于懂一些技術的詞典使用者來說,內置型的詞典有的也可以深度定制,例如iOS中可以自行下載其他語言的詞典,Kindle設備中另行購買或定制的詞典也可以加入系統字典中。
(三) 按照詞庫的性質分類
按照詞庫性質的不同,張杜一雄(2009)將智能手機詞典分為以下三類: 詞庫開放型、詞庫捆綁型和詞庫聯網型,這種分類標準不僅適用于手機詞典,也可以推廣到所有的電子詞典上。這種分類標準其實是將電子詞典分為了主程序和詞庫兩個部分,前者是用來查詢的工具,后者則是用來查詢的數據庫。詞庫開放型由一個主程序加多個獨立詞庫構成;詞庫捆綁型由一個主程序加一個(或幾個)捆綁的詞庫構成;詞庫聯網型則僅有一個主程序或沒有主程序,詞庫必須通過主程序或網頁瀏覽器連接網絡查詢。按照這種分類方式,其實硬件類電子詞典也完全可以歸入詞庫捆綁型電子詞典。而在軟件類電子詞典中,不難看出,詞庫開放型和捆綁型都屬于上文(一)中所提到的本地詞典,詞庫聯網型則相當于網絡詞典。
1. 詞庫開放型電子詞典
詞庫開放型電子詞典是制定一個詞庫的標準,由出版機構、研究機構、內容提供商、個人等將自己的數據打包為符合該標準的詞庫,可配合專用的主程序進行查詢,因為詞庫標準公開,甚至允許軟件開發者自行開發詞典主程序以實現更多功能。其主要特征是平臺通用性好、可多詞典查詢、定制性強,應該說是電子詞典中功能最強,資源最多,用戶最廣,最能代表電子詞典發展趨勢的。(盧華國,張雅2010)
詞庫開放型電子詞典最成功的例子應該說是日本的EPWING格式電子詞典(及相似規格的EB、SystemSoft格式電子詞典)。自1987年以來,日本發行了46張以上EPWING規格的CDROM光盤,其中有的光盤還包含多部紙質詞典。這意味著日本出版商和廠商能夠在這個市場上得到足夠的利潤,可以說是辭書電子化的一個巨大成功。這種成功筆者認為有以下幾個因素: (1) 國家標準對行業的指導作用。當該詞典格式成為JIS標準,日本的各大出版商都按照該規格(或略加修改)生成電子詞典數據庫,使得其通用性大大增強。(2) 日本讀者的版權意識比較強,并且因為通用性好,只要購買一次光盤,即可在多個終端、多種平臺上使用,讀者愿意為之付費。(3) 規格的公開為讀者的各種個性化需求提供了支持,讀者購買的是數據庫,查詢主程序可以有多種選擇,有需要的可以付費購買功能更強大的主程序,各種免費主程序也有很多選擇空間。此外,還可以自行轉換和制作個性化EPWING詞典。(4) 規格本身的優越性。由于該規格支持使用日語的假名和漢字進行查詢,支持前方一致、后方一致、完全一致、混合查詢、條件查詢、目錄查詢、全文檢索等眾多檢索方式,支持鏈接(可跳查),支持圖片、音頻、視頻等多媒體格式,支持多詞典查詢,為電子詞典的使用者帶來了紙質詞典所不能比擬的使用便利性。
遺憾的是,索尼的EB詞典于2000年退市,2010年以后EPWING詞典也很少上市,僅2013年有一部《經濟金融商務英和大辭典》。EPWING規格已逐漸為新規格ONESWING所替代,該規格最大的特征是優化了全文檢索,但同時規格本身不再公開。而SystemSoft的詞典也從2012年起不再支持通用的主程序。這樣做的結果就是日本20多年的軟件電子詞典“黃金時代”(筆者眼中的)宣告結束,每種詞典規格各自為營,忙于圈地,讀者不再擁有多詞典查詢的便利。對于EPWING最終的失敗,筆者認為其原因有以下幾點: (1) 規格本身的局限性。因為EPWING規格制定的時間比較早,有些地方時至今日已經落后于時代。例如該規格采用JIS文字編碼,使其在生僻字和其他國家文字的支持上存在先天的不足,結果詞典中帶有大量不能正常顯示的文字以圖片格式顯示,既占空間又不美觀。又如EB格式因為光盤容量的問題,原本是不支持漢字查詢的,雖然在其他平臺上使用時可以通過工具增加該功能,但畢竟其硬件已經不再銷售,因此也是最早消亡的。此外還有EPWING只讀光盤無法實現詞庫的升級等諸多因素。最重要的是光盤這種存儲介質本身也已經式微。(2) 多終端、多平臺使用對于讀者而言是方便的,但并不是出版商所樂于見到的。不少光盤的使用條款中明確規定“本光盤僅在一臺設備上使用”,但讀者往往從自己的方便出發,置該條款于不顧。甚至有人將光盤的內容分享到網絡上。事實上,目前中國絕大多數EPWING詞典使用者所使用的詞庫,都是免費獲得的,這當然是侵權行為,也是開放性詞庫難免會遇到的問題。接替光盤形式的新存儲介質在數據保護上更是存在先天不足。(3) 各家出版商為了自己的利益不再團結起來,而是為了圈住自己的讀者各行其是。
除了EPWING規格之外,還有很多其他格式的詞庫開放型電子詞典,例如KDic、PDic、SugarDict、StarDict、Lingoes、Mdict等詞典格式,但是這些詞典格式一般都是詞典愛好者個人所制定的,在影響上與EPWING不可同日而語,功能上也顯得有些簡陋。值得一提的是,Lingoes、Mdict電子詞典是由國人開發的,具有一定的影響力。在詞庫來源上,一般都是作者和網友利用各種網絡數據庫或流出的其他詞典數據制作而成,也有詞典愛好者組織人員對紙質詞典進行掃描識別和校對后制成詞庫的,其中的侵權性質難以回避,文字質量也難以保證。
2. 詞庫捆綁型電子詞典
相比詞庫開放型電子詞典,詞庫捆綁型電子詞典更受出版商和軟件開發商的青睞,因為這種方式可以在自己規定的格式下生成詞庫并隨意加密,以避免數據外流,保護知識產權。當然,對于讀者而言,如果想要多詞典查詢,除非所捆綁的詞庫包含了自己所需的詞典,否則就只能安裝多個詞典軟件了,使用起來還是有所不便。
個人電腦上有代表性的詞庫捆綁型電子詞典有幾年前的收費版金山詞霸。金山詞霸2007版收錄了12部雙語詞典、72個專業詞庫、29種百科性附錄等,內容豐富,功能強大,除了屏幕取詞、真人發音等功能之外,還支持網絡查詞。(顧海峰2010)從2010年起,金山詞霸已經升級為免費版的詞庫聯網型電子詞典了。
上文提到的ONESWING規格,因為其規格的不公開,可有效避免侵權,因而受到了出版商的青睞。2009年前后還有不少ONESWING詞典光盤在市場上銷售,但檢索軟件卻只有官方版,功能基本局限在光盤本身的范圍內,已經帶有詞庫捆綁型電子詞典的色彩了。現在這類光盤也已經基本停止銷售,該規格電子詞典多用于制作智能手機App,一般情況下每一個App對應一部獨立的詞典,已經演化為典型的詞庫捆綁型電子詞典。在日本的iOS App store中,以ONESWING為關鍵詞,可以搜索到100多個App。我國也有不少技術公司研發詞庫捆綁型電子詞典,例如上海海詞信息技術有限公司的“海笛科技”App平臺與傳統出版社合作,推出了《現代漢語詞典》《新牛津英漢雙解大詞典》等大量優質詞典App,在中國iOS App store中,“海笛科技”名下的詞典數已達130多種,形成了規模。(王俊2017)與商務印書館合作最新上架的《新華字典》App還支持筆順演示、數字版紙版對照、播音員語音示范、攝像頭取字等多種增值服務。在智能手機等便攜設備上,詞庫捆綁型電子詞典就這樣占領了絕大部分市場。
出版社也有自行開發詞典App的,例如外語教學與研究出版社曾推出Symbian、Java、PPC等平臺上的外研社手機詞典。現在的iOS和Android這兩個平臺更是兵家必爭之地,除了將原有資源數字化之外,不少出版社還主動出擊,利用各類本社資源開發內容原創性的詞典App。以上海外語教育出版社在這兩個平臺上發布的《外教社大學英語詞典》為例,該詞典是基于外教社詞典語料庫開發的,所有語料均來自正規出版物,經編輯和專家嚴格審校,內容準確可靠。為避免同質化,該詞典以清晰的產品定位和極強的針對性為賣點,收錄大學英語四六級詞匯、碩博階段英語詞匯、學術詞匯,并標明每一詞條的詞級。除一般詞典都包含的信息外,還設置了用法、聯想、辨析、背景知識、諺語、考點、教材例證7個專欄,注重與本社教材相結合,因而在外語電子詞典中具有一定的競爭力。(陳飄平2017)詞庫內容是隨App下載到手機內,并可以在不聯網的環境下使用,因而也屬于詞庫捆綁型電子詞典。
除了上述帶有官方性質的詞典App,一些組織和個人開發者開發的“李鬼”詞典App也充斥著App store,其中絕大多數也是屬于詞庫捆綁型電子詞典,只是其詞庫的合法性、權威性和可靠性值得懷疑。
3. 詞庫聯網型電子詞典
詞庫聯網型電子詞典即網絡詞典,網絡是使用這類詞典必不可少的條件。雖然受制于網絡,但隨著Wi-Fi、4G乃至5G等技術的發展,隨時聯網不再是一個奢侈的條件,詞庫聯網型電子詞典現在也變得越來越普及。因為詞庫位于云端的服務器上,使用者只能通過網絡對詞庫進行讀取,可在一定程度上防止侵權。另外,在利用網絡連接詞庫時,一般都是通過瀏覽器進行的,因此這類電子詞典往往都會開發一個在瀏覽器上呈現的網頁,此時瀏覽器也就擔任了詞典主程序的角色,可以實現查詢等功能,不必為之開發專門的主程序。也可以作為一種補充功能很方便地集成到詞庫開放型App、詞庫捆綁型App中去,例如作為詞庫開放型詞典主程序的EBPocket除本地詞庫之外還支持Yahoo!詞典、日文維基等網頁詞典。
前面也提到過,針對這樣的網頁詞典,也可以開發專用的移動設備查詢App,這種App可以理解為網絡詞典的客戶端,其好處是不必每次在瀏覽器內查找或輸入網址,即點即用,充分體現了移動設備的便利性。韓國的Naver App就是Naver網站的客戶端。金山詞霸2010年以來的個人電腦版本和便攜設備版本也屬于這一類,其便攜設備版本還以內購的形式進行電子詞典的銷售。有道詞典、海詞詞典、滬江小d等App也都擁有不錯的下載量,這些App都是相應網絡詞庫的客戶端,背后依靠大量的網絡詞庫的支持,其中很多都是取得出版社授權的正版詞典。在以技術公司為主的網絡詞典市場上,上海辭書出版社再次以出色的表現脫穎而出。該社《辭海》《大辭海》的數字化開發最近取得了較大的進展,《大辭海》數據庫(www.dacihai.com.cn)測試版已上線(朱淵2016),同時推出的Andoid版其實就是該數據庫的客戶端。
既然網頁詞典也可以配App,也就帶來一個問題,那就是如何判斷一個App是本地詞典還是網絡詞典呢?判斷的標準是詞庫所存放的位置,只是這對于一般的使用者來說既無法掌握也沒有必要區分。簡單說來,如果一個詞典App可以脫離網絡使用,自然是本地詞典;而必須聯網使用的App,往往是網絡詞典,當然其中也有一些情況是詞庫仍然放在本地,只是必須聯網驗證身份。這也反映出隨著技術的發展,兩種詞典的使用體驗已經相差不大了。
這類詞典的詞庫,大多由技術公司開發,其中有向出版社購買版權的,也有自行開發的。也有一些是出版社研發的,例如前述的《大辭海》數據庫,還有研究機構免費公開的各類網絡詞典,例如韓國國立國語院的網頁詞典《標準國語大辭典》。除此之外還有一些網頁詞典是網友自發編寫并免費供人使用的,例如Wikipedia、百度百科,以及漢典(其中的國語詞典以臺灣“教育部”授權的紙質詞典《重編國語辭典修訂本》為藍本),雖然這些詞典談不上是正式的出版物,是否屬于電子詞典尚有爭議,不過也在很大程度上滿足了網友精確度要求不高的查詢需求。
以上各類電子詞典,考慮到版權保護等方面的問題,趨于保守的詞庫捆綁型是現在比較主流的電子詞典。但筆者認為,更加開放而且便利的詞庫聯網型和詞庫開放型電子詞典,通過新的加密技術,在解決了版權保護問題的基礎上,結合微信、支付寶等最新支付手段,應該能夠取得更大的發展。這方面可以期待進一步研究。
參考文獻
1. 陳飄平.外語電子詞典如何避免同質化?——以《外教社大學英語詞典》App為例.出版廣角,2017(1).
2. 戴遠君,徐海.電子詞典研究現狀與展望.辭書研究,2014(4).
3. 顧海峰.國內雙語電子詞典現狀簡論.中國科技信息,2010(22).
4. 盧華國,張雅.移動學習時代的移動詞典——以詞庫開放型智能手機詞典Mdict為例.現代教育技術,2010(6).
5. 聶華.電子書的發展及其對圖書館的影響.大學圖書館學報,2005(2).
6. 王俊.我國電子詞典發展芻議.編輯之友,2017(6).
7. 余傳詩.辭海悅讀器亮相申城.中華讀書報,20100407.
8. 張杜一雄.智能手機應用系列之四: 詞典解決方案——隨心所欲即點即譯.新電腦,2009(6).
9. 章宜華.計算詞典學.上海:上海辭書出版社,2013.
10. 朱淵.一位“無聲的老師” 一座“無墻的大學”——以“辭海精神”打造“辭海品牌”.新民晚報,20161229.
11. Hartmann R R K, James G. Dictionary of Lexicography. Beijing: Foreign Language Teaching and Research Press, 2000.