摘 要 數字化發展正在塑造語言生活和辭書生活的融媒體化、智能化、開放性、多元性等現代化新樣態。文章主要從三個方面探討如何推動辭書生活的開放式發展:一是數字化轉型為當代辭書生活帶來的新變化;二是開放科學背景下開放式辭書生活的內涵、目標和挑戰;三是根據維基百科、GoldenDict詞典、“生僻字征集”微信小程序、對話式AI輔助釋義等案例,探索可用于我國數字時代開放式辭書生活的模式和經驗。開放式辭書生活有助于形成以辭書為紐帶的趣緣群體和文化認同,從現實維度實現中華優秀語言文化的集體構建,在提升我國辭書編纂水平、知識管理與服務水平、文化傳播能力和世界辭書影響力等方面做出重要貢獻。
關鍵詞 辭書生活 融媒辭書 數字化 開放科學 語言智能
一、 引言
數字化、智能化發展正在塑造人們當代社會生活的新形態,也為語言學、數字人文等學科的建設發展指明了新方向。國務院辦公廳在2020年發布了《關于全面加強新時代語言文字工作的意見》,強調基于語言文字信息技術“支持數字經濟發展”,“提供優質學習資源和信息服務資源”。2021年,《“十四五”規劃和2035年遠景目標綱要》繼續指出,我國已轉向高質量發展階段,迎接數字時代、建設數字中國,將加大公共服務資源的開放共享和應用力度,營造開放、健康、安全的數字生態。以人工智能、云計算、大數據、物聯網、虛擬現實等為代表的新一代信息技術,深刻改變著人們的生產方式、生活場景和行為模式,也在不斷推動語言生活和辭書生活的開放式發展。與此同時,“數字鴻溝”、信息過載、數據安全等問題也引發了人們對數字生活的持續擔憂。
“開放”是數字時代背景下國內國際都致力探索的重要議題。2021年,聯合國教科文組織第41屆大會通過《開放科學建議書》(2022年出版),倡導對科學知識的開放獲取。ChatGPT、文心一言、訊飛星火等大語言模型的發展,再次向公眾視野凸顯了促進語言數據開放共享的必要性和緊迫性。中華優秀傳統文化一直蘊含著開放、合作、共享的思想,如“助之視聽者眾,則其所聞見者遠矣”(《墨子·尚同》)、“獨思則滯而不通,獨為則困而不就”(《中論·治學第一》)、“人相聚得言,皆有益也,則此甚善”(《經學理窟·學大原下》)。1949年以來,馬克思主義群眾史觀與群眾路線、建言獻策的民主生活方式和自下而上的基層治理模式,傳承并體現了先進的開放理念與治理智慧。我國語言生活中,《漢字簡化方案》《漢語拼音方案》《國家通用規范漢字表》等語言文字規范的研制過程會廣泛征求“各領域、多層次的意見”(李宇明 2020b),學界及語言產業界也嘗試提出《漢語大詞典》“在線修訂”“動態修訂”模式(汪維輝 2013,2019)、研發“聚典數據開放平臺”(毛文濤 2023)等。但總體來看,開放式辭書生活的理論與實踐尚處于起步階段。
從《爾雅》《說文解字》《康熙字典》,到新中國成立以來的《現代漢語詞典》《辭?!返?,我國的辭書發展歷經變遷,既記載歷史,也反映了我國不同時代的知識管理水平。進入21世紀,在數字時代與融媒體時代背景下,傳統的紙媒辭書正迎來變革。與時俱進地探索建設開放式辭書生活,能夠及時回應數字時代的機遇和挑戰,助力從現實維度實現中華優秀語言文化的集體構建。
二、 數字化轉型對當代辭書生活的影響
(一) 辭書生活的概念及關系
“辭書生活”是我國辭書學研究貢獻的特色理念。查閱辭書是人們語言生活的一部分。像《新華字典》和《現代漢語詞典》這樣的語文辭書,不僅可以提供各種知識信息,還可以為掃盲識字、推廣普通話、語文教學、語言文字規范、漢語國際推廣、減貧脫貧等提供服務。2019年,中國辭書學會討論認為,辭書學應把辭書生活作為研究對象,實現由辭書編纂向辭書生活研究的轉變。(戴宗杰 2019)辭書生活的概念可以從兩個關系層面進行理解,如圖1所示。一是辭書生活和辭書編纂的關系。辭書編纂(dictionary compilation)是辭書學(lexicography)的一項重要實踐內容,包括語言數據的調查、收集、分析和辭書條目的選擇、描述、編輯、排列等。(Zgusta 1971;Hartmann 2003;Atkins amp; Rundell 2008)傳統辭書學在實踐上圍繞辭書的編纂與出版,在理論上關注辭書的類型、結構、用途、評價、歷史等,整體上更傾向編纂者(lexicographer)視角。而辭書生活的特點是以讀者、用戶為核心角色(李宇明,王東海 2020;陳雪 2022),側重觀察用戶與辭書之間的互動。二是辭書生活和語言生活的關系。辭書生活已逐漸成型,成為語言生活的重要組成部分,并與之“互映”。根據李宇明(2022)的定義,語言生活是“運用語言、學習語言、研究語言而形成的社會生活”。在此觀照之下,我們可以將辭書生活界定為與編纂辭書、出版辭書、應用辭書、研究辭書相關的社會生活,關注從辭書研發到生產、從生產到應用、再從應用回到研究的全鏈路 過程。
可見,辭書生活融合了辭書編纂和用戶生活的邊界,天然地蘊含著“開放”屬性。而在辭書數字化轉型發展過程中,這一屬性得以從技術層面具象化實現。
(二) 數字化轉型產生的影響
數字化是從信息化到智能化的過渡階段。在語言文字信息化建設的基礎上,辭書領域的數字化轉型正在引發當代辭書生活的深刻變革,從辭書數據、媒介、類型、出版等方面產生結構性影響。
1. 辭書數據呈現為多源異構數據的集成
用于辭書編纂的語言數據具有多種來源、類型和結構,這是由辭書知識內容決定的。以語文詞典為例:語文詞典幾乎包括所有的語言知識,可以說是語言知識的“詞典化”。詞典編寫既要吸收文字、語音、詞匯、語法、語用等方面的研究成果,又要運用語言類型學、語言交際、語言習得等理論方法來研究問題,還要從“詞義與例句關系”“社會文化對詞語用法的影響”“社會變化對詞語意義的影響”這些專題研究中獲得有力的 支撐。
紙媒詞典的結構比較固定,能夠表達的語言知識有限。數字詞典支持的數據格式更加多元,不僅是詞形、拼音、詞類、釋義、配例等基礎文本數據,還有詞頻表、分級詞匯表、知識圖譜等結構化數據以及基于語義關聯的圖解、音頻、視頻、超鏈接等多模態數據。多源異構數據是辭書實現數字化轉型的基礎,據此可以擴展更多的融媒體應用和創新功能,例如語音朗讀、情景視頻查詢等。
2. 辭書媒介呈現融合趨勢
在移動互聯網普及、語言智能技術快速發展的今天,人們的數字素養和信息檢索能力得到極大提升,詞典查檢需求、方式和習慣也發生了重大變化。人們越來越偏好“碎片化”“跟隨性”的在線即時查檢,(李宇明 2020a;杜翔 2023)作為獨立工具的紙媒辭書已經無法滿足用戶需求,辭書電子化、融媒體化是大勢所趨?!吨袊蟀倏迫珪贰掇o?!贰洞筠o?!贰缎氯A字典》《現代漢語詞典》《英漢大詞典》《唐詩鑒賞詞典》等系列辭書,都已經推出或正在開發各種類型的數字版、網絡版以及App、小程序等移動端產品;《全球華語大詞典》更是在2020年啟動了融媒體版的開發。
融媒體是辭書實現數字化轉型的關鍵,不同媒體的融合能夠充分利用多源異構數據,促進辭書與相關資源的融合,為人們的辭書生活帶來顛覆性改變。圖像識別是目前對融媒辭書建設貢獻較大的一項人工智能技術,能夠在用戶和辭書之間創造更立體的交互模式和認知體驗。例如,“網易有道詞典”“微軟必應詞典”等在線詞典設有屏幕取詞、截圖翻譯等功能;“植物智”“識花君”等應用程序支持拍照識別植物,進而檢索植物百科知識和植物圖像、植物標本、植物志書等內容。
融媒辭書也更容易獲取物聯網技術的支持,在“萬物互聯”的基礎上實現“辭書萬物載體”。物聯網可以通過網絡為用戶鏈接空間環境中的物品,在人與環境之間進行信息交互。融媒辭書能夠更好地適應、搭載物聯網平臺,除了安裝在電腦和手機上之外,目前還可以在汽車、手表、眼鏡、臺燈等物品上應用。物聯網技術方興未艾,未來的融媒辭書可能出現在衣服、帽子、餐桌等任意物品上,為人們的所見所感提供隨時隨地的辭書知識服務,從“按需求連接萬物”升級為“按需求認知萬物”。
3. 辭書類型呈現綜合性發展取向
辭書可以按照五個不同的標準來劃分類型:(1) 按用途,例如常見辭書可分為語文辭書、百科辭書和??妻o書三類;(2) 按所起的規范作用,如語文辭書可分為查檢型和規范型(張書巖 2023);(3) 按所包含的語言種類,如單語詞典、雙語詞典等;(4) 按歷史原則,例如根據反映詞義的歷時演變情況來劃分古代漢語詞典、近代漢語詞典、現代漢語詞典;(5) 按條目排列的方式,例如按音序排列或按部首排列等。
區分辭書類型進行編纂,是紙媒時代傳承的一種知識管理方式,既保證了在媒體資源有限的情況下合理組織辭書內容,也便于人們根據不同的知識需求來分類查檢。而在融媒體時代,數字化技術為辭書知識的組織與管理重新賦能。以數據庫形式存儲辭書條目,不僅用“一鍵”檢索的方式取代了按音序、部首等查檢,還在辭書分類編纂和多源數據集成的基礎上實現了“一次滿足多種需求”的綜合查檢,使用途、語種、歷史等辭書分類標準轉變為開放性的知識類別選擇。例如:“國學大師網”匯總了字典、詞典、成語、詩詞、書法、中醫等類別,字典中又囊括字形、字源、拼音、部首、漢字編碼、筆順及演示動畫、歷時詞義變化及例句、辭書來源等綜合信息;“維基詞典”支持輸入字形或詞形的跨語言(方言)查檢,對字形提供在不同語言中的發音、釋義、字源、衍生字、相關字、辭書來源等信息,對詞形提供在不同語言中的發音、釋義、模板用法、衍生詞、派生詞、翻譯等信息;“歐路詞典”除了導入多種來源的詞典之外,還提供中文百科和英文百科作為參考。綜合性的數字辭書,有助于人們降低查檢成本,更全面地構建知識體系,享受便捷豐富的辭書 生活。
4. 辭書出版向辭書知識服務轉型
辭書數字化可以促進“編纂系統化和使用個性化”(章宜華 2021)。在傳統的辭書學實踐中,辭書出版是辭書從編纂到應用必經的一個獨立活動,也是編纂者和用戶這兩個角色的“一墻之隔”?;ヂ摼W的發展使辭書知識的傳播媒介、發布平臺和獲取途徑更加多元,大數據、人工智能等技術使辭書研發能夠實現內容的融通提質,辭書正在由實體產品向數字化、智能化產品轉型(呂海春 2023);相應地,單向的辭書出版也正在向互動性更強的辭書知識服務轉型升級。一方面,用戶的個性化辭書需求得以凸顯,可以在多源異構數據、多種媒介、不同知識類別中自主選擇。例如,越來越多的在線學習詞典支持用戶進行詞典庫管理、自建詞庫和例句庫,WantWords(萬詞王)、WantQuotes(據意查句)等網站還可以通過描述語義來反向查詢字詞或名言名句。另一方面,辭書條目的收集、編輯、評價等權限也呈現公開化趨勢,編纂者和用戶之間的“墻”在逐漸打破,二者的角色分工不再鮮明地二元對立。這在一定程度上消解了部分辭書的權威性,同時也引發了虛假、錯誤辭書知識泛濫的風險。
以上幾項發展趨勢,促使數字時代的辭書編纂邏輯和應用場景發生深刻變化,保障辭書資源能夠公開獲取、使用、傳播、編輯與評價。因此,開放式辭書生活具備了現實意義上的技術基礎和探索條件。
三、 開放式辭書生活的內涵及其帶來的挑戰
(一) 開放式辭書生活的內涵
開放式辭書生活的內涵至少有三個層級:
首先,辭書知識內容應保持開放,及時反映社會變化導致的字、詞、語變化。以中文詞“視頻”為例:“視頻”原本只是一個通信術語,指圖像信號頻段(頻率范圍),對應的英文術語是video frequency。《現代漢語詞典》第7版對該詞條的釋義反映了這一點:
視頻 shìpín 名在電視或雷達等系統中,圖像信號所包括的頻率范圍,一般在零到幾兆赫之間。
但在當代數字生活中,人們更常用“視頻”來指動態影像本身,或者借助互聯網設備實現“面對面”交流的行為。為了反映這些新的詞義,建議將“視頻”的釋義修 改為:
視頻 shìpín ①名動態的影像:看~|制作~。②動依靠網絡在手機、電腦上面對面地交流:跟孩子~。③名在電視或雷達等系統中,圖像信號所包括的頻率范圍,一般在零到幾兆赫之間。
其次,在保持內容開放的基礎上,開放式辭書生活應盡量保證辭書資源的公開獲取和使用,促成辭書知識共享和辭書產品及服務的普惠應用。如前文所述,隨著語言文字信息化、數字化發展,許多辭書都已經推出或正在開發各種類型的數字產品,我國開放式辭書生活在這一層級上已初步實現。
最后,辭書生活的各項活動應面向社會公眾開放,鼓勵多元主體協同參與辭書建設和知識共創。辭書生活包含辭書編纂、辭書出版、辭書應用、辭書研究等幾項基本活動,在傳統的辭書學實踐過程中,各項活動環環相扣但相對獨立,編纂、出版等辭書生產活動具有一定的封閉性,從編纂者發現變化到用戶能夠查檢到變化需要經歷較長的周期。面對數字時代的“知識爆炸”與海量信息,適應辭書內容和資源的開放需求,也需要進一步探索群策群力、協作共享的開放式辭書活動。
綜上所述,我們把開放式辭書生活的建設目標描述為:鼓勵社會公眾嘗試辭書生活中的多元角色,通過協同參與辭書編纂、出版、研究等活動,共同促進辭書知識內容的動態更新、辭書資源的共建共享、辭書產品及服務的普惠應用。從開放科學與語言治理的角度看,數字時代的開放式辭書生活仍面臨著諸多挑戰。
(二) 開放式辭書生活所帶來的挑戰
在聯合國教科文組織(2022)的《開放科學建議書》中,開放科學被定義為“人人皆可公開使用、獲取和重復使用多種語言的科學知識”“增進科學合作和信息共享”“向傳統科學界以外的社會行為者開放科學知識的創造、評估和傳播進程”的包容性架構,并且重視與其他知識體系的開放式對話。從開放科學背景出發,開放式辭書生活必須應對知識產權、數據安全、數據隱私、語言倫理、語言規范等方面的挑戰。
第一,知識產權和數據安全問題。一部成熟的辭書,往往是編纂團隊代際接力、多次修訂的知識產品,具有重大的教育、學術和經濟價值。辭書領域的數字化轉型,必然形成規?;恼Z言產業和數字經濟。數字辭書資源的開放,不僅關涉到集體智力勞動的知識產權問題,也可能觸及軍事、經濟、民生等關鍵領域的數據安全問題。
第二,數據隱私和語言倫理問題。數字化手段可用于輔助研判、修訂辭書知識內容。例如基于語言監測平臺的詞形、詞頻、語料等數據實時更新條目、配例、義項及順序等,廣泛吸收“大眾的日常生活經驗”對辭書進行動態修訂。(李仕春 2021)但是,關于社會語言生活的觀測數據涉及人們的偏好和隱私,應在合法、合理的基礎上謹慎開放使用。語言智能,特別是大語言模型的發展,離不開大規模、高質量的語言數據,其中也包括辭書數據。能否對辭書數據的來源和去向進行有效監管,則關系到語言倫理 問題。
第三,規范問題。引導社會公眾參與辭書編纂、出版等活動,還要格外注意規范問題。一是語言文字規范,辭書生活語言應符合《中華人民共和國國家通用語言文字法》等法律法規和語言文字規范標準;二是內容規范,應尊重法律和公序良俗;三是程序規范,提供的條目、注音、釋義、例證等信息應符合編纂規則、出版規范、數據規范和文獻引用 規范。
辭書生活應當開放,更應安全、規范、高質量開放。應對開放式辭書生活的挑戰,宏觀層面需要重視辭書規劃和辭書生活治理,推動制定辭書產業規范標準。本文聚焦微觀層面,考察開放式辭書生活的一些已有探索,從中歸納出適用于我國數字時代開放式辭書生活的建設經驗。
四、 開放式辭書生活的探索模式及案例
(一) 眾源編纂:從《牛津英語詞典》到“維基百科”
“眾源”(crowdsourcing)是一個管理科學概念,指組織機構將內部任務以自愿參與的方式外包給非特定的個人或群體。眾源模式的興起與互聯網發展有關,但在辭書學領域可以追溯到一些早期的眾源編纂實踐。
《德語大辭典》《牛津英語詞典》《朗文英語發音詞典》等紙媒辭書在編纂過程中嘗試過號召志愿者來分擔閱讀文獻、收集詞條引文、辨別詞匯發音等任務,當時主要通過郵寄資料等方式傳遞關于詞典編纂的意見。(金丹 2019)進入互聯網時代,“維基百科”作為一個具有全球影響力的開放式在線百科全書,本質上還是沿襲眾源編纂的核心思路,但編纂權限進一步放開:用戶不僅限于提供引文例證,還可以通過自發創建或維護條目等行為來協同 編輯。
基于互聯網平臺的眾源編纂,最大特點是融合了編纂者和用戶的邊界,使“編輯”也成為一類使用行為,從而動員更多人廣泛參與到辭書編纂過程中,并根據日常應用或研究辭書的經驗知識隨時更新詞條。互聯網平臺的優勢在于,能夠保存過程性的條目編輯記錄,并為眾多參與者提供一個公共討論空間。例如,截至2023年10月27日,“維基百科”中的“茶”詞條共經歷過1074次修訂,每個歷史版本標注有“修正筆誤”“內容擴充”“修飾語句”“增加或調整參考來源”等具體修訂操作,可以比較修訂版本、統計或交互式瀏覽修訂歷史;另外,條目下設置有討論區,用于交流觀點、展示條目質量評價情 況等。
如今,越來越多的數字辭書采取這種眾源編纂模式。除了“百度百科”“搜狗百科”“MBA智庫百科”“知乎百科”等百科網站之外,《在線大牛津》《中國英語詞典》等網絡詞典也正在逐步開放收集、編輯、修訂、擴充等編纂權限。不過,這種模式下用戶主要承擔辭書編纂的“義務資料員”和“學術顧問”兩類角色(秦曉惠 2014;秦曉惠,邸乙娟 2020),生活化程度有限。而且,為了保證條目編輯質量,辭書眾源編纂的前期、中期和后期分別需要設置明晰嚴格的工作流程、編輯規則和審查制度。
(二) 開源管理:學習詞典的個性化定制
“開源”指公開計算機軟件的源代碼,允許用戶獲取、修改和分享。廣義的“開源”不僅限于軟件,而是泛指一種開放共享的協作模式。如果說眾源編纂是對辭書編纂活動的開放式探索,數字辭書的開源管理則是對傳統辭書出版模式的創新,將辭書產品的設計權限更多地移交給用戶。
目前市場上許多學習詞典都支持用戶對數字辭書資源進行開源管理,例如“歐路詞典”“墨墨背單詞”“DesktopVoc”等軟件。用戶可以選擇已有詞典、導入詞典庫或創建詞庫,也可以添加或修改詞條,根據自己的學習需求來定制實際使用的詞典,或者接受系統算法基于查檢習慣提供的個性化推薦。
值得一提的是真正實現狹義開源的辭書工具“GoldenDict”。它公開提供不同歷史版本的軟件安裝包和源代碼,不僅支持導入多種開源格式的詞典資源、添加在線詞典或百科網站、結合正則表達式進行語料檢索,還允許用戶自定義字體、背景、顯示風格等界面設計,并且主要依靠用戶網絡社區進行維護與升級。這類開源辭書工具的使用門檻相對較高,需要具備一定的計算機知識。但用戶探索、討論、推薦辭書管理方案的主觀意愿也比較強,經常在網絡社區內交流使用經驗、功能擴展、詞典資源、語言學習等問題。
數字辭書的開源管理模式對構建開放式辭書生活具有較大的啟發意義。隨著人的全面發展,對美好生活的多元需求得以釋放,數字化與融媒體技術也讓人們更關注個性化定制方案。在辭書編纂與出版等活動中提升人們參與辭書生活的主動權,可以引導人們自發探索和維護辭書資源,促進更好的用戶體驗。
(三) 移動社區:“生僻字征集”微信小程序
“生僻字征集”微信小程序是由工業和信息化部電子工業標準化研究院指導的生僻字提交入口,廣泛征集生僻字的圖片、讀音、來源、釋義等信息,通過審核考證的生僻字將被賦碼并錄入國標字庫,從而實現在信息化系統中的無障礙輸入與輸出。除了提交生僻字之外,用戶還可以在該小程序中使用以下幾項功能:(1) 進入“生僻字廣場”,查看所有用戶最新提交的生僻字信息,進行評價(“有啟發”或“很費解”)和分享;(2) 互動答題,根據圖片猜測漢字的意思,回答后可以查看詳細釋義;(3) 瀏覽關于“漢字守護計劃”的科普文章。此外,為了提高用戶的積極性和創造力,該小程序采用的激勵機制是提供“漢字守護者”的守護記錄和證書,以證明用戶為共建漢字文明做出的貢獻。
我們把以“生僻字征集”小程序為代表的辭書生活模式概括為移動社區模式,其特點是覆蓋了從源頭征集到應用落地的全鏈路,通過多種互動場景構建移動端的虛擬辭書社區。相較于辭書的眾源編纂和開源管理,這種移動社區模式在保留開放式征集任務的基礎上,鼓勵用戶培育猜一猜漢字、逛一逛“廣場”、看一看所參與計劃的動態等辭書生活習慣,隨時獲取辭書知識,豐富語言文化生活。用戶從“義務資料員”角色成長為中華語言文化的建設者和見證者,對于辭書生活的黏性和活躍度更高,有利于建立以辭書為紐
帶的趣緣群體(interest-related group)和文化認同。
(四) 智能交互:對話式AI作為釋義工具
智能化是數字化發展的下一階段,可以預見的是,數字時代的開放式辭書生活將不斷與語言智能深度融合。作為語言智能的典型代表,對話式AI有兩個顯著優勢,一是能快速從海量數據中提取相關信息并生成簡要回答,二是對話式的人機交互方式對用戶更友好。在此,我們嘗試跳出辭書生活的固有場景,探索對話式AI工具在釋義過程中的輔助性介入作用,想象智能交互模式在未來辭書生活中的應用前景。
1. 大語言模型輔助解釋新詞新義
對于隨著社會發展出現的新詞或新義,我們進行釋義時,可以先對大語言模型下指令,初步了解詞語的意義和用法。例如,“逆行者”是《咬文嚼字》發布的2020年度十大流行語之一,對于指令“請對中文詞語‘逆行者’進行釋義”,GPT-3.5、文心一言和訊飛星火這三類對話式AI的回答分別如下:
(1) GPT-3.5:“逆行者”通常指的是那些不按照社會傳統或規范來行事的人,他們可能持有與主流觀點相反的看法,或者在特定領域或問題上采取與大多數人不同的立場和行動。這個詞語可以用來形容那些敢于挑戰權威、常規或傳統的人,他們通常追求獨立思考和創新,有時會遭受批評或反對,但也可能因此取得顯著的成就或引領變革。逆行者常常代表一種對社會變革和進步的力量。
(2) 文心一言:“逆行者”這個詞語通常用來形容那些在困境中表現出頑強和毅力的行動者。它帶有一種贊美和敬仰的情感色彩。具體來說,“逆行者”是指那些在面對困難、挑戰或者是不利環境時,不屈不撓地前行,甚至能夠改變自己以適應環境的人。這些人通常具有非常強的意志力和決心,他們不畏艱難險阻,勇往直前,不放棄任何機會去實現自己的目標。例如,在疫情期間,那些冒著風險堅守在一線的醫護人員就可以被稱為“逆行者”,因為他們在這個困難時刻選擇了前行,而不是后退。
(3) 訊飛星火:“逆行者”是一個中文詞語,通常用來形容在特定情況下,與大多數人或主流趨勢相反行動的人。這個詞語常常用來表示這些人具有勇敢、堅定的品質,他們敢于挑戰權威、傳統觀念或者社會規范,為了追求真理、正義或者個人信仰而選擇與眾不同的道路。例如,在疫情期間,醫護人員冒著生命危險救治病患,他們被稱為“抗疫逆行者”。在這個語境下,“逆行者”表示這些醫護人員不顧自身安危,勇敢地投身于抗擊疫情的戰斗中,與病毒傳播的大趨勢背道而馳。
從上述回答來看,“逆行者”有兩個義項,并且釋義關鍵詞是“逆”和“勇敢”。但是,AI給出的釋義太過冗長,不符合簡明易讀的釋義原則。人工釋義如下:
逆行者 名 ①勇于跟通常的行為或認識反向行動的人。②特指敢于奔赴受災地區或危險境地進行救援工作的人。
而且,AI解釋的都只有比喻義,忽略了“逆行者”的本義,即“反向運動的人”,如:
(4) 車輛行人都要靠右行駛。如果不這樣就是逆行,出了交通事故,一般要由逆行者負責。(師言《社會保險行政爭議處理辦法實施手冊》)
不過,“逆行者”的本義不常用;且中文里帶“者”的詞語很多,例如“旅行者、唱歌跑調者、饑餓者、貧困者……”?!澳嫘姓摺苯瓿稍~,與抗疫先進個人和集體產生的重大社會影響有關,創建詞條時可以只收常用的、超出字面的比喻義。
2. AI文獻閱讀工具輔助術語釋義
當代世界科技創新呈指數增長,新概念、新術語不斷涌現,而權威的學術文獻通常是術語釋義的重要參考來源。合理運用AI文獻閱讀工具,可以快速得到關于術語的綜合理解和觀點對比,有效減輕編纂專科辭書的考證壓力。
以對話式AI工具“SciSpace”為例,它可以在理解論文的基礎上,為用戶的問題提供一些有價值的見解(insight)。比如,我們希望了解學界關于“元宇宙”概念的解釋,于是提問“‘元宇宙’是否有定義”(Does“ Metaverse” have a de?nition?),得到的AI見解如下:
(5) “元宇宙”一詞確實有定義,盡管其描述方式存在一些差異。元宇宙通常被理解為結合虛擬現實和物理現實的虛擬宇宙或共享空間,包括虛擬世界、增強現實和互聯網。它是一個由相互連接的虛擬空間組成的網絡,用戶在其中可以通過虛擬現實(VR)和增強現實(AR)等沉浸式技術與彼此和環境進行交互。元宇宙被視為一個為品牌提供與消費者互動并創造沉浸式體驗機會的平臺。它也被描述為一個自給自足的系統,擁有自己的虛擬物品經濟和貿易,并且需要一個相互依存的架構來促進交互。無數用戶可以同步持續體驗元宇宙,它為各行各業的數字創新提供了巨大機遇。
除了綜合性回答之外,AI還會詳細地整理每個觀點的論文出處,并且接受用戶的評價和反饋。如表1所示,表格中列出了談及“元宇宙”定義的論文標題、作者、來源期刊、發表時間和相關觀點,以便術語編纂者進一步地查閱和考證。
以上兩個案例說明,對話式AI能夠很好地發揮數據驅動優勢,提供開放的釋義線索和參考材料,在一定程度上有可能取代眾源編纂中“義務資料員”的角色。智能交互模式是一種值得繼續探索的辭書生活模式,但AI有明顯的局限性,在辭書生活中更宜充當釋義“助手”。
五、 結語
本文將辭書生活定義為與編纂辭書、出版辭書、應用辭書、研究辭書相關的社會生活,并從辭書的數據、媒介、類型、服務等方面討論了數字化轉型對當代辭書生活的顯著影響。數字時代的辭書編纂邏輯和應用場景已發生深刻變化,技術上支持辭書資源的公開獲取、使用、傳播、編輯與評價,有必要及時探索開放式辭書生活的理論概念和實踐模式。
“開放”是數字時代的重要議題,建設開放式辭書生活,應重視人們的個性化、多元化需求,鼓勵社會公眾協同參與辭書編纂、出版、研究等活動,共同促進辭書知識內容的動態更新、辭書資源的共建共享、辭書產品及服務的普惠應用;同時,也要注意應對知識產權、數據安全、數據隱私、語言倫理、語言規范等方面的挑戰。本文集中歸納了開放式辭書生活的四種模式:眾源編纂,開源管理,移動社區和智能交互。隨著語言智能的發展,辭書編纂“義務資料員”的角色將來可能被AI取代,人們應更積極地嘗試辭書生活中的多元角色。為了引導安全、規范、高質量的開放式辭書生活,專業的辭書編纂者或可向辭書生活治理者轉型。
開放式辭書生活有助于形成以辭書為紐帶的趣緣群體和文化認同,從現實維度實現中華優秀語言文化的集體構建,在提升我國辭書編纂水平、知識管理與服務水平、文化傳播能力和世界辭書影響力等方面做出重要貢獻。未來,更多現代化辭書生活模式值得進一步探索。
參考文獻
1. 陳雪. 數字時代,辭書有何新變化. 光明日報,2022-11-29.
2. 戴宗杰. 中國辭書學會融媒體辭書專題研討會暨常務理事會擴大會議在魯東大學舉行. http://www.cishu.ldu.edu.cn/info/1041/2703.htm,2019.
3. 杜翔.試論中國辭書精神.語言戰略研究,2023(3).
4. 國務院辦公廳. 關于全面加強新時代語言文字工作的意見:國辦發〔2020〕30號. http://www.gov.cn/zhengce/content/2021-11/30/content_5654985.htm,2020.
5. 金丹.“眾包方式”在詞典編纂中的應用.開封教育學院學報,2019(9).
6. 李仕春.基于日常生活經驗的語文辭書釋義研究.魯東大學學報,2021(5).
7. 李宇明. 我看“融媒辭書”——小論“聚典數據開放平臺”. 中華讀書報,2020a-09-16(6).
8. 李宇明.語言治理的現實路向(代主持人語).云南師范大學學報,2020b(3).
9. 李宇明.語言規劃學說略.辭書研究,2022(1).
10. 李宇明,王東海.中國辭書歷史發展的若干走勢.魯東大學學報,2020(1).
11. 聯合國教科文組織. 開放科學建議書. 巴黎:聯合國教育、科學及文化組織,2022.
12. 呂海春.中國辭書數字化發展三十年.語言戰略研究,2023(5).
13. 毛文濤.從《辭?!返健熬鄣鋽祿_放平臺”.出版與印刷,2023(4).
14. 秦曉惠.基于“眾源方式”的詞典編纂模式探析——以《在線牛津英語詞典》為例.語言教學與研究,2014(4).
15. 秦曉惠,邸乙娟. 基于眾源方式的《中國英語詞典》編纂與使用研究. 北京:對外經濟貿易大學出版社,2020.
16. 汪維輝.時代呼喚在線《漢語大詞典》.寧波大學學報,2013(4).
17. 汪維輝.探索辭書“動態修訂”新模式.辭書研究,2019(4).
18. 張書巖.權威辭書對語言文字規范的貫徹與引領——以《新華字典》為例.魯東大學學報,2023(1).
19. 章宜華.融媒體視角下多模態詞典文本的設計構想.辭書研究,2021(2).
20. 中華人民共和國國民經濟和社會發展第十四個五年規劃和2035年遠景目標綱要. https://www.gov.cn/xinwen/2021-03/13/content_5592681.htm,2021.
21. Atkins B T S,Rundell M. The Oxford Guide to Practical Lexicography. New York:Oxford University Press,2008.
22. Hartmann R R K. Lexicography:Critical Concepts. London:Routledge,2003.
23. Zgusta L. Manual of Lexicography. Prague:Academia,Publishing House of the Czechoslovak Academy of Sciences,1971.
(儲澤祥 中國社會科學院大學文學院/中國社會科學院文學研究所 北京 100732;徐夢真 北京郵電大學人文學院 北京 102206)
(責任編輯 劉 博)