辭書出現在文字產生之后、書面知識有一定積累的時期,如中國最早的辭書《爾雅》《方言》《說文解字》產生在戰國末年與兩漢時期,那時已經有了《周易》《尚書》《詩經》《周禮》《儀禮》《禮記》《春秋左傳》《春秋公羊傳》《春秋穀梁傳》《孝經》《論語》《孟子》等重要經書。再如印度的《阿摩羅辭典》,成書約在公元550—750年之間;阿拉伯最早的詞典《埃因書》,編纂于公元760年;據傳歐洲在2世紀已有字書學者,中世紀已有拉丁文詞典,但今日可見的最早辭書是意大利佛羅倫薩學士院的《詞集》(1612)法蘭西學士院的《法語詞典》(1694)等。辭書的基本功能就是知識的整合與供給,并在整合與供給中進行知識再生產,這需要社會有一定的書面知識積累。辭書是書籍的一個類別,在印刷術出現后得到快速發展,形成了辭書的平面媒體形態。
從莫爾斯1837年發明電報機,到1928年美國廣播組織播出第一套電視片《Felix theCat》,在90多年的時間里,人類發明了電報、傳真、電話、留聲機、電影、錄音機、廣播、電視等,開啟了利用電波傳遞信息的電信時代,標志著人類語言擁有了聲、光、電三種物質媒介。面向機器的“電子詞典”的概念,在自然語言處理、機器翻譯興起的20世紀40年代末就已經提出,但是面向人的辭書,直到20世紀80年代才出現電子形態,如文曲星、諾亞舟、好易通等產品。伴隨著信息技術、網絡媒體的發展,電子形態的辭書由芯片辭書、光盤辭書發展到網絡辭書、辭書App等,形成了一個電子辭書家族。現在,電子辭書逐漸呈現融媒體特點,向融媒辭書的方向發展。
何謂“融媒辭書”?章宜華教授的新著《融媒詞典學:理論與實踐》便是回答這一問題的專著。這部得風氣之先的著作,何以能出自他手?因為他是融媒辭書學的積極研究者,又是融媒辭書事業的積極推進者。宜華教授發起建立了廣東外語外貿大學詞典學研究中心,撰寫了《計算詞典學與新型詞典》(上海辭書出版社,2004)和《計算詞典學》(上海辭書出版社,2013),發表了一系列的融媒辭書研究論文,是我國融媒辭書學研究的頂流學者。他連任三屆中國辭書學會副會長(2007一2023年),長期兼任中國辭書學會學術委員會主任、雙語詞典專業委員會主任和《中國辭書學報》主編。在這些重要的學術領導崗位上,他積極引導學界研究融媒辭書,積極支持業界開發融媒辭書,一直站在融媒辭書發展的第一線。
我十分有幸能夠成為這部著作出版前的讀者。宜華教授的不少文章我讀過,不少報告我聽過,對他的學術觀點有所了解。這次有緣進行“整本書閱讀”,而且是紙本閱讀,理解更全面,體會更深刻。體會最深者有如下幾個方面。
一、 融媒辭書的理論奠基
辭書電子化的進程,一直是由技術和產業帶動,理論研究相對滯后。沒有理論指導的電子辭書的發展,必然會出現許多不如人意之處。例如,許多電子辭書,只是不同形式的詞匯重組和紙質辭書的電子化復刻;許多人只把技術看作電子辭書發展的一種工具或手段,甚至只把融媒辭書看作多媒體元素的簡單疊加,未能觸及多模態認知的協同融合機制。
宜華教授長期關注電子辭書的發展,在對國內外各種類型的電子辭書深人研究的基礎上,在尋求電子辭書發展問題的解決對策時,一直在進行理論的思考與構建。在本書中,他提出了“模態層級理論”和“模態融合理論”,構擬了“動態語義網絡框架”,進行了“靜態融合與動態融合”的區分等。這些理論學說,系統闡釋了多模態符號協同釋義的重要性,提出了依照模態認知權重進行多模態的協調和融合,破解了跨模態表征失序的難題;本書對大語言模型多模態對齊算法的深度解析,則揭示了語義網絡立體化重構的技術邏輯。這種“認知機制建模-技術路徑驗證”的雙向閉環及相關理論,為融媒辭書的發展奠定了堅實的元理論基石。
理論之于實踐是相互適應、相互推動的關系,具體來說有兩種表現方式:其一是實踐先行,之后構建理論,對實踐做出解釋;對實踐具有解釋力的理論,反過來又對實踐發揮指導作用。其二是理論先行,預見性的理論指導著實踐的發展;在指導實踐的過程中,理論也會做出適當調整,以適應豐富多彩、充滿活力的實踐。宜華教授提出的這些理論,是在電子辭書的實踐基礎上產生的,至于其是否很好地解釋了實踐,還需要接受實踐的檢驗。而且電子辭書的實踐也會如電一般地活躍和迅捷發展,理論在接受實踐的檢驗和指導實踐的過程中,也需要敏捷地適應、調整和發展。
二、辭書編纂的技術助力
宜華教授用較大氣力繪制了融媒辭書學的“技術-認知基因圖譜”。第四章系統論述融媒辭書的多模態符號學;第五章揭示大語言模型的“多模態微調策略”;第七章提出“五層融合機制”;第八章詳細描述融媒辭書的“多模態表征元素”,相關內容可以直接應用于大語言模型的“優化學習訓練”;第九章系統闡釋“融媒模態詞典綜合數字處理平臺”的各種功能模塊;第十、十一兩章,提出了“融媒-多模態”辭書的具體設計原則、釋義的理想模式、范疇化釋義模版,以及基于大語言模型的多模態信息提取、自動對齊和交互融合的實踐方法等。
關于融媒辭書這種“跨界融合”的理論與技術,涉及多個學科,但并非學科的簡單拼貼,而是以辭書學為樞紐,貫通語言學、人工智能、認知科學的知識再生產。其中最為重要的,我認為是重構了辭書編纂的方法論。書中提出的“多模態知識蒸餾技術”,依托大語言模型的跨模態映射能力,使辭書編纂效率大為躍升;特別是通過“語義網絡—文化語境—語用規則”的融合,解決了傳統線性釋義的局限性。當大語言模型的數據積累和智能水平達到一定程度時,就可以利用大語言模型即時生成辭書。而辭書工作者的主要任務,就會放在研制辭書釋義模版、制定編纂的規則和范式、制作相關輔助軟件等方面,有望把辭書工作者從繁重的具體文字處理中解脫出來。這種情況改變了辭書編纂的方法和流程,也將影響到辭書的表現形態。
三、辭書功能的認知升維
本書在辭書功能的認知上,也有重大的學術突破。
第一,重新定義辭書的功能。傳統上,辭書被看作以條目呈現的“靜態知識庫”,而本書提出了“媒體融合一模態協同一用戶中心”的三維模型,將辭書功能重新建構為動態的認知交互,將“學習詞典編纂”視為“課堂教學設計過程”,實現了辭書由信息容器到交互生態的范式轉換。
第二,重塑教學價值鏈。第四章對視覺理論的闡述和第十二章對“認知閾值效應”的展示,說明當多模態表征協同刺激讀者的感官通道時,知識遷移效率會呈現指數級增長,這為智能教育提供了可以復用的認知增強模型。
第三,強調用戶中心觀。辭書編纂者和出版者是知識的供給方,辭書用戶是知識的需求方。供給方應當滿足需求方的需求,提供需求方所需要的內容,充分照顧需求方獲取知識的習慣及途徑。供給方在較好滿足需求方的需求中,體現自己的價值,實現自己的利益。
在數字時代,辭書不僅由紙質形態發展為電子形態(特別是發展為多模態、多數據庫融合而成的融媒辭書),其功能、價值也在發生變化。如由靜態知識庫發展為辭書編纂者與用戶認知的動態交互,由文字單模態發展為多模態而大大提升了知識遷移效率,由辭書編纂者自己的知識生產活動發展為以用戶為中心的知識服務等。
最后特別需要提出的是,人類已經進人了以大語言模型為代表的數智時代。2022年11月30日ChatGPT上線,之后Sora、GPT-4o 接踵問世。最近,中國也掀起了“百模大戰”,DeepSeek大語言模型幫人和詩、寫詩、賞詩、集句或發表銳評文章,水平遠超凡人。2024 年諾貝爾物理學獎授予約翰·霍普菲爾德(JohnJ.Hopfield)和杰弗里·辛頓(Geoffrey E.Hinton),諾貝爾化學獎授予大衛·貝克(David Baker)戴密斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper)。這兩項諾貝爾獎都與人工智能有關,這不僅是對這兩項成果的認定,更是對人工智能發展前景的認可。順著宜華教授這部著作的展望,還應該再思考這樣一個問題:大語言模型已經閱讀了網絡上人類的絕大部分數據,占有了人類的大部分知識,可謂“無所不知”,數智時代還需要辭書嗎?
就目前的大語言模型來看,它雖然“無所不知”,但也常“信口雌黃”,甚至出現“幻覺”。辭書是人類知識的基本集合,可以幫助人們對大語言模型的說法進行校驗,特別是甄別其“幻覺”言論。辭書也是最為優質的數據,機用電子辭書已走過了半個多世紀的歷程。雖說大語言模型目前主要還是“數據驅動”,但如果算法進階,可以更多地利用人類發現的科學規則,可以“讀懂”辭書,那么也可以大大減弱其“幻覺”,減少其“信口雌黃”的語言行為。如此,辭書就會在原有的知識整理、知識供給和知識生產的基礎上,再發展出“知識校驗”的功能。大語言模型當前的最大問題,是其提供知識的“不確定性”,而辭書則是克服其不確定性的重要知識產品,是數智時代人類的“知識底盤”。
數智時代仍需要辭書,但辭書的編纂、應用和形態會不斷發展變化。最為可能的發展方向是不斷的“智能化”,亦即編纂的智能化、應用的智能化。辭書很可能常以“隱身跟隨”的方式來滿足用戶需求,當用戶需要查檢辭書時,它就會隨時出現在用戶的眼前耳畔,以用戶需要的方式提供知識服務。現在,我們在網上閱讀時,點擊所要檢索的詞語,馬上就會出現相關的解釋或翻譯。這可能就是未來辭書的雛形,可以稱為辭書的“智能形態”。當然,辭書是迭代發展的,各種形態的紙質辭書和電子辭書也會共時而存,在不同場景中發揮各自的作用。
這些感受是我個人的、初步的,不一定合適、全面且有代表性。但一部著作能讓讀者愿意讀、有所獲,就是成功。我以為,章宜華教授的《融媒詞典學:理論與實踐》便是這樣一部讓人愿意讀、讀后有所獲的著作!當然,我也希望在辭書智能化的發展中,讀到宜華教授的更多佳作。
(北京語言大學語言科學院 北京 100083)(責任編輯 郎晶晶)
《融媒詞典學》即將出版
《融媒詞典學》,章宜華著,即將于2026年出版。該書系統構建了融媒詞典多模態釋義的理想認知模式和編纂實踐的路徑及方法,涉及理論框架、技術支撐與教學應用三個層面。理論層面,基于符號學、認知科學與教育學構建融媒詞典學理論框架,提出“媒體融合一模態協同一用戶中心”的核心范式,搭建“認知模式一釋義模板一語義網絡”三層結構的釋義模型:以認知意象為基礎,通過多模態符號語法和知識可視化等實現詞匯意義的立體呈現;并針對不同詞匯范疇,根據“五層融合機制”進行多模態交互融合,確保釋義模態的協同互補和釋義的科學性。技術層面,基于“感官整合一大腦融合一技術賦能”多模態認知路徑,引人大語言模型為信息獲取引擎,運用多模態處理、知識蒸餾與跨模態映射動態校準權重,為生成情境化釋義提供算法支撐;在此基礎上,構建集智能采集、自動編纂、定制輸出于一體的融媒數據平臺與多模態詞典數據庫,形成“數字平臺一多模態數據一人機互動”三位一體的智能詞典生態系統。教學層面,通過詞典平臺與數字教材的無縫鏈接,踐行“詞典即課堂”的理念,創設介入式場景,通過詞典釋義的多模態協同,深度激活并優化用戶的認知加工過程,從而提升用戶的知識遷移效率,培養學習者的批判性思維與跨文化理解能力,推動辭書由“靜態知識庫”轉型為“動態認知伙伴”。