一、引 言
本文提到的編纂模式旨在提高詞典編纂效率,并為在線詞典學未來發展的三個重要理念提供依據(Fuertes-Olivera 待出版):其一,在線詞典學是一門獨立的學科,由四個要素組成:詞典數據、用戶、訪問與呈現、使用;其二,這四個要素相互關聯和制約,任何一個要素都會影響詞典編纂過程;其三,每個要素又相對獨立,可以同時具有多種功能,這些要素既是詞典的組成部分,也可以作為詞典的釋義內容呈現出來。Fuertes-Olivera(2025)明確界定了在線詞典學是一門獨立學科,主要研究如何創建和/或驗證詞典數據。這些詞典數據存儲在詞典編纂編輯軟件(LSE)的數據庫信息槽位中,方便詞典用戶檢索不同類型的信息并清楚地呈現出來,這種多功能在線電子詞典往往能夠以最直接、最快速的方式滿足不同詞典用戶的即時需求。根據上述釋義內容,在線詞典學(e-lexicography)就好比是一個詞典“方陣”,包含四個相互關聯的要素:詞典數據、用戶、訪問與呈現及使用。詞典數據是指由詞典編纂者準備或接受并存儲在LSE數據庫信息槽位中的所有數據,這些數據直接轉換成信息,服務于真實用戶和/或機器。這一定義表明,詞典數據指的是詞典資源中的一組或多組詞典條目,這些條目最終被轉換成信息,信息轉換過程也就是輸人數據轉化為輸出知識的過程。用戶可以是真實的人類或機器,也可以說是詞典數據的消費者或生產者。作為消費者,他們要求詞典數據能夠滿足使用需求,適用于不同的使用情境。作為生產者,人類、自然語言處理(NLP)語料庫查詢工具及生成式人工智能聊天機器人都能夠積極地參與到詞典數據的準備工作中去,例如Wikipedia和 Wiktionary所采用的所謂“自下而上的詞典編纂”方式就能很好地說明這一點。當然,這種新情況也會影響數據訪問、呈現及用途等各個方面。數據訪問與呈現是與信息數字化相關的兩個概念。訪問是一種技術,能夠使用戶在特定的語言外情境中搜索所需的數據。呈現是數據的展示方式,尤其是在數字環境中的展示。由此可見,訪問與呈現的前提是要有可搜索的字符串,這些字符串有不同的大小、格式和搜索情境。這就為“詞條\"(lemma)注入了新的解釋,詞條指任何具有標準可搜索形式的詞匯(語言的)或非詞匯(非語言的)字符,支持對其進行詞典編纂和定制化描述。(Fuertes-Olivera待出版)無論是作為詞典數據的創建者還是消費者,詞條是一種詞典編纂者和用戶用來簡化工作的“錨點”,是最為基礎的可搜索字符串,有助于實現詞典描述和定制化檢索?!岸ㄖ苹瘷z索”取決于用途,這一概念類似于詞典編纂學中用于指代詞典在特定情境中為特定用戶提供幫助的詞典功能。(Bergenholtzamp; Tarp 2003;Tarp 2008;Fuertes-Oliveraamp; Tarp 2014)在數字環境中,其用途還包括詞匯注釋編纂(glossography)及其他任何詞典數據,例如基于人工智能開發軟件的建模數據,可以將具體意義和/或用途與特定的查閱需求相匹配,這一用途已經在電子閱讀器中得到了廣泛的應用。(Bothma&Gouws2022;Tarp&Gouws 2023)
本文以《西班牙語數字詞典》(DiccionarioDigitaldel Espanol,以下或簡稱 DIDES[1] )為例,通過詞組(word combination)的編纂處理來闡述上述新理念。在此框架下,我將分析詞組的概念(第二部分),說明如何使用ChatGPT4o和Claude3.5(Pro)等聊天機器人生成詞組(第三部分),然后將其存儲在詞典數據槽中(第四部分)。最后總結主要觀點,并為未來研究提供一些啟發性建議。
二、概念辨析:詞組
詞組是一個總括性術語,詞典編纂者通常用它來指代由兩個或多個單詞組成的短語或表達,這些單詞經常一起使用并在語言中表達特定的意義或功能。語言學家通常將“短語”(phrases)和“搭配”(collocations)區分開來,這兩個相關的概念并非同義詞。短語是指在句子中作為一個整體起作用的兩個或多個單詞的組合。它們可以由包括名詞、動詞、形容詞、副詞等在內的各種詞匯組合而成。短語不包括主語和謂語,這也是它們與從句的區別所在。在詞典編纂中,短語非常重要,它們的意義通常無法通過逐詞分析得到,例如kick the bucket、on time 等短語。搭配是指特定單詞與另一個或多個單詞習慣性并列使用的現象,使用頻率高于一般使用的情況。經常一起使用的、并列關系非常緊密的搭配被標記為“強搭配\"(strong collocations),例如 fast food(不是 *quick food);并列關系比較松散的搭配則被標記為“弱搭配”(weakcollocations),例如 takeawalk。
語言學家通常從三個角度分析搭配,分別是詞匯、語義和結構,(Gitsaki1999)詞匯和語義主要針對詞匯性單詞,而結構主要是語法性單詞。詞匯視角(基于分布或頻率的方法,參見Grangeramp;Munier2008)和語義視角(短語學方法,參見Grangeramp;Munier2008)在處理搭配問題上有顯著差異。詞匯視角由Halliday等(1964)和Sinclair(1966)發起,遵循Firth(1957)的詞義觀念,將搭配解釋為“一個詞匯項與一個或多個單詞共現的傾向\"(Fan 2009)11。Sinclair(1991)進一步將搭配限定為一種統計選項,指出搭配是“兩個或多個單詞在文本中短距離內的共現”,并區分了常見搭配和罕見搭配兩種概念。語義視角最早由俄羅斯學者Vinogradov(1947)提出,后來Katz和Fodor(1963)及Chomsky(1965)等人繼續發展了這一觀點?;谡Z義視角,詞語搭配的語義屬性決定搭配詞的選擇,由此可以說,大多數詞語搭配的意義能夠反映出構成詞匯的語義。最后,Benson提出結構視角(Benson,Benson,Ilson1997),他認為,搭配是“經常與特定單詞或語法結構組合的詞語”。(Fan 2009)11
大多數詞典編纂者認同并接受從結構視角來看待詞組,他們把詞組看作是附加詞條(run-ons),認為詞組是一個主詞條(headword)中相關詞或派生形式的一部分。這種編纂實踐似乎回應了兩種筆者不認同的觀點。第一種觀點認為,將詞組處理成附加詞條可以節省空間。然而,在數字詞典編纂中,空間的使用并不重要,因此不值得去“節省”。第二種觀點傾向于:搭配詞的每個元素都“依附”于一個單詞詞條。這種觀點似乎基于這樣的信念,即我們稱之為“語言”的交流系統基本上由語境中的單個詞組成。筆者的看法則不同,我們認為人類通常使用詞塊(chunksof words)進行交流,其中一些詞塊具有獨立的意義,我們稱這些詞塊為詞組?;谝陨蠈煞N觀點的回應,筆者認為詞組應該被詞條化(lemmatised),在詞典編纂中與單詞同等重要(參見下文第四部分)。
三、使用大型語言模型(LLMs)生成詞組
將詞組納人詞典編纂需要完成三個相關的任務。首先,詞典編纂者需要明確在詞典編纂項目中什么是“詞組”。以筆者個人主持研編的《西班牙語數字詞典》為例,基于西班牙語的特點,假設詞組是由兩個或多個單詞組成的詞匯鏈,并且滿足以下一種或多種特征(Gantar等 2019)141-142:
(1)搭配性(Collocability):詞匯鏈中的單詞組合在一起有意義。例如,“and he is”沒有意義,而“veryhigh”有意義。
(2)習語性(Idiomaticity):詞匯鏈中的單詞組合在詞匯(如ad hoc)句法(如every now and then)、語義(如kick the bucket)、語用(如good morning)統計(如cats and dogs)以及慣用(如heavysmoker)等方面偏離了常規行為。
(3)組合性(Compositionality):詞匯鏈中的單詞組合不僅與習語性相關,還涉及“通過對單個詞匯應用標準組合規則來預測一組詞匯特征(語義、句法等)的能力\"(Ramish2015,引自Gantar等 2019142 )。
(4)比喻意義(FigurativeMeaning):詞匯鏈中的單詞組合具有比喻意義,與字面意義相比則更加凸顯。如在西班牙語中,senalar con el dedoa alguieno algo(用手指指某人或某物)同時具有字面意義和比喻意義,而比喻意義在理解并解釋字面意義后會更為合理。
(5)變化性(Variation):詞匯鏈中的單詞組合允許形態上的變化。例如,西班牙語中的 morderse la lengua(咬住自己的舌頭,意指忍住不說話)允許根據主語的性別和數量對se進行調整,同時允許動詞詞根根據時態、人稱或數量進行變化。
(6)固定性(Fixedness):詞匯鏈中的單詞組合不允許形態句法的變化或內部變化。例如,by and large 是一個詞組,而*by and larger 就不是。
其次,詞典編纂者需要明確他們在編纂過程中會使用哪些詞典證據,也就是如何設計、獲取和處理一系列語言數據和非語言數據,以用于創建詞典數據。Fuertes-Olivera(2025)指出,一般意義上的詞典證據指的是選擇詞典數據的記錄情況。詞典證據主要有三種類型:主觀詞典證據、客觀詞典證據和混合詞典證據。具體而言,主觀詞典證據指的是基于個人判斷、意見或解釋使用的數據,而非基于客觀事實或使用的數據。例如,母語者都知道comeup short是一個詞組,因此他們能夠根據已掌握的語言知識來準確識別類似的表達??陀^詞典證據指的是我們通過觀察語言使用所學到的單詞和表達方式,以及它們是如何使用的,目的是將這些知識用于創建詞典數據。例如,在文學引文、語詞索引和詞形圖中往往能夠找到詞組的使用情況?;旌显~典證據指的是部分主觀和部分客觀的詞典數據,也就是說,證據是客觀的,因為它是由某人產生并可以在真實的口語或書面文本中找到的,但同時它也是主觀的,因為詞典編纂者必須決定它是否適用于詞典編纂。例如,使用生成式人工智能聊天機器人[如ChatGPT4o和Claude3.5(Pro),通常被視為大語言模型(LLMs)]生成的詞典數據。
在詞典編纂中也會用到大語言模型。在接下來的內容中,我們會使用大語言模型來完成兩個任務:搜索詞組和對先前識別的詞組進行編纂。具體可分為三個步驟,旨在將大語言模型的使用功能最大化并將其潛在的幻覺和錯誤行為的影響最小化。
第一步是確立我們與聊天機器人展開對話的三個基本概念:“語義熵”(semanticentropy)、“詞匯熵”(lexical entropy)和“多智能體系統\"(multi-agent systems)。語義熵是指在特定上下文語境中單詞或短語的意義不一致或不可預測的程度。Farquhar 等(2024)提出了一種應對這一問題的技術。該技術包括多次給出相同的提示,然后根據其含義回答“聚類”。這種技術有助于評估“幻覺”及其他錯誤,因為憑此可以推測大語言模型的回答,從而發現可能與大語言模型不確定性(或者說幻覺)相對應的不一致程度。在實際操作中,我們通過多次在不同時間、同時向兩個聊天機器人提出相同或相似的提示語來討論語義熵的問題。我們發現這個方法非常有效,因為它緩解了生成式大語言模型的主要問題之一:它們是“非確定性的”,即它們可能會對相同的問題給出不同的答案。詞匯熵指的是在上下文中,單詞選擇的不可預測性或變異性。Karimi等(2024)指出,這種技術包括對語義相似的提示語進行不同的措辭。與語義熵一樣,通過分析大語言模型給出的回答,提取滿足詞典編纂者任務的詞典數據,例如搜索詞組。多智能體系統是指讓兩個或更多聊天機器人協同工作,目的是解決相同或相似的問題。最新研究表明,這種協同工作模式能提高大語言模型的推理能力。(Wang等 2024)在實際操作中,我們向兩個聊天機器人輸入相同的提示語,收集它們的答案,并深人分析答案中的差異(如果有)。
第二步是收集已提取的數據。例如,可以將對話復制并粘貼到兩列中,一列是與ChatGPT4o的對話,另一列是與Claude3.5(Pro)的對話,詳見表1:
第三步是檢查兩個聊天機器人的回答,并像詞典編纂者一樣進行處理,也就是說,信任并整理這兩列中的數據。信任數據意味著驗證數據的真實性和準確性。整理數據意味著積極選擇符合數字環境技術的數據,不帶有數據整理者任何的偏見與喜好,也不再局限于通過“頻率”“典型性”“多樣性”等維度來描寫詞典數據。所整理出的數據以合乎邏輯的方式對其進行排序,例如先列出字面意義,再列出比喻意義,當然也可以根據數據不同的使用目的來調整順序,例如用作解釋的數據。
最后,因為詞組一般是由兩個或多個單詞組成,我們就必須設計一個訪問和呈現系統,讓用戶能夠搜索“隱藏數據”,即用戶不知道、不記得或不確定其準確形式的數據。(Fuertes-Olivera2025)這一點非常重要,因為大多數用戶只有看到完整的詞組才能識別它們。
四、示例:《西班牙語數字詞典》中的詞組
接下來,筆者將通過舉例來闡述如何在《西班牙語數字詞典》中搜索詞組及詞組數據是如何在詞典中呈現出來的?!段靼嘌勒Z數字詞典》是一個西班牙語在線通用詞典,由巴利亞多利德大學國際詞典編纂中心(西班牙)負責編纂,PedroA.Fuertes-Olivera任主編。截至本文撰寫時,詞典已完成超過5萬個詞條,其中約 26% 為詞組(約等于1.3萬個)。在該詞典中,所有詞組都作為詞條處理。
將詞組列為詞條符合筆者在新書AGuidetoPracticalOnlineLexicography(Fuertes-Olivera 2025)中對“詞條”下的定義,即“可搜索的單位,便于定制化的詞典描述”。事實上,這樣處理對詞典用戶來說有許多優勢,包括:
(1)它在很大程度上能夠減輕用戶的負擔(例如,認知負荷),避免用戶猜測。例如,在《劍橋在線詞典》(CambrdgeOnlineDictionary)[2」中,搜索farming會檢索出不同類型的詞典數據,包括發音、詞性、定義和例句等,在頁面底部會出現標題為“COLLOCATIONwith farming”的部分,內容是常與farming搭配使用的單詞,并且還有“點擊一個搭配查看更多示例”的操作提示。其中,一個與 farming 搭配的詞組是farmingequipment,點擊它會檢索出帶有該“搭配”的例句,此外沒有其他數據。這將迫使用戶去猜測 farmingequipment的意義、語法、用法等??偠灾~典沒有提供任何關于這個詞組的詞典數據,不能直接、快速地滿足用戶需求。
(2)它將為第二語言學習者、翻譯人員等詞典用戶提供更全面的詞典數據(3)詞組信息呈現更清晰、更精確,詞典用戶更容易識別和研究它們的基本意義,以及它們的使用方式和語法特點。(4)搜索和訪問詞組更容易,把它們當作詞條處理,能確保在查找任何單詞時都可以找到它們。(5)在機器學習和人工智能的時代背景下,把“詞組”當作詞條處理,有助于改進語言模型,從而能夠更自然、更準確地識別和生成包含這些詞組的語言成分。
對詞組進行詞條化處理也會影響詞典用戶所給出的提示語和與聊天機器人之間展開對話的類型。基于“語義熵”“詞匯熵”和“多智能體系統”等重要概念,我們以西班牙語單詞comida(食物)為例設計了如下的提示語。針對其他語言的單詞或表達,也可以參考類似的提示語。
提示語:
1.我認為西班牙語的[comida]有幾種含義。請一一列出它們,每個含義都要有上下文說明,包括示例、同義詞、反義詞、相關詞等。換句話說,我需要西班牙語[comida]的詞典數據。請用西班牙語回答,并且為每個含義提供英語對等詞。
2.我認為你提到的西班牙語[comida]的某些含義僅在某些西班牙語國家使用。你能列出這些國家及其對應的英語對等詞嗎?請用西班牙語回答,并且別忘了為每個含義提供詞典數據。
3.你提到了西班牙語[comida]的三種含義。我認為可能還有更多含義,其中一些可能是“比喻的”,即隱喻擴展。如果你同意,能否為我列出這些含義(以及它們的英語對等詞)?請用西班牙語回答,并且別忘了提供上下文說明,即提供對編寫詞典有用的詞典數據。
4.針對西班牙語單詞[comida],請列出與該單詞有關的詞組(以及它們的英語對等詞)嗎?請用西班牙語回答,并且別忘了對每個詞組提供詞典數據,特別是含義、同義詞、語法、示例、變體等。
5.你知道哪些帶有西班牙語單詞[comida]的詞組?能否給我列出它們,以及它們的英語對等詞?請用西班牙語回答,并且別忘了對每個多詞表達提供詞典數據,例如它們的含義(字面意義和比喻意義)同義詞、反義詞、示例、語法、變體等。
6.你怎么看待西班牙語單詞[comida]?能否給我列出包含該單詞的西班牙語表達式,并提供它們的英語對等詞?請用西班牙語回答,并且別忘了對每個表達進行上下文說明,例如給出含義(字面意義和比喻意義)同義詞、反義詞、示例、語法、變體等。
7.我想找出帶有[comida]的西班牙語表達式,這些表達式由兩個或更多正字法單詞組成。請給我列出這些表達式及其英語對等詞。請用西班牙語回答,并且別忘了對每個表達式提供詞典數據,例如給出含義(字面意義和比喻意義)同義詞、反義詞、示例、語法、變體等。
8.許多包含西班牙語單詞[comida]的表達式中間帶有介詞[de],例如[comidadeplastico]。能否給我列出按照這種組合方式形成的西班牙語單詞組合及其英語對等詞?請用西班牙語回答,并且別忘了對每個表達式提供詞典數據,例如含義(字面意義和比喻意義)同義詞、反義詞、示例、語法、變體等數據。
9.我碰到了一些西班牙語表達式,它們以[comida]開頭,后跟介詞[de]或[para],例如[comida para llevar]。我認為這種表達方式在西班牙語中很常見,可以用來創建與[comida]相關的詞組。如果你同意,能否列出更多類似的表達方式,并附上它們的英語對等詞?請用西班牙語回答,并且別忘了我需要它們的詞典數據,例如含義、示例、變體、同義詞、反義詞、語法等。在設計好提示語后,詞典編纂者就開始用不同措辭向兩個或多個聊天機器人發出指示。根據具體任務的需要,詞典編纂者可以使用上述所有或部分提示語,以便開始與聊天機器人展開對話,從而找出相關數據。在這個框架下,我們首先輸入西班牙語單詞comida,然后開始與聊天機器人進行更具體的對話,以便獲取關于這個詞的數據,這些數據將幫助我們對可能的詞組進行詞條化(詳見圖1所示)處理。由于篇幅限制,僅展示通過這種方法獲取的5個表達式(總共60個)。
我們一邊審讀兩個聊天機器人所提供的答案,一邊驗證從中獲取的大部分數據,并嘗試用它們來創建55個包含comida的多詞詞條(在檢查和驗證過程中,僅有5個被舍棄)。以comidachatarra為例,DIDES大多數潛在用戶相關的詞典數據詳見圖1所示。
·comidabasura 和comidachatarra 是同義詞。它們的英語對應詞都是 junk food。·comidabasura 和comidachatarra都是名詞(在西班牙語詞典中,它們通常作為名詞comida的附加詞條)。從語法上看,它們可以與冠詞una、la、unas 和las搭配使用,這表明該西班牙語單詞是陰性,并且有單數和復數形式。
comidachatarra在多個美洲國家使用(屬于美洲主義)。
? 兩個詞組的意義已“語境化”,即有包含comidachatarra的例句和短語,這些例句和短語進一步強化了它們的意義。
·兩個聊天機器人最開始提供的兩個術語的意義是很充分的。然而,我們認為需要進一步研究,因此再次輸入提示語:你提到comidachatarra通常指熱量高但營養價值低的食物。我同意這一點,但需要你為我提供一個更好的描述。可以為我完成嗎?通過研究兩個聊天機器人給出的答案,我們確定了DIDES中提供的定義:
(1)comidachatarra是加工食品,熱量高但營養價值低;
(2)通常含有不健康的脂肪、糖和鹽;
(3)還含有添加劑,如谷氨酸鈉,這是一種常見于加工食品中的增味劑。
最后,可以通過點擊主頁底部任何包含comida的短語來獲取更多相關的詞組數據。同時,還可以通過點擊同義詞列表,或者在搜索框中使用諸如“?”“ °+ ”等符號加任何單詞來定位這些詞組。
五、結語
在線詞典編纂學的定義清楚地表明了它獨立的學科地位,相關研究具有跨學科特點。它還強調了四個核心要素之間的相互聯系,在具體的詞典編纂工作中,每位詞典編纂者都需要充分考慮這些元素的協同作用。本文提供了一種把生成性人工智能聊天機器人應用于在線詞典編纂實踐的方法論。這類似于“后期編輯詞典編纂”(post-editinglexicography)的概念。在筆者看來,如果在創建初始提示語時能夠充分考慮語義熵、詞匯熵和多智能體系統,我們的實踐會更加穩妥,事實已經證明了這一點。一旦與聊天機器人的對話開始,詞典編纂者可以(且應該)繼續提示下去,需要特別注意,提示語應基于先前的回答、自己的知識和他們所使用的語言的特點。例如,在西班牙語中,理解名詞和形容詞的數和性是非常重要的,因此提示語中可以包含有關的問題。我們認為,使用生成性AI聊天機器人進行詞典編纂有以下優點:1)便于描述詞典數據,例如,我們無需依賴含有所有語言變體的語料庫來識別變體;2)提高了詞典編纂效率;3)比構建一個或多個語料庫更經濟,也更省時省力;4)比現有的語料庫查詢工具更便于使用。
附注
[1]《西班牙語數字詞典》(DIDES)在線網址:DiccionarioDigitaldelEspanol。
[2]《劍橋在線詞典》(Cambrdge Online Dictionary)網址:English:https://diesgital.com/。
參考文獻
1. Abel A. Dictionary Writing Systems and Beyond. //Granger S,Paquot M. (eds.) Electronic Lexicography. Oxford:Oxford University Press,2012:83-106.
2. Benson M,Benson E,Ilson R. The BBI Dictionary of English Word Combinations. Amsterdam and Philadelphia:John Benjamins Publishing Company,1997.
3. Bergenholtz H,Tarp S. Two Opposing Theories:On H.E. Wiegand’s Recent Discovery of Lexicographic Functions. Hermes,Journal of Linguistics,2003(31):171-196.
4. Bothma T J,Gouws R H. Information Needs and Contextualization in the Consultation Process of Dictionaries that are Linked to E-texts. Lexikos,2022,32(2):53-81.
5. Chomsky N. Aspects of the Theory of Syntax. Cambridge,MA:MIT Press,1965.
6. Fan M. An Exploratory Study of Collocational Use by ESL Students:A Task-Based Approach. System,2009(37):110-123.
7. Farquhar S,Kossen J,Kuhn L,et al. Detecting Hallucinations in Large Language Models Using Semantic Entropy. Nature,2024(630):625-630.
8. Firth J R. Papers in linguistics 1934—1951. London:Oxford University Press,1957.
9. Fuertes-Olivera P A. The Mental Lexicon in Lexicography:The Diccionarios Valladolid-UVa. Lexikos,2022,32(1):118-140.
10. Fuertes-Olivera P A. A Guide to Practical Online Lexicography. London amp; New York:Routledge,2025.
11. Fuertes-Olivera P A. Innovations in Spanish lexicography:The Diccionario Digital del Espa?ol (DIDES). Círculo de Lingüística Aplicada a la Comunicación,in press.
12. Fuertes-Olivera P A,Tarp S. Theory and Practice of Specialised Online Dictionary. Terminology versus Lexicography. Berlin:De Gruyter,2014.
13. Fuertes-Olivera P A,Tarp S. Critical Lexicography at Work:Reflections and Proposals for Eliminating the Gender Bias in General Dictionaries of Spanish. Lexikos,2022,32(2):105-132.
14. Gantar P,Colman L,Parra E C,et al. Multiword Expressions:Between Lexicography and NLP. International Journal of Lexicography,2019,32(2):138-162.
15. Gitsaki C. Econd Language Lexical Acquisition:A Study of the Development of Collocational Knowledge. San Francisco:International Scholars Publications,1999.
16. Granger S,Meunier F. (eds.). Phraseology. An Interdisciplinary Perspective. Amsterdam and Philadelphia:John Benjamins Publishing Company,2008.
17. Halliday M A K,McIntosh A,Strevens P. The Linguistic Sciences and Language Teaching. London:Longman,1964.
18. Karimi H,Weber P,Zinn J. Information Entropy (not Impedes) Lexical Processing during Language Comprehension. Psychon Bull Rev,2024. https://doi.org/10.3758/s13423-024-02463-x.
19. Katz J J,Fodor J A. The Structure of a Semantic Theory. Language,1963,39(2):170-210.
20. Ramisch C. Multiword Expressions Acquisition:A Generic and Open Framework. Berlin:Springer,2015:34.
21. Rundell M. Automating the Creation of Dictionaries:Are We Nearly There? Proceedings of the 16th International Conference of the Asian Association for Lexicography:“Lexicography,Artificial Intelligence,and Dictionary Users”. Seoul:Yonsei University,2023:1-9.
22. Sinclair J M. Beginning the Study of Lexis.// Bazell C E,Catford C E,Halliday M A K,et al.(eds.)In Memory of J.R. Firth. London:Longman,1966:410-430.
23. Sinclair J M. Corpus,Concordance,Collocation. London:Oxford University Press,1991:170.
24. Tarp S. Lexicography in the Borderland Between Knowledge and Non-knowledge. Tübingen:Niemeyer,2008.
25. Tarp S,Gouws R H. A Necessary Redefinition of Lexicography in the Digital Age:Glossography,Dictionography and Implications for the Future. Lexikos,2023,33(1):425-447.
26. Vinogradov V V. Ob osnovnij Tipaj fraseologicheskij ledinits v russkom yazike. Moscow:Moscow University Press,1947.
27. Wang Q,Wang Z,Su Y,et al. Rethinking the Bounds of LLM Reasoning:Are Multi-agent Discussions the Key? 2024. https://arxiv.org/abs/2402.18272.
(
(責任編輯 劉 博)