李佐文 王玉玲
(北京外國語大學,北京,100089)
隨著人工智能發展到認知智能階段,“語言智能”作為一門新興交叉學科亟待發展。對語言認知機制的探索是語言智能學科的重要任務之一(李佐文、梁國杰 2022)。關于語言的本質,學界均贊同它屬于認知科學,應該用認知神經科學的手段去探索語言(Chomsky 2017)。生物學家在嘗試理解生命時通常從具有較少細胞的生命著手。同理,語言學家在嘗試理解語言加工機制時,一個完整的句子通常難以操控,而一個詞則更易于理解且便于探索。但是,當前詞的心理表征及語義獲取機制遠遠沒有定論。例如,形態復雜詞(屈折詞、派生詞、復合詞)的形態結構在大腦中是否具有明顯表征?換句話說,語素在大腦中是否被顯著表征?形態復雜詞在大腦中是如何被存儲的,是構成語素通過形態關系相連還是整詞具有單獨的表征?形態復雜詞整詞語義的獲取是否必須經過語素分解重組過程?總體來說,詞的內部形態表征及語義獲取機制遠未明確(Leminenetal.2019)。
詞的認知研究是語言高階理解模型的基礎。如果不搞清楚詞的存儲加工機制,那么由多個詞組合成的句子的理解模型更難刻畫。重要的是,形態學的相關探究幾乎提供了語言認知領域所有爭論的微觀模型。例如,形態復雜詞的神經表征研究可以為區分規則和必須存儲在內存中的非規則形式提供證據。語言規律是基于規則的知識生成的嗎?語言規則是明確表征的嗎?不論屈折、派生還是復合詞研究,當前“基于規則”和“基于網絡”的形態表征觀點爭執不休。
當前對形態的認知機制研究主要集中在拼音文字語言,尤其英語。拼音文字語言的形態變化主要分為屈折(inflectional morphology)、派生(derivational morphology)、復合(compounding)三種。
在三種形態類型研究中,屈折詞的認知機制研究最多(Leminenetal. 2019)。屈折詞綴附在詞干后僅改變詞形,只增加該詞的語法范疇,并不構成新詞,比如 “book-books”“work-worked”。那么在心理詞典中如何表征這些屈折詞,是以完整的形式(例如,“books”“worked”)還是通過其構成語素(例如,“book”+“s”,“work”+“ed”)存儲訪問?不規則的屈折詞(“taught”)又如何存儲?規則的過去時態(例如 “walked”)和不規則的過去時態(例如“ran”)之間的顯著性差異是否導致存儲加工機制也顯著不同?關于是否以及如何區分規則和不規則的屈折形式,形成了神經語言學領域研究時間最長且最活躍的爭論之一,即所謂的“過去時之爭”。
關于屈折詞,Rumelhart 和 McClelland (1986)的聯結觀點提議最先引發了英語過去時的爭論。聯結主義方法允許通過一種單一的計算機制來推導規則和不規則形式。具體表現為,一種聯結主義網絡系統會將所有動詞的詞干映射到它們的過去時形式。例如,從規則詞干產生規則過去時的相同單元和連接也會處理不規則詞,將詞干的特征復制到過去時形式并根據最終輔音添加/d/、/t/ 或/^d/。例如生成“kept”而不是“keeped”,所需要的只是調整代表元音的輸出單元的激活,并且網絡將根據 “keep”的經驗處理 “creep, leap, sleep, sweep,weep”。該網絡使用相同的基于聯結的知識,允許它執行常規映射,并且還利用由 “keep”的屬性激活的特定連接來產生元音調整(McClelland & Patterson 2002)。即聯結主義觀點認為屈折形式僅有一種存儲加工機制,無論是規則的還是不規則的屈折詞都以整詞的形式存儲在大腦詞庫。由于形式與意義重疊的差異或者詞干頻率差異而導致的規則和非規則的屈折詞之間沒有原則性的區別。該模型認為語音和語義之間的映射形式在形態表達中起著至關重要的作用,從而有效地消除了對單獨的形態表征的需求(Coxetal.2014)。另外,聯結主義理論支持者認為這個相對簡單的模式能夠以驚人的準確度模仿英國兒童所表現出的習得階段。
相反,一些觀點認為規則和不規則的屈折形式之間的存儲加工是分離的。其中規則過去式由規則系統產生,而不規則過去式則作為整詞存儲在內存中(Pinker &Ullman 2002)。該觀點既允許用于檢索存儲的不規則形式的詞匯列表路線,又允許用于生成常規屈折形式的規則合成路線。即該觀點主張兩種計算系統:整詞存儲和規則計算系統,稱為“陳述/程序模型”(declarative/procedural model)(Ullman 2001)。該模型進一步假設規則(規則過去式)形態的處理是由額下回和頂葉腦區的網絡處理的,而不規則形態(不規則過去式)主要存儲在內側顳葉。
基于腦電及磁共振成像的形態學研究,屈折是研究最充分的形態類別,其數量遠超派生和復合詞的相關研究。當前探究的目標主要集中在規則和不規則屈折形態加工是否與可分離的神經過程有關,即兩者是否在不同的腦區激活或通過不同的ERP成分表征。針對該問題學界主要采用了典型的掩蔽啟動范式。在掩蔽啟動實驗中,啟動詞的呈現時間通常不超過50 ms, 并且會在啟動詞前或者啟動詞后呈現一個掩蔽刺激,均是為了進一步防止被試能意識到啟動詞。因此,被試對目標詞做出判斷的腦電可以揭示詞在大腦中早期自動加工的模式。例如英語的屈折詞啟動(stretched-stretch vs. fought-fight),與控制條件(與目標詞毫不相關的啟動條件)相比,有研究發現規則啟動條件顯示N400效應減小。相反,不規則動詞啟動則顯示N400效應比規則動詞晚約100 ms,或者直接無任何顯著效應。以上N400效應的差異被解釋為規則過去式在形態上分解加工,而不規則過去式N400效應的缺失被解釋為其只能通過間接整詞方式訪問。然而,有研究則觀察到了等效的N400效應,或者觀察到了由規則和不規則的過去時態引起的等效的LAN和N400效應(Justusetal.2011)。另外,支持分解觀點一些研究又集中在形態-詞形(morpho-orthographic) 分解與整詞意義計算是并行的還是前者先于意義計算,結果仍不一致。當前關于屈折詞的磁共振成像研究也未能達成一致。
總的來說,屈折形態的認知加工機制研究主要分為兩派觀點。聯結主義觀點認為不論規則的還是不規則的屈折詞,均采用一種計算系統加工。在聯結主義模型中,規則和不規則過去時形式之間的分離主要參照這些形式對語音和語義處理的依賴程度來解釋。而雙路徑或者“詞和規則”理論則認為規則的和不規則的屈折詞采用兩種系統分別加工。規則形式的屈折詞采用規則計算系統,而不規則形式的屈折詞采用整詞存儲記憶系統。
派生指通過將詞根或詞干與一個或多個詞綴(例如前綴、后綴、中綴)組合來創建新詞的方式(例如“teach-teacher”)。派生形態領域內的爭議也集中在是否存在獨立的形態組合(“規則”)的證據。
采用掩蔽的形態啟動決策任務,有些研究發現事先呈現的透明(“farmer-farm”)和不透明(“corner-corn”)的詞都可以促進后續目標詞的識別。此外,有研究發現這兩種情況的啟動強度在統計學上是等量的,表明語義信息沒有介入整詞早期識別過程(Beyersmannetal.2019)?;诖?一種強制性的形態分解的觀點被提出。該觀點認為看起來像語素的字母序列將進行無條件切分,無論這一切分是否有助于形態復雜詞整詞語義獲取。因此,無論透明還是不透明的形態復雜詞首先都將被分解,但是由于“-el”不是英語中的合法后綴,因此對諸如“brothel”之類的單語素詞將進行整詞訪問。采用類似的觀點,還有Taft提出的形態復雜詞識別的層次結構框架 (Taft &Nguyen-Hoan 2010)。根據該模型,形態是在“詞元”級別編碼的。“詞元”是位于形式和功能信息(例如語義和句法特征)之間的抽象表示層。因此,語素語義啟動可以歸因于啟動詞和目標詞之間共享的同一詞元的預激活。詞元模型本質上也是兩階段的強制分解模型,即同樣認為形態復雜詞首先經過無語義信息介入的強制語素分解階段。
持相反觀點的學者認為,早期形態加工不僅依賴形態—詞形結構,還依語義信息。支持這一觀點的證據是,在某些掩蔽啟動實驗中,有研究發現透明詞所產生的促進作用要比不透明詞所產生的促進作用顯著更強(Jaredetal.2017)。形式和意義在早期形態加工中的參與,與分布式聯結主義理論一致。該理論主張由于同一形態族內詞與詞之間的形式和含義的穩定相關性而出現了形態表征。即形態結構是詞形、語音和語義因素融合的結果。因此形態學效應可以從這些因素預測,即語素并不需要獨立的心理表征。有研究發現語義透明詞的啟動作用最大,半透明詞的次之,不透明詞的最小,并發現語義透明度對無論早期還是晚期的腦電成分均有影響(Gonnermanetal.2007)。語義透明度的分級效應是證明聯結主義觀點而非分解觀點的關鍵證據。另外形式和意義在早期形態加工的共同參與還與雙路徑模型觀點一致。
如圖1所示,派生詞加工的三種觀點分別被展示。A中描述的框架預測了強制性的派生詞分解機制。不論真派生詞“worker”還是偽派生詞“corner”,首先都會被強制進行語素分解,因為它們看起來均像形態復雜詞,均包含后綴“er”。一旦這種分解的結果被轉到詞匯層面,形態語義關系就可以發揮作用。發生這種情況是因為透明親屬的表征之間的明確或隱含的聯系(“work”和 “worker”)。B顯示了詞形和語義信息同時處理的并行雙路徑模型。與前一種模型的關鍵區別在于,形態表征和整詞表征之間存在直接聯系。這條路線原則上允許觀察到單獨的形態語義效應,即可觀察到形態效應而不涉及亞詞匯分解機制。在實際識別過程中,除了不規則形式外,直接路徑和分解路徑之間可能存在合作。C描述了關于形態處理的分布式聯結主義觀點。該模型認為通過統計學習,連續的隱藏單元表征(描繪為條形圖模式)捕捉形式和意義之間的系統相關性。由于形態家族是這種相關性的原型,因此透明派生詞親屬的表征比僅在形式或含義上相關的詞的表征更加相似。
關于復合詞研究的基本問題,仍然是它們以整個詞的方式還是以相連接的組成語素存儲的。當前對復合詞的認知機制研究較少,且結論不一。有研究支持在訪問整個復合詞之前訪問組成語素的觀點,有研究則認為復合詞是在整個詞級別上進行識別的(Davisetal. 2019)。此外,一些研究表明復合詞的語義透明性可能決定訪問這些詞的處理方式,但其他研究則聲稱語義透明和不透明復合詞的處理方式相似 (Smolka &Libben 2017)。還有研究聲稱新復合詞和現有復合詞的形態分解與否也存在差異 (Kaczeretal.2015)。
復合詞形態分解的證據主要來自目標復合詞可以被它的某個組成語素(例如 man-milkman)促進識別的現象。然而,組成語素和目標復合詞之間的語義啟動效應可能并不能作為復合詞組合加工的決定性證據,因為它們可能是由純粹的整詞級別的語義相關性驅動的。所以,單純的語素促進復合詞識別的現象不能作為復合詞分解加工的證據。有研究發現共享語素的透明復合詞不會相互啟動,除非復合詞作為整個詞在語義上相關。具體來說,盡管啟動詞-目標詞對都是透明的復合詞,但“teacup/茶杯”可以啟動“teapot/茶壺”,而“headache/頭痛”并沒有啟動“headscarf/頭巾”。如果復合詞由通過形態關系連接的組成語素表征,那么重復獲得的語素表征應該對目標詞具有促進啟動作用,而不管啟動詞和目標之間的全詞語義相關性如何。相反,以上結果更有可能是啟動詞和目標詞整詞之間的語義相關性決定了形態啟動效應(Zhou &Marslen-Wilson 2000)。當前針對漢語復合詞形態加工機制的研究較少。Wang 等人 (2021a, 2021b, 2023) 發現整詞語義的早期激活,并發現單獨的構成語素對復合詞影響作用微弱,推測復合詞整詞語義的提取可能并不需要強制經過語素分解重組過程。
目前,關于形態復雜詞處理機制的理論模型主要有三種:強制分解模型,雙路徑模型,聯結主義模型。
形態復雜詞的強制分解觀點(Obligatory decomposition models)認為心理詞典存儲詞干(例如build)以及關于什么詞綴可以與每個詞干組合的信息(例如re-、-er、-ing、-s)。當出現一個形態復雜的詞(或看似形態復雜的詞“corner”)時,形態解析機制會從詞干中迅速剝離詞綴,詞匯訪問僅基于詞干進行(Taft &Nguyen-Hoan 2010; Taftetal.2018)。有學者也提出了一種類似的強制解析機制,該機制在處理的早期將具有形態復雜性的詞迅速分解為其語素成分(Rastle &Davis 2008)。與最初的 Taft的強制分解觀點類似,該解析機制認為形態復雜詞識別的早期僅基于詞形信息進行分解操作,而對語義信息視而不見。
這種強制分解觀點預測,在處理的早期階段應該對真實的形態復雜詞(例如foolish、predictable、builder)和偽形態復雜詞或不透明詞(例如vanish、tenable、corner)進行等效處理,即使將 “corner”等詞分解為“corn”和“er”無助于獲得語義?!癱orn”和“corner”之間沒有語義關系,僅僅因為“corner”包含形態復雜詞后綴“er”所以一樣會被強制進行語素分割。總的來說,這種強制分解觀點認為形態復雜詞或者看起來像形態復雜詞的詞首先會根據語素-詞形信息均被分割為語素,緊接著語素-語義被加工,最后經過語素合并才會獲取整詞語義。
雙路徑或者混合方法結合了分解和整詞表征訪問的兩條路徑。兩個過程可能是并行運行也可能是競爭關系。該模型認為分解路徑可能只應用于規則形成的形態復雜詞,而不規則的詞則存儲在詞典中。然而,雙路徑模型內部對分解的規則形式定義不同。換句話說,該模型內部對于哪些非規則詞將從記憶中檢索存在爭議。有些學者認為語義上透明的詞分解加工,不透明的詞則整詞存儲。而有些學者則認為帶后綴的詞分解加工但非前綴。有些學者認為屈折詞分解但派生詞不分解。另外,這些雙路徑模型在分解或檢索哪個路徑被認為是更重要和更快的過程方面也存在分歧。最后,關于分解解析和整詞檢索是合并到單個系統還是兩個不同的系統中(對常規的形態變化對應于規則計算系統,而不規則形態則應用于聯想記憶系統)觀點也不統一。即使內部存在爭議,這些雙路徑模型均假設語素是離散的且某些形態復雜詞是分解加工的。
雙路徑模型中比較具有代表性的是陳述/程序模型。如圖2所示,該模型提供了一種語言處理架構的神經認知實現,該架構明確區分了詞匯知識和基于規則的知識。陳述性記憶負責存儲事實(“語義記憶”)和事件(“情景記憶”)。它允許快速學習關聯關系,并且可以被其他系統訪問。相比之下,程序性計算系統包括感覺運動和認知領域的序列、動作和技能的知識。更詳細地說,基于規則的語言知識(即句法和規則形態知識,以及音系和組合語義方面)是構成程序系統的一部分,而詞匯存儲信息(例如不規則形態、詞匯語義)表示為陳述性信息類型(Ullman 2001)。
關于形態復雜詞表征處理的第三種觀點——聯結主義模型(Connectionist models)與以上兩種模型完全不同。該模型直接摒棄了語素作為獨立的表示級別,而主張形態是在共同激活的形式單元和語義單元之間學習映射。這一映射可能是直接的或由隱藏單元層介導的(Baayenetal.2016)。
在典型的聯結主義體系結構中,詞的表征被編碼在代表詞形、語音和含義的單元池中。如圖3所示,橢圓形代表簡單的類似神經元的處理單元庫,而實線代表單元組之間的連接。表征是分布在這些單元上的激活模式,知識存儲在它們之間的連接權重中。該模型主張語素表征不是離散的實體。相反,它是隨著網絡學習從一個域到另一個域的映射(例如語音到語義或者詞形到語義)。并且它會根據映射的規律性來進行選擇。從聯結主義的角度來看,形態是對詞的表層形式(詞形、語音)與其意義之間的學習映射的表征。依照該觀點,形態結構不是離散的,而是分級的、連續的。該模型指出現實中存在許多既不完全透明(規則)也不完全不透明(不規則)的中間情況。例如,像“dresser/梳妝臺”這樣的詞在語義上既不是完全透明的,也不是完全不透明的。雖然“dresser”不是穿衣服的人,而是一件裝著衣服的家具,但它顯然與穿衣活動有關。雙路徑觀點將特殊性與系統規則知識隔離開來,這是雙路徑理論的核心。聯結主義觀點認為這種明確區分的隔離可能最終成為處理豐富的、等級不分明的語言結構的嚴重障礙。

圖3 聯結主義模型中詞的心理表征機制 (Plaut &Gonnerman 2000)
表示輸入和輸出之間的相關性是分布式聯結主義模型的特征。在這樣的模型中,通過激活的子模式捕獲相關性,該子模式在介導輸入和輸出之間的單元隱藏層內發展。當詞形和語義信息的一致同時出現時,穩定的子模式發展,形態結構就會出現。例如,由于重復形式的“hunt”在某些詞中都具有相似的含義,因此在該級別上捕獲了“hunt”“hunter”“hunting”等之間的關系。類似地,盡管“venge”本身并不是一個詞,但在“revenge”“avenge”“vengeance”“vengeful”再次出現“venge”的相似含義將在此級別被捕獲。總的來說,在完全存儲和完全解析之間的連續統一體的一側即聯結主義觀點。聯結主義網絡假設一個單一的聯想記憶系統,該系統直接從詞形表征計算意義表征。而從這些模型中出現的形態“表征”僅是形式到意義映射的附帶現象。
關于形態復雜詞(屈折、派生、復合詞)的認知加工機制的爭論主要圍繞著“基于規則”和“基于網絡”方法展開。盡管這兩種觀點各自都有幾種不同的解釋,但它們之間的爭論均與語言規律是否由基于規則的知識產生有關。需要注意的是,這場辯論不應被視為暗示聯結主義模型的支持者否認語言存在規則結構。在聯結主義提出其最初的過去式模型(屈折詞)時,Rumelhart 和 McClelland (1986)用一個類比來舉例說明這一點:蜂巢的規則結構源于蠟球在壓縮時相互施加的力的相互作用。蜂巢可以用一條規則來描述,但產生它的機制不包含這條規則的任何陳述。因此,兩大觀點的分歧主要涉及語言規則是否被明確表示的問題。鑒于兩個對立的理論都贊同語言表現出規律性,并且某些模式比其他模式“更規律”這一事實,那么具體如何區分這兩大觀點、三種模型?
對于形態復雜詞識別是通過分解解析還是從記憶中整詞檢索,以及是由單一系統還是由雙重系統來處理,三種模型觀點不一。在完全存儲和完全解析的連續體的一側,聯結主義網絡模型假定有一個單一的聯想記憶系統,該系統直接從詞形表征計算意義表征。并且該模型主張形態學表征僅僅是形式到意義映射的一個表象。即該觀點認為無論只包含一個語素的單純詞還是包含多個語素的形態復雜詞都被作為完整的形式來訪問。在通往語義信息的路徑中,有一個抽象的層次,在這個層次上,由于形式-意義的相互作用,是詞而不是語素聚集在一起。在任何層次上均沒有解析,形態相關的影響來自系統的形式-意義的相互作用。即在聯結主義觀點中,針對所有類型的詞都由一個單一的聯想記憶系統來處理。
另一方面,強制分解模型假定必須進行分解,所有形態復雜詞均被解析成詞干和詞綴,然后再訪問整個詞的表征。因此,該模型也實現了一個單一的處理系統,其中不同的過程(解析、全詞訪問)以一種連續的方式運作,并且形態復雜詞表征既表現為整詞也表現為語素形式。雙路徑或者混合方法則結合了分解和訪問整詞形式的兩條路徑,兩個過程可能是并行運行也可能是競爭機制。該模型認為分解路徑可能只應用于規則的形態復雜詞,而非規則的詞則整個存儲在詞典。然而,雙路徑模型內部對規則形式的定義有爭議,即對于哪些詞采用規則計算系統哪些詞將從記憶中整個檢索觀點不一。最后,關于分解解析和整詞檢索是合并到單個系統還是兩個不同的系統中意見也不統一。
從是否分解角度來看,雙路徑和強制分解模型均認為語素是離散的,是被明確表征的,形態規則也被明確表征。而聯結主義認為形態復雜詞是以整詞形式存儲的,語素沒有明顯的表征,它僅是形式到意義映射的表象。從單一系統還是雙重系統處理角度來看,強制分解和聯結主義模型均認為形態復雜詞處理僅通過單一系統,而雙路徑模型則認為包含兩條不同的處理系統。從整詞語義獲取的時間進程來看,雙路徑和聯結主義觀點均認為整詞語義的獲取并不需要強制經過語素分解重組,而強制分解觀點則完全相反。
總體來看,聯結主義完全不同于強制分解和雙路徑觀點。聯結主義認為傳統上歸因于屈折、派生或者復合形式的形態分解的處理效果應該通過語義、語音和詞形代碼的融合來解釋。傳統觀點認為形態是語言結構的基本要素,而聯結主義觀點則認為形態來自詞的形式和意義之間的系統映射規律,不具有單獨的心理表征,并且可以從詞形、語音和語義表征中推導出形態。需要注意的是,聯結主義與分解觀點均承認語言存在規律的事實,兩方爭議點主要在于語言規律是否由語言規則生成或語言規則是否被明確地表示(Zwitserlood 2018)。
為了證明語言規則被明確表征,Ullman(2001)提出陳述/程序系統與可區分的電生理成分相關。存儲記憶的各個方面被認為反映在N400效應中,基于規則/組合的處理會產生LAN,P600則被視為程序性方面的標志。本質上,它們對應于與語言相關的ERP成分非常經典的功能解釋(即LAN效應反映了某些描述的組合處理;N400效應與詞匯/聯想知識有關)。然而,這種詳細的電生理定義與最近的一些發現不兼容。特別是有越來越多的證據表明N400效應也可能反映組合過程。具體來說,有研究認為整詞語義的提取在目標詞出現后前200 ms已經完成(Hauketal.2012)。根據以上發現,N400可能并不表征自動語義提取過程,而是表征語義整合到語境的過程。自動語義的提取過程可能在早期時間窗口已經完成。從陳述/程序模型的角度來看,這是難以解釋的。第二個問題出現在晚期P600效應方面。P600除了與句法再分析相關(即根據 Ullman 指出P600表征程序性知識的使用)之外,有研究稱其也可能表征語義信息和句法信息的整合,或者僅表征語義的整合(Brouweretal.2017)。依照這些發現,陳述/程序模型對P600成分(或相關成分)明確的“程序”解釋可能有點過于狹窄。
另外,當前很多研究從語義信息加工的時間進程角度加以驗證。如果整詞語義信息不影響早期形態復雜詞識別,則可能支持兩階段的強制分解觀點。而如果整詞語義加工較早,可能支持雙路徑或者聯結主義觀點。另外,如果發現早期語義信息的分級啟動效應,則更可能符合聯結主義觀點。之所以當前研究結果不統一,可能是因為各實驗的任務設定、實驗材料、啟動詞的呈現時間、掩碼類型等諸多因素不一致。另外不同語言系統甚至不同形態類別是否具有不同的形態表征機制也未可知。針對漢語形態加工機制,Wang 等人(2023)從復合詞角度出發,發現整詞語義信息可能在最早期已被激活,并不需要強制經過語素分解重組過程。這一結果與強制分解觀點相反,但還不能明確雙路徑還是聯結主義模型更符合漢語復合詞表征機制。換句話說,不論針對字母語言還是針對漢語,“基于規則”還是“基于網絡”的神經表征機制均需進一步驗證。
形態復雜詞的神經表征一直是神經語言學領域的研究焦點。不論屈折、派生還是復合詞研究,“基于規則”還是“基于網絡”的形態表征觀點爭執不休。兩方均承認語言存在規律的事實,爭議點主要在于語言規律是否由語言規則生成或者說語言規則是否被明確地表示。本文對相關研究的最新進展提供了一個比較全面的概述。另外,現代漢語語法體系的基礎單位問題一直存在爭議。本文對語素級別的大腦表征的討論對語言學理論可能也有借鑒意義。