


摘" 要" 在語言表型與神經機制之間尋找對應關系, 即所謂的映射問題(the mapping problem), 是當前研究的一大熱點。其中, 句法解析的神經機制尤具挑戰性, 這涉及到如何在神經活動中識別出對應于句法結構構建的過程, 是人類語言能力之謎破題的關鍵。近期神經振蕩活動的相關研究不僅為句法解析過程中句法加工的心理現實性提供了有力證據, 也展示了利用神經振蕩來闡釋句法解析過程的神經編碼活動的可行性。而理論語言學最簡方案有關句法計算的理論模型可以與神經科學中有關神經振蕩的實驗研究相互印證, 通過此類研究可以窺探句法構建的時間進程。未來研究可集中于四方面:神經振蕩與句法加工的更細粒度對齊; 神經振蕩的發生機制及其生物學意義; 兒童語言發展過程中神經振蕩的變化模式; 語言障礙神經生理基礎及其康復應用。
關鍵詞" 神經振蕩, 語言理解, 句法解析, 最簡方案, 增量轉換
分類號 "B842; B845
1" 引言
David Poeppel (2012)提出了語言學與神經科學的映射問題:語言學與神經科學之間本體論結構間具有怎樣的聯系?這一問題的核心在于, 如
何以一種詮釋性的框架將語言加工的不同方面與大腦中的神經活動直接關聯起來, 從而揭示自然語言加工的具體神經機制。而要回答這一問題, 最大的挑戰源于粒度不匹配問題(granularity mismatch problem), 即理論語言學傾向于以細粒度的視角對語言本體進行描寫與研究, 而神經科學研究往往聚焦于較為宏觀的、粗粒度的語言行為。這種視角上的差異導致很難在語言表征與神經活動之間建構起對應關系, 這使得語言與人腦相關性的研究容易浮于表面, 難以找到語言現象真實對應的神經機制。映射問題的解決是探究人類語言能力的關鍵, 因此, 學界開始對句法、語義等語言構建過程中的神經編碼活動進行研究(Hale et al., 2022)。
目前, 有越來越多的研究揭示了以低頻神經振蕩(low frequency neural oscillation)作為句法層級結構構建指標的可行性, 使其成為闡述句法解析相關神經機制的有力候選者。特別是, 這些研究發現了外源性刺激時間與內源性振蕩表征時間之間的非同構映射關系, 以及語法知識與語義統計線索、詞匯屬性的分離, 揭示了人腦專司句法構建的先驗語法知識1的存在, 為句法加工的心理現實性提供了證據。此外, 神經振蕩的相位相干性(phase coherence)與不同語言層級結構之間的潛在聯系也逐漸得到關注, 相關領域涌現出了具有發展潛力的理論模型。
2 "句法解析管窺:序列到層級的增量轉換
句法結構的層級性是自然語言區分于其它交際系統的重要特征, 它賦予了人類用有限手段生成無限的語言表達的能力(Chomsky, 1957, 1965)。句法解析(syntactic parsing), 即語言實現從線性語音序列到抽象句法層級結構增量轉換的過程, 是語言學及認知科學內廣受關注的議題(Traxler, 2014)。在映射問題的框架內, 語言學理論與神經科學研究都對增量轉換的句法解析過程有了一定的探索與描述。
2.1" 語言本體理論中的句法解析:句法對象的合并操作
最簡方案(the Minimalist Program)是Noam Chomsky在語言學中新近提出的一種理論框架, 旨在尋求語言的結構和解釋方式的最簡化形式(Chomsky, 1995)。根據最簡方案理論, 句法解析實質上是以詞匯項(lexical items)為基本原子單位, 通過合并(merge)操作將工作空間(workspace)中的可操作句法對象(accessible syntactic object)構建為二分叉的層級組織集合的過程。以下為合并的數學表達式:(其中, WS =工作空間; P/Q =句法對象; X =附加元素; { } 用于標記短語結構; [ ] 用于標記特征) (Chomsky et al., 2023; Marcolli, Chomsky, amp; Berwick, 2023)。
""""""""""""""""""""""""" (1)
(2)
外合并(直接從詞庫調用詞匯項以生成基礎的論元結構等)可表示為:
""""" (3)
內合并(即‘移位’, 從已構建的結構成分內部選取成分移位到新的合并位置, 以核查與話語等信息結構安排所需要的特征)可表示為:
(4)
簡單來說, 為實現線性序列到層級結構的增量轉換, 需要考量以下三個方面:(1)可供合并操作的句法對象的表征如何形成, 即大腦如何收集感覺信息形成詞匯表征; (2)工作空間如何動態更新實現對句法對象的存儲與預測; (3)合并操作如何將工作空間內的詞表征構建為層級結構(Chomsky, 1995)。合并操作最終生成的結果在技術上通常用句法樹(syntax tree)來表示, 根據線性對應公理(Linear Correspondence Axiom), 句法樹的層級結構映射在線性序列上形成終端節點為標識的語音線性序列, 它以一種可視化的方式展示了句法結構的層級化構建的布局和程序。通過合并操作, 低層級的句法單元被整合在更高層級的句法表征中, 實現了從線性序列到層級結構的增量轉換。從心理語言學視角可將其描述為:在線性的語音序列輸入的過程中, 人腦整合各類信息在詞匯通達(lexical access)后形成詞表征(句法對象), 詞表征存儲入工作記憶(工作空間)后在推斷(合并)的過程中被提取與運用, 形成具有垂直層級關系的樹形結構(tree notation), 最終實現對句子的理解。
2.2" 神經科學研究中的句法解析:神經振蕩與時間結構
研究句法解析的神經機制需要訴諸對人腦活動的觀測。如前文所述, 在語言本體理論的框架下, 句法解析是一種將線性序列構建為層級結構的過程。人腦中的神經活動如何表征這一過程, 便是句法解析的神經機制問題。傳統上, 學界對于句法解析神經機制的探討主要集中于事件相關電位(Event Related Potentials, ERPs), 比如與語義違例相關的N400 (Kutas amp; Federmeier, 2000, 2011), 與句法違例相關的P600 (Gouvea et al., 2010, p. 600), 以及與韻律邊界識別相關的閉合正漂移(Closure Positive Shift, CPS) (Steinhauer et al., 1999)等。事件相關電位的相關研究已取得重大成效, 作為更敏感的腦電指標, 可以揭露行為表現中無法呈現的心理過程。然而, 通過誘發電位對句法加工過程進行探究具有一定的局限性:事件相關電位的誘發對違例性刺激材料的依賴性較強, 其實驗設計在可操作性定義及變量控制上難免失之于主觀, 導致其誘發機制解讀的重大爭議; 且相關研究難以直接提供層級結構加工的時間信息, 難以展現句法解析神經活動的全貌。近年來, 有越來越多的研究發現了神經振蕩(neural oscillation)與句法解析之間的潛在聯系, 并開始著手研究用神經振蕩解釋句法解析時不同的心理過程(Bastiaansen et al., 2011), 為句法解析的研究提供另一種可行的路徑。
神經振蕩是大腦皮層神經集群在時空尺度上表現出的節律性活動。這些活動通常被分為5個主要頻段:delta波段(δ: 0.5~4 Hz), theta波段(θ: 4~8 Hz), alpha波段(α: 8~12 Hz), beta波段(β: 12~30 Hz), 低gamma波段(γ: 30~60 Hz)和高gamma波段(60~200 Hz) (Prystauka amp; Lewis, 2019)。根據其頻率, 神經振蕩又可被分為低頻振蕩(涵蓋δ和θ波段)以及高頻振蕩(涵蓋α、β和γ波段)。作為一種周期性的神經活動, 神經振蕩編碼信號的一個顯著特征便是其時間尺度, 不同頻段的神經振蕩與不同時間尺度的信息處理相關聯。因此, 神經振蕩的時空屬性使其天然成為編碼具有顯著時間結構特征信息的候選機制。具體來說, 低頻神經振蕩因其周期較長, 因此與較大時間窗口的信息交流潛在相關; 相對地, 高頻神經振蕩由于周期較短, 可能與較小時窗內的信息交流存在聯系(張力新 等, 2017)。這一特性表明神經振蕩的時間結構與自然語言加工中不同層次結構(詞、短語和句子)構建的時間進程存在一定關聯, 這意味著神經振蕩與不同尺度的句法解析有著潛在聯系(胡瑞晨 等, 2019)。此外, 神經振蕩可以為大腦系統內部系統的信息處理和傳遞提供相對精確的時間特征, 這與進行魯棒性句法解析的需求相符合。
語言學理論已對句法解析的過程做出了豐富的探討, 而神經科學研究則表明人腦的神經振蕩活動與句法解析的時間進程可能存在符合直覺的關聯。彌合映射問題之間的鴻溝需要將這兩個學科的理論以及研究范式結合起來, 事實上也確實有越來越多的新近研究綜合語言學理論與神經科學研究范式, 利用神經振蕩相關指標探索句法解析心理過程, 更進一步地為句法層級結構構建過程的心理現實性提供強有力的解釋, 并揭示了句法解析潛在的神經編碼活動, 推動映射問題的解決。
3" 句法解析探幽:先驗語法知識的心理現實性
合并操作形成的語言層級結構是自然語言的核心特征, 在探討其具體的增量轉換過程前, 需要明確語言層級生成過程中句法加工的心理現實性。語言層級結構的生成需要倚賴先驗語法知識的表征, 而非單純是韻律、語義等模塊作用的結果。在此視域下, 自然語言的層級結構生成基于先驗語法知識[2], 即聽者依靠已有語法知識對外來刺激進行自上而下的解析的過程是句法解析的必要條件。從句法解析的角度看, 如果有證據表明建構層級結構的“結構依存原則” (Principle of Structural Dependency)確實存在, 即句子在線加工過程層級結構的表征的句法因素相對獨立于韻律、語義、詞匯等因素的作用, 那么就可以認為句法加工的心理現實性得到了支持[3]。
低頻神經振蕩的相關研究對此做出了重要討論。人們能夠根據不同的信息和線索進行有效的語言理解, 這一過程中觀測到的低頻振蕩活動[4]與句法解析任務顯示出顯著的相關性。然而, 對于低頻神經振蕩活動具體表征著句子加工中的哪個心理過程, 學界仍存在很大爭議。一方面, 一些學者認為低頻振蕩活動所反映的是內源性(endogenous)神經振蕩活動對抽象語言層級結構的表征, 是一個相對獨立的、由個體先驗知識驅動的過程(Ding, 2023; Giraud, 2020; Haegens, 2020; Kandylaki amp; Kotz, 2020; Klimovich-Gray amp; Molinaro, 2020; Lewis, 2020), 這樣的觀點被稱為層級結構構建假說(Hierarchical Structure Building, HSB)。另一方面, 也有研究認為低頻振蕩活動源于對外在節律的追蹤(Keitel et al., 2018)、統計線索的預測處理(Frank amp; Christiansen, 2018), 以及詞匯表征(Frank amp; Yang, 2018)等因素。盡管在實際的言語感知過程中, 低頻振蕩活動是由不同信息交互作用的共同結果(陳梁杰 等, 2022), 但通過實驗設計以及變量控制, 研究者仍然能夠將句法結構的表征與其他心理過程進行區分, 從而找到低頻振蕩活動與句法層級結構的相關性證據。
3.1" 語法知識與韻律信息
由于句法結構與韻律信息在宏觀時間尺度上的推進大致相似, 二者引發的神經活動時常容易被混淆。有研究認為低頻振蕩活動主要是通過追蹤語音包絡等韻律信息以支持言語感知和信息提取的(Poeppel amp; Assaneo, 2020)。而Meyer等人(2020a, 2020b)則提出不同觀點, 認為這種低頻活動實質上反應的是對語言結構本身的推斷與追蹤, 使得外源輸入不斷與先驗語法知識進行內在同步化(intrinsic synchronization)的過程。事實上, 越來越多的證據表明, 僅僅將低頻振蕩活動歸因于對外在節律的追蹤并不能充分解釋句法表征的成因, 低頻振蕩與句法計算程序之間的一致性更加顯著, 其根本上更可能是對語法知識本身的內在表征。
就韻律?句法界面本身而言, 句法結構與韻律信息存在著非同構關系(non-isomorphic relationship):首先, 語言外化是一種“拼盤式”實現方式(Si, 2016; 司富珍, 2024), 因為雖然“言語產出會使用到內部語言, 但并不能與之等同。關于語言的可計算理論使得我們能夠將內化的語言知識系統與訪問它的過程區分開來, 而這是一個非常重要的區別” (Chomsky, 2017, p.2)。其次, 自然語言本身的呈現頻率并非是固定的。盡管有研究表明自然語音是準節律性的(quasi-rhythmic), 但這并不意味著可以忽略不同自然語音之間的節律差異(Kazanina amp; Tavano, 2023)。另外, 自然語音中韻律邊界與句法成分邊界的聯系相對松散, 二者間并非嚴格對應(馬寶鵬, 莊會彬, 2022), 即對一段自然語音中不同成分的切分與提取難以完全單獨依靠聲學線索進行。句法范疇本身不由聲學邊界定義, 而句子本身語義的組合性(compositionality)則需依靠句法成分間的相互關系來構建, 無法僅通過對語音包絡的追蹤完成對句子的理解(Meyer et al., 2020b)。
正是由于句法結構與外在節律間的非同構關系, 人類在缺乏明確的聲學線索或韻律邊界的情況下, 仍然能夠憑借內在語法知識成功地理解句子。Ding等(2016)通過頻率標記范式(frequency tagging paradigm)將不同層級的語言結構(詞、詞組、句子)以不同的刺激頻率呈現, 發現在人工移除句子韻律邊界的條件下, 仍能成功分別觀測到1、2、4 Hz左右的δ振蕩響應; 而相同漢語材料在英語母語被試中卻只能觀測到4 Hz響應, 說明低頻振蕩活動實質上是對可理解的語言層級結構的表征, 而非對刺激材料節律的追蹤。其他研究也發現, 在語言刺激材料以非周期性頻率呈現的情況下, 研究者仍然能觀測到表征句法結構加工的1、2、4 Hz的響應(Ding et al., 2016; Jin et al., 2018)。此外, 甚至是在無外在節律刺激的情況下, 如視覺呈現刺激(Henke et al., 2023)、想象言語(Lu et al., 2021)等, 也有與正常句法解析相似的低頻神經振蕩響應。相反, 在外在節律正常, 而句法信息難以通達的情況下, 如無句法結構的詞匯表(word list)條件(Kaufeld et al., 2020)、非母語材料感知(Ding et al., 2016)以及倒放語條件(Gross et"al., 2013; Mai et al., 2016)等情況下, 相應的神經振蕩指標都有衰減。
以上實證研究均成功將神經振蕩對外在節律刺激的表征與內在語法知識的表征相分離:在外在節律無法提供充足聲學線索的情況下, 研究者仍然能觀測到與句子層級相關的低頻振蕩活動; 而在外在節律線索豐富但缺乏語法知識通達的情況下, 則不一定能觀察到相應的振蕩響應。這表明了低頻神經振蕩所反映的是內在語法知識的推斷過程而非簡單地、自下而上地對外在節律的感知。
3.2" 句法規則與語義統計線索
廣泛的研究表明, 人類可以通過語義統計線索來預測言語感知的內容(Dikker et al., 2010; Poeppel et al., 2008)。例如, 詞頻(word frequency)顯著影響單個單詞的識別時間(Gardner et al., 1987)。詞間轉移概率(transitional probability)與單詞在句中的閱讀時間也有很強的相關性(Smith amp; Levy, 2013)。在噪聲環境下, 詞與詞之間轉移概率較高的句子比轉移概率較低的句子識別效果更好(Miller et al., 1951)。基于概率線索在言語加工中的作用, 有學者認為句法解析的過程實質上是基于語義分析及統計概率預測的產物。相比于句法層級結構, 線性序列本身傳遞的統計信息對語言理解來說更重要。因此, 低頻神經振蕩的響應模式在僅針對線性序列關系的統計模型中也可實現(Frank amp; Christiansen, 2018)。然而, 盡管統計概率能輔助和補償語言理解, 本文認為基于規則的句法層級構建是語言理解的主要驅動力, 語義統計概率并不足以完全說明語言理解過程。
自然語言句法本身的層級結構性無法僅通過統計概率解釋。統計概率本質上是基于簡單線性序列的信息, 而自然語言中的詞組之間并非簡單的鄰接依存關系(adjacent dependency), 而是存在復雜的長距離依存結構(long-distance dependency) (Berwick et al., 2013)。這表明句法解析的過程需要句法規則來進行層級結構的構建, 僅依靠線性概率無法生成具有遞歸性質的自然語言(Ding et"al., 2017)。事實上, 有研究通過將句法組塊與具體詞匯語義分離, 發現低頻神經振蕩更可能是句法層級構筑的結果, 而非對詞匯語義及概率分析的產物(Jin et al., 2020; Lu et al., 2023)。
此外, 研究表明人類可以在低程度依賴轉移概率的情況下實現對語言的理解, 但卻無法在不依賴句法層級結構的情況下理解句子。Ding等(2016)在低頻振蕩的實驗中通過構建馬爾可夫句集(Markovian Sentence Set, MSS)對實驗句的轉移概率的控制, 最終發現轉移概率的高低對δ振蕩響應強度的調控作用并不顯著。此外, 句法結構本身也可對與統計預測產生調控作用。使用概率線索進行預測在很多時候需要依賴句法的結構層級。Slaats等(2023)通過對前人研究的MEG數據集進行分析, 發現語境驅動的概率線索的影響僅在句子條件下顯著, 而在詞匯表條件下則不然。這表明在言語感知過程中的低頻振蕩的響應是由句法結構與語義共同調制的, 而非僅僅受到詞匯語義間轉移概率差異的影響。概率線索的運用本身也需要以句法層級結構為條件。相似的, Rafferty等(2023)的研究通過最小短語范式(minimal phrase paradigm)以及Jabberwocky范式, 發現短語層的低頻神經振蕩響應(0.5Hz)主要與句法組合有關而并不與具體的詞匯語義性質相關聯。除了低頻振蕩的相關研究之外, 其他心理語言學實驗也區分了句法與語義加工的神經機制(Brennan amp; Hale, 2019; Pallier et al., 2011), 支持了兩者的相對獨立性。
3.3" 句法層級與詞匯屬性
除了排除韻律、語義模塊的相關性之外, 針對低頻振蕩在句法解析過程中的頻段響應模式, Frank和Yang (2018)提出詞匯表征說(lexical representation account), 主張實驗中觀測到的頻段響應并非是與句法層級結構有關, 而是與刺激材料中特定句法范疇的詞匯呈現頻率相關。也就是說, 1 Hz低頻神經振蕩響應并非是對句子層級本身的響應, 而是對著句中某個呈現頻率為1 Hz的詞匯屬性的反應。如“老牛吃草”這一句子中, 動詞(“吃”)的出現次數為1次, 名詞(“牛” “草”)的出現次數為2次, 單個字表征(“老” “牛” “吃” “草”)的出現次數為4次, 分別對應著1、2、4 Hz的呈現頻率。這類理論雖將低頻振蕩活動的響應歸因為詞匯句法范疇, 但其并不承認句法結構層級在句法解析過程中的作用。
對此, Jin (2020)通過組塊任務證明低頻神經振蕩響應的產生是基于句法規則的組塊過程產生的, 并非是詞匯屬性組合的副產品。還有研究利用反轉詞匯(reversed phrase), 保留基線句中原有的詞匯屬性的頻率與分布, 而去除原有的句法層級結構信息, 最終在相應條件下未觀測到相應的1 Hz神經指標(Lo et al., 2022)。這些結果與上述詞匯表征說相悖, 證實了層級結構對于低頻神經振蕩響應的必要性。
綜上, 本文認為, 低頻神經振蕩活動所反映的更可能是專司句法結構的神經機制, 其本身表征的語言層級結構計算的“結構依存原則”的確存在, 并不是語音加工、概率預測等活動過程的副產品。毋庸諱言, 在實際言語感知的過程中, 句法解析的過程是內源性振蕩與外在節律、概率預測、詞匯語義等共同調控的產物, 在某些時刻低頻振蕩相關活動所對應的神經回路也很難從解剖結構上嚴格區分(Meyer et al., 2020a), 但這并不意味著這種不同表征的分離是沒有價值的。相反, 這能夠幫助我們分離語言層級結構表征中的不同模塊, 為句法解析過程中句法加工的心理現實性提供解釋。
4" 句法解析溯因:具體神經編碼過程
正如前文所述, 研究者可以通過神經振蕩分離句法解析中的多重信息表征。其中大多數相關實驗都是通過觀測不同神經振蕩的響應強度(power)或幅值(amplitude)以分離不同模塊線索表征。但要進一步解釋句法解析的神經編碼過程, 將神經振蕩活動與語言層級結構相對其, 就必須對神經振蕩更具有時間屬性的物理性質有更深入的了解。在句法加工心理現實性存在的前提下, 句法解析過程中不同信息的整合如何通過神經振蕩之間的協調來實現?
近來, 有越來越多的理論模型及實證開始利用神經振蕩的相位相干性(phase coherence)探究句法解析的相關過程(Bai et al., 2022; Brennan amp; Martin, 2019; Calmus et al., 2020; Ding, 2020; Flanagan amp; Goswami, 2018; Ghitza, 2011; Martin, 2020; Martin amp; Doumas, 2017; Murphy, 2024)。這使得神經振蕩的信號變換與語言層級結構構建的時間進程相對齊, 是對句法解析神經編碼活動的更深入探討。研究表明, 神經集群對句法層級結構的表征可能是通過同一頻段或不同頻段振蕩的相位同步與去同步化過程來完成的。也就是說, 不同神經集群會隨著加工時間變化逐步激活或抑制, 并產生不同相位屬性的振蕩信號, 對不同時間尺度的感覺信息進行存儲、維持與提取, 最終實現從結構層級構建的動態編碼。
4.1" 相位相干性
神經振蕩空間分布的顯著特性主要依賴其相位(phase)屬性。相位, 指的是振蕩信號在周期性波形中的位置。相位相干性, 指的是不同神經元之間振蕩活動的相位同步(phase synchronization)程度, 是衡量神經元之間協調活動的重要指標。相位同步有不同的表現形式, 如同一頻段不同腦區間的相位同步(Fries, 2005), 不同頻段振蕩的間相位相關的交叉節律耦合(Cross-Frequency Coupling, CFC)等。在句法解析的過程中, 同一頻段內與不同頻段間的神經振蕩會表現出不同程度的相位相干性。因此, 相位相干性被認為反映了語言不同層級的表征在不同時間尺度上整合信息的過程(Giraud amp; Poeppel, 2012)。
具體來說, 有研究利用CFC等相關指標發現, 在神經振蕩對語言結構進行追蹤的過程中, 會系統性地展現出頻段內與頻段間的相位同步現象, 包括低頻耦合(如δ-θ耦合), 以及低頻高頻耦合(如θ-γ耦合)等形式(Bai et al., 2022; Brennan amp; Martin, 2019)。這種耦合過程中, 高頻神經振蕩攜帶的低層級感官信息與低頻神經振蕩表征的高層級語言結構進行匹配, 是實現語言線性序列合并為層級結構的關鍵一步。盡管目前的研究暫未發現特定語言層級與顯示出同步化的頻率帶之間嚴格的對齊關系, 但仍然可以基于現有的成果對句法解析的過程做出更進一步的假設。如圖1所示, 神經振蕩的相位耦合信號模式與句法樹符號的橫向表示和縱向結構相匹配(參見Marcolli, et al., 2023a, 2023b), 且與神經振蕩的相位屬性存在著非同構映射(non-isomorphic mapping)關系, 即神經振蕩活動信號與句法結構的對應可能是非線性的, 但兩者可經過一定的數學變換進行轉換(參見Murphy, 2024; Coopmans et al., 2023; Kazanina amp; Tavano, 2023)。
4.2" 理論模型
目前已有部分理論模型以相位相干性為基, 對神經振蕩編碼句法解析提供了不同視域下的細致描述(見表"1)。其中, ROSE (Representations, Operations, Structures, Encoding)模型圍繞交叉頻率耦合等神經信號變換模式, 側重于在句法操作與神經活動之間建立聯系(Murphy, 2024); CNAL (Compositional Neural Architecture for Language)模型以神經流形(neural manifolds)為基礎, 為語義組合性實現過程中語音、詞匯、句法、語義等不同模態間的相互轉化提供了解釋性機制; SMMM (Structure-based Memory Maintenance Model)作為經典的心理學模型, 其主要特點在于清晰地具象化句法長短時工作記憶在維持結構表征時的作用(Ding, 2020); DORA (Discovery of Relations by Analogy)作為符號?聯結主義模型, 提出了論元結構的一種可能的生成與預測機制(Martin amp; Doumas, 2017); VS-BIND (Vector- symbolic Sequencing of Binding INstantiating Dependencies)使用向量的圓周卷積運算(circular convolution, 運算符“?”)模擬θ-γ振蕩耦合, 以此來表征句法依存關系(Calmus et al., 2020)。這些模型從不同維度對句法解析及其神經編碼活動提出了假設, 在其適用范圍內均具有較強的解釋力, 并且得到了一定的實證數據支持。然而, 由于學科視角和研究范式不同, 這些模型不具有直接可比性。為更深入全面地介紹各個模型的特征與異同, 本文嘗試在David Marr提出的三分框架內對它們進行系統性的評述。
David Marr (1982)[5]關于人腦信息處理機制的三層次理論為相關認知科學研究提供了重要參考框架, 這三個層次分別是:計算層(computational level)、算法層(algorithmic level)及實現層(implementational level)。在本文的語境中, 這三個層次分別關注:(1)語言的基本計算功能, 如語法規則的使用; (2)神經振蕩活動, 探討其在語言處理中的時間過程和調控; (3)底層的生物學機制, 如基因、蛋白質、神經元和腦回路的運作。依照這種三分框架, 本文將立足于映射問題視角, 從計算層、算法層以及實現層的角度對模型的異同點進行梳理, 以此討論它們對句法解析過程的闡述程度(見圖2)。
在這統一的理論框架下, 上述模型具有三個方面的共性。首先, 從實現層來說, 這些模型在解釋句法解析的底層生物學機制上是相似的, 它們都以神經集群在句法加工中逐步的、漸進的激活為前提解釋表征句法結構的神經振蕩活動。也就是說, 隨著外界刺激的不斷輸入, 不同神經集群會在語言層級結構形成的過程中次第激活, 產生節律性的神經信號, 實現對語言層級的動態表征。值得一提的是, 目前的這5個模型暫未涉及更深入的神經生理與動力學層面的探討。其次, 從算法層來說, 這些模型都假設語言層級結構表征的關鍵在于神經信號時間結構的耦合, 通過其相位相干性來說明句法解析的過程。最后, 從計算層來說, 盡管這5個模型基于不同的語言學理論, 對不同結構類型進行了解釋, 但它們都肯定了語言表型當中層級結構的存在, 并圍繞這一點展開討論。因此, 這5個模型在總體上都揭示了神經振蕩作為句法結構構建發生機制的可行性, 認為神經振蕩是句法解析的潛在神經機制。
同時, 上述模型也存在三個方面的差異。最主要的差異首先體現在算法層。這些模型對于不同頻段神經振蕩與不同語言層級結構的具體聯系有不同解讀:ROSE將全頻段的神經活動與最簡方案理論中的句法計算過程進行映射, 假設γ振蕩活動表征句法對象(也就是詞匯)的形成, θ-γ耦合表征詞匯調用過程, δ-θ耦合表征層級結構的合并, α振蕩與抑制活動有關, β振蕩與預測活動有關; CNAL與ROSE相似, 唯一不同的是未討論α與β波段在此過程中的作用。SMMM與DORA主要強調了δ振蕩在語言層級實現中的核心地位, 而對其它頻段的討論較少; VS-BIND則僅基于θ-γ耦合對句法加工的過程進行解釋。
根據目前的實證研究結果, δ頻段的相關研究已成功排除了韻律、語義、詞匯等因素的影響, 說明δ振蕩與句法層級結構構筑之間更相關(Ding et"al., 2016), 而θ振蕩更可能與刺激材料的語音包絡共變(Chalas et al., 2023), γ振蕩則更可能與刺激材料的聲學特征結構相關(Xu, Zhao et al., 2023)。這意味著θ-γ耦合可能表征詞匯的形成, 這一過程發生在語言層級結構構建之前。從這一角度來說, VS-BIND的可信度弱于其它模型, 而其它四個模型的神經機制均有實證研究結果的支撐。對于α與β振蕩, 也有認知功能相關的研究支持其分別與抑制與計時(Klimesch, 2012)及預測活動(Abbasi amp; Gross, 2020)相關。因此, ROSE對句法解析過程的闡述更加全面。此外, 并非所有模型都對這些神經信號的活動模式進行了數學層面的模擬。CNAL利用神經流形這一數據模型, 假設神經集群的信號模式可被降維成某一高維中的內嵌流形, 并以其中子空間(subspace)的坐標系變換(coordination transformation)來解釋外界刺激在不同模塊之間如何轉化表征; VS-BIND則以圓周卷積運算來模擬θ-γ振蕩耦合, 以此解釋句法成分之間的鄰接與非鄰接關系; 而ROSE、DORA、SMMM則未利用具體的數學工具對神經振蕩表征句法層級的信號模式進行解讀。
除算法層方面的差異之外, 這些模型在計算層聚焦的語言本體結構也有所不同。具體而言, ROSE與CNAL較為系統地涉及到了句法解析從原子特征到層級結構構筑的全方面, 對于外界輸入在語音、詞匯、句法、語義模塊的轉化都有自己的詮釋, 屬于更細粒度的模型; 而SMMM、DORA、VS-BIND則側重于解釋句法層級結構形成的過程本身, 探討了抽象的句法記憶裝置是如何實現對層級結構的維持和預測的, 屬于相對粗粒度模型, 但更直觀地展現了句法層級構筑的心理過程。
從模型本身所屬的類別以及核心內容來看, 這些模型的底層運行機制涉及不同學科的研究范式, 并存在較大差別。ROSE基于語言學理論框架, 系統性地將各個頻段神經振蕩及其之間的活動對應至句法解析過程中的某個步驟, 重在體現語言表型與神經活動之間的關系; CNAL引入了前沿的神經流形概念, 屬于計算神經科學研究范式; SMMM則為經典的心理機制模型, 其核心在于具象化了句法單元的維持與表征, 并凸顯了句法長短時記憶裝置在其中的作用; DORA與VS-BIND均為符號?聯結主義(symbolic-connectism)模型, 利用神經網絡描述句法解析過程。因此, 這些模型在一定程度上具有不可比性, 它們之間的差異并不體現在其是否相悖, 而體現在從不同的維度對句法解析的過程進行解釋。
綜上, ROSE和CNAL以細粒度的視角完備地將不同頻段的神經振蕩活動與句法解析過程相對應, 并且有較多實證研究結果支撐, 能更好地解決映射問題, 具備良好發展潛能。其它三個模型雖然粒度不及前二者, 但在具象化句法層級構建的行為過程方面仍然具備較強解釋力, 為后續的研究提供了參考。
綜上所述, 相位相干性與句法層級結構的潛在聯系已經逐漸得到關注。盡管目前缺乏將神經振蕩與句法解析過程相聯系的嚴謹的數學證明及動力學計算模型, 但神經振蕩相位性質顯著的時間分布特征的確能夠為句法解析的神經編碼活動提供一種潛在的合理解釋。
5" 總結與展望
句法層級結構是自然語言區別于其他交際系統的本質屬性, 句法解析的過程需要著重解釋語音線性序列與句法層級結構的增量轉換。在這一過程中, 盡管韻律、統計概率等線索都會參與加工, 但這些線索對于句法解析來說并不充分, 魯棒性句法結構表征的形成仍需要倚賴先驗語法知識。回顧現有的神經振蕩研究, 相關領域已累積豐富的證據支持抽象語言結構的內在句法表征, 并展現出利用神經振蕩解釋句法解析神經編碼過程的巨大潛力。神經振蕩已經成為探索語言與神經基元映射問題的重要切入點。在未來研究中, 以下幾個方面值得關注。
第一, 探究句法解析的因果性神經編碼活動。本文對神經振蕩以及語言結構關系的闡述屬于一種猜想, 如若要進一步證明兩者之間更細粒度的映射關系, 還需進一步探究。具體來說, 首先, 目前研究主要以神經振蕩具體頻段的幅值和強度作為觀測指標, 而缺乏對神經振蕩相位屬性與語言層級結構之間關系的探究。因此, 大部分的研究結果可能停留于對句法知識的存在性探討, 而不能直接證明不同頻段的神經振蕩如何通過信號變換來表征語言層級結構, 實現增量轉換。未來研究應更深入地探索神經振蕩相位屬性與句法解析的具體心理過程之間的聯系, 利用相位耦合相關指標(如CFC), 以及可充分分離不同語言層級結構的實驗范式(如頻率標記范式)進行研究。此外, 目前研究主要依賴傳統心理學實驗中控制變量的手段來進行研究, 通過直接觀察不同條件對比的結果來回答研究問題, 得出的相關結論可能受到語言表層形式的制約。未來研究可將句法結構的特征(如句法樹深度, 節點等)編碼為抽象的數據結構來進行建模與驗證(參考Gwilliams et al., 2024), 以越過表層的語言實現形式, 進一步解釋神經振蕩與抽象句法結構之間的潛在聯系。最后, 本文回顧的研究在實驗設計與統計學方法上都只涉及相關性分析而暫未涉及因果推斷。在日后實驗數據儲備允許的情況下, 可以通過更多的數學與統計方法對其進行分析, 推進對句法解析的更細粒度的因果性的解釋, 在兩者的非嚴格同構結構間找到映射關系, 并將其與神經振蕩的精細活動對齊。目前的語言學理論已經試圖用抽象代數將句法計算層的活動進行細致的描繪(Marcolli, Chomksy, amp; Berwick, 2023); 已有的句法解析模型中也有試圖將句法層級構建的數學模型與其具體神經生理性相匹配(Kaushik amp; Martin, 2022)。未來研究可以更進一步地在這些理論框架的指導下探索句法解析的神經機制。
第二, 厘清神經振蕩的發生機制及其生物學意義。神經振蕩活動的實現層機制尚存在爭議:首先, 神經振蕩與誘發響應存在很大的區分困難。神經振蕩本身可能涌現于無數個誘發響應的組合(Ding, 2022), 而誘發響應本身也可能產生于振蕩活動的平均調制(Meyer et al., 2020a)。其次, 不同成像技術觀測的神經振蕩指標存在本質差異, 且由于EEG與MEG空間分辨率的缺陷, 目前研究也難以將振蕩活動與宏觀或微觀的神經結構進行對應[6]。神經生理相關研究表明, 神經振蕩信號的周期性可能與神經集群的激活抑制循環機制有關, 本文著重于討論其作為句法構建的發生原理與闡述機制的可能, 因而沒有對這些神經活動本身進行梳理。未來如若要更進一步地探究句法解析過程, 勢必需要探究這些神經活動之間的因果, 將神經振蕩的空間分布與其時間結構進行聯系, 將其與神經集群興奮傳導的具體模式相對應, 以明確其具體神經生理基礎, 或者通過基因學研究找到與語言層級結構相關的基因表達, 彌合句法解析算法層以及實現層之間的鴻溝。
第三, 關注語言發展過程中神經振蕩模式的變化。從語言習得的角度來說, 兒童句法結構的習得體現為從對外在節律的倚賴到內在語法知識的形成的轉變。嬰幼兒語言習得早期具有知覺窄化(perceptual narrowing) (Kuhl, 2004)以及發展性權重轉移(Seidl, 2007)的現象。這可能是因為隨著相關大腦皮層發育, 嬰幼兒對語言輸入的識別與區分逐漸由依賴聲學特征向依靠語法知識轉變(Meyer et al., 2020b)。而目前相關的假設與研究都主要從對外在節律的跟蹤出發考察神經振蕩在兒童語言習得中的作用(Attaheri et al., 2022; Nallet amp; Gervain, 2021), 后續的相關研究可以利用頻率標記范式等研究方法進一步分離語法知識與韻律信息以考察兩者在語言習得過程中的不同作用。
第四, 明確不同語言障礙群體的神經生理缺陷。從語言蝕失的角度而言, 老年人語言能力的衰退在神經振蕩活動中可體現為低層級語言結構(4Hz)振蕩響應的增強和高層級語言結構(1、2 Hz)振蕩響應的減弱(Xu, Qin et al., 2023), 這體現了抽象語法知識衰退對于低頻神經振蕩活動的影響。后續研究可以低頻神經振蕩為切入點探究老年人群語言蝕失的具體神經表現。從特殊人群角度出發, 前人研究發現, 與健康人群相比, 語言障礙人群的神經振蕩活動會出現一定的變異(Fridriksson et al., 2015; Meyer et al., 2021; Peter et"al., 2023), 這意味著其內在的語法知識表征可能存在一定的缺陷。尤其是對于神經發育障礙(Neural Developmental Disorder, NDD)人群, 其語言障礙發生機制尚無明確的病理學定義, 往往難以通過高空間分辨率腦成像技術確定其腦損傷病灶(Abbott amp; Love, 2023), 可以考慮利用神經振蕩指標來考察其語言行為缺陷。已有理論已試圖從內源性振蕩活動的角度對發展性失讀癥(Developmental Dyslexia, DD)語言障礙的神經缺陷進行解釋(Goswami, 2011), 未來研究可拓展到更難以界定的發展性語言障礙(Developmental Language Disorder, DLD)群體。對語言障礙群體的研究, 不僅可以為句法解析過程中的神經振蕩機制提供病理性證據, 也可進一步克服部分語言障礙群體研究的異質性問題, 為該類疾病的早期預測與臨床干預工作提供更為統一的病理學標準。
參考文獻
陳梁杰, 劉雷, 葛鐘書, 楊曉東, 李量. (2022). 節律在聽覺言語理解中的作用. 心理科學進展, 30(8), 1818? 1831.
胡瑞晨, 袁佩君, 蔣毅, 王瑩. (2019). 時間結構信息在人類知覺中的作用及其腦機制. 生理學報, 71(1), 105?116.
姜孟. (2009). 句法自治: 爭鳴與證據. 外國語文, 25(3), 79?86.
馬寶鵬, 莊會彬. (2022). 二十年來韻律-句法接口研究的回顧與啟示. 外國語, 45(1), 56?66.
司富珍. (2024). 語言與人腦科學研究中的“伽利略謎題”.外國語, 47(2), 2?9.
楊烈祥. (2012). 唯遞歸論的跨語言比較述評. 外語教學與研究, 44(1), 54?64+158.
張力新, 王發頎, 王玲, 楊佳佳, 萬柏坤. (2017). 認知功能研究中神經振蕩交叉節律耦合應用研究進展. 生理學報, 69(6), 805?816.
Abbasi, O., amp; Gross, J. (2020). Beta-band oscillations play an essential role in motor-auditory interactions. Human Brain Mapping, 41(3), 656?665.
Abbott, N., amp; Love, T. (2023). Bridging the divide: Brain and behavior in developmental language disorder. Brain Sciences, 13(11), 1606.
Attaheri, A., Choisdealbha, á. N., Di Liberto, G. M., Rocha, S., Brusini, P., Mead, N., ... Goswami, U. (2022). Delta- and theta-band cortical tracking and phase-amplitude coupling to sung speech by infants. NeuroImage, 247, 118698.
Bai, F., Meyer, A. S., amp; Martin, A. E. (2022). Neural dynamics differentially encode phrases and sentences during spoken language comprehension. PLoS Biology, 20(7), e3001713. https://doi.org/10.1371/journal.pbio.3001713
Bastiaansen, M., Mazaheri, A., amp; Jensen, O. (2011). Beyond ERPs: Oscillatory neuronal dynamics. In E. S. Kappenman amp; S. J. Luck (Eds.), The Oxford handbook of event- related potential components. Oxford University Press.
Berwick, R. C., Friederici, A. D., Chomsky, N., amp; Bolhuis, J. J. (2013). Evolution, brain, and the nature of language. Trends in Cognitive Sciences, 17(2), 89?98.
Brennan, J. R., amp; Hale, J. T. (2019). Hierarchical structure guides rapid linguistic predictions during naturalistic listening. PloS One, 14(1), e0207741. https://doi.org/10. 1371/journal.pone.0207741
Brennan, J. R., amp; Martin, A. E. (2019). Phase synchronization varies systematically with linguistic structure composition. Philosophical Transactions of the Royal Society B: Biological Sciences, 375(1791), 20190305.
Calmus, R., Wilson, B., Kikuchi, Y., amp; Petkov, C. I. (2020). Structured sequence processing and combinatorial binding: Neurobiologically and computationally informed hypotheses. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences, 375(1791), 20190304.
Chalas, N., Daube, C., Kluger, D. S., Abbasi, O., Nitsch, R., amp; Gross, J. (2023). Speech onsets and sustained speech contribute differentially to delta and theta speech tracking in auditory cortex. Cerebral Cortex, 33(10), 6273?6281.
Chomsky, N. (1957). Syntactic structures. De Gruyter Mouton.
Chomsky, N. (1965). Aspects of the theory of syntax. The MIT Press.
Chomsky, N. (1995). The minimalist program. The MIT Press.
Chomsky, N. (2017). The Galilean challenge: Architecture and evolution of language. Journal of Physics: Conference Series, 880, 12?15.
Chomsky, N., amp; Moro, A. (2022). The Secrets of words. The MIT Press.
Chomsky, N., Seely, T. D., Berwick, R. C., Fong, S., Huybregts, M. A. C., Kitahara, H., McInnerney, A., amp; Sugimoto, Y. (2023). Merge and the strong minimalist thesis. Cambridge University Press.
Coopmans, C. W., Mai, A., Slaats, S., Weissbart, H., amp; Martin, A. E. (2023). What oscillations can do for syntax depends on your theory of structure building. Nature Reviews Neuroscience, 24(11), 723?723.
Dikker, S., Rabagliati, H., Farmer, T. A., amp; Pylkk?nen, L. (2010). Early occipital sensitivity to syntactic category is based on form typicality. Psychological Science, 21(5), 629?634.
Ding, N. (2020). A structure-based memory maintenance model for neural tracking of linguistic structures. arXiv. https://doi.org/10.48550/arXiv.2002.11870
Ding, N. (2022). The neural correlates of linguistic structure building: Comments on Kazanina amp; Tavano (2022). arXiv. https://doi.org/10.48550/arXiv.2212.04219
Ding, N. (2023). Low-frequency neural parsing of hierarchical linguistic structures. Nature Reviews Neuroscience, 24(12), 792?792.
Ding, N., Melloni, L., Tian, X., amp; Poeppel, D. (2017). Rule-based and word-level statistics-based processing of language: Insights from neuroscience. Language, Cognition and Neuroscience, 32(5), 570?575.
Ding, N., Melloni, L., Zhang, H., Tian, X., amp; Poeppel, D. (2016). Cortical tracking of hierarchical linguistic structures in connected speech. Nature Neuroscience, 19(1), 158?164.
Flanagan, S., amp; Goswami, U. (2018). The role of phase synchronisation between low frequency amplitude modulations in child phonology and morphology speech tasks. The Journal of the Acoustical Society of America, 143(3), 1366?1375.
Frank, S. L., amp; Christiansen, M. H. (2018). Hierarchical and sequential processing of language: A response to: Ding, Melloni, Tian, and Poeppel (2017). Rule-based and word-level statistics-based processing of language: Insights from neuroscience. Language, Cognition and Neuroscience, 33(9), 1213?1218.
Frank, S. L., amp; Yang, J. (2018). Lexical representation explains cortical entrainment during speech comprehension. PLoS One, 13(5), e0197304. https://doi.org/10.1371/ journal.pone.0197304
Fridriksson, J., Basilakos, A., Hickok, G., Bonilha, L., amp; Rorden, C. (2015). Speech entrainment compensates for Broca’s area damage. Cortex, 69, 68?75.
Fries, P. (2005). A mechanism for cognitive dynamics: Neuronal communication through neuronal coherence. Trends in Cognitive Sciences, 9(10), 474?480.
Gardner, M. K., Rothkopf, E. Z., Lapan, R., amp; Lafferty, T. (1987). The word frequency effect in lexical decision: Finding a frequency-based component. Memory amp; Cognition, 15(1), 24?28.
Ghitza, O. (2011). Linking speech perception and neurophysiology: Speech decoding guided by cascaded oscillators locked to the input rhythm. Frontiers in Psychology, 2, 130.
Giraud, A.-L. (2020). Oscillations for all ˉ_(ツ)_/ˉ? A commentary on Meyer, Sun amp; Martin (2020). Language, Cognition and Neuroscience, 35(9), 1106?1113.
Giraud, A.-L., amp; Poeppel, D. (2012). Cortical oscillations and speech processing: Emerging computational principles and operations. Nature Neuroscience, 15(4), 511?517.
Goswami, U. (2011). A temporal sampling framework for developmental dyslexia. Trends in Cognitive Sciences, 15(1), 3?10.
Gouvea, A., Phillips, C., Kazanina, N., amp; Poeppel, D. (2010). The linguistic processes underlying the P600. Language and Cognitive Processes, 25(2), 149?188.
Gross, J., Hoogenboom, N., Thut, G., Schyns, P., Panzeri, S., Belin, P., amp; Garrod, S. (2013). Speech rhythms and multiplexed oscillatory sensory coding in the human brain. PLoS Biology, 11(12), e1001752. https://doi.org/10.1371/ journal.pbio.1001752
Gwilliams, L., Marantz, A., Poeppel, D., amp; King, J. R. (2024). Hierarchical dynamic coding coordinates speech comprehension in the brain. bioRxiv: The preprint server for biology, 2024.04.19.590280.
Haegens, S. (2020). Entrainment revisited: A commentary on Meyer, Sun, and Martin (2020). Language, Cognition and Neuroscience, 35(9), 1119?1123.
Haegens, S., amp; Zion Golumbic, E. (2018). Rhythmic facilitation of sensory processing: A critical review. Neuroscience amp; Biobehavioral Reviews, 86, 150?165.
Hale, J. T., Campanelli, L., Li, J., Bhattasali, S., Pallier, C., amp; Brennan, J. R. (2022). Neurocomputational models of language processing. Annual Review of Linguistics, 8(1), 427?446.
Henke, L., Lewis, A. G., amp; Meyer, L. (2023). Fast and slow rhythms of naturalistic reading revealed by combined eye-tracking and electroencephalography. Journal of Neuroscience, 43(24), 4461?4469.
Jin, P., Lu, Y., amp; Ding, N. (2020). Low-frequency neural activity reflects rule-based chunking during speech listening. eLife, 9, e55613. https://doi.org/10.7554/eLife. 55613
Jin, P., Zou, J., Zhou, T., amp; Ding, N. (2018). Eye activity tracks task-relevant structures during speech and auditory sequence perception. Nature Communications, 9(1), 5374.
Kandylaki, K. D., amp; Kotz, S. A. (2020). Distinct cortical rhythms in speech and language processing and some more: A commentary on Meyer, Sun, amp; Martin (2019). Language, Cognition and Neuroscience, 35(9), 1124? 1128.
Kaufeld, G., Bosker, H. R., Ten Oever, S., Alday, P. M., Meyer, A. S., amp; Martin, A. E. (2020). Linguistic structure and meaning organize neural oscillations into a content- specific hierarchy. Journal of Neuroscience, 40(49), 9467?9475.
Kaushik, K. R., amp; Martin, A. E. (2022). A mathematical neural process model of language comprehension, from syllable to sentence. PsyArXiv. https://doi.org/10.31234/ osf.io/xs5kr.
Kazanina, N., amp; Tavano, A. (2023). What neural oscillations can and cannot do for syntactic structure building. Nature Reviews Neuroscience, 24(2), 113?128.
Keitel, A., Gross, J., amp; Kayser, C. (2018). Perceptually relevant speech tracking in auditory and motor cortex reflects distinct linguistic features. PLoS Biology, 16(3), e2004473. https://doi.org/10.1371/journal.pbio.2004473
Klimesch, W. (2012). α-band oscillations, attention, and controlled access to stored information. Trends in Cognitive Sciences, 16(12), 606?617.
Klimovich-Gray, A., amp; Molinaro, N. (2020). Synchronising internal and external information: A commentary on Meyer, Sun amp; Martin (2020). Language, Cognition and Neuroscience, 35(9), 1129?1132.
Kuhl, P. K. (2004). Early language acquisition: Cracking the speech code. Nature Reviews. Neuroscience, 5(11), 831?843.
Kutas, M., amp; Federmeier, K. D. (2000). Electrophysiology reveals semantic memory use in language comprehension. Trends in Cognitive Sciences, 4(12), 463?470.
Kutas, M., amp; Federmeier, K. D. (2011). Thirty years and counting: Finding meaning in the N400 component of the event-related brain potential (ERP). Annual Review of Psychology, 62, 621?647.
Lewis, A. G. (2020). Balancing exogenous and endogenous cortical rhythms for speech and language requires a lot of entraining: A commentary on Meyer, Sun amp; Martin (2020). Language, Cognition and Neuroscience, 35(9), 1133?1137.
Lo, C.-W., Tung, T.-Y., Ke, A. H., amp; Brennan, J. R. (2022). Hierarchy, not lexical regularity, modulates low-frequency neural synchrony during language comprehension. Neurobiology of Language, 3(4), 538?555.
Lu, L., Sheng, J., Liu, Z., amp; Gao, J.-H. (2021). Neural representations of imagined speech revealed by frequency- tagged magnetoencephalography responses. NeuroImage, 229, 117724.
Lu, Y., Jin, P., Ding, N., amp; Tian, X. (2023). Delta-band neural tracking primarily reflects rule-based chunking instead of semantic relatedness between words. Cerebral Cortex, 33(8), 4448?4458.
Mai, G., Minett, J. W., amp; Wang, W. S.-Y. (2016). Delta, theta, beta, and gamma brain oscillations index levels of auditory sentence processing. NeuroImage, 133, 516?528.
Marcolli, M., Berwick, R. C., amp; Chomsky, N. (2023a). Old and New Minimalism: A Hopf algebra comparison. arXiv. https://doi.org/10.48550/arXiv.2306.10270
Marcolli, M., Berwick, R. C., amp; Chomsky, N. (2023b). Syntax-semantics interface: An algebraic model. arXiv. https://doi.org/10.48550/arXiv.2311.06189
Marcolli, M., Chomsky, N., amp; Berwick, R. (2023). Mathematical structure of syntactic merge. arXiv. https://doi.org/10.48550/arXiv.2305.18278
Marr, D. (1982). Vision: A computational investigation into the human representation and processing of visual information. W.H. Freeman.
Martin, A. E. (2020). A compositional neural architecture for language. Journal of Cognitive Neuroscience, 32(8), 1407?1427.
Martin, A. E., amp; Doumas, L. A. (2017). A mechanism for the cortical computation of hierarchical linguistic structure. PLoS Biology, 15(3), e2000663. https://doi.org/10.1371/ journal.pbio.2000663
Martins, P. T., amp; Boeckx, C. (2019). Language evolution and complexity considerations: The no half-Merge fallacy. PLoS Biology, 17(11), e3000389. https://doi.org/10.1371/ journal.pbio.3000389
McClamrock, R. (1991). Marr's three levels: A re-evaluation. Minds and Machines, 1, 185?196.
Meyer, L., Lakatos, P., amp; He, Y. (2021). Language dysfunction in Schizophrenia: Assessing neural tracking to characterize the underlying disorder (s)? Frontiers in Neuroscience, 15, 640502.
Meyer, L., Sun, Y., amp; Martin, A. E. (2020a). “Entraining” to speech, generating language? Language, Cognition and Neuroscience, 35(9), 1138?1148.
Meyer, L., Sun, Y., amp; Martin, A. E. (2020b). Synchronous, but not entrained: Exogenous and endogenous cortical rhythms of speech and language processing. Language, Cognition and Neuroscience, 35(9), 1089?1099.
Miller, G. A., Heise, G. A., amp; Lichten, W. (1951). The intelligibility of speech as a function of the context of the test materials. Journal of Experimental Psychology, 41(5), 329?335.
Murphy, E. (2024). ROSE: A neurocomputational architecture for syntax. Journal of Neurolinguistics, 70, 101180.
Nallet, C., amp; Gervain, J. (2021). Neurodevelopmental preparedness for language in the neonatal brain. Annual Review of Developmental Psychology, 3, 41?58.
Obleser, J., amp; Kayser, C. (2019). Neural entrainment and attentional selection in the listening brain. Trends in Cognitive Sciences, 23(11), 913?926.
Pallier, C., Devauchelle, A.-D., amp; Dehaene, S. (2011). Cortical representation of the constituent structure of sentences. Proceedings of the National Academy of Sciences, 108(6), 2522?2527.
Peter, V., Goswami, U., Burnham, D., amp; Kalashnikova, M. (2023). Impaired neural entrainment to low frequency amplitude modulations in English-speaking children with dyslexia or dyslexia and DLD. Brain and Language, 236, 105217.
Poeppel, D. (2012). The maps problem and the mapping problem: Two challenges for a cognitive neuroscience of speech and language. Cognitive Neuropsychology, 29(1?2), 34?55.
Poeppel, D., amp; Assaneo, M. F. (2020). Speech rhythms and their neural foundations. Nature Reviews Neuroscience, 21(6), 322?334.
Poeppel, D., Idsardi, W. J., amp; van Wassenhove, V. (2008). Speech perception at the interface of neurobiology and linguistics. Philosophical Transactions of the Royal Society of London. Series B, Biological Sciences, 363(1493), 1071?1086.
Prystauka, Y., amp; Lewis, A. G. (2019). The power of neural oscillations to inform sentence comprehension: A linguistic perspective. Language and Linguistics Compass, 13(9), e12347. https://doi.org/10.1111/lnc3.12347
Rafferty, M. B., Saltuklaroglu, T., Reilly, K., Paek, E. J., amp; Casenhiser, D. M. (2023). Neural synchrony reflects closure of jabberwocky noun phrases but not predictable pseudoword sequences. The European Journal of Neuroscience, 57(11), 1834?1847.
Si, F. (2016). Paralinguistic features and non-verbal elements in human communication. The 7th International Conference on Formal Linguistics, China, Tianjin.
Seidl, A. (2007). Infants’ use and weighting of prosodic cues in clause segmentation. Journal of Memory and Language, 57(1), 24?48.
Slaats, S., Weissbart, H., Schoffelen, J.-M., Meyer, A. S., amp; Martin, A. E. (2023). Delta-band neural responses to individual words are modulated by sentence processing. Journal of Neuroscience, 43(26), 4867?4883.
Smith, N. J., amp; Levy, R. (2013). The effect of word predictability on reading time is logarithmic. Cognition, 128(3), 302?319.
Steinhauer, K., Alter, K., amp; Friederici, A. D. (1999). Brain potentials indicate immediate use of prosodic cues in natural speech processing. Nature Neuroscience, 2(2), 191?196.
Traxler, M. J. (2014). Trends in syntactic parsing: Anticipation, Bayesian estimation, and good-enough parsing. Trends in Cognitive Sciences, 18(11), 605?611.
Xu, N., Qin, X., Zhou, Z., Shan, W., Ren, J., Yang, C., Lu, L., amp; Wang, Q. (2023). Age differentially modulates the cortical tracking of the lower and higher level linguistic structures during speech comprehension. Cerebral Cortex, 33(19), 10463?10474.
Xu, N., Zhao, B., Luo, L., Zhang, K., Shao, X., Luan, G., Wang, Q., Hu, W., amp; Wang, Q. (2023). Two stages of speech envelope tracking in human auditory cortex modulated by speech intelligibility. Cerebral Cortex, 33(5), 2215?2228.
Neural oscillations: Exploring the temporal dynamics ofsyntactic parsing
QI Ruiying, FENG Ye, SI Fuzhen
(Department of Linguistics/ Lab of Biolinguistics and Brain Sciences,Beijing Language and Culture University, Beijing 100083, China)
Abstract: The mapping problem, which aims to establish correspondences between linguistic phenotypes and neural mechanisms, is a central focus of contemporary research. Within this domain, the neural mechanisms underlying syntactic parsing are particularly challenging, as they involve identifying neural activities corresponding to the processes of syntactic structure construction. This endeavor is crucial for deciphering the enigmas of human linguistic capability. Recent investigations into neural oscillatory activity not only furnish compelling evidence for the “autonomy of syntax” of language functions in the human brain but also illustrate the feasibility of employing neural oscillations to explicate the neural coding activities underpinning syntactic parsing. The theoretical models of syntactic computation within the minimalist framework of theoretical linguistics can be corroborated by experimental research on neural oscillations in neuroscience. Such interdisciplinary studies have the potential to elucidate the temporal dynamics inherent in autonomous syntactic structure building. Future research should focus on four key areas: the fine-grained alignment between neural oscillations and syntactic processing, the mechanisms and biological significance of neural oscillations, the developmental trajectory of neural oscillations during language acquisition in children, and the neurophysiological foundations of language disorders alongside their rehabilitative applications.
Keywords: neural oscillation, language comprehension, syntactic parsing, the minimalist program, incremental conversion
* 教育部人文社會科學研究一般項目“漢語嬰幼兒聲調感知的大腦偏側化模式及其對語言發展的影響” (23YJC740011)、北京語言大學校級科研項目“音樂節奏對漢語發展性語言障礙兒童語法加工的潛在影響及其神經機制研究” (24QN07)、北京語言大學院級科研項目“漢語兒童關系從句的加工模式探究” (23YJ120001)資助。
通信作者:封葉, E-mail: echofy@blcu.edu.cn
1 本文對于“先驗語法知識”的工作定義, 指與后天經驗相對的, 人生來具備的構建句法的知識或能力。這里的“知識”也有別于一般日常生活中所指的通過學習和積累而獲得的知識, 而是指一種由生物遺傳等先天因素所決定的不需要學習就擁有的一種智能。而在其他認知科學語境下先驗的定義略有些許不同, 主要指與后驗知識相對的, 不依賴具體數據而憑借已有的期望與知識進行的數據加工方式, 類似于(但不完全等同)知覺加工方式中的概念驅動加工方式。
[2] 理論語言學歷來存在句法自治與句法涌現之爭。句法自治也稱“句法中心”論, 指句法作為一個相對獨立的模塊與通過接口(interface)與語音、韻律、語義等模塊進行聯系(姜孟, 2009), 即語言層級結構的生成會由于語音、語義等模塊的作用而發生調整, 但其本質上由句法主導; 與句法自治理論相對, 一些學者認為句法并非獨立的模塊, 其結構特征是其他模塊信息或一般認知能力的產物, 是基于用法的涌現(楊烈祥, 2012)。盡管目前實證研究的結果尚不能直接證明任何一方觀點, 但已為先驗語法知識的存在提供了重要證據。
[3] 學界這方面經典的成功實驗案例可參考Chomsky和Moro (2022)中有關“結構依存”的兩組實驗的介紹。
[4] 在討論神經振蕩相關活動時, 不少研究者會以夾帶作用(entrainment)為切入點, 但夾帶作用這個語本身的定義及其機制在很多時刻都并未明晰(Obleser amp; Kayser, 2019)。一些學者對夾帶作用的定義有較為嚴格的限制(Haegens amp; Zion Golumbic, 2018); 而另一些學者則默認夾帶作用概念較為寬泛, 與外在節律有關的追蹤與同步活動都可稱為夾帶作用。 本文旨在將語法知識與其他心理過程進行分離, 而非對概念本身進行討論。因此, 為避免因措辭而產生歧義, 本文于此不援引夾帶作用來指稱相關活動。
[5] David Marr的三分框架存在一定爭議(如McClamrock, 1991)。盡管如此, 它仍是非常經典的對人腦運作機制進行探討的研究框架。
[6] 此處參考審稿專家意見進行補充說明, 感謝匿名評審專家所提出的問題。