岳 源 張清芳,2
(1中國科學院心理研究所, 北京 100101) (2中國人民大學心理學系, 北京 100872)
言語產生是將思想轉化為具體言語的過程。一般認為言語產生包括三種類型的心理過程:首先是概念化過程, 即講話者明確要用言語表達什么概念;第二是言語組織階段, 即為所表達的概念選擇適當的詞匯, 建立詞匯的語法結構和發音結構; 第三是發音階段,即將選擇的詞匯通過一定的肌肉運動程序用外顯的聲音表達出來(Roelofs, 1992)。人類表達語言的過程是非常迅速的, 上述三個過程可以在大約600~700 ms之內完成(Levelt, Roelofs, Meyer,Helenius, & Salmelin, 1998)。言語組織階段是口語產生中的核心, 又被稱之為詞匯通達, 包括了兩個階段:詞條選擇和單詞形式編碼。單詞形式編碼過程可進一步細分為詞素音位編碼、音韻編碼和語音編碼三個過程。在詞素音位編碼過程, 講話者根據詞條選擇階段所得到的詞匯選擇相應的詞素及其句法特征。在音韻編碼過程, 根據詞素選擇音段和節律結構, 并進行音節化, 將音段與節律結構中的音節節點聯系起來。在語音編碼過程選擇音節程序節點為發音做好準備(Dell, 1986; Roelofs, 1997; Levelt,Roelofs, & Meyer, 1999)。音韻編碼的單元和加工方式一直是言語產生研究的爭論焦點之一。
口語產生的兩大理論模型對于音韻編碼的單元和加工方式提出了不同的看法。Dell (1986, 1988)根據語誤分析的結果提出的單詞形式編碼模型認為:音韻編碼的單元包括了音素、音節、音節的組成成分及其語音特征。音韻編碼過程中音節的組成部分(首音、核心元音和尾音)同時得到激活后被插入音節框架結構。當一個詞素包含多個音節時, 音節的加工是從左至右序列進行的。對于單個音節內部的編碼方式, Dell未提出任何具體的假設。Roelofs(1997)提出的 WEAVER (Word-form Encoding by Activation and VERification)模型是目前為止最為詳細的單詞形式編碼模型。在該模型框架中, 音韻編碼的單元是音素, 單個音節內部的音韻編碼是一個增長式的編碼過程, 從音節的首音開始到核心元音最后到尾音(Levelt et al., 1999)。關于音韻編碼的單元和加工方式, 兩類模型之間存在激烈爭論。Dell認為音韻編碼的單元可以是音節或音素, 音節內部的音素可以同時被激活并插入音節框架; 而 Levelt等認為音韻編碼的單元是音素, 音素以序列的方式從左至右被插入音節框架。
已有研究對于“音節是否是單詞形式編碼單元”的爭論尤為激烈, 不同語言的研究對此問題也難以達成共識。已有研究在法語(Ferrand, Segui, &Grianger, 1996)和英語(Ferrand, Segui, & Humphreys,1997)口語詞匯的產生中都發現了音節啟動效應,表明音節是口語產生的功能單元。Schiller (1998,2000)利用相同的實驗范式考察了荷蘭語和英語中音節和音段的作用, 發現的卻是音段重疊效應, 表明音段是口語產生中的功能單元, 得到了與 Ferrand等不一致的結果。根據上述結果, 研究者指出口語產生中音韻編碼的單元與語言特點有關, 很多研究者認為在法語語言產生中, 音韻編碼單元更有可能是音節。盡管如此, 也有研究結果與此假設相矛盾, 例如, 在法語非詞命名中未發現音節啟動效應(Mehler,Dommergues, Frauenfelder, & Segui, 1981), 因此研究者認為法語或許不是探測音節作用最適合的語言。根據Levelt等的觀點, 重新音節化現象是他們認為不存在存儲音節的主要原因, 畢竟在法語中也存在一些模糊音節和重新音節化現象。漢語作為一種非字母語言, 在音節結構上與法語類似, 但在口語產生過程中不存在模糊音節和重新音節化現象,這對探測音節和音段的作用非常有幫助。
最近, 漢語口語詞匯產生中單詞形式編碼單元是音節還是音段的爭論尤為引人注目。Chen, Chen和Dell (2002)利用內隱啟動范式探索漢語雙音節詞匯產生中的音韻編碼階段, 發現無聲調的音節在音韻水平上能作為一個獨立的計劃單元, 聲調的作用則類似于字母語言中的重音和節律結構。Chen, Lin和 Ferrand (2003)利用掩蔽啟動范式得到了同樣的結果。張清芳和楊玉芳(2005)利用圖畫-詞匯干擾實驗范式探索了音韻編碼過程的單元, 結果僅發現了音節或音節與聲調的結合是音韻編碼的單元, 而音素相關(首音、韻母或“韻母+聲調”的結合)不能對圖畫命名產生顯著的促進效應。Chen (2000)分析語誤語料庫發現音節交換錯誤的發生率顯著高于音段交換錯誤, 表明音節在口語產生中的重要性高于音段。You, Zhang和Verdonschot (2012)利用圖畫命名和單詞命名兩種任務均發現了音節啟動效應, 為漢語口語中音節是音韻編碼單元提供了更強的證據。與此結果相對的是, 有一些研究發現了粵語口語產生中音段的促進效應。Wong和 Chen (2008,2009)采用圖畫-詞匯干擾范式, 在粵語中發現當干擾詞與目標詞的韻母和聲調相同時, 圖畫命名顯著快于無關條件, 因此他們認為, 粵語口語產生中的音韻編碼單元可能是音段(Segments) (多個音素結合形成的一個單元, 其音素個數少于音節)。Wong,Huang和 Chen (2012)采用內隱啟動范式得到了類似的結果。Qu, Damian和Kazanina (2012)采用首音素重復范式, 在行為結果上未發現啟動效應, 但是在事件相關電位的指標上發現了首音素重復條件下的波幅與非重復條件下存在顯著差異。這些研究表明音段信息在漢語口語產生中似乎也起了一定作用。
為了解釋已有研究結果之間的不一致,O′Seaghdha, Chen和Chen (2010)提出了合適單元假設(Proximate unit Principle)來解釋漢語口語詞匯產生中的單詞形式編碼過程(如圖1所示)。這一假設認為音韻編碼單元中最先選擇的單元存在語言上的差異, 印歐語系語言如英語或荷蘭語中最先選擇的單元是音素, 而在漢語中則為音節。在印歐語系語言中, 講話者在選擇音素后, 結合節律信息進行音節化過程, 從心理音節表中提取音節準備發音運動程序。漢語口語產生中講話者則在選擇音節后進一步分解為音素或音段信息(音韻編碼階段), 準備發音運動程序(語音編碼過程), 最后進行發音輸出口語產生的結果(發音階段)。“合適單元”假設對于印歐語言的單詞形式編碼過程的闡述是符合WEAVER模型的觀點的。從上述假設可以看到, 在印歐語言中首先提取音素再從心理音節表中提取音節, 而在漢語中是先提取音節再分解成音段(或音素)。

圖1 O′Seaghdha等(2010)提出的漢語單音節詞匯產生的示意圖
目前尚未有研究直接探測漢語普通話口語產生中音節或音段起作用的認知機制, 漢語中認為“音段是音韻編碼單元”的發現均來自對粵語口語產生過程的探索(Wong & Chen, 2008, 2009; Wong et al.,2012)。Wong等(2012)的研究(p.6)中認為粵語的口語產生可能與漢語普通話存在差異, 這是因為粵語的音韻體系比漢語普通話復雜:例如, 普通話中僅有兩種尾音/n/和/ng/, 而粵語中包含六種尾音/p/,/t/, /k/, /m/, /n/和/ng/, 而且/ng/在粵語中還可以作為首音出現。粵語中包括了6個聲調, 而普通話中僅包括4種聲調。總結上述研究發現, 粵語口語詞匯產生中的音段促進效應是在圖畫詞匯干擾范式和內隱啟動范式中發現的, 而音節效應是在圖畫詞匯干擾任務、內隱啟動范式或者掩蔽啟動任務中發現的。基于上述比較, 我們認為圖畫-詞匯干擾實驗范式對音段啟動效應更為敏感, 且圖畫命名任務是典型的口語產生任務, 包括了口語產生的完整過程,因此在本研究中我們采用這一經典范式探索音節和音段效應的認知機制。
口語產生中的單詞形式編碼過程中涉及到語音信息的加工, 包括了音韻編碼和語音編碼。依據合適單元假設, 在漢語口語產生的音韻編碼過程中,講話者提取音節后分解成音素或音段, 然后在語音編碼階段準備音素或音段的運動程序, 最后在發音階段輸出目標詞。音節效應和音段效應可能出現在口語產生中的單詞形式編碼過程的哪一個階段, 目前的研究都未對此進行考察(Levelt et al., 1999;O′Seaghdha et al., 2010)。基于已有研究, 本研究的目的是考察漢語普通話口語產生過程中音節效應和音段效應產生在哪個階段。實驗 1采取了圖畫-詞匯干擾實驗任務, 要求被試在看到圖畫和干擾字時, 忽略干擾字, 盡可能準確和迅速地說出圖畫的名稱。這是一個即時命名任務, 包括了口語產生的所有過程, 從概念準備、詞匯選擇、單詞形式編碼(音韻編碼和語音編碼)到最后的發音階段。實驗 2采取了圖畫-詞匯干擾范式與延遲命名結合的任務,要求被試看到圖畫后不能立刻進行命名, 而是要做好命名的準備, 在看到提示命名信號出現后盡快說出圖畫名稱, 此時被試已經完成了發聲前的所有準備, 即被試已經完成了概念準備、詞匯選擇、單詞形式編碼中的音韻編碼和語音編碼階段的加工。在提示線索出現時, 被試只要立即開始執行發音程序即可, 反應時僅反映了發音階段的加工特點。實驗3采取了圖畫-詞匯干擾任務與延遲命名和發音抑制任務的結合, 即在延遲命名的同時要求被試完成一個發聲抑制任務, 在等待命名信號出現的過程中要求被試重復發出某個指定的特定語音或者數數,這會影響被試短時記憶中的操作, 使得被試不能進行語音編碼階段的加工(Baddeley, Lewis, & Vallar,1984)。因此在這一任務中當命名信號出現時, 被試完成了概念準備、詞匯選擇和單詞形式編碼中的音韻編碼過程。命名信號出現時, 被試需要進行語音編碼, 再進行發音, 所記錄的反應時中包括了語音編碼和發音兩個階段。通過比較三個實驗中是否出現音節效應或音段效應, 可以推測這些效應發生在口語產生中單詞形式編碼(音韻編碼或者語音編碼)還是最后的發音輸出階段。
2.1.1 被試
24名大學生和研究生(13名男性), 年齡19歲到25歲, 北方人, 普通話標準, 視力或矯正視力正常, 聽力正常。實驗后獲得一定報酬。
2.1.2 材料
27幅黑白線條圖片, 選自張清芳和楊玉芳(2003)建立的漢語圖片命名的圖片庫。用于正式實驗的圖片為18幅, 填充圖片9幅。圖片名稱均為單音節詞, 每幅圖片與4種類型的干擾字匹配。例如,圖片名稱為“鈴” (/ling2/), 分別與 1)音節相關字“另” (/ling4/), 與目標圖片名稱音節完全相同, 聲調不同; 2)首音段相關字“烈” (/lie4/), 與目標圖片名稱的第一個輔音和第一個元音相同, 聲調不同,即與目標圖片名稱的頭兩個音素相同(CV相關, C表示輔音Consonant, V表示元音Vowel); 3)韻相關字“鼎” (/ding3/), 與目標圖片名稱的元音和結尾的輔音相同, 音調不同, 即與目標圖片的韻相同(VC相關); 4)無關字“泡” (/pao4/), 與目標圖沒有語音重合。4種條件下干擾字的字頻(王還, 劉杰, 常保儒, 1986)和筆畫數匹配, 統計結果無顯著差異, 字頻:F
(3,68) = 0.001,p
= 1.00; 筆畫數:F
(3,68) = 0.130,p
= 0.97。實驗材料及其字頻和筆畫數見附錄1。在Wong和Chen (2009)的研究中, 3/4的測試次中干擾字與圖畫名稱之間存在語音相關, 僅有 1/4為無關條件, 被試更有可能覺察到語音相關條件從而影響到實驗結果。因此實驗1增加了9幅圖片作為填充材料, 分別搭配 4個不同的無關干擾字, 與圖片在語義、字形和語音上不相關, 被試接受的測試中干擾字與圖畫名稱語音相關和無關試次各占一半。
2.1.3 設計
單因素被試內設計, 自變量為“圖片名稱與干擾字之間的關系”, 包括了 4個水平(音節相關, 首音段相關, 韻相關和無關)。各試次以偽隨機方式呈現, 相同圖片至少間隔2幅其它圖片。首音段相同、韻相同或音節相同的干擾字不會連續呈現。每一名被試完成的試次順序不同。
2.1.4 實驗儀器
E-Prime 編寫的程序, PST SRBOX反應盒, 麥克風和計算機。圖片都呈現在PIII-667計算機屏幕中央。被試的反應通過 PSTSR-BOX連接的麥克風記錄。實驗材料的呈現、計時及被試反應時的收集由電腦過程控制。主試記錄被試的反應正確與否。
2.1.5 程序
在正式實驗開始之前, 在屏幕中央依次呈現每幅圖片及圖片對應的名稱3 s, 共27幅圖片, 包括18幅目標圖片和9幅填充圖片。告訴被試下面的正式實驗會呈現這些圖片, 要求被試記住圖片及其對應的名稱。如果被試對某一幅圖片的命名出現錯誤時進行糾正, 并強調要記住圖片下方呈現的目標名稱。一般來說, 因為這些圖片都是日常生活中常見的命名一致性很好的圖片, 被試對圖片的命名與程序中給出的名稱是一致的。
正式實驗時, 首先呈現注視點500 ms, 然后空屏300 ms, 接著同時呈現圖畫和干擾詞。圖片經過標準化形成大小為6 cm × 6 cm的圖片并呈現在屏幕中央, 干擾字采用25號宋體, 呈現在圖片中央。被試的任務是忽略出現的詞語, 盡可能準確而迅速地說出圖畫的名字。被試做出反應的同時圖片和干擾字消失, 呈現主試判斷正誤的提示符號。主試按鍵判斷后, 間隔1000 ms后開始下一次測試。計算機記錄被試的反應時間, 主試記錄被試的命名并判斷正確與否。正式實驗前有4次練習, 使被試熟悉實驗任務。正式實驗包含填充材料在內, 共有 108個試次。整個實驗的完成大約需要15 min。
刪除命名錯誤的數據(1.60%), 其它聲音比如“嗯”或“啊”引起的反應(1.70%), 以及偏離平均值2.5個標準差以外的數據(2.08%)。

表1 不同干擾條件下的平均反應時(ms)和錯誤率(%)
表1第一部分所示為實驗1中4種不同條件下被試的平均命名反應時。利用R分析軟件(2013)進行混合線性模型擬合分析, 結果表明擬合最優的模型包括了干擾詞類型這一因素。進一步的比較發現,音節相關條件下的反應時顯著快于無關條件,t
(1609) = -7.60,p
= 0.001; 首音段相關條件反應時顯著快于無關條件,t
(1609) = -2.70,p
= 0.007; 韻相關條件下反應時顯著快于無關條件,t
(1609) = -2.07,p
= 0.043。我們進一步采用效果量Cohend
評估了各相關條件與無關條件下平均數差異的效果量大小。Cohend
值是衡量統計檢驗效果大小(效應量)的指標之一, 效果量是表示實驗效應強度或者變量關聯強度的指標(Snyder & Lawson, 1993), 它不受樣本容量大小的影響(或者影響較小) (鄭昊敏, 溫忠麟, 吳艷, 2011)。0.2 < Cohend
< 0.5 表示效果量大小弱, 0.5 < Cohend
< 0.8 表示效果量大小中等, Cohend
> 0.8表示效果量大小強(Cohen, 1988)。4種條件下的錯誤率都很低, 因此未對錯誤率進行分析。采用圖畫-詞匯干擾實驗范式, 實驗 1發現了音節促進效應和音段促進效應(首音段相關和韻相關), 而且音節相關條件下產生的促進效應量顯著地大于音段相關條件。與Wong和Chen (2009)的實驗結果類似, 實驗1發現了首音段和韻相關條件下的語音促進效應, 表明對音段的準備促進了口語產生過程。Wong等的實驗中三種相關條件所產生的效應量無顯著差異, 他們認為音節與音段促進效應都發生在音韻編碼階段。與Wong的實驗結果不同,實驗1發現音節相關條件下的效應量與音段相關條件下的效應量之間差異顯著(p < 0.05), 而且效果量Cohen d值的評估表明, 音節促進效應是一個可靠的強效應, 而首音段促進效應和韻相關促進效應的效果量Cohen d值很小, 這提示我們音節和音段促進效應的產生機制可能存在差異。
根據O′Seaghdha等(2010)提出的漢語口語產生模型(如圖1所示), 音節是詞匯選擇階段之后最先選擇的單元, 之后音節分解為音段進行編碼為發音做好準備。根據其假設, 音段促進效應可以發生在音韻編碼階段中的音節提取之后, 亦可發生在語音編碼或發音階段。語音編碼的主要任務是編碼運動程序, 發音階段執行準備好的語音運動程序, 輸出口語產生的結果。實驗2和3的主要目的是考察圖畫-詞匯干擾實驗范式中音段效應的發生階段。
延遲命名任務中, 被試在看到圖片時不能立即說出圖片名稱, 而是要等到反應提示出現時才能命名圖片。由于在發聲前有足夠長的延遲, 且要求被試在看到提示線索后盡快命名, 當提示線索出現時,被試已經完成了音韻編碼和語音編碼過程, 只需要執行發音程序即可, 因此所記錄到的反應時反映了發音階段的特點(Levelt et al., 1999; Laganaro &Alario, 2006)。如果在延遲命名中發現了音節或音段促進效應, 表明實驗1中的效應可能發生在最后的發音階段(Laganaro & Alario, 2006)。實驗結果的另一種可能性是:實驗1中發現的促進效應發生在音韻編碼階段, 在延遲命名任務中不會發現促進效應; 抑或發現抑制效應, 因為對干擾詞的發音準備可能對目標詞的發音產生干擾(Mahon, Costa, Peterson,Vargas, & Caramazza, 2007)。
3.1.1 被試
24名大學生和研究生(3名男性), 年齡19歲到28歲。與實驗1中的被試來自同一群體, 且沒有參加過實驗1。實驗后支付一定報酬。
3.1.2 材料、設計、儀器
與實驗1相同。
3.1.3 程序
實驗時, 首先呈現 500 ms的注視點(+), 注視點消失后呈現空白屏 300 ms, 之后屏幕中央同時呈現目標圖片及干擾字 600 ms, 接著呈現空白屏幕, 其呈現時間在600 ms到1000 ms之間隨機, 目的是防止對被試對反應提示的出現有所準備; 空白屏幕后呈現紅色嘆號, 要求被試在看到這一提示符號后盡可能正確而迅速地說出圖畫名稱。在正式實驗開始前有4次練習, 被試熟悉整個實驗流程。程序其它部分與實驗1完全相同。
刪除提前反應的試次 53個(0.03%), 刪除 2.5個標準差以外的試次56個(0.03%)。
表1的第二部分表示了延遲命名中4種不同條件下被試的平均反應時、平均錯誤率以及Cohen d值。混合線性模型擬合分析發現最優模型中包括了干擾詞的類型這一自變量。進一步分析發現, 音節相關條件下反應時顯著慢于無關條件, t(1617) =2.03, p = 0.042。首音段相關條件與無關條件反應時沒有顯著差異, t(1617) = 1.01, p = 0.310。韻相關條件下被試反應顯著慢于無關條件, t(1617) = 3.34, p =0.0006。4種條件下的錯誤率都很低, 因此未對錯誤率進行分析。
實驗 2發現, 與無關條件相比, 圖畫與名稱之間存在韻或音節相關時, 對干擾詞的發音準備會對目標名稱的發音產生抑制作用, 表明目標詞和干擾詞之間韻或音節的重疊阻礙了目標詞口語產生中的發聲執行過程。值得注意的是, 實驗2發現的是抑制效應, 而非實驗 1觀察到的促進效應。實驗 1和實驗2的結果表明音節或音段相關在音韻編碼階段和發音階段產生了不同的效應。
實驗2發現了韻相關產生的抑制效應量大于音節相關, 但兩者之間的差異未達到顯著差異的水平。在音節相關條件下, 也存在目標詞與干擾詞在韻上的重合, 我們猜測音節相關條件下的抑制效應可能是由于韻相關引起的。首音段相關條件與無關條件相比未達到顯著差異, 這可能是由于被試對韻相關信息可能更為敏感引起的, 對干擾詞韻相關信息的準備阻礙了目標詞的發聲。Wong和Chen (2008)的研究中發現了干擾詞和目標詞共享韻母和聲調時產生了促進效應, 而未發現首音段和聲調重合時的促進效應, 這表明粵語被試對韻相關的信息更為敏感。在對韻信息比對首音段信息更為敏感這一點上, 我們的發現與 Wong和 Chen (2008)的發現一致。效果量大小Cohen d值表明音節抑制和音段抑制效果量都很弱。
為了進一步確定實驗1中發現的音段促進效應是否發生在口語產生中的語音編碼階段, 實驗3采取了圖畫命名與延時命名和發音抑制相結合的任務, 在等待命名信號出現的過程中要求被試重復發出某個指定的特定語音或者數數, 這會影響被試短時記憶中的操作, 使得被試不能進行語音編碼階段的加工(Baddeley et al., 1984)。當提示線索出現時,要求被試說出目標圖畫的名稱。已有研究表明延時命名和發音抑制任務的結合可以探測口語產生中的語音編碼和發音階段的特點(Laganaro & Alario,2006; Wheeldon & Levelt, 1995)。如果在延遲命名和發音抑制結合的任務中發現了音段促進效應, 表明實驗1中的效應可能發生語音編碼階段。與實驗2類似, 實驗結果的另一種可能性是:實驗 1中發現的促進效應發生在音韻編碼階段, 在延遲命名任務中不會發現促進效應; 抑或發現抑制效應, 因為對干擾詞的發音準備可能對目標詞的發音產生干擾。
4.1.1 被試
30名大學生和研究生(7名男性), 年齡19歲到25歲, 與實驗1和2來自同一群體。均未參加過實驗1和2, 實驗后支付一定報酬。
4.1.2 材料、設計、儀器
與實驗2相同。
4.1.3 程序
實驗程序與實驗2基本相同, 只是從目標圖片呈現開始, 要求被試立刻開始不停重復說“1”直到反應提示符號(紅色嘆號)出現時, 立即停止發聲任務, 然后盡量準確而迅速的說出之前所呈現目標圖片的名稱。
實驗中被試所犯錯誤極少, 多數錯誤為被試在看到反應提示時不能立刻停止發聲而造成的錯誤記錄, 包含標準差 2.5個標準差以外的極值數據,共刪除數據98個, 占總數據4.5%。
表1第三部分所示為實驗3中4種不同條件下被試的平均反應時、平均錯誤率和效果量Cohen d值。利用R分析軟件對反應時數據進行混合線性模型擬合分析, 最優的模型包括了干擾類型因素。進一步分析發現, 音節相關條件與無關條件之間無顯著差異, t(2061) = 1.37, p = 0.171。首音段相關條件下反應時顯著慢于無關條件, t(2061) = 2.37, p =0.021。韻相關條件下反應時顯著慢于無關條件,t(2061) = 2.13, p = 0.037。效果量Cohen d的評估表明音節相關、首音段相關和韻相關的抑制效應量均很弱。
實驗3發現, 當圖片名稱與干擾字的首音段或韻相同時, 反應時顯著慢于無關條件下圖片命名的反應時, 出現了首音段和韻相關的抑制效應, 其效果量Cohen d值弱。另一方面, 音節相關條件與無關條件相比僅有 10ms的差異, 其效果量 Cohen d值小于音段相關條件。實驗3的反應時中包含了語音編碼和發音階段, 而實驗2中的反應時只包含發音階段, 實驗3中發現了首音段抑制效應而實驗2未出現這一效應, 這表明首音段所產生的效應可能發生在語音編碼階段(Levelt et al., 1999; Laganaro& Alario, 2006)。實驗2和實驗3均包含發音階段,且都發現了韻的抑制效應且效應量大小相當, 表明韻的抑制效應可能發生于發音階段(Laganaro &Alario, 2006; Mahon et al., 2007)。
采用圖畫-詞匯干擾實驗范式, 通過比較即時命名、延遲命名以及延遲命名與發音抑制任務的結合, 我們考察了漢語口語產生中音節和音段在單詞形式編碼的不同階段所產生的不同效應。主要發現包括:在包含有音韻編碼、語音編碼和發音階段的即時命名中, 發現了音節的促進效應以及首音段和尾音段的促進效應; 在僅包含發音階段的延遲命名任務中, 發現了音段抑制效應和音節的抑制效應;在包含有語音編碼和發音階段的延遲命名和發音抑制結合的任務中, 發現了首音段相關和韻相關的抑制效應。上述結果綜合表明:在口語詞匯產生的單詞形式編碼過程中, 音節和音段促進效應發生在音韻編碼階段, 而音節和音段的抑制效應發生在語音編碼和發音階段。效果量大小(Cohen d)的分析表明, 音節的促進效應是可靠的強效應, 而其它差異的效果量均較弱。不同的認知階段, 音節和音段起作用的方式可能存在不同。我們第一次在漢語普通話中發現了音段促進效應、音節和音段的抑制效應,更為重要的是, 我們確定了音節和音段促進效應在口語產生過程中的發生階段。下面將在O′Seaghdha等(2010)提出的漢語口語產生的單詞形式編碼模型的框架中討論本研究的實驗結果。
音節的促進效應與抑制效應。根據O′Seaghdha等(2010)提出的漢語口語產生中單詞形式編碼模型(如圖1所示)的合適單元假設, 在漢語的口語產生中, 音節(與目標詞的聲調不同)是合適的單元, 且音節的促進效應來自于對音韻信息的事先提取; 另一方面, 與目標詞不同聲調的干擾字在語音編碼階段不能對發音產生促進效應。與此假設一致, 我們在實驗1發現了音節的促進效應, 即對干擾詞的音節準備促進了目標詞的產生, 該效應發生在音韻編碼階段(張清芳, 楊玉芳, 2005; 張清芳, 2008; Chen et al., 2002; O′Seaghdha et al., 2010; Wong et al.,2012); 同時, 我們在語音編碼和發音階段發現了干擾詞與目標詞音節相關時的抑制效應。這些發現表明音節的促進效應確實發生在音韻編碼階段, 而非語音編碼或者發音階段。
音段的促進效應與抑制效應。根據O′Seaghdha等(2010)提出的合適單元假設, 在提取音節后分解成首音、韻等音段信息, 與節律信息(包括聲調和音節結構等)結合, 進行語音編碼為發音做好準備。實驗1發現的音段促進效應為此提供了支持證據, 表明在漢語口語產生過程中干擾字和目標名稱之間存在音段相關時, 音段信息對目標名稱的命名產生了促進效應(Wong & Chen, 2008, 2009; Wong et al.,2012)。同時, 實驗2和3發現的音段抑制效應則從相反的角度證實了:音段促進效應發生在音韻編碼階段, 而非語音編碼和發音階段。
比較音節和音段在不同任務中的效應, 我們發現:音節信息和音段信息在音韻編碼和語音編碼、發音階段產生了不同方向的效應。音節相同而聲調不同時在語音編碼和發音階段不能產生促進效應,這表明在口語產生的這兩個階段, 講話者是綜合考慮音段信息和節律信息(如聲調和音節結構)對發音進行準備。在口語產生中的語音編碼和發音兩個階段, 提供部分信息不能產生促進效應, 反而會阻礙口語產生結果的輸出。另一方面, 在音韻編碼階段,音節的效果量Cohen d值大; 相比而言, 在語音編碼和發音階段, 音段相關的效果量Cohen d值大于音節相關的效果量, 這表明在音韻編碼階段音節的作用大于音段, 而在語音編碼和發音階段, 音段的作用大于音節。在音韻編碼階段需要從心理詞典中首先提取整體音節, 之后再分解為音段, 因此音節效應強于音段效應(O’Seaghdha et al., 2010); 在語音編碼和發音階段, 被試需要根據音段信息而非音節信息來進行發音運動程序的準備, 因此音段相關的效應顯著。
在口語產生研究領域, 一些研究者提出了前運動(Pre-motor)和運動加工過程的分離假設(Eickhoff,Heim, Zilles, & Amunts, 2009; Hickok & Poeppel,2007), 該假設認為對詞匯表征的準備與其執行過程是獨立的。音韻編碼過程是對詞匯音韻表征的提取, 屬于詞匯表征的準備過程, 而語音編碼和發音過程則屬于對運動執行過程的準備。與此觀點一致,我們的結果發現了音節和音段信息的準備效應與隨后運動執行過程中所產生的效應方向不同, 支持了前運動過程與運動執行過程分離的假設。需要注意的是, 實驗2和3中效果量的Cohen d值都較小,表明無論是音節還是音段在語音編碼和發音執行階段所起作用都較小, 這有可能是由于圖畫-詞匯干擾實驗范式與延遲命名和發音抑制的結合任務是一個程序上相對較為復雜的任務, 對音節或音段的作用不夠敏感, 進一步的研究可以采用掩蔽啟動范式或者是重復啟動范式與發音抑制任務的結合來探測音節和音段在運動執行階段的作用。研究者更進一步提出需要整合心理語言學和運動控制的研究方法來考察口語產生過程中詞匯準備和運動執行過程之間的關系(Hickok, 2012, 2014; Roelofs, 2014)。
計算和報告效果量不僅能夠區分統計顯著性和實際顯著性(Kirk, 1996), 而且可以通過元分析方法比較同一效應在不同研究中的實驗結果(Hunter & Schmidt, 1990)來估計統計檢驗力(Cohen,1988)。根據已有文獻的報告數據(Wong & Chen,2008, 2009; Wong et al., 2012), 我們計算了Wong等研究中所得到的音節效應和音段效應的效果量Cohen d值。如表2所示, 音節效應的Cohen d均大于0.8, 效果量強, 而韻促進效應的Cohen d值均較小, 效果量很弱。本研究實驗1所發現的音節促進效應與音段促進效應的 Cohen d值與已有研究相當。綜合本研究以及已有研究的統計檢驗效果量Cohen d值的分析表明:音節確實在音韻編碼中扮演了重要角色, 而音段(首音和韻)的促進效應雖然在統計上顯著, 但效果量Cohen d值很小, 表明音段在漢語口語詞匯產生中音韻編碼階段的作用可能相對較弱, 或者難以探測到。已有研究(Qu et al.,2012; Wong & Chen, 2008, 2009; Wong et al., 2012)所得出“音段可能是在漢語口語產生中音韻編碼單元”的結論需要謹慎對待, 關于音段在口語產生中的作用及其機制需要進一步探索。

表2 粵語口語產生研究中的效果量Cohen d值
綜上, 采用經典的圖畫-詞匯干擾實驗范式以及其與延遲命名和發音抑制任務的結合, 研究發現了音節和音段促進效應, 這些效應發生在口語產生中的音韻編碼階段; 在圖畫命名與延遲命名以及其與發音抑制結合的任務中發現了音節和音段抑制效應, 這些抑制效應可能發生在口語產生中的語音編碼或發音階段。音節和音段在音韻編碼、語音編碼和發音階段的效應方向不同, 出現了分離的模式:在音韻編碼階段, 音節的促進效應強而音段的促進效應弱, 因此音節更可能是音韻編碼過程加工的合適單元, 為合適單元假設提供了支持證據; 在語音編碼和發音階段, 音段的效應強而音節的效應弱, 這表明音段在運動執行過程可能起了相對重要的作用, 支持了口語產生中詞匯表征準備階段與運動階段分離的觀點。關于音段在口語產生中的作用及其機制需要進一步探索。
Baddeley, A. D., Lewis, V., & Vallar, G. (1984). Exploring the articulatory loop.Quarterly Journal of Experimental Psychology, 36A
, 233-252.Chen, J.-Y. (2000). Syllable errors from naturalistic slips of the tongue in Mandarin Chinese.Psychologia: An International Journal of Psychology in the Orient,43
(1), 15-26.Chen, J.-Y., Lin, W.-C., & Ferrand, L. (2003). Masked priming of the syllable in Mandarin Chinese speech production.Chinese Journal of Psychology, 45
(1), 107-120.Chen, J.-Y., Chen, T.-M., & Dell, G. S. (2002). Word-Form encoding in Mandarin Chinese as assessed by the implicit priming task.Journal of Memory and Language, 46
(4),751-781.Cohen, J. (1988).Statistical power analysis for the behavioral sciences
(2nd ed.). Hillsdale, NJ: Erlbaum.Dell, G. S. (1986). A spreading-activation theory of retrieval in sentence production.Psychological Review, 93
(3), 283-321.Dell, G. S. (1988). The retrieval of phonological forms in prodution: Tests of predictions from a connectionist model.Journal of Memory and Language, 27
, 124-142.Eickhoff, S. B., Heim, S., Zilles, K., & Amunts, K. (2009). A systems perspective on the effective connectivity of overt speech production.Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences,367
(1896), 2399-2421.Ferrand, L., Segui, J., & Grainger, J. (1996). Masked priming of word and picture naming: The role of syllabic units.Journal of Memory and Language, 35
(5), 708-723.Ferrand, L., Segui, J., & Humphreys, G. W. (1997). The syllable’s role in word naming.Memory & Cognition, 25
(4),458-470.Hickok, G. (2012). Computational neuroanatomy of speech production.Nature Reviews Neuroscience, 13
, 135-145.Hickok, G. (2014). The architecture of speech production and the role of the phoneme in speech processing.Language,Cognition and Neuroscience, 29
(1), 2-20.Hickok, G., & Poeppel, D. (2007). The cortical organization of speech processing.Nature Reviews Neuroscience, 8
(5),393-402.Hunter, J. E., & Schmidt, F. L. (1990).Methods of meta-analysis:Correcting error and bias in research findings
. Newbury Park, CA: Sage.Kirk, R. E. (1996). Practical significance: A concept whose time has come.Educational and Psychological Measurement,56
(5), 746-759.Laganaro, M., & Alario, F. (2006). On the locus of the syllable frequency effect in speech production.Journal of Memory and Language, 55
(2), 178-196.Levelt, W. J. M., Roelofs, A., & Meyer, A. S. (1999). A theory of lexical access in speech production.Behaviroal and Brain Sciences,22
, 1-75.Levelt, W. J. M., Roelofs, A., Meyer, A. S., Helenius, P., &Salmelin, R. (1998). An MEG study of picture naming.Journal of Cognitive Neuroscience, 10
(5), 553-567Mahon, B. Z., Costa, A., Peterson, R., Vargas, K. A., &Caramazza, A. (2007). Lexical selection is not by competition:A reinterpretation of semantic interference and facilitation effects in the picture-word interference paradigm.Journal of Experimental Psychology: Learning, Memory, and Cognition, 33
, 503-535.Mehler, J., Dommergues, J. Y., Frauenfelder, U., & Segui, J.(1981). The syllable's role in speech segmentation.Journal of Verbal Learning and Verbal Behavior, 20
(3), 298-305.O'Seaghdha, P. G., Chen, J. -Y., & Chen, T. -M. (2010). Proximate units in word production: Phonological encoding begins with syllables in Mandarin Chinese but with segments in English.Cognition, 115
(2), 282-302.Qu, Q., Damian, M. F., & Kazanina, N. (2012). Sound-sized segments are significant for Mandarin speakers.Proceeding of the National Acadamy of Science of the United States of America, 109
(35), 14265-14270.R Core Team. (2013).R: A Language and Environment for Statistical Coputing
. R Foundation for Stastical Computing,Vienna, Austria, www.R-project.org.Roelofs, A. (1992). A spreading-activation theory of lemma retrieval in speaking.Cognition, 42
, 107-142.Roelofs, A. (1997). The WEAVER model of word-form encoding in speech production.Cognition, 64
(3), 249-284.Roelofs, A. (2014). Integrating psycholinguistic and motor control approaches to speech production: Where do they meet?Language, Cognition and Neurosicence, 29
(1), 35-37.Schiller, N. O. (1998). The effect of visually masked syllable primes on the naming latencies of words and pictures.Journal of Memory and Language, 39
(3), 484-507.Schiller, N. O. (2000). Single word production in English: The role of subsyllabic units during phonological encoding.Journal of Experimental Psychology: Learning, Memory,and Cognition, 26
(2), 512-528.Snyder, P., & Lawson, S. (1993). Evaluating results using corrected and uncorrected effect size estimates.Journal of Experimental Education,61
, 334-349.Wang, H., Liu, J., & Chang, B. R. (1986).Modern Chinese frequency dictionary
. Beijing, China: Beijing Language Institute Publisher.[王還, 劉杰, 常寶儒. (1986).現代漢語頻率詞典
. 北京: 北京語言出版社.]Wheeldon, L. R., & Levelt, W. J. M. (1995). Monitoring the time course of phonological encoding.Journal of Memory and Language, 34
(3), 311-334.Wong, A. W., & Chen, H. -C. (2008). Processing segmental and prosodic information in Cantonese word production.Journal of Experimental Psychology: Learning, Memory,and Cogntion, 34
(5), 1172-1190.Wong, A. W., & Chen, H. -C. (2009). What are effective phonological units in Cantonese spoken word planning?.Psychonomic Bulletin & Review, 16
(5), 888-892.Wong, A. W., Huang, J., & Chen, H. -C. (2012). Phonological units in spoken word production: Insights from Cantonese.PloS One, 7
(11), e48776.You, W. P., Zhang, Q. F., & Verdonschot, R. G. (2012). Masked syllable priming effects in word and picture naming in Chinese.PloS One, 7
(10), e46595.Zhang, Q. F. (2008). Phonological encoding in monosyllabic and bisyllabic Mandarin word production: Implicit priming paradigm study.Acta Psychologica Sinica, 40
(3), 253-262.[張清芳. (2008). 漢語單音節和雙音節詞匯產生中的音韻編碼過程: 內隱啟動范式研究.心理學報, 40
(3), 253-262.]Zhang, Q. F., & Yang, Y. F. (2003). The determiners of picturenaming latency.Acta Psychologica Sinica,35
(4), 447-454.[張清芳, 楊玉芳. (2003). 影響圖畫命名時間的因素.心理學報, 35
(4), 447-454.]Zhang, Q. F., & Yang, Y. F. (2005). The phonological planning unit in Chinese monosyllabic word production.Psychological Science, 28
(2), 374-378.[張清芳, 楊玉芳. (2005). 漢語單音節詞匯產生中音韻編碼的單元.心理科學, 28
(2), 374-378.]Zheng, H. M., Wen, Z. L., & Wu, Y. (2011). The appropriate effect sizes and their calculations in psychological research.Advances in Psychological Science, 19
(12), 1868-1878.[鄭昊敏, 溫忠麟, 吳艷. (2011). 心理學常用效應量的選用與分析.心理科學進展, 19
(12), 1868-1878.]
附錄1:實驗1-3中所使用目標圖片的各項指標