徐楚言 朱 麟 王蕓萍 王瑞冰 劉聰慧
(中國人民大學心理學系, 北京 100872)
言語互動是社會行為的重要組成部分, 對于人類生存和繁衍至關重要(Krauss, 2002)。言語互動往往需要兩人或多人共同參與。在此過程中, 個體表達自己的看法并跟隨他人觀點, 完成觀點的相互傳遞與理解(Celce-Murcia, 2001)。第一語言作為個體最初學會的語言, 習得時間早, 熟練度高, 一般為主要溝通語言; 但在進行跨文化交流時, 個體也會使用第二語言, 其習得時間晚, 熟練度低, 言語互動質量經常會受到焦慮等負性情緒的影響(Dewaele,2013)。盡管很多研究者發現外語焦慮程度高的個體, 其外語成績和外語使用的表現更差(Elkhafaifi,2005; Horwitz et al., 1986), 但是很少有研究考察外語焦慮影響言語互動質量的神經基礎。
外語焦慮屬于特定情境焦慮的一種, 是個體在外語學習和使用情境中產生的消極情緒狀態, 如緊張、恐懼和害怕等(Horwitz et al., 1986)。和外語的輸入過程(如閱讀)相比, 外語口語輸出過程更容易誘發個體的焦慮情緒, 即外語口語焦慮(Diao &Shamala, 2013)。很多研究發現, 外語口語焦慮與外語口語表達水平、口語交流質量等呈顯著負相關(Buchanan et al., 2014; Radi?-Bojani? & Topalov,2021), 即外語口語焦慮水平高的個體更加關注自己的錯誤, 難以進行流暢的外語口語表達, 進而妨礙言語互動的效果(Balemir, 2009)。已有多種理論分析了焦慮對認知任務造成妨礙的可能原因。認知干擾理論(cognitive interference theory, Sarason,1988)認為, 焦慮情緒會讓個體受到負性思維等任務無關信息的干擾, 額外占用與任務有關的認知資源, 造成內部資源的競爭, 進而導致任務成績下降(Sarason, 1988); Eysenck 和Calvo (1992) 在該理論的基礎上提出了加工效能理論(processing efficiency theory), 認為焦慮通過占用工作記憶的資源造成認知干擾, 使得用于當前任務的認知資源被占據, 進而影響加工的效率; 之后, Eysenck(2007)等人在加工效能理論上更進一步, 提出了注意控制理論(attentional control theory), 認為焦慮會增加個體對任務無關刺激的注意偏向, 使得針對當前任務的注意資源減少, 造成分心, 在需要轉換功能的任務中表現更差(Derakshan et al., 2009)。這幾種理論雖然側重點有所不同, 但都認同焦慮通過占用認知資源、使個體無法集中于當前任務, 并因此影響任務效率和表現。由此, 外語口語焦慮可能會使得個體更關注自身是否存在語法或發音錯誤, 這一過程會占用個體的認知資源, 使其不能集中到口語對話的過程中, 導致言語互動質量下降。綜上,雖然大量的研究發現外語口語焦慮和口語成績之間存在負性相關(Radi?-Bojani? & Topalov, 2021),并對該機制進行了解釋和理論構建(Eysenck et al.,2007; Eysenck & Calvo, 1992; Sarason, 1988), 但大多局限在行為層面, 對于其內部的神經過程, 尤其是互動雙方大腦同步的神經基礎則很少關注。
言語互動是一種復雜的認知過程, 往往涉及兩人或多人, 需要個體能夠理解他人所表達的內容并進行跟隨才能順利完成(Celce-Murcia, 2001)。這一過程不僅涉及個體自身的言語產生和接收, 還需要理解他人表達的信息才能順利推進(Kelsen et al.,2020; Schoot et al., 2016), 這兩種認知活動涉及眾多腦區。言語的產生和接收與大腦的語義系統、認知控制系統緊密相關(程士靜, 何文廣, 2020), 主要涉及部分額葉(布洛卡區)和顳葉皮層(威爾尼克區)(劉麗虹 等, 2004; 張清芳, 楊玉芳, 2003; Kelsen et al., 2020); 跟隨與理解他人意圖則涉及到對他人心理狀態的預測和解釋, 即心理理論的運用(Corbetta et al., 2008), 這一過程主要涉及顳頂聯合區、內側前額葉、額極等腦區(Sassa et al., 2007), 這些腦區也都被證明和言語及社會互動有密切關系(Liang et al., 2022)。最近有研究者使用 fMRI(functional magnetic resonance imaging, Jeong et al.,2016)考察了外語焦慮影響言語溝通的單腦神經基礎, 發現外語溝通任務會激活左側緣上回, 還發現眶額皮層(包括左側腦島)的激活會隨著語言焦慮水平的增加而降低。
基于功能性近紅外光譜成像(functional Near Infrared Spectroscopy, fNIRS) 的超掃描技術(hyperscanning)已經被廣泛應用于社會認知神經科學相關研究中(Babiloni & Astolfi, 2014), 也有一些研究使用該技術考察了言語互動過程中的腦間神經同步性(Interpersonal Neural Synchronization,INS), 從多腦的角度拓展了言語交流的神經基礎。如有研究發現, 相比起個人獨白任務, 在言語互動任務中觀察到被試間顳葉部分區域INS 更高, 這些區域均涉及了言語的產生和理解(Hirsch et al.,2018); Jiang 等(2012)讓被試采取4 種不同的交流形式(面對面對話、面對面獨白、背靠背對話與背靠背獨白), 發現配對被試僅在面對面對話條件下,左下額葉皮質表現出更明顯的INS。分析INS 可以加深我們對于言語互動的理解。首先, 言語互動過程中的腦間同步性能夠反映被試在當下的互動質量, 如Jiang 等(2015)采用無領導小組討論的方法,發現在言語交流中, 領導者?跟隨者之間左側顳頂聯合區的INS 顯著高于跟隨者?跟隨者, 這一區域與心理理論密切相關; 相應地, 相比起跟隨者?跟隨者, 跟隨者?領導者的交流和關系也更加密切,因此更能形成有效的言語互動。此外, INS 也可以對個體的互動質量進行預測, 如在師生互動的研究中, 發現師生之間部分腦區的INS 可以預測學生的課堂參與度和學習程度(Dikker et al., 2017)。綜上所述, 我們認為在言語交流過程中, 個體的INS 可能與其言語互動的質量密切相關, 對于研究第二語言的互動質量及其影響因素, 是一個良好的腦神經指標。在已有研究中, 言語交流相關的INS 多發生在左側前額葉(Jiang et al., 2012)和左側顳頂聯合區域(Hirsch et al., 2018), 這兩個腦區與言語的加工和表達(張清芳, 楊玉芳, 2003; Kelsen et al., 2020)、心理理論密切相關(Sassa et al., 2007), 且也涉及到了第二語言的加工(Jeong et al., 2016)。綜上, 在言語溝通過程中, 與人際神經同步相關的腦區多集中在額葉和顳頂區域, 且這些腦區的腦活動耦合程度越高, 傾聽者對講述者表達的內容理解程度也越高(Stephens et al., 2010)。
在外語互動過程中, 參與者體驗到的焦慮多是由于其對負性評價的恐懼。害怕負性評價的人往往預期得到他人的負面評價, 并傾向于回避評價性情景(Watson & Friend, 1969), 不敢使用外語進行言語互動(Gregersen & Horwitz, 2002), 甚至逃避外語教學活動(MacIntyre & Gardner, 1994), 進而阻礙外語表達技能的獲取, 負面影響其外語的交流和學習。有研究者發現, 負性評價恐懼強烈的個體更注重在別人面前的形象, 因此存在外部評價會引起更強的焦慮感(劉洋, 張大均, 2010; Sapach et al.,2015)。Young (1990)使用問卷法對外語口語焦慮的影響因素進行了系統的探究, 發現外語口語焦慮主要源于存在外部評價的情景。也有很多研究通過問卷法或訪談法得出相似結論, 即負性評價恐懼是引起 外 語 口 語 焦 慮 的 重 要 因 素(Radi?-Bojani? &Topalov, 2021; Rajitha & Alamelu, 2020)。這種負性評價恐懼可能來源于教師評價, 也可能來自同齡人評價(Horwitz et al., 1986)。總體來看, 在具有評價性因素的情景中, 個體得知自己的外語表現會受到評價, 可能引起其負性評價恐懼, 進一步喚起更高水平的焦慮。本研究擬引入外部評價的情景, 以探究外部評價對外語焦慮程度的影響, 以及這種影響在神經層面的表現。
綜上, 本研究擬使用基于fNIRS 的超掃技術,通過兩個實驗探究英語口語焦慮對英語言語互動質量的影響, 以及相關的認知神經基礎。本研究使用的范式改編自Hirsch 等人(2018)的輪換敘述范式。Hirsch 等人要求被試完成的任務是交替進行物品描述, 而本研究使用有連貫情節的故事作為材料(Donate, 2018; Sasayama, 2016), 被試之間存在更多的信息傳遞與動態交互, 更類似現實生活中的言語互動。在完成任務過程中, 使用近紅外腦功能成像設備記錄額葉、顳葉和顳頂聯合區的活動狀況,最近一項元分析發現這些區域的神經同步與言語互動有關(Kelsen et al., 2020); 同時, 使用問卷搜集被試的英語課堂焦慮、英語口語焦慮水平, 以及其在完成任務過程中的狀態焦慮水平。本研究的兩個實驗不同點在于, 實驗2 將提前告知被試其英語口語表現會受到專家評價, 實驗1 則無此環節。本研究預期:(1)行為方面:英語任務會喚起(和漢語任務相比)更高的口語焦慮感, 更高的負性評價恐懼,且焦慮水平越高其言語互動質量越低; (2)腦間同步性方面:在英語任務中, 左側顳頂皮層和部分額葉皮層INS 水平會低于漢語任務, 且焦慮水平越高,INS 越低, INS 可以中介英語口語焦慮對言語互動質量的影響; (3)提前告知存在評價環節會增加被試的外語口語焦慮程度。
通過G*power 3.1 (Faul et al., 2007)計算確定研究所需樣本量。選取配對樣本t檢驗, 輸入參數如下:效應量取0.5, 即中等大小的效應量; 統計檢驗力(1 ? β)取0.8; α err prob 取0.05。結果顯示, 共需要27 組即54 名被試。共招募66 名非英語專業本科生和研究生參加實驗, 其中女性37 人, 被試的平均年齡為21.86 歲(SD= 2.75), 均為右利手, 視力或矯正視力正常。所有被試的母語均為漢語, 第二語言均為英語, 且通過國內課堂習得英語, 沒有人具有出國留學經歷。被試對自身英語能力從“聽說讀寫”四個維度進行自評(采用7 點評分, 其中1 代表“非常不熟練”, 7 代表“非常熟練”)。被試英語口語的自評得分最低(M= 3.08,SD= 1.37), 且口語與聽力(M= 3.50,SD= 1.30)、閱讀(M= 5.14,SD=1.15)和寫作(M= 4.27,SD= 1.26)自評得分均存在顯著差異(allps < 0.01)。以上66 名被試隨機形成33 對, 每組被試在實驗前互不認識, 其中同性別被試對28 組, 包含16 對女性被試。實驗前被試均已簽署知情同意書, 實驗后獲得一定的被試費。實驗方案經中國人民大學倫理委員會批準。
2.2.1 研究問卷
(1) 外語課堂焦慮問卷(Horwitz et al., 1986;王才康, 2003), 被試評價自己是否符合題目的描述(如:“在英語課上說英語很沒有信心”), 采用李克特5 點評分(1 = 非常不同意, 5 = 非常同意), 共33個項目, 分為3 個維度:交流畏懼、考試焦慮、負性評價恐懼, 各維度得分越高則其焦慮水平越高。在本研究中該問卷的總體α = 0.83。
(2) 外語口語焦慮問卷(Apple, 2013), 被試評價自己是否符合題目的描述(如:“在全班同學面前說英語, 我會感到緊張”), 采用李克特6 點評分(1 =完全不同意, 6 = 完全同意), 共20 個項目, 得分越高則外語口語焦慮程度越高。在本研究中該問卷的總體α = 0.95。
(3) 口語焦慮自評問卷(Donate, 2018), 被試評價自己在任務過程中各方面的焦慮程度(如:“我害怕不能正確理解我同伴敘述的故事信息而緊張”),采用李克特7 點評分, 選擇的數字越大代表越緊張,共6 個項目, 主要用于多次測量被試在整個任務期間的口語焦慮水平, 以了解被試在整個任務期間口語焦慮的動態變化。
(4) 言語互動質量自評和他評問卷, 采用李克特7 點評分(數字越大則評分越高), 共8 個項目(前6 個為自評項目, 后2 個為他評項目)。他評項目由兩位評分者獨立對每組被試的言語互動質量進行評分, 評分者均為心理系研究生, 均已通過大學英語六級考試, 評分前并不知曉實驗假設。
2.2.2 故事敘述材料
實驗包含中、英兩個故事敘述任務, 改編自口語輸出的故事敘述任務范式(Donate, 2018; Sasayama,2016), 兩名被試輪流根據卡通材料敘述故事。每個任務的材料均由24 張卡通圖片組成, 選自丹麥漫畫家赫爾盧夫·皮德斯特魯普的連環畫作品, 其中每12 張圖片為一個完整的故事。在要素方面, 四個故事均只包含兩個人物; 涉及詞匯為日常生活中常見的詞匯(例如書、沙發、帽子等), 適合以英語為第二語言的大學生被試群體(Sasayama, 2016)。
采用單因素兩水平(漢語 vs. 英語)組內設計,并測量被試在實驗全程中的焦慮水平、言語互動質量(自評和他評分數)、腦間同步水平(INS), 最后使用問卷測量被試的英語課堂焦慮、英語口語焦慮和人口學信息。
兩位被試來到實驗室后面對面就坐于同一張桌子的兩個斜對角(見圖1A)。實驗共分為4 個階段,具體步驟如下:

圖1 實驗場景俯視圖(A)及故事敘述任務的流程示意圖(B)
(1) 靜息階段:該階段將持續600 s, 使被試腦部的血氧水平回歸到基線水平。在此階段之前, 呈現指導語(告知被試不設置任務結束后的口語評價環節), 讓被試理解實驗流程, 根據屏幕提示進入靜息階段; 在此期間被試需要閉眼, 全身保持靜止,并放松心情。
(2) 英語敘述任務階段:在任務開始前, 被試填寫口語焦慮自評問卷, 作為該階段的前測得分。每對被試根據屏幕提示自行推進任務進程, 此階段的24 張圖片按編號順序構成一個完整的故事。為每對被試均準備兩份紙質版的實驗材料, 被試1 的實驗材料只呈現奇數編號的圖片, 被試2 的實驗材料只呈現偶數編號的圖片。首先由被試1 對第1 張圖片的內容用英語進行盡可能詳細的敘述(該張圖片在被試2 的實驗材料中不呈現, 要求被試2 認真傾聽被試1 的講述); 當被試1 敘述完畢后, 兩位被試均快速完成口語焦慮自評問卷, 然后根據屏幕提示的按鍵進入第2 張圖片的敘述環節, 此時由被試2 用英語敘述, 被試1 認真傾聽。上述環節交替進行, 直到24 張圖片全部用英語敘述完畢, 具體流程見圖1B。任務結束后再次填寫口語焦慮自評問卷,作為該階段的后測得分。
(3) 休息階段:該階段將持續300 s, 為使被試腦部活躍的血氧信號回歸到基線水平; 在此期間同樣要求被試閉眼, 全身保持靜止, 并放松心情。
(4) 漢語敘述任務階段:被試在任務開始前填寫口語焦慮自評問卷, 作為該階段的前測得分。該階段同英語任務一致, 也是由24 張圖片按編號順序構成一個完整的故事(故事與英語敘述任務中的不同)。材料的分配方式和敘述環節的推進方式同英語敘述任務相同, 唯一的不同是要求被試用漢語進行敘述, 并完成相關題目。任務結束后再填寫口語焦慮自評問卷, 作為該階段的后測得分。
完成以上全部實驗流程后, 要求被試通過問卷星鏈接填寫好基本的人口學信息和英語水平自評分數。漢英兩個任務階段的順序會進行組間平衡,一半小組先進行漢語任務, 另一半小組先進行英語任務。
采用日本島津公司生產的功能性近紅外光譜腦成像儀(LABNIRS 系統, Shimadzu Corp., Kyoto,Japan)來記錄腦活動數據。為了可以覆蓋相關腦區,本研究針對每一位被試采用了兩塊光極模板進行布局, 共計18 個通道。第一套光極模板以“4×3” (包括6 個發射光極和6 個探測光極, 共計17 個通道)覆蓋左側額葉、顳葉與頂葉皮層; 第二套光極模板為“1×2” (包括1 個發射光極和1 個探測光極, 共計1 個通道)置于內側前額葉皮層處(Jiang et al.,2012)。探頭之間間隔30 mm, 定位以國際10-20 系統為參照。光極排列和通道位置見圖2。通過3D定位儀(FASTRAK, Polhemus, Colchester, VT, USA)對各個通道的坐標進行定位, 覆蓋的腦區主要包括:(1)左側額下回(left inferior frontal gyrus, LIFG),對應通道為:1, 4, 8, 11; (2)左側中央后回(left posterior central gyrus, LPCG), 對應通道為:2, 5, 9,12; (3)左側緣上回(left supramarginal gyrus, LSMG),對應通道為:3, 6, 7, 10; (4)左側顳中回(left middle temporal gyrus, LMTG), 對應通道為:13, 14, 15, 16,17; (5)左側額極(left Frontopolar area, LFA), 對應通道18。

圖2 光極排列和通道位置圖
綜上, 本研究中的每位被試共劃分5 個ROI(region of interest), 依次分別為ROI1:左側額下回、ROI2:左側中央后回、ROI3:左側緣上回、ROI4:左側顳中回、ROI5:左側額極; 那么每對被試共存在“5×5”組腦區對, 即25 組腦區對, 如表1 所示。

表1 實驗1 中每對被試25 組腦區對的排布情況
2.6.1 行為數據處理
參照前人研究, 將每一組兩位被試行為指標得分的均分作為該組被試的行為指標得分(Donate,2018); 利用SPSS 26.0 進行數據分析。
2.6.2 fNIRS 數據處理和頻段選擇
在MATLAB 2013b 的操作環境下進行數據分析。首先對信號進行預處理, 剔除數據中光強過飽和的通道, 將各通道的原始光強數據轉換成光密度數據, 并依據樣條插值(Spline interpolation)去除原始信號中的運動偽跡(Scholkmann et al., 2010); 使用0.01~0.2 Hz 的帶通濾波進行處理, 以避免由生理信號, 例如心跳、呼吸造成的信號干擾(Pierro et al.,2014); 依據修正的Beer-Lambert 定律將各通道光密度數據的相對變化值轉化成血紅蛋白濃度的相對變化值。由于氧合血紅蛋白對實驗條件更加敏感(Pinti et al., 2020), 故后續分析只使用氧合血紅蛋白(Δ[HbO])的數據。
使用MATLAB 統計軟件包中的小波相干分析包來計算3 個階段(靜息階段、英語任務與漢語任務)的腦間活動同步性(Grinsted et al., 2004)。對于感興趣頻段的選擇, 本研究參照近年來關于人際互動的其他研究, 先選擇可規避全局生理信號的較大頻段(0.01~0.2 Hz), 在此基礎上對頻段內每一頻逐一計算, 從而獲取與該研究相關的頻段范圍(Liu, Zhang et al., 2019; Lu et al., 2019)。本研究最關注的是每對被試在用英語進行言語互動時其INS 的結果, 因此為了更精確的鎖定與英語口語任務更相關的頻段,對靜息階段與英語任務階段進行比較。首先, 將英語任務和靜息階段0.01~0.2 Hz 中每一個頻段的INS 進行平均, 并進行Fisher Z 轉換; 接著, 對各頻段下25 個腦區對的INS 分別進行配對樣本t檢驗;最后, 對p值進行FDR 校正(Benjamini & Hochberg,1995), 并分別生成t值與p值熱圖(張如倩 等,2019)。結果顯示, 在英語任務下0.02~0.04 Hz、0.14~0.20 Hz 的INS 較為集中并顯著高于靜息階段(見圖3)。0.02~0.04 Hz 對應的時間長度為25~50 秒, 與每張圖片的敘述時間基本相符; 而0.14~0.20 Hz 這一頻段同樣在先前研究中被發現與言語互動有關(Nozawa et al., 2016)。因此, 選取0.02~0.04 Hz、0.14~0.20 Hz為實驗1 的感興趣頻段。此外, 在這兩個頻段上, 中文對話和靜息態的INS 對比也是顯著的。

圖3 實驗1 中頻段選取部分的t 值(A)與p 值(B)的熱圖
2.7.1 口語焦慮在雙語任務中的差異性檢驗
對英語任務期間與漢語任務期間的口語焦慮自評得分進行配對樣本t檢驗, 發現英語任務下被試的口語焦慮自評得分(3.74 ± 0.67)顯著高于漢語任務(1.01 ± 0.01),t(32) = 23.58,p< 0.001, Cohen’sd= 5.81。分別用兩種任務的后測分數減去前測分數, 得到口語焦慮提升值, 發現英語任務口語焦慮提升值(0.35 ± 0.84)顯著高于漢語任務口語焦慮提升值(?0.01 ± 0.06),t(32) = 2.42,p= 0.02, Cohen’sd=0.85。此外, 比較不同語言任務下口語焦慮的前測得分發現, 英語任務的口語焦慮前測得分顯著高于漢語任務,t(32) = 26.28,p< 0.001, Cohen’sd= 6.63。
上述數據結果表明, 相較于漢語任務, 被試在英語任務中存在顯著的口語焦慮, 且被試的口語焦慮在不同語言任務開始前便存在顯著差異; 此外,在完成英語任務時, 其口語焦慮水平相較于任務前顯著上升, 而在漢語任務中則不會出現此現象。這與以往研究得出了相似的結果, 即用英語進行言語表達會引起比漢語更高水平的焦慮情緒(張積家等, 2020), 這表明本研究中所使用的英語口語任務能夠喚起個體的焦慮情緒。
2.7.2 行為結果分析
對英語課堂焦慮、英語口語焦慮、雙語任務下口語焦慮自評得分、雙語任務下言語互動質量自評和他評得分進行相關性分析。本實驗的言語互動質量他評得分來自兩位評分者, 其內部一致性系數良好(ICC = 0.77) (潘曉平, 倪宗瓚, 1999)。
行為數據的相關分析結果見表2 (經Bonferroni校正的結果見表3)。英語口語焦慮與口語焦慮自評得分(英語)呈顯著正相關(p= 0.038), 與言語互動質量自評得分(英語)呈顯著負相關(p= 0.045); 口語焦慮自評得分(英語)與言語互動質量自評得分(英語)呈顯著負相關(p< 0.001)。由此可見, 外語口語焦慮水平高的個體, 其使用外語進行言語互動的質量也更差。除此之外, 在英語課堂焦慮的三個維度(負性評價恐懼、考試焦慮、交流畏懼)中, 僅有負性評價恐懼這一維度分數與英語口語焦慮(r=0.39,p= 0.026)、口語焦慮自評得分(英語) (r= 0.71,p= 0.001)均呈顯著正相關, 說明了負性評價恐懼與外語口語焦慮的密切關系。

表2 實驗1 中各變量的描述統計及相關分析結果

表3 實驗1 中各變量的描述統計及相關分析結果(Bonferroni 校正后)
對英語任務期間與漢語任務期間的言語互動質量自評和他評得分分別進行配對樣本t檢驗, 發現英語任務言語互動質量自評得分(4.85 ± 0.75)顯著低于漢語任務言語互動質量自評得分(6.55 ±0.12),t(32) = ?13.37,p< 0.001, Cohen’sd= 3.29;英語任務言語互動質量他評得分(5.18 ± 0.57)也顯著低于漢語任務言語互動他評得分(6.53 ± 0.40),t(32) = ?9.99,p< 0.001, Cohen’sd= 2.44。
2.7.3 雙人腦間同步性結果分析
使用配對樣本t檢驗考察被試在漢語和英語任務中的雙人腦間同步性差異, 結果如圖4 所示。當頻段為0.02~0.04 Hz 時, 發現以下腦區對的INS 在英語任務中顯著低于漢語任務:第13 組腦區對(左側緣上回),t(32) = ?3.23,p= 0.003, Cohen’sd=0.80; 第19 組腦區對(左側顳中回),t(32) = ?3.48,p= 0.001, Cohen’sd= 0.86; 第25 組腦區對(左側額極),t(32) = ?1.86,p= 0.07, Cohen’sd= 0.46; 其余腦區對均未發現雙語任務的INS 存在顯著差異。當頻段為0.14~0.20 Hz 時, 所有腦區對均未發現雙語任務的INS 存在顯著差異。

圖4 實驗1 中0.02~0.04 Hz 頻段內腦間同步性(INS)在任務間的差異(*p < 0.05, **p <0.01, ?代表邊緣顯著), 圖中的errorbar 表示均值的標準誤。
此外, 在該頻段下, 左側緣上回、左側顳中回與左側額極在雙語任務中的INS 均顯著高于靜息階段(經FDR 校正, allps< 0.005), 即上述腦區在雙語任務中(相較于靜息階段)均出現了顯著的腦間活動同步。
2.7.4 雙語任務中行為指標與腦間同步指標的分析
(1) 相關分析
將英語課堂焦慮得分、英語口語焦慮、口語焦慮自評得分(英語)、言語互動質量的自評和他評得分(英語)分別同英語任務中(0.02~0.04 Hz)的左側緣上回、左側顳中回和左側額極的INS 進行相關分析。結果發現, 在英語任務中, 左側緣上回的INS同英語課堂焦慮得分(r= ?0.37,p= 0.033)、口語焦慮自評得分(英語)均為顯著負相關(r= ?0.60,p=0.001); 同言語互動質量自評/他評得分呈顯著正相關(r= 0.74,p< 0.001;r=0.40,p= 0.02)。在漢語任務中, 左側緣上回、左側顳中回與左側額極的INS同口語焦慮自評得分(漢語)、言語互動質量的自評和他評得分(漢語)均無顯著相關。
(2) 中介效應檢驗
采用 Hayes (2013)編制的 Process 程序中的Model 4 來檢驗英語任務中左側緣上回的平均相干值(0.02~0.04 Hz)在口語焦慮自評得分(英語)和言語互動質量自評得分(英語)間的中介效應, 將被試自評的英語口語能力分數作為控制變量納入模型。結果如表4 所示, 口語焦慮自評得分(英語)直接顯著負向預測言語互動質量自評得分(英語),也可以通過左側緣上回的INS, 顯著預測言語互動質量自評得分(英語)。此外, 將因變量換成言語互動質量他評(英語), 其余變量保持不變, 未發現中介效應。

表4 實驗1 中左側緣上回INS 的中介模型分析結果
通過抽取5000 個樣本, 使用偏差校正的百分位Bootstrap 法檢驗左側緣上回的腦間同步性在外語口語焦慮與言語互動質量間的中介效應。結果表明, 模型直接效應(95% CI = [?1.20, ?0.61], 效應值占比為 59.7%)和間接效應(95% CI = [?0.88,?0.21], 效應值占比為40.3%)皆顯著。因此, 在英語任務期間, 左側緣上回的INS 在英語口語焦慮對言語互動質量的影響中起部分中介作用, 具體中介路徑見圖5。

圖5 實驗1 中左側緣上回的腦間同步水平的中介作用(標準化系數)。
共招募60 名在校非英語專業本科生和研究生參加實驗, 其中女性 38 人, 被試的平均年齡為21.58 歲(SD= 3.01), 均為右利手, 視力或矯正視力正常。所有被試的母語均為漢語, 第二語言均為英語, 且通過國內課堂習得英語, 沒有人具有出國留學經歷。被試對自身英語能力從“聽說讀寫”四個維度進行自評(采用7 點評分, 其中1 代表“非常不熟練”, 7 代表“非常熟練”)。被試英語口語的自評得分最低(M= 3.30,SD= 1.38), 且口語與聽力(M= 3.88,SD= 1.51)、閱讀(M= 5.23,SD= 1.06)和寫作(M=4.63,SD= 1.22)的自評得分均存在顯著差異(allps< 0.01)。以上60 名被試隨機形成30 對, 確保每組被試實驗前互不相識, 其中同性別被試對26 組, 包含17 對女性被試。實驗前被試均已簽署知情同意書, 實驗后則獲得一定的被試費。實驗方案經中國人民大學倫理委員會批準。
同實驗1。
提前告知被試任務結束后存在口語評價的環節, 其余同實驗1。
實驗程序基本同實驗1, 不同點在于, 在靜息階段呈現的指導語會告知被試將設置任務結束后的評價環節; 在敘述任務進行過程中, 每頁實驗材料中也新增了一句指導語“請認真完成實驗, 任務結束后將會進行口語評價”, 以強調該實驗存在評價的背景。
同實驗1。
3.6.1 行為數據處理
同實驗1。
3.6.2 fNIRS 數據處理和頻段選擇
方法同實驗1。結果顯示, 在英語任務下0.02~0.04 Hz、0.14~0.20 Hz 的INS 較為集中并顯著高于靜息階段(見圖6)。因此, 和實驗1 一致, 選取0.02~0.04 Hz、0.14~0.20 Hz 為實驗2 的感興趣頻段。
3.7.1 口語焦慮在雙語任務中的差異性檢驗
對被試在英語任務期間與漢語任務期間的口語焦慮自評得分進行配對樣本t檢驗, 發現英語任務下被試的口語焦慮自評得分(4.24 ± 0.68)顯著高于漢語任務(1.07 ± 0.10):t(29) = 25.21,p< 0.001,Cohen’sd= 6.51。對被試在不同任務期間口語焦慮自評的前后測得分進行配對樣本t檢驗, 結果表明, 在英語任務下口語焦慮的前測得分(3.90 ± 0.88)顯著低于后測得分(4.26 ± 0.69):t(29) = ?2.29,p=0.030, Cohen’sd= 0.59。而漢語任務下無顯著差異。分別用兩種任務的后測分數減去前測分數,得到口語焦慮提升值, 發現英語任務口語焦慮提升值(0.36 ± 0.86)顯著高于漢語任務口語焦慮提升值(?0.03 ± 0.36),t(29) = 2.39,p= 0.02, Cohen’sd= 0.89。此外, 比較不同語言任務下口語焦慮的前測得分發現, 英語任務的口語焦慮前測得分顯著高于漢語任務,t(29) = 16.59,p< 0.001, Cohen’sd= 6.16。
實驗2 的口語焦慮結果模式和實驗1 基本相同。但在實驗1 中, 被試報告的英語任務期間口語焦慮自評得分為3.74 ± 0.67, 口語焦慮前測得分為3.62 ± 0.55, 口語焦慮后測得分為3.97 ± 0.96。可以看出, 實驗2 被試報告的這些得分均高于實驗1,證明當被試得知自己將接受口語評價時, 其口語焦慮程度確實會被提升。
3.7.2 行為結果分析
分析方法同實驗1。本實驗的言語互動質量他評得分來自兩位評分者, 其內部一致性系數良好(ICC = 0.82) (潘曉平, 倪宗瓚, 1999)。
行為數據相關分析結果如表5 (經Bonferroni校正的結果見表6), 結果模式基本同實驗1:口語焦慮自評得分(英語)與英語言語互動質量自評(p<0.001)及他評得分(p= 0.024)均呈顯著負相關; 在英語課堂焦慮的三個維度中, 僅有負性評價恐懼這一維度分數與英語口語焦慮(r= 0.67,p< 0.001)、口語焦慮自評得分(英語) (r= 0.42,p= 0.021)均呈顯著正相關。

表5 實驗2 中變量的描述統計及相關分析結果

表6 實驗2 中變量的描述統計及相關分析結果(Bonferroni 校正后)
對30 組被試在英語任務期間與漢語任務期間的言語互動質量自評與他評得分分別進行配對樣本t檢驗, 發現英語任務言語互動質量自評得分(5.07 ± 1.36)顯著低于漢語任務言語互動質量自評得分(6.56 ± 0.12),t(29) = ?5.92,p< 0.001, Cohen’sd= 1.56; 英語任務言語互動質量他評得分(5.16 ±0.61)顯著低于漢語任務言語互動質量他評得分(6.40 ± 0.37),t(29) = ?8.68,p< 0.001, Cohen’sd=2.49。此處結果模式也和實驗1 類似。實驗1 中英語言語互動質量的自評得分為4.85 ± 0.75, 他評得分為5.18 ± 0.57。由此可見, 在得知將接受口語評價的情況下, 被試雖然被引起了更高的口語焦慮,但最終言語互動質量并未受到明顯影響。
3.7.3 雙人腦間同步性結果分析
使用配對樣本t檢驗考察被試在漢語和英語任務中的雙人腦間同步性差異。當頻段為 0.02~0.04 Hz 時, 結果如圖7A 所示, 以下腦區對的INS在英語任務中顯著低于漢語任務:第13 組腦區對(左側緣上回),t(29) = ?3.21,p= 0.003, Cohen’sd=0.83; 第19 組腦區對(左側顳中回),t(29) = ?2.09,p= 0.045, Cohen’sd= 0.54; 在此頻段下, 其余腦區對均未發現雙語任務的INS 存在顯著差異。

圖7 實驗2 的腦間同步性(INS)在任務間的差異(*p < 0.05, **p < 0.01, ?代表邊緣顯著), A 和B 分別為0.02~0.04 Hz頻段和0.14~0.20 Hz 頻段, 圖中的errorbar 表示標準誤。
當頻段為0.14~0.20 Hz 時, 結果如圖7B 所示,以下腦區對的INS 在英語任務中顯著低于漢語任務:第13 組腦區對(左側緣上回),t(29) = ?2.86,p=0.008, Cohen’sd= 0.74; 第19 組腦區對(左側顳中回),t(29) = ?2.06,p= 0.049, Cohen’sd= 0.53; 第25 組腦區對(左側額極),t(29) = ?1.82,p= 0.08,Cohen’sd= 0.47; 在此頻段下, 其余腦區對均未發現雙語任務的INS 存在顯著差異。
此外, 在上述兩個頻段下, 左側緣上回、左側顳中回與左側額極在雙語任務中的INS 均顯著高于靜息階段(經FDR 校正, allps< 0.005), 即上述腦區在雙語任務中(相較于靜息階段)均出現了顯著的腦間活動同步。
3.7.4 雙語任務中行為指標與腦間同步指標的分析
(1) 相關分析
將英語課堂焦慮、英語口語焦慮、口語焦慮自評得分(英語)、言語互動質量的自評和他評得分(英語)分別同英語任務中(0.02~0.04 Hz / 0.14~0.20 Hz)的左側緣上回、左側顳中回與左側額極的INS 進行相關分析。
結果顯示, 英語任務中口語焦慮自評得分(英語)與0.02~0.04 Hz (r= ?0.48,p= 0.007)頻段、0.14~0.20 Hz (r= ?0.44,p= 0.014)頻段的左側緣上回INS 為顯著負相關, 與0.02~0.04 Hz (r= ?0.39,p= 0.032)頻段、0.14~0.20 Hz (r= ?0.44,p= 0.015)頻段的左側顳中回INS 為顯著負相關; 言語質量自評得分(英語)與0.02~0.04 Hz (r= 0.57,p= 0.001)頻段、0.14~0.20 Hz (r= 0.56,p= 0.002)頻段的左側緣上回INS 為顯著正相關。左側額極只在0.02~0.04 Hz 中, 其英語任務的INS 同口語焦慮自評得分(英語)為顯著負相關(r= ?0.37,p= 0.047)。
(2) 中介效應檢驗
采用 Hayes (2013)編制的 Process 程序中的Model 4 來檢驗英語任務中左側緣上回的 INS(0.02~0.04 Hz 和0.14~0.20 Hz)在口語焦慮自評得分(英語)和言語互動質量自評得分(英語)間的中介效應, 將被試自評的英語口語能力分數作為控制變量納入模型。兩個頻段的結果一致顯示, 口語焦慮自評得分(英語)顯著負向預測左側緣上回的 INS,當口語焦慮自評得分與左側緣上回的INS 共同作為預測變量時, 口語焦慮自評得分(英語)負向預測言語互動質量自評得分(英語) (詳見表7)。

表7 不同頻段下中介模型的分析結果
通過抽取5000 個樣本, 使用偏差校正的百分位Bootstrap 法檢驗左側緣上回的INS 在外語口語焦慮與言語互動質量間的中介效應。結果表明,0.02~0.04 Hz 頻段下, 模型直接效應(95% CI =[?1.60, ?0.26], 效應值占比為73.2%)和間接效應(95% CI = [?0.80, ?0.06], 效應值占比為26.8%)皆顯著。0.14~0.20 Hz 頻段下, 模型直接效應(95%CI = [?1.60, ?0.30], 效應值占比為74.6%)和間接效應(95% CI = [?0.73, ?0.07], 效應值占比為25.4%)皆顯著。因此, 在英語任務期間, 左側緣上回的INS在英語口語焦慮對言語互動質量的影響中起部分中介作用。兩種頻段下的中介路徑見圖8。

圖8 實驗2 中0.02~0.04 Hz (0.14~0.20 Hz)左側緣上回的腦間同步水平的中介作用(標準化系數)
3.7.5 兩個實驗結果的對比
綜合兩個實驗的結果, 可以發現, 不管外界評價是否存在, 被試的外語口語焦慮對其言語互動質量的影響模式是相同的。此處我們將兩個實驗的結果放在一起分析, 進一步探索外界評價壓力對于實驗結果的影響。
獨立樣本t檢驗結果顯示, 實驗1 (無評價)中被試的口語焦慮自評得分(3.74 ± 0.67)顯著低于實驗2 (有評價)的分數(4.24 ± 0.68),t(61) =?2.91,p=0.005, Cohen’sd= 0.75。這證明外界評價的引入確實有效喚起了被試更高的外語口語焦慮。但兩個實驗中被試的自評言語互動質量分數差異不顯著,t(61) =?0.77,p= 0.444; 對于他評分數也是如此,t(61) =0.16,p= 0.875。即評價的存在并未顯著影響被試的言語互動質量。
以往很多研究表明英語口語焦慮是影響英語互動和學習的重要變量, 但很少有研究考察其神經基礎。本研究首次使用超掃技術, 探究了大學生雙語被試在英語、漢語敘述任務中口語焦慮對言語互動質量的影響, 探究了腦間同步性(INS)在該過程中的作用。在行為方面, 兩個實驗均發現被試在英語(相比漢語)任務中焦慮水平更高, 言語互動質量更差, 與以往問卷法的研究結果相一致(Buchanan et al., 2014; Fathi & Shirazizadeh, 2020)。在腦間同步方面, 兩個實驗均發現英語(相對于漢語)任務中左側緣上回、左側顳中回和左側額極的INS 減弱,且左側緣上回的INS 在英語口語焦慮和英語互動質量之間起部分中介作用。
負性評價恐懼在兩個實驗中都與英語口語焦慮呈正相關。負性評價恐懼往往伴隨著個體對其能力表現的較差預期, 使個體對于外語的展示產生較低的自我效能感(Chen & Lin, 2009), 而外語口語能力的自我效能感與外語口語焦慮呈顯著負相關(Cubukcu, 2008), 因此較高的負性評價恐懼會提升個體的外語口語焦慮, 與最近的研究結果一致(Radi?-Bojani? & Topalov, 2021)。
本研究還發現, 和沒有評價相比, 口語評價環節確實會引起被試焦慮情緒的增加, 但并未明顯影響到言語互動質量。我們推測, 這可能是因為評價壓力讓個體投入了更多的認知努力。根據努力投入假說(mere effort hypothesis, Harkins, 2006), 當個體知道將接受外界評價時, 將付出更多的努力去完成任務, 進而提升任務的成績。即外部評價的存在雖然會提升焦慮情緒, 但也提升了個體的努力程度, 從而削弱了焦慮情緒對互動質量的負面影響。此外, 雖然外部評價環節出現后, 被試的焦慮情緒出現了一定程度的提升, 但提升的幅度較小, 可能不足以過多影響互動質量。有研究者認為僅有高度焦慮會對英語的學習和使用造成較強負面影響, 低度和中度的焦慮則沒有那么大的影響(Williams, 1991)。本研究實驗2 的被試口語焦慮自評分雖然高于實驗1, 但是也僅有4.24 分, 在滿分為7 分的量表里不屬于很高的水平, 所以可能并沒有嚴重影響到互動質量。
本研究fNIRS 的結果顯示, 相較漢語任務, 被試用英語交流時其左側緣上回、左側顳中回和左側額極的腦間同步性出現了顯著的減弱。這些腦區涉及了言語互動的初級水平(言語產生和接收)及高級水平(相互理解) (Schoot et al., 2016), 其中左側顳中回參與了語義的表征和信息聯結, 是與語義控制有關的重要腦區(程士靜, 何文廣, 2020); 左側緣上回對于語音和語義加工(Stoeckel et al., 2009)及心理理論(Liang et al., 2022; Jiang et al., 2015)都十分重要; 而左側額極與心理理論和社會互動有關(Gilbert et al., 2006)。最近的一項元分析也表明這些腦區的 INS 與言語互動的有效性有關(Kelsen et al., 2020), 即成功的言語互動不僅需要聽者接收到說者的聲音信號, 還需要對其內容進行理解(Schoot et al., 2016)。Stephen 等人(2010)在關于言語互動的研究中發現, 當說者用聽者不熟悉的語言進行講述時, 僅在初級聽覺皮層發現二者腦活動的耦合, 和心理理論相關的腦區則并沒有明顯的耦合,表明聽者如果對講述的內容存在理解困難, 就無法完成信息的傳遞和理解。這也和本研究的結果一致,即用一種相對不熟練的語言進行言語互動阻礙了信息的傳遞和相互理解。相較漢語任務, 在執行英語任務時, 被試會被喚起更高的口語焦慮, 焦慮狀態下的個體會投入更多資源到認知控制的腦區, 如背外側前額葉(Berggren & Derakshan, 2013), 以抑制焦慮情緒的影響, 從而削減了任務相關腦區的認知資源(Banich et al., 2019), 造成了INS 的下降。體現在行為層面, 就表現為較之漢語任務更差的言語互動質量。
此外, 在本研究的兩個實驗中, 針對兩個感興趣頻段發現了不同的結果。在實驗1 中, 只在0.02~0.04 Hz 頻段發現相關腦區在兩種語言任務下的INS 存在差異, 而在實驗2 中, 在0.02~0.04 Hz 和0.14~0.20 Hz 兩個頻段都發現了差異。其中0.02~0.04 Hz 周期長度約為25~50 秒, 基本符合一幅圖片的描述時間, 是任務相關的頻段。對于0.14~0.20 Hz, 也有研究發現這一頻段的INS 與交流行為有關(Nozawa et al., 2016), 表明本研究中在0.14~0.20 頻段出現的INS 同樣可能具有神經學意義, 而非單純的生理影響造成。本研究實驗2 與實驗1 的不同點在于事先告知了被試即將接受評價, 以引發被試的負性評價恐懼, 提升被試的外語口語焦慮,因此也許可以推測0.14~0.20 Hz 頻段的神經活動與該實驗條件有關。但目前還尚未明確不同頻段和具體腦活動的關聯(Zheng et al., 2018), 還需要未來研究提供更多相關證據。此外, 也有部分研究表明,0.14~0.20 Hz 頻段也可能會受到呼吸的影響(Liu,Branigan et al., 2019; Long et al., 2022), 且此頻段結果在兩個實驗間不夠穩定, 因此對于本研究的這一結果應謹慎看待。未來需要對該頻段信號進行針對性的深入研究, 以考察其穩定性和有效性。
本研究兩個實驗的中介效應分析結果一致表明, 左側緣上回的INS 在英語口語焦慮和英語互動質量自評分數之間起部分中介作用, 即英語口語焦慮不僅會直接影響言語互動質量, 還可以通過左側緣上回的INS 影響言語互動質量。左側緣上回與語音和語義處理都密切相關(Stoeckel et al., 2009), 在第二語言言語互動中也扮演了十分重要的角色, 先前研究發現相比起母語任務, 該區域在第二語言任務中激活程度顯著更強(Jeong et al., 2016), 且左側緣上回的激活程度與溝通意圖有關(Carota et al.,2010)。此外, 作為顳頂聯合區的一部分, 緣上回被發現在和心理理論有關的任務中有更顯著的激活(van Ackeren et al., 2012), 或和其他腦區的功能連接更強(Park et al., 2021)。這一腦區的INS 提高意味著雙方對刺激形成了相似的理解(Wang et al.,2022), 因而能夠促進交流的效率和質量。綜上, 外語口語焦慮水平的提高可能會使得個體花費更多認知資源抑制無關信息(Rajitha & Alamelu, 2020),額外占用任務相關腦區的認知資源(Banich et al.,2019), 造成其INS 的降低, 影響個體的言語產生和相互理解, 進而導致更差的言語互動質量。因此, 在外語言語交流中, 談話者左側緣上回的INS 可能是外語口語焦慮影響言語互動質量的重要神經基礎。
另外, 當將中介模型中的因變量換成言語互動質量他評分數時, 沒有發現相應的中介效應。這可能是因為言語互動的自評和他評分數的性質存在不同。他評一般直接依據被評分者的外在表現, 而自評的結果往往還受到個體內在心理狀態的影響,如有研究發現個體的英語能力自評分數和其英語課堂焦慮、動機等有關(Dong et al., 2022), 但旁人并不清楚被評分者的內在心理狀態, 所以他評分數也許不會受到被評分者外語口語焦慮的影響。正如本研究結果發現, 英語口語焦慮和言語互動自評分數在兩個實驗中都存在顯著正相關, 而實驗1 中英語口語焦慮和他評分數則無顯著相關關系。所以當因變量是他評分數時, 也無法得到更加穩定的中介關系。
本研究使用近紅外超掃技術, 首次在真實的對話情境下, 揭示了外語口語焦慮對言語互動質量的影響及相關腦間同步的神經基礎, 為情緒影響外語言語互動提供了新的神經同步方面的證據。此外,本研究的兩個實驗區分了是否事先告知被試將接受評價, 發現被試即使因接受評價而引起更高的焦慮情緒, 也并未影響最終的言語互動表現。這一結果深化了目前對于外語言語互動外在影響因素的理解。
本研究存在以下不足之處。第一, 因硬件條件的限制, 本研究并沒有記錄被試間右腦的同步情況,而右側顳頂聯合區(Zheng et al., 2018)及右側額葉皮層(Baker et al., 2016)的腦間活動同步水平同樣可能和言語互動有關; 還有研究發現相比起母語,對外語的加工更多涉及到大腦右半球(Weber-Fox& Neville, 1996), 如右側額下回與外語的語音感知和學習有關(Qi et al., 2019)。因此, 本研究可能存在某些重要腦區的遺漏, 未來研究可嘗試覆蓋更多的腦區。第二, 本研究被試的選取可能會影響結果的推廣性。首先, 被試的性別比例不夠均衡, 兩個實驗中均是女性數量更多; 而個體的外語口語焦慮也受到性別的影響(鐘蘭鳳, 鐘家寶, 2015; Balemir,2009), 而且本研究中還存在少量異性被試對, 這也可能影響實驗的結果。因此, 未來研究可平衡被試的性別比例, 或以性別為組間變量來探究性別因素對本研究結果的影響。另外, 被試均為大學生,英語水平可能偏高, 尚且不知道本研究的結果在其他英語水平的人群中是否穩定。第三, 近紅外超掃描技術僅可記錄皮層下2 至3 厘米范圍內血氧濃度,難以探測位于大腦深處的腦區, 如腦島、杏仁核等(張如倩 等, 2019)。因此, 未來研究可以結合多種腦成像技術, 如高密度EEG (electroencephalographic)成像技術(Seeber et al., 2019)或fMRI 技術, 進一步完善本領域的探索。第四, 本研究雖然在中介模型中對被試的外語熟練度進行了控制, 但使用的是被試自評的英語能力分數。相比起系統的語言能力測評,這種簡單的自評分可能并不能完整地反映被試的英語能力。未來研究可以使用更專業的測評手段,如教育部和國家語言文字工作委員會2018 年發布的《中國英語能力等級量表》, 對被試的英語能力進行更客觀的評價。
(1) 英語口語焦慮會對個體間言語互動質量和腦間活動同步性產生負面影響; (2) 英語口語焦慮可以通過左側緣上回的腦間活動同步性, 進而影響言語互動質量; (3) 無論是否增設評價環節, 英語口語焦慮對言語互動質量的影響在行為和腦間同步性的表現是一致的。