張蕾 鮑貴
(1.北京外國語大學 英語學院/北京工業大學 文法學部 100124,北京;2. 南京工業大學 外國語言文學學院,江蘇 南京 211816)
口語復述指二語學習者通過言語重復識記過的材料,是口語產出的一種形式。同其他相對自由的口語產出形式(如獨白)相比,口語復述的一個顯著特點是語言輸入制約學習者產出的內容。它是綜合考量學習者理解能力、口頭表達能力、信息整合能力和記憶能力等的有效手段(Crossley et al., 2014;Frost et al., 2012;文秋芳 等, 2009)。學習者的口語復述表現能夠綜合體現其二語產出能力,因而口語復述任務被廣泛用于英語聽說綜合測試。
有關口語復述的前期研究主要涉及語言表達準確性、復雜性和流利度、意義單位、n元組(含習慣性搭配和短語)和關鍵詞的測量(Skehan et al., 1999;Skehan et al.,2014;Hoang et al., 2016;Awwad et al., 2017;周丹丹, 2010;杜娟 等, 2011;韓亞文, 2015;王華 等, 2018;徐鷹 等, 2019,2020)。特別值得注意的是,隨著自然語言處理技術的快速發展,對口語復述語言形式和內容的研究傾向于采用客觀的計量學方法測量n元組和關鍵詞,減少意義單位等測量存在的主觀性和片面性問題(Hoang et al., 2016;嚴可 , 2009;蔡寧 等, 2017)。n元組是文本詞串,包括通常所說的搭配和詞塊,既能夠體現原文本的語言形式,又能夠體現原文本的內容。關鍵詞指體現原文本內容的重要詞。關鍵詞覆蓋率是測量復述內容完整性的重要指標。
從為數不多的現有研究來看,對n元組和關鍵詞的探究還有待深入。關于n元組的前期研究主要從原文本中提取若干語塊或固定短語,調查學習者復述文本對這些語塊的復現率,未能全面考察學習者復述文本中n元組的使用。Hoang et al.(2016)對比分析了原文本與學習者復述文本中詞族的重合率,但是測量單位是單個詞。嚴可等(2009)利用人工判斷篩選與原文內容相關的重要詞作為關鍵詞,計算學習者復述文本對這些關鍵詞的覆蓋率。但是,學習者復述中更多地使用原文中的關鍵詞還是使用與之相關的關鍵詞,目前尚無證據。
與口語復述相關的一個理論議題是協同(alignment)效應(Atkinson et al., 2007;王初明, 2010)。協同是人類自適應(即靈活地依賴、整合與構建)不斷變化的心智、身體和外部世界的復雜過程,是二語發展的必然要求(Atkinson et al., 2007)。在聽說或讀寫過程中,協同效應源自語言輸入與產出的緊密結合,二語學習者構建與語言輸入相適應的情境模式和語言結構層次,催生語言產出層面的趨同,提高語言產出的質量。協同效應在課堂互動和寫作領域得到了實證支持(Trofimovich et al., 2014;Wang et al.,2015;王敏 等, 2014)。在復述研究領域,協同效應研究尚處于起步階段。蔡寧等(2017)調查不同輸入模態對四元組再現數量的影響,支持了輸入多模態對協同效應的促進作用。英語水平等學習者因素如何影響協同效應尚需進一步研究。
綜上,作為這一領域研究的初步嘗試,本研究擬擴大n元組和關鍵詞的調查范圍,利用計量學方法探索不同水平英語學習者在故事復述中如何使用不同長度的n元組(三元、四元和五元組)和不同類型的關鍵詞(原文詞和語義相關詞)再現原文的語言表達形式和內容,希冀研究發現為大學英語口語教學提供改進建議。
本研究回答以下兩個主要問題:
(1)不同長度n元組的重復量如何隨學習者的英語水平發生變化?
(2)不同類型關鍵詞的復現度如何隨學習者的英語水平發生變化?
本研究采用兩個混合設計回答研究問題,其中n元組和關鍵詞類型是被試內因素,學習者英語水平是被試間因素,兩個因變量是n元組的重復量和關鍵詞的復現度。n元組體現詞語組合方式,在語言形式和內容上對復述提出較高的要求。將n(n> 1)元組進行詞條化是研究文本鄰近詞組合的有用方式。根據n元組的構成,本研究將不同長度n元組操作定義為三個類別,即三元組、四元組和五元組。
關鍵詞是體現文本內容的重要詞項,本研究將之定義為兩個類別,即相同關鍵詞和同義關鍵詞。相同關鍵詞指復述中使用與聽力文本相同的重要詞。同義關鍵詞包括相同關鍵詞和與之相關的近義詞。
本研究采用聽說任務測量學習者的口語表現。聽力原文是一則故事。故事講述一個小男孩參加三場賽跑,第一場贏了另外兩個小男孩,第二場贏了兩位長者,第三場和兩位長者攜手穿過終點線。聽力文本長度為316個詞,共29個句子,平均句長約為11個詞,其中的絕大部分詞均為常用詞,只有個別詞(如frail和plead)對英語水平較低者可能有理解困難。
來自兩所高校的112名英語專業學習者在參加全國英語專業四級考試一個月后的同一時間在語言實驗室參加了故事口頭復述測試。這批學習者以女生為主(105名女生,七名男生),根據專業四級考試成績被分為低、中、高三個水平組。故事復述測試要求學習者聽完兩遍同一篇聽力原文后隨即對故事進行復述。在聽短文期間,學習者可以做筆記,復述時間控制在三分鐘左右。復述材料保存為音頻文件。
經過培訓的四名研究生對112份有效的音頻文件進行了轉錄和校對。在轉錄過程中,對不當停頓、機械重復和意義不完整的語段做出標注。研究者對提交的轉錄文件做了最終的核對。
在開展統計分析之前,剔除轉錄文本中所有標注和標點符號,同時將所有的字母改為小寫,避免統計結果受其影響。為了回答第一個研究問題,本研究對所有文本進行詞條化處理,將每位學習者復述文本和聽力文本依次轉化為n(n = 3,4,5)元組,再利用匹配技術計算每個學習者復述文本中包括的原文本n元組的總數,以此作為n元組重復量測量。
第二個研究問題涉及基于關鍵詞的復述內容分析,無須考慮由語法所限定的詞形變化形式。為此,本研究將所有文本中的詞語還原為詞目,詞類保持不變,如將runs、ran和running還原為run。利用停用詞表排除聽力文本中在內容方面沒有太大作用的功能詞(如and和the),保留揭示文本內容的重要詞作為關鍵詞(包括名詞、動詞和形容詞和副詞)。將由此得到的83個詞(即詞目)作為相同關鍵詞。在操作層面,同義關鍵詞包括相同關鍵詞和近義詞。利用WordNet 2.1(https:∥wordnet.princeton.edu/citing-wordnet)確定與原文83個關鍵詞意義相近的同義詞(即詞目),由此得到249個同義關鍵詞。將相同關鍵詞詞表和同義關鍵詞表與詞目化的復述文本進行匹配,得到每位學習者在復述過程中使用的相同關鍵詞總數和同義關鍵詞總數,以此作為內容復現度的測量。
本研究使用的統計分析軟件為R 3.6.2。停用詞表來自R數據包quanteda(Benoit et al. , 2018)。該詞表由175個詞組成,包括代詞、助動詞和情態動詞、連詞和介詞。詞目還原調用的R數據包為textstem(Rinker, 2018)。研究問題的回答采用雙因素混合方差分析。配對比較效應量估計采用Cohen’sd。效應量大小采用Cohen(1988)建議的標準:d= 0.2,效應量小;d= 0.5,效應量中等;d= 0.8,效應量大。
不同長度n元組的重復量隨英語水平變化的描述性統計量如表1所示。

表1 不同英語水平組n元組重復量描述性統計
表1顯示,在每個英語水平上的n元組隨著長度n的增加,重復量都在大幅度減少。從標準差、最大值與最小值來看,每個水平組內部差異都比較大,高水平組尤為如此。
圖1顯示不同長度n元組的重復量隨英語水平變化的模式。

圖1 每種長度n元組的重復量隨英語水平的變化
圖1中圓點、三角形和正方形符號代表不同英語水平組中n元組的重復量平均數。如圖所示,在每個英語水平組中,隨著長度n的增大,n元組重復量均呈明顯的下降趨勢,從三元組到四元組,下降的幅度特別明顯。從平均數變化的線條和數據點分布來看,對于每種長度的n元組,隨著英語水平的提高,學習者復述中重復的n元組量均呈上升趨勢。但是,這種上升趨勢在三元組上較為明顯,在其他兩個n元組上不太明顯。

表2報告在每類n元組上英語水平配對比較Tukey檢驗的結果。

表2 每類n元組在不同英語水平中的配對比較
表2顯示,在三元組重復量方面,中、高水平組顯著好于低水平組(p< 0.05),且效應量大,但是中、高水平組之間沒有顯著差異(p> 0.05),效應量較小。當三元組增至四元組和五元組時,只有低、高水平組之間有顯著差異(p< 0.01),效應量大,其他所有配對比較均沒有顯著差異,效應量處于中等或較低的水平。
表3報告在每個英語水平上不同長度n元組配對比較Tukey檢驗的結果。

表3 每類n元組在不同英語水平中的配對比較
表3顯示,在每個英語水平中,隨著長度n增大,n元組重復量無一例外地顯著降低(p< 0.001),且效應量很大。各個英語水平中n元組配對效應量的差異與英語水平和n元組類別之間的顯著交互效應有關。即,n元組配對差異的大小在不同英語水平上具有不一致性,但是差異的方向一致。
不同類型關鍵詞復現度隨英語水平變化的描述性統計量如表4所示。

表4 不同英語水平組關鍵詞復現度描述性統計
由表4可知,在每類關鍵詞上,隨著英語水平的提高,學習者復述時整體上再現更多的關鍵詞。從平均數來看,每個英語水平組同義詞的復現量比相同詞的復現量高出大約兩個詞。從最大值和最小值來看,各個英語水平組組內復現度的個體差異較大,高水平組尤為如此。從大約標準差來看,英語低、中等水平組組內差異近似,英語高水平組組內差異要大一些。
圖2呈現內容復現度隨英語水平和關鍵詞類型變化的模式。

圖2 每類關鍵詞的復現度隨英語水平的變化
如圖2所示,在每類關鍵詞上,關鍵詞復現度平均數有隨英語水平增加之勢。從平均數和數據點分布來看,英語低水平組與中、高水平組之間的差異較大,而中、高水平組之間的差異較小。在每個英語水平組中,同義關鍵詞平均復現度均高于相同關鍵詞平均復現度,但是增幅不大。
混合方差分析發現,英語水平對內容復現度有顯著主效應(F(2,109)= 9.35,p< 0.001),關鍵詞類型也有顯著主效應(F(1,109)= 296.42,p< 0.001),英語水平和關鍵詞類型沒有顯著交互效應(F(1,109)= 0.42,p= 0.658 > 0.05)。根據以上結果,在每個英語水平上同義關鍵詞復現度顯著高于相同關鍵詞復現度。
表5報告在每類關鍵詞中英語水平配對比較Tukey檢驗的結果。

表5 每類關鍵詞中不同英語水平配對比較
表5顯示,在每類關鍵詞上,英語中、高水平組在內容復現度方面均顯著高于英語低水平組(p< 0.01),且效應量大,但是英語中、高水平組沒有統計顯著性差異(p> 0.05),效應量也較小。
本研究得到以下主要發現:(1)不論英語水平如何,隨著n元組長度的增加,n元組重復的難度顯著增加;英語水平能夠在低、高水平組之間顯著區分各個長度上n元組的重復量,但是不能在中、高水平組之間做出有效區分,中等水平組相對于低水平組的優勢只停留在三元組的重復上;(2)不論英語水平如何,學習者整體上都會在復述時少量使用近義詞替代原文關鍵詞傳達原文內容;不論復述的關鍵詞是相同詞還是同義詞,英語中、高水平組的內容復現量顯著好于英語低水平組,但是前兩者之間沒有顯著差異。
Hoang et al.(2016)發現,在接受聽說任務的實驗組中學習者重復原文中習慣性搭配和短語的總量和語言水平沒有統計顯著性正相關關系。但是本研究發現,英語水平在三元組的重復中能夠保持相對較好的區分優勢。產生這一結果的主要原因可能在于Hoang et al. (2016)沒有較為全面地考察學習者在復述中對原文措辭的提取,且有些習慣性搭配和短語(如Despite the fact that)并不體現原文的主要內容,學習者或許覺得沒有必要記憶這些搭配和短語從而增加記憶負擔或者因為短語過長,學習者無法準確重復。
本研究發現高水平組比低水平組在復述中提取更多的四元組和五元組,支持了語言水平對協同效應的積極作用,即英語水平高更有助于學習者與輸入本文互動,增強協同效應。但是,我們也發現,隨著n元組長度的增加,在鄰近水平組之間,英語水平喪失了對n元組的提取優勢。這說明學習者對n元組的加工與提取能力并非僅僅取決于英語水平,還取決于學習者的非語言能力,如記憶力和筆錄能力(Crossley et al., 2014)。當然,英語水平、記憶力和筆錄能力等如何協同作用提升口語復述的質量尚需進一步研究。下面舉例說明一名英語中等水平的學習者在復述的開首時如何再現不同三元組和五元組。
學生文本:
Once there was a little boy. He was hungry for sport and success, and to him winning is everything and he desired for success. One day, the little boy took part in a race in his village, and his competitors are other two young boys.
三元組切分:

1once there was16him winning is31part in a2there was a17winning is everything32in a race3was a little18is everything and33a race in4a little boy19everything and he34race in his5little boy he20and he desired35in his village6boy he was21he desired for36his village and7he was hungry22desired for success37village and his8was hungry for23for success one38and his competitors9hungry for sport24success one day39his competitors are10for sport and25one day the40competitors are other11sport and success26day the little41are other two12and success and27the little boy42other two young13success and to28little boy took43two young boys14and to him29boy took part15to him winning30took part in
以上n元組切分包括43個三元組,其中與聽力原文相同的三元組數有17個(見畫線部分),重復率約為40%。觀察以上三元組發現,這名學習者正確使用了一些過去時描述故事背景和情節,如once there was和he was hungry,也恰當重復了一些習慣搭配,如took part in和in a race。但是我們也發現,復述中存在誤用現在時代替過去時和措辭不當等問題,如winning is everything和other two young,導致三元組重復量減少。學習者對重要信息記錄和記憶的不準確也可能降低三元組重復量。譬如,聽力原文的第一句是:Once there was a little boy who was hungry for success in sports.從重要信息再現的角度來看,這名學習者將這個包括關系從句的復合句重述為兩個簡單句未嘗不可,但是錯誤地將“渴望體育活動中勝出”(hungry for success in sports)理解為“渴望體育活動和成功”(hungry for sport and success)。對于這樣一名英語水平達到中等的學習者,聽懂原文中的這個句子應該不難,信息錯位問題可能出現在信息的記憶和組織上。
我們再看以上幾句話的五元組切分:與原文相同的五元組沒有劃線,應如下所示:
五元組:

1once there was a little22desired for success one day2there was a little boy23for success one day the3was a little boy he24success one day the little4a little boy he was25one day the little boy5little boy he was hungry26day the little boy took6boy he was hungry for27the little boy took part7he was hungry for sport28little boy took part in8was hungry for sport and29boy took part in a9hungry for sport and success30took part in a race10for sport and success and31part in a race in11sport and success and to32in a race in his12and success and to him33a race in his village13success and to him winning34race in his village and14and to him winning is35in his village and his15to him winning is everything36his village and his competitors16him winning is everything and37village and his competitors are17winning is everything and he38and his competitors are other18is everything and he desired39his competitors are other two19everything and he desired for40competitors are other two young20and he desired for success41are other two young boys21he desired for success one
以上切分包括41個五元組,其中與聽力原文相同的五元組數有10個,重復率只有25%。重復五元組的挑戰性在于,五元組不僅包括文本內容和短語表達,而且還涉及句子的主干、短語之間甚至句子之間的銜接等語篇問題,如race in his village and和boy took part in a。簡言之,五元組重復不僅要求學習者再現聽力原文的內容,而且還要求準確使用原文的語言表達形式,在語言水平和記憶力等方面向學習者提出了比三元組更高的要求。
本研究發現,復述中原文本內容的再現主要通過原文關鍵詞的重復。本研究從聽力原文中提取了83個關鍵詞。表4顯示,各個英語水平組都較多地重復來自原文的關鍵詞,如低水平組平均重復大約41個關鍵詞,占比為49%。同樣,Hoang et al.(2016)發現,接受聽說任務的實驗組在故事復述中平均使用的詞族與原文有69%的重合。這表明,在故事復述中,學習者會傾向于憑借對聽力輸入的記憶和筆錄再現原文的重要信息。同低水平組相比,中、高水平組復述中重復關鍵詞的占比更高(中等水平組:59%;高水平組:63%),個別學習者甚至能夠重復81%的關鍵詞。因此,語言水平一定程度上能夠促進相同關鍵詞的提取。雖然本研究發現各個英語水平組除了使用相同詞之外,還使用了同義替代關鍵詞,但是同義替代詞的使用量很少。從表4可以發現,各個水平組實際上只是平均使用了2-3個同義替代詞。這一發現同蔡寧等(2017)的研究一樣支持了協同效應。學習者在與聽覺輸入文本互動時,有限的語言產出能力被更高的理解力所牽引,提取原文關鍵詞會減少產出過程中的認知負荷和注意力的分散,緩解信息加工能力不足和時間壓力等問題。其結果是,復述中的內容再現主要通過重復原文關鍵詞,使用同義替代詞只是輔助手段。從表5提供的各個水平組配對比較在兩類關鍵詞復現中出現近似的效應量可以推斷,復述中同義替代詞的使用量與學習者英語水平沒有必然的正向聯系。同低水平學習者一樣,高水平學習者也傾向于盡可能使用原文關鍵詞,減少信息加工的負荷,這樣做既“省力”,又“準確”。不過,由于英語水平對協同效應的積極作用,高水平組比低水平組能夠從原文本中提取更多的關鍵詞。
這里仍以前文提及的學習者為例,分析其復述對原文重要信息的再現情況。圖3顯示學習者復述文本和聽力原文中的關鍵詞詞云。

圖3中關鍵詞的字體大小代表詞語出現的頻數,字體越大,頻數越高。例如,boy在兩個文本中出現的頻數皆為最高,因為這則故事的主角是小男孩。在學習者復述中出現三次及以上的關鍵詞還有race、old、man、cheer、success、little、time。這些高頻詞在聽力文本中也同樣以高頻出現。但是,在聽力文本中出現的其他一些高頻詞(如wise),在學習者的復述中未能以高頻出現,甚至一次都未出現(如crowd)。從兩個詞云的大小可以看出,這名學習者的復述漏掉了一些重要信息。聽力文本中包括83個關鍵詞,而學習者復述只包括52個關鍵詞,其中50個詞為聽力文本詞,另外兩個詞too和desire作為同義詞替代了原文詞 also和hungry (for),保留關鍵詞信息的占比約為63%。很顯然,這名學習者在復述中漏掉了一些重要細節。譬如,第一場比賽的復述中漏掉評價性信息,如unsurprisingly,也漏掉觀眾的反應信息,如喝彩(cheer)和招手(wave)。再如,原文描述少年懇請(plead)第二場比賽是希望(hope)感染(impress)智慧老人(wise old man),但是學習者的復述卻沒有使用相同或同義關鍵詞再現這一信息。原文描述觀眾對第三場比賽的反響時用了cheer和like a thunderstorm(雷鳴般),但是學習者的復述卻漏掉了這一信息。原文介紹與少年第二、第三場比賽的一位選手是身體虛弱的婆婆(frail granny),另一位選手是盲人(blind man),但是學習者在復述中均沒有提及。這名學生的復述中缺失的關鍵詞信息占比達到37%。如此高比率的關鍵詞信息的缺失是具有普遍性的。根據表4提供的各個英語水平組復述使用的關鍵詞(即同義詞)平均數,我們得到低、中、高水平組的復述中平均丟失的關鍵詞信息占比依次為48%、38%和35%。由此可見,在英語專業聽說教學中,學習者的復述能力應作為薄弱環節來加強。學習者復述能力的培養不僅應該包括提升學習者的聽力,而且還應該包括提升筆錄與信息整理的能力以及更具有一般性質的重要信息提取能力和記憶能力。
本文以英語學習者口語復述故事文本為語料,調查英語水平對不同長度n元組重復量以及對不同類型關鍵詞復現度的影響。研究表明,英語水平的提高一定程度上有助于學習者在口語復述中提取聽力原文中的n元組和關鍵詞。隨著n元組長度的增加,學習者提取n元組的能力下降;學習者對故事內容的再現以提取原文關鍵詞為主。整體上,學習者的復述能力在內容和語言形式方面都有很大的提升空間。
本研究對英語專業聽說教學有重要的啟示。聽與說是口語交際不可分割的兩個方面。學習者只有同時注意高質量語言輸入的形式和內容,有意識地模仿地道的語言表達形式,方有可能真正提高語言產出能力。口語復述是實現“聽”“說”相結合的重要手段。口語復述教學中應著力提高學習者從聽力故事中提取關鍵詞的能力,包括傳授如何構建關鍵詞之間的語義網絡,如何做有效的筆錄和使用其他記憶技巧。在提高學習者關鍵詞提取能力的同時,教學中也應注重語言形式和意義的統一,鼓勵學習者在復述中盡可能使用原文的語塊,提升語言表達的準確性和流利度。