陳為捷 林韻蔚

英語寫作是體現英語掌握能力的重要項目,并且在各種升學考試中,英語寫作都是必不可少的,但是學生對英語寫作充滿困惑,而教師對英語寫作的指導又不能滿足英語學習者對英語寫作的需求。隨著計算機輔助教學技術的發展,寫作自動評價系統出現并在教學中投入使用,系統的效度為學界所認可。通過對系統使用的調查研究發現,系統使用者的態度以及使用方法都會影響它的效果,但是系統對英語寫作的輔助作用被證實是確實有效的。但是迄今為止卻鮮有人去調查根據系統反饋進行的修改中哪些語言特征對習作分數的提升有積極的預測作用。因此本研究想探尋在自動評價系統的幫助下,那些寫作成績獲得顯著提高的學習者,在作文修改方面存在哪些共性特征?旨在為英語寫作教學提供指導依據。
1. 多維分析方法
Biber的多維分析法:Biber(1988)從LLC(LondonLund Corpus)英語口語語料庫和LOB(Lancaster-Oslo-Bergen)英語書面語語料庫中選取了覆蓋23種口筆語語體的文本。根據以往的研究,Biber總結出67個常用于分析語體變異的語言特征,它們包括過去時態、完成時態、現在時態、地點狀語、時間狀語等(具體67個語言特征見附錄)。Biber對文本中的 67種語言特征進行了調查:他提取了每個文本的所有語言特征頻率,通過對頻率值的因子分析發現語言特征的共現情況,總結出描述語體特征的7個因子或7個功能性維度。它們包括維度1“交互性與信息性表達”(involved versus informational production)、維度2“敘事性與非敘事性描述”(narrative versus non-narrative concerns)等。每一維度由因子負荷為正、負值的兩組“共現”性語言特征組成。這兩組語言特征在一個維向上呈互補分布,表達相反的交際功能。比如說,第一維度上呈互補關系的是交互性功能和信息性功能。交互性功能由負荷值為正值的語言特征來體現,包括第一二人稱代詞、特殊疑問句、動詞的現在時態以及私人性動詞 (private verbs) 、強調式詞語 (emphatics) 等,而信息性功能由因子負荷為負值的語言特征來體現,包括名詞、介詞、詞長 (這里指復雜的詞匯) 、類符與形符比 (type-token ratio,即語篇中的詞匯密度) 等。所謂互補分布是說當帶有負負荷值的語言特征頻繁出現在一個語篇中,那帶有正負荷值的語言特征就會出現的較少。 Biber(1989)在其多維分析框架的基礎上,通過5個維度上詞匯和句法特征的共現規律將481篇文本聚類為8種不同文本類型,包括親密人際互動型(intimate interpersonal interaction)、信息互動型(informational interaction)等。在多維分析出現之前,以往的語體對比研究大多集中于分析語篇在某一參數上的差異 (如正式性與非正式性) ,難以充分揭示語體間的差異。多維分析這種基于統計分析的研究方法顯然大大提高了分析的客觀性和準確性。
2. 研究設計
2.1 研究問題
本文擬回答以下研究問題:
2.1.1分數得到顯著提升的習作的初稿和定稿分別具有何種語體特征和具體語言特征?
2.1.2初稿和定稿在語體特征和具體語言特征上有何差異?
2.2 研究語料
下載某次批改網舉辦的“百萬同題”寫作活動中某學校參與的1448位學生的初稿和終稿共2896份習作,篩選出終稿與初稿相比提分達到10分以上的習作,得到81位同學的初稿和終稿,共162份習作,建立起一個小型語料庫。
2.3 研究工具
Biber的多維分析嚴重依賴統計技術, 給研究者帶來了巨大的技術困擾。 Nini (2015)根據Biber的研究框架設計了一個多維標注與分析工具MAT 1.3(Multidimensional Analysis Tagger 1.3)。通過實驗對比發現用MAT按照 Biber1984年的分析流程處理文本后的結果與Biber的研究結果相符。實驗證明MAT可以復制Biber的多維分析方法。江進林、許家金進一步認定了MAT多維語體分析的信度與效度。
MAT的使用使一系列繁瑣的工作得以自動化完成,例如文本標注、特征提取和數據分析。 軟件處理完文本就能生成每篇文章中每種語言特征的頻數、每篇文章的維度值,在每個維度里參照其他8種文本類型,報告被研究文本最接近的文本類型等。
3. 結果與討論
3.1 總體維度差異
3.1.1 體裁與文本類型
從MAT的報告的數據總體來看,提分10分以上的習作的初稿和定稿的文本類型相同,都是屬于交互勸說型(involved persuasion)。初稿和定稿在單一維度之間的體裁類型只在維度六有變化——初稿在維度六“即席信息組織精細度(online information elaboration)”表現出來的體裁類型為廣播稿(broadcasts),而定稿在維度六的體裁類型為官方文件(official documents),表明定稿的即席信息組織精細度略高于初稿,語篇組織緊湊度有所提升。
3.1.2 六個維度值差異
圖1直觀地顯示初稿和定稿在維度5上的維度值有明顯的差異,定稿的維度值明顯高于初稿。維度5為“信息抽象與具體程度”(abstract versus non-abstract information)。維度值越高表明文章越抽象、越正式。可見,學生作文內容抽象程度與其作文成績成正相關。
3.2 語言特征分析
從表2可以看出,將提分10分以上習作的初稿的語言特征和定稿的語言特征進行配對T檢驗后得出有顯著差異的語言特征有8個,其中維度值升高的有名詞化名詞、聯合短語、表語形容詞和類形符比,維度值下降的有除名詞化的名詞外的其他名詞、第二人稱代詞、過去時和現在完成時。
Biber和馬克沃斯和Baker(1974)發現,現在完成時經常與過去時同時出現,作為敘事的標志。語料庫中的習作文體是議論文,因此在定稿中,作為敘事文體標志的現在完成時和過去時的減少符合議論文文體的特點,為習作成績的提高做出了貢獻。Chafe(1985)指出,第二人稱代詞需要一個特定的接收信息人,并表示與該接收人的高度參與。這體現了文章中的高度互動。該語料庫中定稿的第二人稱代詞使用頻率的下降,正體現了論說類文章不需要那么強的互動性。第二人稱代詞使用的減少促使了習作成績的提升。Chafe(1982,1985)和Danielewicz(1986)指出名詞化的名詞合能擴展思想的容量,并將信息整合到更少的單詞中。名詞化的名詞使用頻率的提升表現了相比于初稿,定稿信息的復雜度有所提升,這也促使習作成績得到提升。由于名詞化的名詞使用頻率的增加,比如導致其他名詞使用量的減少,這與檢驗結果一致。類形符比的提高和聯合短語的使用頻率提升都體現了定稿信息密度的提高。表語形容詞使用頻率的增加體現了定稿中對某行為或某事件的評價,符合論說類文章中又論又評的需求,因而也促使了習作成績的提升。
通過多維分析模型,我們發現分數提分10分以上的定稿與初稿相比,在維度5與維度6上有差異。相比初稿,該論說文的定稿表現出信息更密集、更抽象的特點,這是由語言特征使用頻率的增減實現的。本研究給寫作教學的啟示是,引導學生形成語域意識,采用適合寫作文體的語言特征。