張 銳 呂長竑
(西南交通大學外國語學院 四川 成都 610000)
1976年,Halliday和Hasan合著的《英語的銜接》一書的出版,標志著銜接理論的系統研究的開始。連接是語篇銜接中重要的手段之一,人們通過連接性可以了解相鄰句子(群)之間的語義聯系,甚至可以經前句從邏輯上預測后文的語義[1][2]。由于連接詞“明確表示文本段落之間的聯系,因此連接詞就與連接成分和從句一起成為了創建文本凝聚力的重要手段”,它們在章節長度或更長的話語的連接單元中具有廣泛的文本功能[3]。按照抽象邏輯語義區分,韓禮德將英語連接詞,分為四大類:增補、轉折、因果、時序,每類又分為了許多小類。
國內對于連接詞的研究主要分為宏觀研究和微觀研究兩類。宏觀角度的研究主要是對英語寫作中連接手段使用的總體情況的研究。例如,陳新仁[4],趙蔚彬[5],鄧飛[6],都平、吳曉春和王清正[7]。微觀角度的研究主要是對某種特定連接手段或者某些連接詞的深入研究。例如,莫俊華[8],吳志芳[9],初良龍和趙成發[10],陳振龍和江桂英[11]。以往的研究,總體而言都獲得了比較一致的發現,即中國學習者使用連接詞的數量比本族語者多,但是豐富度卻不如本族語者。但在微觀研究角度方向,當前的連接銜接關系研究僅涉及因果、轉折和增補關系,時序類連接詞的銜接關系研究尚未出現。且以上研究中,在選擇中國學習者語料庫時主要是基于CLEC或者SWECCL,這兩個語料庫建立時間比較早,語料較老,語料庫任務也多半是高風險的標準化考試作文。本文所選的學習者語料庫是北外語料庫團隊建立的中國學生作文萬篇英語作文語料庫(TECCL),該語料庫于2015年年底建庫,語料較新,寫作任務類型包括課堂限時作文、課后家庭作業、期中期末考試作文,為課堂演講而準備的講稿,以及小組協作作文等,屬于英語課程體系內的學業任務,代表性較強。目前,還沒有學者基于TECCL對連接詞進行過相關研究。
本文的研究是基于中國學生作文萬篇英語作文語料庫(TECCL)和英語本族語者語料庫(LOCNESS),使用語料庫檢索軟件Wordsmith 6.0和數據分析軟件SPSS 24,進行對比研究。研究過程中,筆者根據文本文件批量分離程序將TECCL中的學生作文語料按照年齡段分為三個子語料庫:小學階段作文語料庫、中學階段作文語料庫和大學階段(小部分其他)作文語料庫。
時序顧名思義即表示時間和序列,綜合Halliday,Chen和趙蔚彬對銜接理論、時序類連接詞的分類,時序類連接詞主要可以分為時間類、順序類和總結三類[12]。本文結合幾位前輩的分類,主要研究以下44個時序類連接詞:
時間類:early,previously,formerly,before,after,until,later,afterwards,meanwhile,in the meantime,at the same time,simultaneously,on another occasion,occasionally,at this moment,after a while,all the time
順序類:first,second,third,firstly,secondly,thirdly,then,next,at first,first of all,to start with,in the first(second,third)place,in turn,last,finally,initially
總結類:all in all,in short,in summay,in brief,in sum,in conclusion,to sumup,to summarize,to conclude,overall,in a word
主要是解決以下四個問題:
(1)學習者與本族語者在時序類連接詞使用頻數方面是否存在顯著差異?
(2)學習者和本族語者最常使用和最少使用的時序類連接詞是否有相似性?
(3)學習者和本族語者在三類不同功能的時序連接詞的使用情況是怎樣?
(4)不同語言水平學習者在使用時序類連接詞時有什么差異?
通過檢索44個時序類連接詞的頻數發現,TECCL和LOCNESS中分別有21496和2199個時序類連接詞,這可能是兩個語料庫總體規模不同導致的。筆者將檢索數據換成了百萬詞頻:兩個語料庫中分別有11828和7630個時序類連接詞。每百萬詞頻中TECCL語料庫比LOCNESS多使用4198個時序類連接詞,由此可見,中國學習者較英語本族語者更多地使用時序類連接詞。但是從Wordsmith 6.0中檢索到的平均句長和平均詞長來看,學習者和英語本族語者作文的平均句長分別是14.36和20.05,平均詞長分別是4.46和4.64,可見,在語言水平上學習者較本族語還有一定差距。
以百萬頻數來看,中國學習者使用頻數在200詞以上的時序類連接詞有17個,本族語有11個。在44個時序類連接詞中,中國學習者使用了43個,而本族語者只使用36個,其中on another occasion在兩個語料庫中都沒有使用。而in a word,in the first place,in brief,in the meantime,in summary,in sum和to summarize這7個時序類連接詞是中國學習者語料庫有出現而本族語者語料庫沒有出現的。在學習者過多使用的7個詞中,尤其以in a word最為突出,以百萬詞頻計算,該短語在本族語中使用了283次。但是學習者在本族語者使用過的某些時序類連接詞里面,也有少部分是學習者過少使用的,比如until,overall,in turn,to conclude,initially,simultaneously 和formerly這7個詞。總體而言,學習者時序類連接詞使用頻數比本族語者高,呈過多使用的現象,少部分詞呈過少使用現象。
用SPSS數據分析對TECCL和LOCNESS語料庫中檢索的時序類連接百萬詞頻數進行配對樣本T檢驗發現,配對樣本相關系數是0.845,sig=0.000,樣本T檢驗P=0.002〈0.05,說明兩組數據具有顯著性差異,由此進一步說明學習者時序類連接詞比本族語者顯著增多,學習者時序類連接詞比本族語者使用過多。
TECCL和LOCNESS中最常使用的10個時序類連接詞分別是first,after,then,last,second,before,finally,secondly,firstly,next和 then,first,after,before,until,second,last,later,next,finally,兩個語料庫中最常使用的時序類連接詞有8個是相同的,有兩個不一樣,但總體差別不大,這說明學習者和本族語者在時序類連接詞的選擇上具有相似傾向。筆者推測之所以學習者使用最多的10個時序類連接詞中有firstly(468)和secondly(393),而本族語者沒有,且本族語者使用二詞的百萬詞頻分別僅為104和62,原因在于相比于first和second而言,中國學習者可能認為firstly和secondly更帶有連接副詞或者連接詞的標記性(-ly),而認為first和second更多是數詞,有些中國學習者并不認為這兩個詞具有連接副詞的功能。就兩個語料庫各自使用最少的10個時序類連接詞而言,有6個詞是相同的。綜上,中國學習者和本族語者在常用和少用的時序類連接詞的選擇上具有極強的相似性。
學習者和本族語者使用的時序類連接詞都主要集中在順序類連接詞上:表次序和序列的連接詞。TECCL中有7789個順序類連接詞,占學習者所用時序類詞的65.86%;LOCNESS中有4424個順序類連接詞,占本族語者所用時序類的57.97%,尤其體現在頻數最多的前四位:first,then,last,second。但總體而言,學習者較本族語者更多地使用順序類連接詞。其次,學習者和本族語者使用次頻繁的是時間類連接詞,本族語者比學習者更加頻繁地使用該類連接詞,但本族語者使用過的所有時間類連接詞,學習者也都有使用。就總結類連接詞而言,在使用比例上本族語者更多,占6.2%,學習者只占2.7%;就總結類連接詞使用類型而言,學習者要多很多,其中in a word,in the first place,in brief,in the meantime,in summary,in sum,to summarize這七個連接詞在本族語者語料庫中檢索出來的結果都為0,特別值得注意的是,就百萬詞頻而言,in a word在學習者語料庫中使用了283個;in the first place使用了59個。
筆者推測學習者和本族語者在三類時序類連接詞中使用時間類連接詞不多的原因是這些作文的體裁主要是議論文和說明文,不會帶有太多的時間標記。而順序類連接詞的使用比總結類多是因為總結類連接詞一般都用在結尾或者段末,而順序類連接詞一般用在文章主體的敘述中,文章的主體應占全文的大半以上,自然是使用順序類連接詞比時間類和總結類多很多。而in a word,in the first place,in brief,in the meantime,in summary,in sum,to summarize這七個連接詞在本族語者語料庫中檢索出來的結果都為0,但在學習者語料庫中卻經常使用的原因是這些表達總體上就比較偏中式英語的表達,它們當中有的就是漢語“一句話總結來說”“簡而言之”等中文的完美對應,本族語者少用也是不言而喻。
為檢驗不同層次的學生的語言水平關系,筆者采用文秋芳、丁言仁和王文宇(2003)的辦法,用Wordsmith 6.0統計了各層次水平學生的平均詞長和平均句長。小學和中學的平均詞長和平均句長都比大學要低,可見大學學習者的英語語言水平是三個階段里面最高的,尤其是平均句長呈上升趨勢,符合正常認知發展思維。比較有趣的是,中學組的平均詞長和平均句長分別是:4.29、12.42,小學組的平均詞長和平均句長是4.42、14.25,可見在TECCL語料庫中,中學組無論是平均詞長還是平均句長都比小學組要低,即中學組語言水平比小學低。顯然,這個推論是不太符合常識的,但是數據的確是真實數據。筆者查閱了TECCL語料庫來源情況后發現,在TECCL語料庫中小學生的語料庫只有59篇,而且只來自兩個省份:江蘇和湖北,而中學生的語料庫占了2795篇,文本數量的差異和所選省份的小學生英語水平過高可能是導致數據差異的主要原因。筆者推測,因為TECCL語料庫收集的是學生作文,而如果小學生都能達到寫英語作文的程度,這說明這些小學生英語水平應該就是比較高。在中國小學生英語能夠達到寫作文的程度的省份并不多,因為很多中西部省份小學并沒有開設英語課,即便有,很多小學的學生的英語水平也不能達到寫作文的難度。所以,TECCL語料庫中小學組樣本的選取比較難取,而江蘇和湖北是比較成功的樣本選取省份,因為這兩個省份的小學生英語開設較早且培養得較好,學生的英語水平能夠達到寫作文的程度。這也從側面說明,如果學習者在小學就開始接觸英語,小學六年的時間的英語學習效果,有可能比中學才開始學習英語的學習效果要好。當然這只是筆者的推測,具體情況還有待后期研究。
本研究根據銜接理論,對比TECCL和LOCNESS兩個語料庫,分析學習者寫作時序類連接詞方面的應用情況,得出結論:(1)中國英語學習者與本族語者在時序類連接詞使用頻數方面存在顯著差異:學習者時序類連接詞使用頻數總體上比本族語者高,呈現使用過多現象,小部分連接詞呈現使用過少現象;學習者和本族語者最常使用和最少使用的時序類連接詞呈現相似性特征;學習者和本族語者在三類不同功能的時序連接詞的使用情況方面也具有相似特征,主要集中在順序類連接詞上,其次是時間類,總結類使用比例都最少;不同語言水平學習者在使用時序類連接詞時呈現大學(及其他)階段使用時序類連接詞水平最高,學習者時序類連接詞的使用情況與學習者水平、層次不太成正比,主要是表現在小學組的水平比中學組高,這里的具體原因還有待進一步研究。在時序類連接詞的分類上,某些詞的歸屬可能還存在爭議性,如last既可以是順序類連接詞,也可能是時間類連接詞,也需要后續研究加以注意。