摘 要:本文運用語料庫語言學的方法,自建超過250萬詞的英專本科畢業論文語料庫,并按照論文質量將其分為高水平,中水平和低水平論文三個子語料庫。通過分析語料庫中的詞頻、句長、關鍵詞列表、搭配列表等,發現了高中低分組論文的相同和相異特征。此研究對準確了解當前英專學生學術論文寫作質量,以及提高英語學術寫作水平具有較強的實踐意義。
關鍵詞:英語專業;本科畢業論文;論文質量差異;對比研究;語料庫語言學
基金項目:本文為安徽省省級質量工程項目“基于分析性評價體系的英專本科畢業論文質量評估研究”(項目編號:2017jyxm0039)的階段性成果。同時,本文也受到教育部人文社會科學研究青年基金項目(項目編號:14YJCZH148)的經費支持。
1 引言
《英語類專業本科教學質量國家標準》要求本科生要具有“學習能力以及思辨、創新和科學研究的能力”,而這種能力突出的在畢業論文課程中得以檢驗(仲偉合, 2015:5)。針對英專本科畢業論文的研究有很多,既有微觀層面的選題、摘要、語言和格式問題,也有涉及宏觀層面的現狀分析、意義分析、課程改革、論文指導體系和評估機制、利用網絡資源的寫作指導模式、論文指導和管理的網絡平臺建設問題以及論文寫作動機研究(如孫文抗 2004;郭玉鑫 2010;顧佩婭等2010;盛國強,周永模 2011;陳正倫2012)。研究方法多采用文獻資料法,問卷調查法,個案分析法,內省法及實驗法。同時,出于研究者的研究目的,多選用少量文本或者僅僅是教師針對畢業論文寫作的直覺反饋,帶有強烈的主觀性、片段性和闡述性,無法真實全面反應目前英語專業本科生的論文質量。因此,已有研究者建議運用語料庫大數據進行英語寫作方面的研究,因為語料庫技術能展示那些并非一目了然的現象(Baker 2005:197)。但是學者們的研究對象主要針對大學英語或英專低年級的短篇英語作文寫作(如袁昌萬,金雙軍2015;丁永久 2013)。本研究自建超過250萬詞的英專本科畢業論文語料庫,并按照質量將其分為高水平,中水平和低水平論文三個子語料庫,擬運用語料庫技術,從詞數、詞頻列表、關鍵詞列表、搭配等方面去探討各類水平論文的相同和相異特征。這是一次將語料庫技術應用于英語寫作質量分析的實踐,其研究結果可幫助教師準確了解當前本科學生英語論文寫作質量,對提高英語學術寫作教學水平具有較強的實踐意義。
2 研究問題與研究方法
本研究嘗試回答以下問題:1)通過語料庫手段能發現不同水平論文的差異體現在哪些方面?2)高分、中分、低分的英專畢業論文有什么樣的相同特征以及差異性特征?
首先,筆者收集了合肥工業大學近4年英語專業本科畢業論文,共計541篇。按照論文分數,分為高分組(85分及以上)105篇、中分組(75分—84分)329篇、低分組(74分及以下)107篇,建立了約250萬詞的英專本科畢業論文語料庫,如表1。
第二,運用wordsmith tools 6.0,針對英專本科畢業論文,以英國學術英語語料庫為參照語料庫,列出了以關鍵性(keyness)為標準排序的關鍵詞列表。然后通過分析關鍵詞的搭配詞以及上下文,來討論三組論文的選題特點。
最后,分析詞頻列表(如表3)以及索引行來討論論文研究對象,口語化程度,感性和理性的側重點以及論文主客觀程度等。
3 結果與討論
3.1 高中低分組畢業論文在選題上的異同
畢業論文的選題會直接影響畢業論文的整體語篇的質量。通過觀察關鍵詞列表發現,整體來說文學、翻譯方向的論文數量高居第1,2位。其原因在于文學和翻譯方向的論文參考資料相對來說比較豐富,理論也比較容易看懂。此外,高中低分三組的高頻詞中都有“English”、“Chinese”、“culture”等,這說明英漢語言對比和中西文化對比等,也是較高頻率選題。
進一步分析表2,發現高中低分組選題的側重點是不同的:第一,低分組和中分組相比,低分組文學選題更為分散,而中分組選取的作品更為集中。低分組的論文關鍵詞大多與文學作品中的人物名稱或是作者有關,例如Blanche、Oliver、Riley、 Sula、 Lawrence、Stella等。由此可見,低分組的同學們更多的關注文學題材。而中分組的關鍵詞有百分之八十是人名,這些人名中包括文學作品中的主人公,例如《白鯨記》中的Moby Dick、《德伯家的苔絲》中的Tess、《哈利·波特》中的Harry、《呼嘯山莊》中的Heathcliff。中分組與低分組相比,選取的文學類的作品更為集中。第二,高分組選題大多和翻譯有關,和其他兩組區別較大。高分組明顯與其他兩組不同,排在第一位的關鍵詞是“Japan”,且排名第十位的是“Diaoyu”,這反映了高分組的同學更加關注于時事政治,或更貼近當代的生活,更加注重新聞方面的搜集與分析。從 “translation”、“corpus”、 “text”等詞可以看出高分組的畢業論文大多與翻譯有關,并且大多以語料庫為手段對文本進行比較;又或者偏重時政新聞的話語分析。
3.2 高中低分組畢業論文在詞匯句法層面的異同
第一,詞匯數量上高分組最多。英語書面語長度與其英語水平呈顯著性正相關,相關系數高達0.7以上(丁言仁,戚焱2005)。因為高中低分三個子語料庫庫的篇目數量不對等,故只有總詞數除以篇目數所得的平均詞數較有可比性。觀察表1發現,高分組的平均詞數為5428,中分組的是4587,低分組的是4037。進一步推算,高分論文的詞數遠超中分論文和低分論文,超出中分論文詞數18.3%,超出低分論文詞數34.5%,而中分論文超出低分論文詞數13.6%。即從詞匯數量上說,高分論文、中分論文和低分論文形成三個梯度,梯度之間的距離差不多。中分論文要想往高分論文上提升,需增加將近1/5的詞數;低分論文要想往中分論文上提升,則需增加大約1/7的詞數,這個應該不難做到;而低分論文要想直接往高分論文上提升,就需增加超過1/3的詞數,這對于學習者來說就具有一定的難度。
第二,語塊上高分組更擅長寫獨立分句。語塊通常是作為一整體儲存在記憶中,使用時直接提取,無需根據語法規則生成和分析。語塊的分類多種多樣(如Becker 1975;Michel Lewis 1997;Nattinger,Decarrico 1992等)。本文選擇表述較為簡潔直觀的Altenberg(1998)的語塊分類法,將詞塊分為完整分句、分句成分和不完全詞組。完整分句具有獨立的主謂結構,可細分為獨立分句及非獨立分句;分句成分可分為多樣分句成分及單一分句成分;不完全詞組指缺乏實意詞的詞組。為了數據的可比性,筆者從高中低三個子庫中各抽取了20篇論文,共計60篇,建立一個小型平衡語料庫,然后抽取其中的3-6字符,進行語塊分析。
分析結果表明,三組論文的共同點在于:第一,從3-6字符的語塊數量上看,3字符語塊數量最多,隨著字符數的增加,三組語塊的數量呈明顯遞減趨勢,6字符語塊數量最少。第二,從語塊分類上看,完整分句的頻數明顯低于分句成分頻數。進一步細化,單一成分的所占比例始終保持高,其次為多樣成分和不完全詞組所占比例。這表明在英專學生論文寫作中,多使用分詞成分或詞組來組合文字。而三組論文的不同點在于:高分組中獨立分句頻數始終高于中、低分組,這說明高分組論文更擅長寫獨立分句,擅長撰寫長句。
3.3 高中低分組畢業論文在研究對象、口語化程度、理性感性側重點及實例數量上的異同
通過分析詞頻列表(表3),可以發現以下四點不同。首先,三組論文的研究對象關注點不同,這一點可以從人稱代詞(he, she, it等)的使用來發現。分析詞頻列表的前幾個人稱代詞時,都是男性人稱代詞多于女性人稱代詞和中性代詞。這說明三組論文所研究的男性作家作品,或者作品中的男性人物,或者男性話語,會相對較多一些。不同點在于,高分組的代詞詞頻為:中性代詞使用頻率>男性人稱代詞>女性人稱代詞,其中男性人稱代詞和女性人稱代詞詞頻數目差距很小。而中分組和低分組步調幾乎一致地呈現出:男性人稱代詞使用頻率>女性人稱代詞>中性代詞。這就意味著,三組論文寫作者的思維方式和關注點有所不同。高分組所用中性代詞較之最多,是因為更多時候都在討論作家作品本身,或者翻譯文本本身,而較少涉及作家或者作品中的人物。
其次,三組論文的口語化程度不盡相同,中分組和低分組論文的口語化程度更高,高分組則相對較低。這主要體現在“I”等第一人稱代詞的使用頻率上。“I”在高中低分組的詞頻出現排位分別是第29,16,14位。低分組過度使用第一人稱代詞,即過分強化作者的顯現度,不符合科研論文要求的嚴謹客觀,而更接近口語的直接和主觀。
第三,三組論文的理性和感性側重點不同。例如,“life”也是三組論文數據庫共同具有的高頻詞之一,人生和生活確實是每個人窮盡一生要思考的問題。按照詞頻列表的單詞排序,高分組論文語料庫的“life”一詞出現在語言對比等詞之后,而在中分組和低分組論文語料庫中則是出現在之前。進一步觀察索引行發現,高分組論文更多時候是在比較客觀地對比語言,而不是以探求人生哲學為主。這就使得高分組論文更加理性和務實,言之有物,邏輯更加清晰,更容易被理解接受。中分組和低分組論文顯得更加感性一些,容易陷入言之無物的境況,有些思想不太好用語言組織,很難準確地表達,從而影響論文質量。
第四,三組論文的主觀和客觀程度不同,這可以從表3中的“translation”一詞看出來。高分組中,“translation”一詞出現頻率位居第1,中分組和低分組位居第6位和第7位。這就說明,三組論文中“翻譯”的研究都是一個重要選題。而英漢互譯的研究離不開中英文的舉例,此類論文中就會出現漢語詞匯。三組論文中的翻譯類論文的平均中文詞數(如表1所示)就體現出漢語例子的數量。研究發現,在涉及翻譯的選題時,高分組的中文詞數比例明顯比中分組和低分組多,這說明高分組舉了大量的實例,使研究更具說服力,也使論證的推導過程更加嚴密,學術客觀性得以提升。
4 結論
本文運用語料庫的手段,發現了高中低分組論文在選題、詞匯層面、句子層面、研究對象、口語化程度、感性理性分析側重點、主客觀程度層面都有異同點,其中差異性特征得到了特別的關注。此研究希望借助語料庫語言學的相關手段,較為客觀的展現當前本科學生英語學術論文寫作的質量差異點,從而有利于教師有的放矢地提高英語學術寫作教學水平。
參考文獻
[1]Altenberg, B. and M. Tapper. The use of adverbial connectors in advanced Swedish learners written English [A]. In S. Granger (ed.). Learner English on Computer [C], 1998: 80-89.
[2]Baker, P. and Tony McEnery. A corpus-based approach to discourses of refugees and asylum seekers in UN and newspaper texts [J]. Language and Politics, 2005, 4(2): 197.
[3]Becker, J. The Phase Lexicon [A]. In Nash B W, Schank R.Theoretical Issues in Natural Language Processing [C]. Cambridge, Mass: Bolt, Beranek and Newman, 1975: 55-74.
[4]Lewis, M. Implementing the Lexical Approach [M]. London: Language Teaching Publications, 1997.
[5]陳正倫.英語碩士畢業論文寫作的動機研究及其啟示[J].外語界,2012(6):81.
[6]丁永久.基于語料庫的高職英語專業一、二年級學生寫作能力的分析[J].中國民航飛行學院學報,2013(4):51-53.
[7]顧佩婭,張燁,,古海波.英語專業本科畢業論文課研究性教學設計與實踐[J].外語教學理論與實踐,2010(4):44-51.
[8]郭玉鑫.英語專業畢業論文與課程設置、教學模式的關系研究[J].中國科技博覽,2010(7):39.
[9]盛國強,周永模.英語專業本科畢業論文存在問題的分析和對策[J].上海海洋大學學報,2011(4):636-640.
[10]孫文抗.英語專業學士論文寫作現狀分析[J].外語界,2004(3):59-64.
[11]袁昌萬,金雙軍.基于語料庫大數據的英語寫作實證研究[J].重慶交通大學學報(社會科學版),2015(4):126-129.
[12]仲偉合.《英語類專業本科教學質量國家標準》指導下的英語類專業創新發展[J].外語界,2015(3):2-8.
作者簡介
王麗君(1981-),安徽淮南,文學碩士,合肥工業大學外國語言學院講師,研究方向:語料庫語言學,話語分析。