陳晉秋
(貴州師范大學外國語學院,貴州貴陽550001)
語料庫是指按照一定的語言學原則收集自然出現的、連續的語言運用文本或話語片段而建成的具有一定容量的電子文庫,它是載有語言信息的大量語言資料的集合體。語料庫語言學是在語料庫的基礎上經過科學選材和標注對語言進行分析和研究的一門科學,它研究自然語言文本的采集、存儲、加工和統計分析,并以真實的語言數據為研究對象;注重研究語言行為,通過系統分析語言的實際運用來尋找語言使用的規律。上世紀80年代末以來,隨著語料庫的發展和語篇研究的不斷深入,國外應用語言學科對學術語篇的語言研究在十余年的時間內,主要形成了四個語篇研究流派。[1][2][3][4]其中體裁分析法的研究著眼點是語篇的宏觀結構,集中分析學術語篇的某個組成部分(摘要,前言,結論)等,對學術論文的選題關注較少,且大部分研究語料的數量偏少。如,Kwan[5]對20篇應用語言學專業博士論文中文獻回顧部分的研究,Lores[6]對36篇學術語篇摘要部分的研究。我國的學習者語料庫建設與研究開始于上個世紀9O年代中期,目前,國內基于英語語料庫的語言學相關研究也取得了很大進展,出現了各種類型的英語語料庫。[7]這些已建成的英語語料庫的分析主要集中在以下方面:對比以英語為母語的語料庫來分析學習者的語料特征;對失誤特征進行分析;研究中國學生的口筆語詞法和句法的變化規律及發展特征等,對學術語篇的研究卻無涉及.“Applied Linguistics”(APL,應用語言學)是應用語言學以及英語作為第二語言教學領域兼具學術性與專業性的國際權威英語綜合性學術期刊,所刊登的學術語篇內容豐富、視角敏銳,代表著世界范圍內語言研究和語言教學特別是英語作為第二語言教學的理論與實踐相關研究的前沿,對非英語國家英語教師的教學與科研極具參考價值。因此,本研究把APL學術期刊所發表的學術文章選為研究樣本,通過對學術語篇選題語料的檢索、統計,展現該領域的研究動向及發展趨勢。
本研究語料選自Applied Linguistics(APL)國際學術期刊。通過下載2005-2009年發表在APL期刊雜志上的綜合性、實證性的學術論文的電子語料130篇,把語料的題目進行整理和轉寫后,建立一個小型的APL英語學術語篇選題語料庫,并將該選題語料文件以“Titles+來源+time”命名為:“<Titles APL2005-2009>”。之后,選擇“純文本”格式保存入電腦,創建一個簡單的、可供軟件檢索的小型的APL英語學術論文選題生語料庫。“選題”語料的時間跨度為5年,數量為130,容量為type:605,token:1498。對選題語料進行清潔、整理、人工校對后,進行標注。然后運用 AntConc的詞匯檢索(Concordance)和單詞例表(wordlist)功能對研究語料進行檢索、分析,通過對研究指標出現頻率的統計分析凸顯APL學術語篇研究選題的范圍與特色;進而深度了解該領域最新的研究思路和傾向。
選題語料的標注主要涉及頭文件信息標注。頭文件信息標注是指在相關語篇篇頭針對語篇的基本信息,如背景信息、來源、主題或類型、時間等所做的標注。所有的標注信息由兩部分組成,統一放在尖括號內:其一為信息項目,其二為參數及值。[8]頭文件信息的標注位置放在語料文檔的開始部分,語料標注采用XML語言,基本結構為層級標簽,標簽內包括屬性和屬性值。如表1所示。

表1 APL選題語料庫頭文件信息標注
首先采用文獻計量學中的詞頻分析方法定量分析數據。主要運用 AntConc詞頻分析軟件的Concordance以及wordlist功能,對學術語篇語料的選題進行掃描,通過對選取的相關詞或詞組出現頻次的計量分析,結合定性描述,揭示APL學術語篇的研究現狀及發展趨勢。具體步驟為;先通過AntConc的“wordlist”工具生成選題語料的詞頻表(見表2),分別去掉排在前面的高頻功能詞:如“of”(85頻次),“in”(65頻次),“the”(60頻次)等,以及排在后面的僅僅表達語法意義的虛詞,截取詞表里上中部高頻及以下有實際含義的其它主要實詞,再使用“Concordance”工具分別檢索這些實詞,獲取有關這些詞匯的索引行信息,然后通過AntConc的“索引行排序 ”(Kwic Sort),凸顯其左右詞匯,進行觀察,再通過“詞簇 ”(cluster)和“搭配詞”(collocate)功能獲取有實際含義的相關詞塊,由索引行觀察轉到搭配分析,最終了解選題的研究視角走向。

表2 APL選題語料的詞頻表
檢索結果發現:language在APL研究選題中的出現頻次最高,總數為59次。直接由first,L1和language以及其它詞語所構成的詞塊頻次僅為5次,分別是:first language development(1次),interaction between first and second language(1次),Role of L1 Lexical(1次),Role of L1 Lexical Knowledge(1次),nonformulaic Language(1次)。研究內容包括:英語母語的發展研究,一語和二語的相互影響研究,第一語言詞匯知識的作用研究,說母語者和非母語者非習慣用語的比較研究。出現頻率遠低于由Second language及相關詞組成的詞塊。見表3。

表3 Second/first language及相關詞組成的詞塊頻次
有關二語學習與研究相關詞塊的實際檢索頻次為54次,通過合并同義詞塊后,英語作為第二語言的相關詞塊頻次為41次。其中頻次較多的詞塊有:“language learning”(6 次),涉及面為:二語學習中的隱喻能力培養研究,二語學習指導研究,任務型語言學習研究,二語學習策略研究,二語的社會定位、課堂話語研究;基于維特根斯坦提出的“語言游戲”概念、強調語言活動意義的“language Play”(語言游戲)頻次為5次,分別涉及游戲輔助二語學習、游戲的種類、語言游戲分析等研究;“language Acquisition”的頻次為5次,研究涉及基于使用的語言習得,二語習得的發展階段研究等。
除此之外,表3中由其它詞塊的平均頻次可見,APL期刊研究領域較為廣泛,研究層面較豐富,分別涉及:語言的涌現性、語言水平的發展、語言知識的相關理論、語言的多元化人才培養理論重構以及語言的意識形態研究;語言性別、語言歧視、語言遺產研究;語言交際及語言交際能力研究,外語教育中的“象征能力 ”研究;[9]基于語言的生態性、運用概化理論對英語口語評估進行的效應分析研究,[10]語言的口語水平、語言會話技巧研究;語言的復雜、準確以及流利性研究,言語生成、語言的再利用、語言的創造性研究;語言表現、語言學習動機、語言學術策略,語言學習的合作活動、任務型語言學習、語言學習的社會互動研究;語言教師的理念、信仰研究等。由此可見,APL對英語作為第二語言習得的教學與研究更為關注。
應用語言學學術語篇有關或基于相關理論的研究檢索頻次總數為27,在排除同類項后,應用語言學學術語篇的理論研究方面的詞塊實際頻數為19。其中語言的自然發生論(Emergence)的出現頻次為9,合并同義詞塊后,“Emergence”相關詞塊的實際頻次為8,分別為語言的自然發生論研究、語言的自然發生論視角、自然發生論的特性、自然發生論的準則、自然發生論的使用、語言自然發生的復雜性、流利度以及精確度研究、二語句法的自然發生論、語篇中隱語的自然發生規律研究。由此可見:應用語言學學術語篇較為傾向于從語言的自然發生論視角探討語言理論與語言習得的關系并進一步理解語言現象。除此之外,通過對其它與理論研究相關的實詞(theory,perspective,ecology,ideology,concept)的檢索發現:應用語言學學術語篇的相關理論研究還包括:1.語言知識理論研究(Theory of Language Knowledge),象征能力理論研究(Theory of Symbolic Competence),代詞的合用和排他性理論研究(Theory Inclusive and Exclusive Pronouns),概化理論研究(G theory);2.社會文化視角研究(sociocultural perspective),跨語言視角研究(cross-Linguistic perspective),應用語言學視角研究(perspectives in applied linguistics),語言的市場– 理論視角研究(Market–Theoretic Perspective);3.基于二語習得生態理論視角的相關研究(Ecology to form relations),語言的生態性研究(Language Ecology),多種語言的生態性研究(Ecology in multilingua Settings);4.應用語言學的意識形態研究(Ideology in AP),研究概念(Conceptions of Research),語言政策研究(Language Policy)等。主要的相關詞塊頻次見表4。

表4 應用語言學相關理論的詞塊頻次
以上可見,應用語言學學術語篇對于從不同的理論角度或多角度思考和探索的研究成果也較為關注。
1.有關詞匯學習和研究相關的詞塊頻次最高,總數為18次,合并相同詞塊后的實際頻數為15次。研究分別涉及詞叢、詞匯概念、詞義推斷、詞匯的網絡結構、詞匯頻率、詞匯學習、詞序、詞語構建研究等層面。相關詞塊見表5。

表5 詞匯學習和研究相關的詞塊頻次
2.在專項研究聽、說、讀、寫的學術語篇中,關于“說”的頻數為10,分別是:英語口語研究(Spoken English),言語生成研究(Language Speech Production),口筆語生成研究(oral and written Production),二語口語生成研究(L2 oral Production),口語輸出行為研究(Oral Speech Act Production),同伴小組口語評估研究(Peer Group Oral assessment),課堂會話研究(Classroom Conversation),在線會話研究(Online Conversation),會話教學研究(Teaching Conversation),會話分析方法(Conversation analytic approach)等相關研究。
3.“Writing”的相關詞塊頻數為8,分別是:寫作準備研究(Preparation for Writing),寫作生成研究(Written Production),寫作差異性研究(Writing Differences),本科生寫作小組合作研究(Group Work in Writing Classes),學術寫作研究(Academic Writing),本科生作文研究(Undergraduate Essay),研究生寫作研究(Graduate Writing),論文發表寫作研究(Scientists Writing for)等。
4.以task-based(任務型)理論為基礎的實踐研究相關詞塊頻數為7,分別為:任務型教學研究(Task-Based),二語任務研究(Tasks on Second Language Instruction),學習者語用發展任務研究(Tasks on the Development of Learners'Pragmatic),任務型語言學習研究(Task-based Language Learning),任務計劃的類型研究(Types of Task Planning),任務的困難研究(Task Difficulty),任務的相互作用研究(Task Interaction)等。
應用語言學學術語篇研究自2005-2009年以來總的研究趨勢表現為:重視語言理論與實踐相融的相關研究,呈現出理論與實踐研究相結合的綜合性研究特點,理論方面的研究視角分別涉及語言的自然發生論、跨語言、社會文化等層面的理論基礎研究。基于實踐的需求,APL期刊尤其關注英語作為第二語言的詞匯教學與研究成果,對以任務型理論為基礎的實踐研究也較為重視,對“說”和“寫”方面的研究成果的關注度高于對“聽”和“讀”相關研究的關注度,特別是有關英語的“說”和“寫”方面的成果涉足面廣,除了傳統的課堂會話和教學研究外,當今英語的在線會話研究成果表現尤其突出;寫作方面的研究成果涉及本科生和研究生的寫作方法探討以及學術寫作,內容涵蓋面廣而豐富。
[1] Biber D.,Conrad,S.& Reppen,R..Corpus Linguistics:Investigating Language Structure and Use[M].Cambridge:Cambridge University Press,1998:16 -38.
[2] Bazerman C..Shaping Written Knowledge:The Genre and Activity of the Experimental Article in Science[M].Madison,WI:U-niversity of Wisconsin Press,1988:22 -35.
[3] Halliday M.A.K..An Introduction to Functional Grammar[M].London:Arnold,1985:10 -20.
[4] Swales,J,M..Genre Analysis:English in Academic and Research Setting[M].Cambridge:Cambridge University Press,1990:1-10.
[5] Kwan B.S.C..The Schematic Structure of Literature Review in Doctoral Theses of Applied Linguistics[J].English for Specific Purpose,2006(1):30-55.
[6] Lores R..On RA Abstracts:From Rhetorical Structure to Thematic Organization[J].English for Specific Purposes ,2004(3):280-302.
[7] 文秋芳,王立非,梁茂成.中國學生英語口筆語語料庫[M].北京:外語教學與研究出版社,2009:12-22.
[8] 梁茂成,李文中,許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010:37-43.
[9] Kramsch C.,Whiteside A..Language Ecology in Multilingual Settings towards a Theory of Symbolic Competence[J].Applied Linguistics,2008(4):645 -671.
[10] KIM Y.H..A G - Theory Analysis of Rater Effect in ESL Speaking Assessment[J].Applied Linguistics,2009(3):435 -440.
[11] 陳晉秋.應用語言學及教師教育理論與實踐研究[J].教育文化論壇,2011(3):28-31.