王靜
摘要:能夠嫻熟使用具有習語性的短語動詞體現了英語口語的地道性。影視劇本臺詞文本庫中蘊含了大量的習語性短語動詞。本文自建了欲望都市臺詞文本庫,運用搜索軟件檢索出文本庫中具有習語性的短語動詞,指導如何將檢索到的短語動詞用于英語口語教學。
關鍵詞:文本庫;習語;短語動詞;數據驅動學習
中圖分類號:G642.41 文獻標志碼:A 文章編號:1674-9324(2015)31-0171-03
一、引言
20世紀90年代初Tim Johns提出了一種基于語料庫的外語學習方法(data-driven learning,簡稱DDL):數據驅動學習。它的主要思想是學生對語料庫呈現的批量語例進行觀察、推斷和歸納,自行發現語言特征和規律。與此同時,Sinclair開創了語料庫驅動的短語學,強調詞語序列的頻數和定量分析(Sinclair 1991)。隨著計算機技術的普及,越來越多的教師發現,文本是保存數據的主要形式。對批量文本進行搜索和操作,可以發現文本背后數據的規律性和特征性(詹宏偉 2013)。梁茂成也提出研究者需要特殊語料時,可以自己動手搜集一些文本,建立一個小型的語料庫(梁茂成 2010)。鑒于此,數據驅動教學的理念和做法日臻成熟。本研究基于自建的美劇《欲望都市》劇本臺詞語料庫,利用檢索軟件檢索出臺詞中出現頻率最高的前20位短語動詞,為數據驅動口語學習的模式打開了一個新的視角。
二、《欲望都市》臺詞劇本與短語動詞
美劇《欲望都市》由美國有線電視HBO出品并自1998年開播,連播6年。全劇共六季,94集。該劇自播放以來,深受觀眾好評,將艾美獎、全球獎最佳喜劇、最佳女主角、最佳女配角等獎項一舉收入囊中。故事主要描述了四位現代都市單身女性尋找愛情,體會大都會城市生活的故事。《欲望都市》的劇本臺詞富有美國大都會職業婦女的動感和時尚氣息,成為經典的英語口語學習內容。
在英語口語之中,短語動詞因其數量眾多,語義豐富而成為口語的基本特征之一(陳怡 2009)。可以這么說,在口語中能否熟練運用短語動詞對英語口語的地道性有著舉足輕重的作用(楊惠中 2005)。從結構上說,短語動詞的是由“動詞加上介詞”、“動詞加上副詞”或“動詞加上副詞再加上介詞”三種形式構成。從語義上說,同一個短語動詞的某些義項可能是習語性的,某些義項則可能不是習語性的(駱世平 2006)。本研究集中關注的是如何檢索習語性動詞短語并將其用于英語口語教學。
三、劇本臺詞語料庫的操作方法
本研究從網絡途徑收集齊全該劇共六季、94集的英文臺詞,建成臺詞文本語料庫。
1.文本清潔。由于網絡途徑獲得的文本存在各種不合規范的符號和格式,進而影響到檢索結果的正確性和可靠性,需要對批量生文本進行清潔與整理。免費軟件“文本整理器”專為文本格式整理而編寫的,可處理單個或批量文本。打開文本整理器界面,設置所需進行清潔的格式轉換,即可對批量的劇本臺詞文本庫進行整理。見下頁圖1和圖2。
2.文本賦碼。對短語動詞進行檢索需要借助其語法結構,這就要求對清潔后的文本進行詞性賦碼。本研究中使用的詞性賦碼工具是免費軟件TreeTagger,利用該軟件對所建臺詞文本語料庫進行詞性賦碼。考慮到一些動詞有大量的屈折形式,出于本研究的目的,需要把同一個動詞的屈折形式歸并到一起,視為同一個詞。因此,在用TreeTagger進行賦碼時,同時運用該軟件對文本庫進行詞形還原,便可生成如下頁圖3所示界面。
3.檢索軟件與檢索步驟。本研究中所使用的檢索軟件為免費軟件AntConc。該軟件由日本早稻田大學Laurence Anthony博士研究開發,是一個語料庫文本分析工具。它有七大功能模塊:Concordance、Concordance Plot、File View、Cluster、Collocates、Word List、Keyword List,并且支持使用正則表達式進行搜索(何安平 2004)。動詞短語的語法構成為“動詞加上介詞”、“動詞加上副詞”或“動詞加上副詞再加上介詞”,因此對文本數據詞性的檢索與分析可以借助正則表達式。經過對Tree Tagger賦碼集的觀察,三個相對應的正則表達式分別為“\S+_VV\w*\s\S+_IN”、“\S+_VV\w*\s\S+_RB”、“\S+_VV\w*\s\S+_RB\s\S+_IN”。
下圖4示范了第一種檢索方式。通過正則方式搜索出的高亮詞組還需要進行人工抽查、檢驗和校對。
4.檢索出的動詞詞組進行頻數統計。利用AntConc軟件中的Concordance標簽,對從第三步檢索出的動詞詞組進行頻數統計。輸入所要檢索的動詞詞組,點擊start鍵,出現的索引行界面如下圖5所示。
四、數據分析
通過利用Concordance標簽對《欲望都市》(全六季)劇本臺詞文本庫進行語料檢索和頻數統計,下表列示出該臺詞文本庫中出現頻率最高的前20位短語動詞。
在《欲望都市》臺詞文本庫中出現較多的短語動詞還有check on,kick in,drop by,fall into,fit into,hang on,make for,reach for,screw in,throw in等。由于《欲望都市》電視劇題材為婚戀類,因此與戀愛交往相關的短語動詞出現較多,如下圖6所示。
五、以“學生為主體、教師為主導”的數據驅動學習模式在英語口語教學中的運用
國家中長期教育改革和發展綱要中指出:以學生為主體,教師為主導,充分發揮學生的主動性,把促進學生成長成才作為學校一切工作的出發點和落腳點。數據驅動學習的教學法充分體現了學生的主體作用以及教師的主導作用。教師激勵學生獨立觀察語料庫中呈現的批量索引行,自主探討和發現索引行背后隱藏的語言特征以及搭配規律。這種教學法充分體現了以學生為主體的特點。然而數據驅動學習大規模的實踐卻未能展開,部分原因是因為現成的大型語料庫中的索引行高密度、大容量,缺少語言的語境背景,使得一些學生感到畏懼或抵觸。教師的主導作用可以克服這些困難。教師預先通過復雜檢索對所需呈現的索引行進行控制(Sinclair 2001),從而使得課堂中呈現的批量索引界面有助于激發學生的興趣和主動性。此外,播放與所研究索引行相對應的視頻,可以給文本提供語境。Widdowson就認為:如果要意識到語言的使用,必須對其重新語境化(recontextulization)(2000:7)。因此,運用影視劇本語料庫進行口語教學一方面發揮了學生的主體和教師的主導作用,另一方面可以克服數據驅動學習模式的一些現有局限性。
六、結語
本研究展示了教師發揮主導作用,通過數據驅動學習的模式激發學生發揮主體作用。在這種模式下,教師首先通過自建影視劇本臺詞文本庫,借助一些語料庫的檢索軟件,搜索到在英語口語教學中某個特定語義框架下的高頻習語性短語動詞。在課堂上批量呈現索引行的同時,播放與之相對應的視頻,為所學習的索引行提供語境。學生發揮主體作用,在教師引導下,對口語的語言特點和習語性短語動詞的意義以及搭配法進行分組探討,最后由教師做總結歸納(陳怡 2011)。當然,本研究中所展示的僅僅是劇本臺詞文本庫,如果需要找到與研究的索引行相對應的視頻片段,對教師來說時間和精力都是巨大的挑戰。因此,影視劇本臺詞文本庫的下一個發展方向將是語料檢索與音視頻定位同步播放的多媒體語料庫(李文中 2009)。
參考文獻:
[1]Sinclair,J.Corpus,Concordance,collocation[M].Oxford:Oxford University Press,1991.
[2]Sinclair,J. 2003. Reading Concordances.London:Pearson.
[3]Widdowson,H. G. On the limitations of linguistics applied[J].Applied Linguistics,2000,1(1):3-25.
[4]陳怡.影視語料與當代英語口語解析[M].上海交通大學出版社,2009.
[5]陳怡.融合多視角的影視劇本語料庫與英語口語教學[J].西安外國語大學學報,2011,(4):61-66.
[6]何安平.語料庫語言學與英語教學[M].北京:外語教學與研究出版社,2004.
[7]何安平,等.語料庫在外語教育中的應用—理論與實踐[M].廣州:廣東高等教育出版社,2004.
[8]李文中.Multimedia Corpus Positioning Concordancing[Z].上海:語料庫語言學發展戰略研討會,2009.
[9]梁茂成,李文忠,等.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
[10]駱世平.英語習語研究[M].上海:上海外語教育出版社,2006.
[11]楊惠中,衛乃興.中國學習者英語口語語料庫建設與研究[M].上海外語教育出版社,2005.
[12]詹宏偉.語塊的認知加工與英語學習[M].杭州:浙江大學出版社,2013.