彭卓
基于語料庫介詞“into”用法的對比研究
彭卓
從認知的角度研究介詞into各種語義的關系,并通過對比分析學習者語料庫與小型Brown語料庫,得出非英語專業大學生與英語母語使用者在介詞into使用上的差異,從而為廣大師生在該詞的用法上提供指引。
意象圖式;語料庫;短語;詞叢;頻次
根據對英語語料庫的統計,在任何英語文本中,大約每8個詞中就有一個是介詞。在美國英語Brown語料庫中,有12.21%的詞是介詞;在與其相對應的英國英語LOB語料庫中,也有12.34%的詞是介詞。[1]傳統語義學對于介詞的多個義項的地位及義項之間的聯系疏于解釋,而認知語言學則為多義現象提供了理論依據。[2]因而,許多研究者都從認知的角度對英語介詞進行研究,如:馬書紅[3]探討了中國學生對英語介詞in、on和over語義成員的分類和習得情況;李佳,蔡金亭[4]運用認知語言學理論研究了中國學習者習得四個英語空間介詞(above,over,under,below)的情況;等等。但當前對介詞 into的研究很少。本文主要從認知的角度來分析介詞into的語義延伸以及基于語料庫分析非英語專業大學生與英語母語使用者在介詞into用法上的差異,從而為廣大師生在該詞的用法上提供指引。
傳統的語義學認為多義詞各個詞義之間是獨立的,而認知語言學認為多義詞的各個義項之間是有理據的,是通過特定的語義引申機制從典型發展而成的,而這種意義拓展的機制就是意象圖式及其隱喻映射。[5]
1.介詞into的意象圖式。
意象圖式是一種心理圖像,它由射體(TR)、路標(LM)和路徑(PATH)三部分組成,TR為圖式中的主體,LM為參照物,TR所經過的路徑為PATH。
根據 Oxford Advanced Learner’s English-Chinese Dictionary(以下簡稱OALD),介詞into的基本空間語義為:“進入,到……里面”。它表示事物間的動態空間關系,其意象圖式為:

圖1 介詞“into”的動態空間原型意象圖式
根據OALD,介詞into的空間語義分別映射到時間域、數值域、對象域和狀態域等抽象領域,從而延伸出以下非空間語義(見表1)。

表1 介詞into的隱喻語義分布表
1.研究問題。
該研究要解決三個問題:非英語專業大學生與英語母語使用者在介詞into的使用頻率上是否存在差異?非英語專業大學生使用介詞into的短語有哪些并與英語母語使用者在該詞的短語搭配上是否存在差異?去掉介詞into所有短語搭配后,非英語專業大學生在介詞into的其它用法上與英語母語使用者是否存在差異?
2.研究對象。
研究者使用由文秋芳[7]等人收集的中國學生英語筆語語料庫2.0(WECCL 2.0)中的非英語專業大學生的作文為語料庫,這些學生分別來自全國不同區域20多所不同類型與層次的高等院校,共包括04、05、06以及07年入學的學生591名,作文是在這些學生就讀大學一年級或二年級時收集起來的。同時,研究者使用Brown語料庫的子庫(以下稱為小型Brown語料庫)作為參照,對比兩個語料庫在介詞into用法上的異同。
3.研究工具。
(1)Sub-corpus Generator.
不知是有意還是無意,圣誕節前的一天,方勛梅突然沒有開車來,下班后站在廠區外面等出租車回家。程曉終于鼓足勇氣,把車開到她身邊,打開車門,在眾人的瞠目結舌中把方勛梅拉上了車,說:“以后就別開車了,由我接送你好嗎?”“憑什么啊?先要看看你的表現!”方勛梅說著,臉上不禁泛上一層紅暈。方勛梅的態度讓程曉內心無比激動,很快把車飚出了城,在高速公路上,他一路加速,好多名車都被遠遠地甩在了后面,他們像坐在一片平緩浮動的浮云上一樣……第二天,方勛梅接受了程曉送上的玫瑰花。
使用Sub-corpus Generator從WECCL 2.0中生成非英語專業大學生的筆語子語料庫(以下稱為學習者語料庫)。
(2)BFSU Stanford POS Tagger 1.0.
使用BFSU Stanford POS Tagger 1.0詞性賦碼軟件,采用Left3words-wsj-0-18標準分別對學習者語料庫與小型Brown語料庫進行詞性賦碼。
(3)Antconc 3.2.1。
使用 Antconc 3.2.1的索引(Concordance)、關鍵詞單(Keyword List)以及詞叢(Clusters)功能對學習者語料庫與小型Brown語料庫進行對比分析。
4.語料收集。
使用Sub-corpus Generator從WECCL 2.0中提取子語料庫構成學習者語料庫。該語料庫由591篇非英語專業大學生的作文構成,其中大一學生與大二學生的作文分別有494篇和97篇,并且這些作文的文體都為議論文,分別來自10個不同的題目,總詞次為117855。此外,研究者從100萬詞規模的美國英語Brown語料庫中隨機抽取了A范疇、M范疇以及R范疇一部分的語料組成了小型Brown語料庫,該語料庫的總詞次達117411。
5.研究方法與過程。
首先,研究者使用Antconc的索引功能分別對學習者語料庫與小型Brown語料庫中介詞into進行檢索,觀察介詞into在兩個語料庫中的使用頻次,并分別計算出該介詞使用頻次占兩個語料庫總詞次的百分比率,同時使用Antconc的關鍵詞單功能對兩個語料庫進行關鍵詞對比,得出介詞into的主題性,以此對比兩個語料庫中介詞into的使用頻率是否存在差異。
其次,研究者使用Antconc的詞叢功能分別查看學習者語料庫與小型Brown語料庫中介詞into的短語搭配情況,借助《新編英語常用短語用法詞典》以及《牛津高階英漢雙解詞典》為參考,分別將兩個語料庫中介詞into的短語搭配頻次記錄下來并做比較。
最后,研究者使用BFSU Stanford POS Tagger 1.0詞性賦碼軟件,對去除介詞into短語搭配后的學習者語料庫與小型Brown語料庫進行詞性賦碼,通過正則表達式將兩個語料庫中的單詞與標點符號刪除,只留下介詞into以及其它單詞和標點符號的賦碼。隨后,研究者使用Antconc的索引功能檢索出介詞into在兩個語料庫中非短語搭配用法出現的頻次。此外,使用該軟件的詞叢功能檢索出包含介詞into在內的由二個至八個詞性賦碼所組成的詞叢,并把出現頻次高的詞叢結構記錄下來。通過對比,研究者找出兩個語料庫中出現頻次相差最大的一些非短語搭配用法的詞叢結構,以這些詞叢結構為基礎,進一步檢索出相似詞叢的頻次。通過對比分析,找出非英語專業大學生與英語母語使用者在介詞into的非短語搭配用法上的差異。
1.介詞into的使用頻次比較。
借助Antconc的索引功能,研究者檢索到學習者語料庫的總詞次為117855,介詞into出現的頻次為85,占總詞次的0.072123%。小型Brown語料庫的總詞次為117411,介詞into出現的頻次為165,占總詞次的0.140531%。同時,根據桂詩春[8]所做的統計,在FLOB和FROWN語料庫中介詞into占語料總詞次的百分比分別為0.131338%和0.125542%。此外,研究者使用Antconc的關鍵詞單功能對兩個語料庫進行對比,采用Log-Likelihood方法計算主題性,得出介詞into的主題性為-26.359。可見學習者語料庫中介詞into出現的頻次明顯比英語母語使用者語料庫中介詞into出現的頻次要低,說明非英語專業大學生在書面語中對介詞into使用較少。
2.介詞into的短語搭配對比分析。
研究者使用Antconc的詞叢功能分別對學習者語料庫與小型Brown語料庫中介詞into的短語搭配進行檢索,其中詞叢的最小長度設置為2個單詞,最大長度為8個單詞(因為一般短語都不會超過8個單詞),詞叢的最小頻率設置為1。檢索結果出來后,研究者借助《新編英語常用短語用法詞典》以及《牛津高階英漢雙解詞典》為參考,將介詞into的原型短語的頻次記錄下來(如表2和表3)。

表3 小型Brown語料庫中介詞into的短語搭配頻次
由表2和表3可知,學習者語料庫中介詞into的短語搭配有11種,總頻次為53。小型Brown語料庫中介詞into的短語搭配有19種,總頻次為45。可見非英語專業大學生使用介詞into的短語搭配種類較少,但使用短語的總頻次卻較高,說明學生對介詞into的某些短語搭配使用較集中。
3.介詞into的非短語搭配用法對比分析。
研究者對兩個語料庫進行賦碼,并把語料庫中的單詞與標點符號刪除,只留下介詞into以及其它單詞和標點符號的賦碼,使用Antconc的索引功能對其檢索,得出學習者語料庫中介詞into的頻次為32,占該語料庫總詞次的0.027152%,同時也占該語料庫中介詞into總頻次的37.65%,另外,小型Brown語料庫中介詞into的頻次為120,占該語料庫總詞次的0.102205%,同時也占該語料庫中介詞into總頻次的72.73%。由此可見,相對于英語母語使用者來說,非英語專業大學生較少使用介詞into的非短語搭配用法。
此外,研究者再次使用Antconc的詞叢功能分別對以上兩個語料庫進行檢索,其中詞叢的長度設置為2至8個單詞,最小頻率設置為1。研究者將詞叢檢索中頻率排在前20位的結構進行比較,發現在這兩個語料庫中介詞into詞叢的最大差異在于介詞into左邊的動詞形式以及介詞into右邊的名詞、代詞或名詞詞組的形式。基于這一發現,研究者再次使用詞叢功能分別對這兩個語料庫中介詞into的特定詞叢進行檢索,從而得到以下兩個表格。
從表4可以看出,學習者語料庫中動詞與介詞into組合結構出現的總頻次為16次,而小型Brown語料庫中動詞與介詞into組合結構出現的總頻次為50次,可見非英語專業大學生在使用動詞與介詞into組合結構上遠遠少于英語母語使用者。

表4 學習者語料庫和小型Brown語料庫中動詞與介詞into組合結構的頻次表
(VB、VBD、VBG、VBN、VBP、VBZ 分別代表動詞基本形、過去式、現在分詞或動名詞、過去分詞、一般現在時非第三人稱單數形式、一般現在時第三人稱單數形式。)

表5 學習者語料庫和小型Brown語料庫中介詞into與名詞、代詞或名詞短語組合結構的頻次表
(NN、NNS、NNP、NNPS、PRP、DT、JJ分別代表普通名詞單數形式、普通名詞復數形式、專有名詞單數形式、專有名詞復數形式、代詞、限定詞、形容詞或序數詞。)
從表5可以看出,學習者語料庫中介詞into與名詞、代詞或名詞短語組合結構出現的總頻次為30次,而小型Brown語料庫中介詞into與名詞、代詞或名詞短語組合結構出現的總頻次為99次,可見非英語專業大學生在使用介詞into與名詞、代詞或名詞短語組合結構上遠遠少于英語母語使用者,具體表現在“into NN”“into NNP”“into DT NN”以及“into DT NNP”的使用頻率相差較大。
基于以上分析,該研究要解決的三個問題都找到了答案。首先,非英語專業大學生相對于英語母語使用者在英語書面語中較少使用介詞into。其次,與英語母語使用者相比,非英語專業大學生使用介詞into的短語搭配種類較少,但使用短語的總頻次卻較高,這說明學生對介詞into的某些短語搭配使用比較集中,具體表現在“come into”“get into”“go into”等短語的使用上。最后,相對于英語母語使用者來說,非英語專業大學生較少使用介詞into的非短語搭配用法,尤其是動詞與into組合結構的使用頻率遠遠少于英語母語使用者的使用頻率,此外,學生在介詞into與名詞、代詞或名詞短語組合結構的使用上也明顯少于英語母語使用者,特別是“into NN”“into NNP”“into DT NN”以及“into DT NNP”的使用頻率上存在巨大差異。
從以上結果可知,外語教師在講解介詞into的用法時,應盡可能多地向學生呈現介詞into短語搭配用法,可以通過列表的形式將該詞的短語搭配以及相關例子展示給學生,同時也可要求學生針對該詞的短語搭配用法進行造句,借此擴充學生使用介詞into短語的種類。此外,教師還應向學生詳細地解釋介詞into的各種語義,讓學生弄清楚該詞各種語義間的聯系與區別,并向學生展示該詞非短語搭配用法的各種例子,使學生在以后的英語表達中能用對該詞,讓他們盡可能避免該詞的超用或少用情況的出現,從而使非英語專業大學生在介詞into的各種用法上與英語母語使用者相同,實現讓學生全面掌握介詞into用法的目標,借此也為其它英語介詞的教學提供范例。
[1]陳建生.非英語專業EFL學生英語作文中的介詞at——基于語料庫的研究[J].山東外語教學,2002(5):51-56.
[2]李艷.空間介詞on多義現象的認知闡釋[J].長沙大學學報,2010(4):102-104.
[3]馬書紅.英語空間介詞語義成員的分類與習得——基于范疇化理論的實證研究[J].解放軍外國語學院學報,2010(4):64-69.
[4]李佳,蔡金亭.認知語言學角度的英語空間介詞習得研究[J].現代外語,2008(2):185-193.
[5]明宏.意象圖式及其在介詞over詞義拓展中的作用[J].沈陽師范大學學報,2009(6):105-107.
[6]趙佳.從認知語言學角度看英漢語言中時間的空間隱喻[J].許昌學院學報,2009(1):87-89.
[7]文秋芳,梁茂成,晏小琴.中國學生英語口筆語語料庫2.0[M].北京:外語教學與研究出版社,2008:1-72.
[8]桂詩春.中國學習者英語介詞使用概述[A].楊惠中,桂詩春,楊達復(編).基于CLEC語料庫的中國學習者英語分析[C].上海:上海外語教育出版社,2005:226-245.
ACorpus-based Contrastive Study on the Usage of Preposition“into”
Peng Zhuo
This paper studied the semantic relation among different meanings of preposition“into”from the perspective of cognition.In the meanwhile,basing on the comparison of the Learners’Corpus and the small Brown Corpus,researcher has found the difference in the use of preposition“into”between non-English major students and native English speakers,and offered guidance in the use of preposition“into”for the vast majority of teachers and students.
image schema;corpus;phrases;clusters;frequency
H319
A
1672-6758(2012)03-0090-3
彭卓,碩士,講師,韶關學院外語學院大學英語部,廣東·韶關。研究方向:認知語言學及英語教育。郵政編碼:512026
Class No.:H319Document Mark:A
(責任編輯:蔡雪嵐)