999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語料庫的《暮光之城》系列小說詞匯特點初探

2010-12-29 03:52:00楊秀珍劉美瑜天津科技大學外國語學院天津300222
關鍵詞:詞匯文本語言

楊秀珍 續 娜 劉美瑜(天津科技大學外國語學院,天津,300222)

基于語料庫的《暮光之城》系列小說詞匯特點初探

楊秀珍 續 娜 劉美瑜(天津科技大學外國語學院,天津,300222)

借助語料庫檢索工具WordSmith,對比分析了由《暮光之城》系列小說組成的自建語料庫與BROWN文學語料庫BROWN(K-R)。通過對比兩庫中詞長、詞匯密度、詞頻等層面的特征,試圖闡釋《暮光之城》系列小說的詞匯特征。

語料庫;《暮光之城》;BROWN(K-R)文學語料庫;詞匯特征

《暮光之城》是近年來風靡全球的熱銷系列小說,共包括《暮色》、《新月》、《月食》以及《破曉》等四部,在40個國家發行,銷量超過1000萬冊,連續152周登上《紐約時報》最暢銷書排行榜,被譽為繼“哈利·波特”系列之后最受年輕人歡迎的小說。美國總統奧巴馬曾提到他和女兒都是不折不扣的“暮迷”。小說中纏綿悱惻的愛情故事固然吸引了許多來自不同文化及不同年齡層讀者的目光,而對于語言學者們來說,構成小說重要部分的詞匯特征也具有著不可忽視的研究價值。語言研究者借助語料庫檢索工具對來自語料庫的數據進行量化分析,可以觀察到用傳統方法無法發現的很多語言事實,從而對語言本身進行更加客觀的描寫和解釋。語料庫語言學同詞匯特征研究相結合,則為研究提供了更加科學的數據支撐,從而使結果更具客觀性,繼而增加了解釋的說服力。因此,借助語料庫及檢索工具的定量分析方法,對《暮光之城》系列小說組成的自建語料庫(約61萬詞)以及Brown語料庫中文學類文本,即BROWN(K-R)(共計約25萬詞)中的詞匯做了對比和分析。通過對比兩庫中詞長、詞匯密度、詞匯分布等層面的特征,試圖闡釋《暮光之城》系列小說的詞匯特征。

一、語料庫語言學

所謂語料庫語言學是指:“以語料庫為基礎的語言研究和語言分析。基于語料庫的分析具有其他傳統分析方法難以比擬的優越性。這一優越性在很大程度上得益于計算機的使用。計算機使得辨別、分析語言使用的復雜模式及存儲和分析大宗自然語料成為可能。基于語料庫的分析具有如下基本特征:(1)它是經驗性的,分析的是自然語篇中語言的真實使用模式。(2)它利用大型的、在一定原則指導下收集而來的自然語篇作為其分析基礎。(3)它廣泛利用計算機的自動和互動技術作為分析工具。(4)它既要求定量分析技巧,又要求定性分析技巧。語料庫語言學主要有兩個研究目標:其一,描述語言結構及其變體;其二,描述某些語篇群。”所以,在不同的場合精心選擇詞匯和語法結構以實現表達得體是文學文體學研究的重要方面。對于外語學習者來說,運用語料庫手段分析文學作品詞匯的方法有助于提高學習外語的效率,增強選詞、用詞的能力,從而提高對外國語言文化的欣賞水平。

二、詞匯特征

Leech和Short提出語言文體特征主要包含:詞匯特征、語法特征、修辭格、語境、銜接五大類(張德祿,1998:49)。由于這些分析方法都需要首先對語言特征進行描述,隨著計算機在語料庫分析中的介入,這種描寫的精確性和有效性得到了很大的提高。目前,基于語料庫的文本詞匯研究主要在以下方面展開:(1)基于詞匯的研究:從出現及出現頻率的角度探索詞匯的出現語境;(2)研究有語法標注的詞匯共現,看這些詞匯如何組成句型并為句法應用的量化分析提供基礎。由此,依據此模式對《暮光之城》全系詞匯特征試做分析。

經過wordlist功能對《暮光之城》全系及BROWN(K-R)文本中詞匯分布對比,數據見圖1:

圖1 兩類語料庫單詞分布圖

經觀察得知,BROWN(K-R)語料庫中所占比例最大的單詞詞長為3個字母,占總詞匯的32.93%,4字母單詞次之,占27.30%,兩者共占總詞匯量的60.23%。而《暮光之城》中詞長3字母的單詞占比例的20.03%,詞長為4字母單詞次之,占比例的19.07%,數值十分相近,二者共占總詞匯量的39.1%。詞長5字母和6字母的單詞分別占11.21%、8.89%,2字母單詞所占比例16.61%。BROWN(K-R)文學語料庫中詞長2字母單詞所占比例15.64%,詞長5字母和6字母的單詞分別占11.85%,8.97%。通過卡方檢驗得知:兩類語料庫2字母單詞p<0.01,有顯著性差異。詞長是決定文本難易程度的一個重要指標。由2-5個字母組成的詞看作是小詞或常見詞,這些詞在整個語料庫中的比例越高,近似地反映出該語料庫中的語料使用的小詞或常見詞越多,文章就越淺顯。單詞越短小,文本越易理解,難度越低,文本的正式程度就越低;反之,單詞越長,文本越不易理解,難度越大,文本越正式。以上結果表明盡管作者用詞難度趨近Brown,但總體詞匯經計算詞長得出結論偏簡單,與一般的文學作品相比閱讀起來更容易。為了進一步說明這一特征,作者引入詞匯密度,通過計算文本中實義詞所占總體詞匯比例說明文本難易程度的指標。作者選用UCREL開發的CLAWS自動附碼系統對兩類語料庫做了詞性附碼(POS tagging)處理,采用的是分類詳細的CLAWS7附碼集,CLAWS自動附碼系統的準確率可以達到96%以上,因此能夠保證研究結果的可靠性①關于CLAWS自動詞性附碼系統和CLAWS7BROWN(K-R)附碼集的詳細情況可參見http://ucrel.lancs.ac.uk/claws/。經過CLAWS自動詞性賦碼后的語料庫,詞性賦碼指識別并標注語料庫中所有詞匯的詞性,通過觀察計算不同詞性詞匯的分布,統計文本詞匯密度說明文本難易程度。

(一)詞匯密度

詞匯密度(Lexical Density)在一定程度上反映了文本的某種本質特征,即用詞的多樣性。測量詞匯密度的主要工具是類符/形符比(Type/Token Ratio,簡稱TTR),不同容量的語料庫類符/形符比不具可比性,故一般用標準化類符/形符比(Std.TTR)來衡量語料庫的詞匯密度。表1為WordSmith提供的 WordList功能分別統計的《暮光之城》系列小說和BROWN(K-R)語料庫的類符、形符、類符形符/比以及標準化類符/形符比。

表1 兩個語料庫類符、形符的相關統計

從表1中可以看出BROWN(K-R)的std TTR值略高于《暮光之城》。需要說明的是Std.TTR統計的類符包括實義詞和功能詞,過度修飾的篇章由于功能詞的增多也可能造成Std. TTR的數值提高,而不意味著語篇信息量的加大。因此,為了更嚴格地進行用詞變化的計算,需要運用Ure(1971)提出的詞匯密度公式:

詞匯密度=實詞數÷總詞數×100%

英語中的詞匯密度(lexicaldensity)也有助于我們認識英語書面語體的正式程度。詞匯密度指的是一個語篇中實義詞的平均值。Ure(1969)指出,詞匯密度是區別語體正式程度的一個標準,語體越正式,詞匯密度越高;相對的詞匯越口語化,密度越低。為了更清楚認識這一點,我們必須辨清實義詞和虛詞的定義。英語詞匯分為兩類:實義詞(content word)和虛詞(grammaticalword或functionword)。實義詞包括名詞、動詞、形容詞、大部分副詞等;虛詞包括限定詞、介詞、代詞、連詞、關連副詞、助動詞等。表2為通過WordSmith工具統計出的兩類語料庫中名詞、動詞、形容詞詞性碼所占比例。

表2 兩類語料庫詞性碼所占比例

表2中列出了《暮光之城》全系中名詞、動詞、形容詞、副詞各占全文的百分比和BROWN(K-R)文學語料庫中名詞、動詞、形容詞,副詞各占總文本的百分比。所以,《暮光之城》系列小說的詞匯密度(即實詞比率)是名詞、動詞、形容詞、副詞所占總文本的百分比之和,也就是《暮光之城》的詞匯密度是54.35%,同理得出BROWN(K-R)文學語料庫詞匯密度為59.96%。運用統計學有關原理對上述兩個語料庫的詞匯密度進行卡方檢驗,檢測兩個語料庫的詞匯密度是否存在顯著性差異,進而分析成因及其詞匯特點。經計算得出顯著性 p值<0.01,也就是說兩類語料庫的詞匯密度存在顯著性差異,《暮光之城》全系的詞匯密度不及BROWN(K-R)文學語料庫詞匯密度高。Halliday曾對英語口語體和書面語體材料做了對比分析,他發現正式語體的詞匯密度高,并具有名詞化(nominalization)特征,而非正式語體詞匯密度較低,名詞化傾向較弱。書面語就可以經過一番的思考和推敲,顯得更加正式、嚴謹。語篇氛圍越嚴肅,作者對所使用的詞匯就越精雕細琢。Halliday(1985:91)認為,非正式的語體,特別是口語體,在呈現經驗和現象時,講話人是在說話,在用語言講述所發生的事件或所做的事情,把經驗和現象當做動作來描述,因此多采用動詞。非正式書面語體的詞匯密度低,書面語詞匯密度高,信息量大;而口語詞匯密度低,包含信息量小,但是句子結構靈活多變、復雜。賦碼后的文本不但為計算詞匯密度提供便利,同時也使不同詞性詞匯分布如形容詞、副詞使用情況一目了然,如例1所示。

例1:Charlie was waiting for me with the cruiser.This I was expecting,too.Charlie is Police Chief Swan to the good people of Forks.My primary motivation behind buying a car,despite the scarcity of my funds,was that I refused to be driven around town in a car with red and blue lights on top.Nothing slows down traffic like a cop.

在本段中共有4句,描述主人Bella的父親Charlie是一位警察,作者僅用了4個形容詞good,primary,red and blue。上述四個形容詞是最常見的形容詞,表意模糊,涵蓋的范圍較廣。作者較少選用形容詞,且僅用最常見的詞匯描述作為主人公之一的父親,這一文體特征離不開作者的宗教背景。Stephanie Meyer畢業于全美最大的教會大學Brigham Young University,主修英國文學,是篤信后基督教(即摩門教)教義的教徒,這使得她的作品中不會有任何吸毒、性愛或者暴力情節出現,甚至連一句臟話也難尋。鑒于上述,《暮光之城》系列簡潔明快,沒有冗余的形容詞和副詞修飾,讀后給讀者以一目了然、脈絡清晰的質感。

(二)詞頻分析

《暮光之城》系列主要是以人類女孩伊莎貝拉·斯旺(Isabella Swan)和吸血鬼少年愛德華·庫倫(Edward Cullen)纏綿悱惻的愛情故事為主線,整合了吸血鬼傳說、狼人故事、校園生活、恐怖懸念、喜劇冒險元素的長篇小說,適合青少年閱讀。《時代》周刊(Times)曾如此評價:“充滿著愛恨情仇的張力,但又優雅精致如簡·奧斯汀,達到了浪漫小說的一種極致。”下面就作品是否以圍繞Bella和Edward為主題,是否適合青少年閱讀做一考證。表3為經Wordlist功能得出的《暮光之城》和BROWN(K-R)的詞頻表及高頻詞,因篇幅所限,本文僅列出前20詞。

詞頻表反映的是上述兩類語料庫中出現頻率依次排序的詞匯。通常高頻詞是功能詞,但是《暮光之城》出現頻率最高的是實義詞第一人稱代詞“I”。是否因小說是第一人稱敘述,所以“I”頻率最高,那么其他第一人稱敘述的小說高頻詞中是否“I”也是排序第一呢?是否第一人稱敘事小說中“I”都是第一高頻詞,還是僅此一例?作者對三部以第一人稱為敘事角度的英文小說做了詞頻統計,分別是《Black Beauty》、《Oliver Twist》、《RobinsonCrosio》。在《Black Beauty》中,“I”是第三高頻詞,在《Oliver Twist》中位于第二,在《Robinson Crosio》中也是第二高頻詞。經過對比得出結論,在以第一人稱為敘述角度的小說中,“I”確實屬高頻詞這點與其他文體小說不同。但是“I”列位第一是《暮光之城》獨有的特點,屬于這一文本的獨到之處,說明作者格外強調“I”(我)的感受,引領讀者從“我”的角度參與故事情節,增強作品感染力。

表3 兩類語料庫詞頻表及高頻詞

不同的是“was”在《暮光之城》詞表中排名第四,遠高于BROWN(K-R)的第七位。經過卡方檢驗0.01

通過對熱銷英文系列小說《暮光之城》自建語料庫與BROWN文學語料庫BROWN(K-R)對比,就詞匯分布、詞匯密度等詞匯特征進行了分析,得出《暮光之城》系列小說所用詞匯普遍短小,詞匯密度較高,口語化特征明顯,多采用動詞,句子簡短,敘事簡潔、平實,可讀性強,適合青少年閱讀。動詞中一般過去時的高頻使用突出小說神秘感,與吸血鬼和人類相戀的主題不謀而合,增強了小說的趣味性和可讀性。

語料庫是一種新興的語言處理技術,其特點是對大規模的真實語言進行科學的統計分析,通過采用對比詞頻表、賦碼計算詞匯密度等來自語料庫的數據對語言系統進行量化分析,從而發現語言規律。語言研究者借助語料庫檢索工具對來自語料庫的數據進行量化分析,可以觀察到用傳統方法無法發現的很多語言事實,從而對語言本身進行更加客觀地描寫和解釋。通過語料庫手段對文學作品詞匯的分析為進一步研究提供了更加科學的數據支撐,從而使結果更具客觀性和準確性,繼而增加了解釋的說服力。然而,其缺點是語料庫的建立比較費時費力,語料庫研究方法也比較復雜,不易在短時間內普及。

[1] Palmer F R.The English Verb[M].London:Longman Group Ltd,1974:94-95.

[2] Stephanie Meyer.Twilight[M].New York:Little,Brown and Company Hachette Book Group,USA.

[3] Stephanie Meyer.New Moon[M].New York:Little,Brown and Company Hachette Book Group,USA.

[4] Stephanie Meyer.Eclipse[M].New York:Little,Brown and Company Hachette Book Group,USA.

[5] Stephanie Meyer.Breaking Dawn[M].New York:Little,Brown and Company Hachette Book Group,USA.

[6] 劉建強,張化麗.科技英語中被動語態的特點及翻譯方法[J].科技信息:科學教研,2008(4).

[7] 曾衛軍.文藝語體中的短句修辭[J].現代語文:語言應用研究版,2007(7).

[8] 郝雁南.談談美國摩門教及其文化[J].山東師大外國語學院學報,2000(2).

[9] 楊信彰.英語書面語體中的詞匯密度特征[J].解放軍外語學院學報,1995(3).

[10] 吳義勤.中國當代新潮小說論[M].南京:江蘇人民出版社,1997.

[11] 馬廣惠.基于語料庫的小說文體學研究[J].常熟理工學院學報,2005(5).

[12] 劉世生.文學文體學:理論與方法[J].外語教學與研究:外國語文雙月刊,2002(3).

[13] 申丹.文學文體學的分析模式及其面臨的挑戰[J].外語教學與研究,1994(3).

[14] 慈繼偉.小說對文學文體學的挑戰[J].外語教學與研究,1985(2).

[15] 李濤,王菊麗.語料庫文體學:計算機輔助文學語篇的文體分析[J].外語電化教學,2009(1).

[16] 劉世生.文學文體學:文學與語言學的交叉與融會[J].清華大學學報:哲學社會科學版,2003(6).

[17] 趙秀鳳,訾纓.文學文體學的回顧與展望[J].北京林業大學學報:社會科學版,2005,4(1).

[18] 杜琳.西方現代文體學的沿革及其主要流派[J].濟南職業學院學報,2007(3).

[19] 閆書穎.詞匯密度在語料庫中的統計[D].大連海事大學碩士學位論文,2001.

[20] 韓國崇.基于語料庫的歐內斯特·海明威作品文體學分析[D].大連海事大學碩士學位論文,2008.

[21] 易仲良.論英語動詞過去時態的實質[J].上海外國語學院學報,1987(1):2.

[22] 易仲良.論英語中“說話時刻”的移位[J].外語與外語教學,1998(11):1.

[23] 許偉.平行語料庫在翻譯批評中的應用--以培根Of Studies的不同譯本為例[J].外語研究,2006.

[24] 段晉麗,李英杰.基于語料庫的文體研究-以《圍城》珍妮英譯本為例[J].黃石理工學院學報,2007(3).

[25] 高彩虹.英語一般過去時非過去用法的認知闡釋[J].重慶工學院學報:社會科學,2009(1).

[26] 楊惠中.語料庫語言學導論[M].上海外語教學出版社,2002.

[27] 王馥芳,羅敏莉.語料庫詞典學的興起與發展[J].辭書研究,2004(5).

A Corpus-based Lexical Analysis of Twilight Series

Yang Xiuzhen,Xu Na,Liu Meiyu

This paper,with the assistance of corpus retrieval tool called WordSmith,makes a comparative analysis of the self-established corpus composed of the Twilight Series and the BROWN(K-R)literary corpus.It tries to illustrate the lexical characteristics of Twilight series from three aspects:word length,lexical density and high-frequency words by combining quantitative findings with qualitative analyses.

corpus;Twilight series;BROWN(K-R)literary corpus;lexical characteristics

H313

A

楊秀珍(1950-),女,教授,碩士生導師,研究方向為英語教學法。

猜你喜歡
詞匯文本語言
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
在808DA上文本顯示的改善
本刊可直接用縮寫的常用詞匯
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
讓語言描寫搖曳多姿
累積動態分析下的同聲傳譯語言壓縮
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
我有我語言
主站蜘蛛池模板: 国产丰满成熟女性性满足视频| 久久激情影院| 亚洲成a人片在线观看88| 亚洲成人在线网| 久久无码高潮喷水| 成人自拍视频在线观看| 永久成人无码激情视频免费| 国产玖玖视频| 真实国产精品vr专区| 国产麻豆精品久久一二三| 国产乱视频网站| 亚洲男女在线| a网站在线观看| 欧美成人手机在线观看网址| 91在线精品免费免费播放| 东京热高清无码精品| 欧美不卡视频一区发布| 久久久久九九精品影院| 欧美成人综合在线| 国产精品性| 亚洲欧美自拍视频| 中文字幕在线一区二区在线| 九色免费视频| 波多野结衣久久高清免费| 国产精品自在线拍国产电影| 国产va在线观看| 亚洲天堂区| 亚洲欧洲自拍拍偷午夜色无码| 亚洲免费福利视频| 国产又大又粗又猛又爽的视频| 日韩无码一二三区| 久久狠狠色噜噜狠狠狠狠97视色 | 91丝袜乱伦| A级全黄试看30分钟小视频| 欧美激情视频二区三区| YW尤物AV无码国产在线观看| 片在线无码观看| 九九精品在线观看| 久久久久夜色精品波多野结衣| 中文无码精品A∨在线观看不卡 | 手机成人午夜在线视频| www.亚洲色图.com| 国产黄在线观看| 亚洲最猛黑人xxxx黑人猛交| 久久精品国产91久久综合麻豆自制| 华人在线亚洲欧美精品| 亚洲天堂网视频| 成人在线亚洲| 欧美一级片在线| 日本国产精品一区久久久| 国产va在线| 无码中文字幕精品推荐| 欧美成人区| 91色国产在线| 国产在线观看精品| 国产精品一区二区在线播放| 国产亚洲美日韩AV中文字幕无码成人| 中文字幕佐山爱一区二区免费| 亚洲欧美综合另类图片小说区| 国产成人精品一区二区三区| 亚洲天堂视频网站| 亚洲成人手机在线| 久久先锋资源| 国内熟女少妇一线天| 精品91在线| 亚洲中文精品人人永久免费| 亚洲无限乱码一二三四区| 国产白浆视频| 青青草原国产一区二区| 国产丝袜精品| 又黄又湿又爽的视频| 欧美日韩北条麻妃一区二区| 久久网欧美| 5388国产亚洲欧美在线观看| 日本久久免费| 国产95在线 | 91美女在线| 成年人午夜免费视频| 久久精品aⅴ无码中文字幕 | 国产欧美另类| 国产国语一级毛片在线视频| 欧美第二区|