999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

英語新聞主題圖式建模——一項基于TIME 語料庫的實證研究

2015-12-23 00:54:42陳月娥
山東農業(yè)工程學院學報 2015年1期
關鍵詞:語義詞匯英語

陳月娥

(安徽建筑大學外國語學院,安徽 合肥230001)

一、引言

美國語言學家薩丕爾曾說:“ 語言不能脫離文化而存在,也就是說不能脫離社會流傳下來的,它決定我們生活風貌和信仰的總體。 ”[1]正是因為語言中滲透著文化,在學習第二語言時,我們必須熟悉與這門語言相關的文化。 社會在變化,文化在發(fā)展,而最能及時反映這些變化和發(fā)展的非新聞莫屬。 因而英語新聞的學習也是了解當今英美社會文化的主要手段之一[2]。 然而,英語新聞很多時候超越了課本和本族傳統(tǒng)文化的視野,這不僅表現(xiàn)在詞匯和文體上,更是體現(xiàn)在新聞報道內容和知識背景中。 目前國內研究者對英語新聞的研究多集中在其語言詞匯特色和文體風格研究上,或者僅僅針對某一具體主題進行研究,如趙國杰[3]對涉華報道中的中國特色詞匯研究等, 而很少單獨提出對新聞主題總體進行研究。本研究擬通基于大規(guī)模真實新聞語料的統(tǒng)計分析,以圖式構建理論為基礎, 利用 “語義空間”、“語義場”、“詞語場”的圖式網絡模型,把大量分散、相對孤立的關鍵詞和主題用圖式網絡的方式歸納、分類,形成脈絡清晰,結構緊湊的主題圖式模型。 利用語料庫提取的關鍵詞作為圖式模型的詞匯填充,使得模型具有信息量大,內容真實、豐富、信息量大的特點,幫助學習者更好地去理解、構建和預測英語新聞的主題圖式。

二、研究的理論基礎

圖式就是知識在大腦中的儲存單位, 是人腦中一種抽象的、結構化和系統(tǒng)化的知識表征,它包括各種各樣的知識,圖式的總和便是一個人的全部知識。圖式的概念最早來自19 世紀德國哲學家康德,他把圖式看成是“原發(fā)想象力”的一種特定形式或規(guī)則。現(xiàn)代圖式理論的主要代表人物Rumelhart[4]認為,圖式理論是一種關于人的知識如何被表征, 以及對知識的表征如何以其特有的方式促進知識應用的理論。McCarthy[5]認為新知識必須與現(xiàn)存知識相聯(lián)系才會得以處理加工, 高效的讀者通過激活必要的知識才會對所讀文本進行解碼。

圖式是一個知識框架,圍繞這個框架,通過已知的背景知識可以使一定的情景得到解釋, 從而使特定圖式的知識框架得到擴展。圖式不是一成不變的,它是一個開放的體系。人腦中已有的圖式知識可以促進學習者的學習。圖式在大腦中形成后會對之后獲得的信息重新組織、理解和記憶,依據人腦中已存的圖式對新輸入的信息解碼、編碼。 根據人們的背景知識結構。 Carrell[6]將圖式分為形式圖式和主題圖式兩種, 其中形式圖式包括語言圖式和語篇圖式;主題圖式則包括了主題知識、世界知識和文化知識。 Carrell 認為形式圖式和主題圖式在閱讀中對某一圖式的激活乃至整個語篇的理解都起著重大的作用。

三、數(shù)據提取和結果

本研究把語料庫詞頻自動分析與人工語義分析的方法結合起來。 觀察語料庫是選取2009 年至2011 年期間在美國出版的77 期美國《時代周刊》,對照語料庫是英國國家語料庫, 使用詞性標準軟件CLAWS 對語料庫進行詞性標注, 運用檢索工具WordSmith4.0 的Keyword 軟件來提取英語新聞詞表中的關鍵詞, 并使用語料庫Range工具測量它們在基礎詞表上的分布。

(一)語料庫準備

本研究在提取TIME 文本時將雜志中重復出現(xiàn)的一些廣告、網址和語句等與新聞內容無關部分進行了剔除,以減少其對統(tǒng)計結果的干擾。 語料庫規(guī)模約為300 萬詞次。 TIME 是美國三大時事性周刊之一,內容廣泛,對國際問題發(fā)表主張和對國際重大事件進行跟蹤報道,在美國的媒體中頗有影響力,有世界“史庫”之稱。 本研究使用的對照詞頻表來自英國國家語料庫。 該語料庫是一個大型的現(xiàn)代英語書面語及口語的語料庫,約為1 億詞次。該庫的書面語部分主題廣泛,語料庫規(guī)模較大[7]。

(二)新聞語料庫的統(tǒng)計學描述

觀察語料庫TIME 新聞語料庫的形符數(shù)2887551、類符數(shù)73055、類符/形符比(TTR)2.53%;標準類符/形符比(STTR)51.125,大于對照語料庫的42.66;平均詞長(Mean WL)4.72, 大于對照語料庫的4.64; 平均句長(Mean SL)18.55 詞/句,小于對照語料庫的19.57 詞/句。 從這些數(shù)據可以看出,英語新聞具有句子簡潔,詞量豐富,詞長偏長,句長偏短的特點。

(三)關鍵詞的提取

關鍵詞提取的理據是,當語篇圍繞某個主題展開時,表達該主題的一些詞匯會反復出現(xiàn),在詞頻上的表現(xiàn)是這些詞匯出現(xiàn)頻率顯著高于隨機發(fā)生概率。 通過計算觀察語料庫和對照語料庫的詞頻表,提取出詞頻差異具有統(tǒng)計學上顯著性的關鍵詞。

本研究采用對數(shù)似然率計算方法得出Keyness,軟件設定max.p value=0.000001,Min.Fre >3, 按Keyness 大小排序提取前500 個候選關鍵詞。去除一些不需要的符號、字母和數(shù)字得到485 個關鍵詞,其中實義詞474 個,虛詞11 個。本文提取關鍵詞的目的是構建新聞英語的主題圖式,故去除沒有語義功能的虛詞。利用語料庫Range 工具對關鍵詞在Range 自帶有3 個基礎詞表中的分布情況進行統(tǒng)計,結果如下:

表1:關鍵詞的Range 工具分析結果

Range 的3 個基礎詞表,分別包括最常用的999 個詞族,次常用的987 個詞族, 和前兩個詞頻表之外的、高中和大學各科教材中最常用的570 個英語詞族。 從Range統(tǒng)計結果來看,有70.4%的關鍵詞不在基礎詞表之中。尤其是專有名詞,比例達到了98.2%。這表明新聞英語的詞匯難度大,生詞多,理解較困難。

四、語義分析和圖式建模

(一)語義空間、語義場和詞語場

心理語言學的研究表明: 母語使用者大腦中存在著大量的心理詞庫。 這些詞匯并非雜亂無序, 而是一個組織嚴密的詞匯集。 詞語通過語義聯(lián)系結成網絡, 便于在交際時被有效快速地提取。 圖式是語義記憶里的一個結構, 它對一群信息的一般和期望的排列作出規(guī)定[8]。McCarthy[9]曾指出,一個人在用詞語來表達真實世界時,詞與詞之間存在一種譜系關系。 在這種關系中, 處于最上層的是“語義空間”,“語義空間”由各種“語義場”組成,后者表達對真實世界的知識或概念,它們又由“詞語場”來構成。 心理圖式就是一個高度抽象的, 龐大的語義空間,它由語義場組成。 語義場是對真實世界的反映,體現(xiàn)為各種主題,由對應的詞語場來實現(xiàn)[10]。語言空間和語義場就是存在于頭腦中不可見的圖式,是無法直接觀測的。詞語場是由具體詞匯聚合而成,是可觀察到的,可以通過實證的方法加以統(tǒng)計。每一個語義場都應該有如下成分:1)主題詞,是知識和經驗的抽象,它帶有語義場自身的標志性;2)行為詞,表達一系列動作的詞語;3) 行為者,是行為的主體,是行動的執(zhí)行者或接受者;4)關聯(lián)詞,行為的客體,是行動的外在事物;5)位置詞,即執(zhí)行動作或行為的環(huán)境;6)時間詞,即執(zhí)行動作或行為的時間;7)修飾詞等,即描述、評價、數(shù)量或限定其他詞語的詞語。

(二)關鍵詞的詞性統(tǒng)計

表2:關鍵詞詞性分布表(詞例按詞頻大小排列)

從表2 可以看出:名詞占關鍵詞的絕對多數(shù),合計占了全部的81.2%,其中專有名詞比例最高,為46.8%。 這說明大量使用專有名詞是英語新聞典型的詞語特征。 而且這些專有名詞大多具有較強的內容和主題色彩, 與熱點人物、事件有關。 由Range 工具分析結果可知,這些詞匯大多是無法在日常用語和教材中獲取,這無疑給二語學習者帶來挑戰(zhàn)。而普通名詞占比為34.4%,它們在語料庫中出現(xiàn)頻率高,Range 工具分析也表明它們多為常用詞匯,詞族種類多,詞匯廣度較大。從表中,我們也可以看出修飾詞、時間詞等數(shù)量均較少。

(三)關鍵詞的語義分析與標注

在下表3 中, 我們對222 個專有名詞進行人工語義標注,按照語義分為人名、地名、國別、機構等7 個類別。可以看出,人名占據最大多數(shù),為45.9%。人名中出現(xiàn)頻率最高的是OBAMA。 在2008 年當選總統(tǒng)之前,他是一個名不見經傳的人物,在BNC 語料庫中只出現(xiàn)了1 次,而在觀察語料庫中出現(xiàn)次數(shù)多達2769 次, 關鍵值達到19,588.85。在地名中, 美國本土的地名, 如NEW YORK,WASHINGTON,CALIFORNIA 等 位 居 前 列。 在 國 別 中,CHINA 頻繁出現(xiàn)在英語新聞中, 其出現(xiàn)的頻率為1345次,甚至大于出現(xiàn)947 次的AMERICA,可以想象在新聞報道中關于中國的話題是非常頻繁的。 當然還有可能的原因是美國的英文表達法不止有AMERICA,還有U.S.等。除此之外,英語新聞中常提及到的機構(如CIA、OSCAR、FBI)、科技(如FACEBOOK、GOOGLE、TWITTER)和組織(如TALIBAN、QAEDA、MUSLIM)的名稱均被提取了出來。

表3:專有名詞分布表(詞例按詞頻大小排列)

在下表4 中,我們對163 個普通名詞進行詞義標注,把主題標記性顯著的關鍵詞進行了主題標記,共計10 個主題101 個主題詞,對其余62 個主題標記不明顯的關鍵詞,根據詞義屬性分為關聯(lián)事物和關聯(lián)人物兩類。

表4:普通名詞主題分布表(詞例按詞頻大小排列)

(四)英語新聞主題圖式的模型構建

通過對關鍵詞的語義分析, 不難發(fā)現(xiàn)構成某語義場核心的是普通名詞中的主題詞, 是特定語義場專有的,具有排他性。 例如,提到NEWS、FILM、MOVIE 等主題詞就會聯(lián)想想到 “媒體” 語義場, 提到PRESIDENT、GOVERNMENT、STATE 等主題詞就會聯(lián)想到 “政治”語義場。 其他的詞語場不具有排他性, 可以是多個語義場所共享的,如關聯(lián)詞詞語場的WORLD、CITY;時間詞語場的YEARS、MONDAY;行為詞語場的SAYS;修飾詞語場的BIG、MORE 等。 語義場的這種構成形式,可以最大的滿足交際需要,減少記憶負擔,提高詞匯提取速度。 在心理圖式的作用下,語言使用者在涉及到某一主題時,其對應的語義場即被激活,觸發(fā)一系列詞語場。 由此可見,詞語在大腦中并非雜亂無章地堆砌在一起, 而是按語義邏輯聯(lián)系構成一個組織嚴密的網絡圖,共同構成學習者關于該話題的心理詞庫和圖式。 不同主題的心理詞庫和圖式內容上不相同, 但是結構體系一致。 下圖為所構建的主題圖式模型。

(五)英語新聞主題圖式特點

從圖1 可以看出,心理圖式作為一個語義空間,由若干多個語義場構成,語義場以主題(“媒體”)為聚合中心,由“主題詞”詞語場組成主題詞匯。 例如,“媒體”的“主題詞” 詞 語 場 由 TV、PICTURES、NEWS、FILM、MOVIE、MEDIA 等23 個關鍵詞組成, 它們在觀察語料庫中詞頻高,關鍵度也高。 這表明英語新聞相對于一般語料而言,“媒體”的主題出現(xiàn)頻率高。 直接與“主題詞”詞語場接觸的是“關聯(lián)詞”詞語場,“行為詞”詞語場和“行為者”詞語場。這些詞語場之間彼此影響,關系緊密,相互激活,是構成語義場的主體部分。而“位置”詞語場,“時間”詞語場和“修飾”詞語場位于語義場邊緣,是對主體部分進行修飾和限定,不與“主題詞”詞語場直接接觸。

從數(shù)據結果看,10 類主題詞詞語場解釋了21.3%的關鍵詞。 依據各主題詞詞語場的關鍵詞數(shù)量排序, 最多的是傳媒、政治、經濟和軍事,最少的是氣候、體育和教育。 關聯(lián)詞詞語場解釋了24.5%,其中各類專有機構、組織、和產品等名稱解釋了16.7%的關鍵詞,關聯(lián)事物解釋了7.8%, 出現(xiàn)頻率高的關鍵詞有WORLD、CITY 等在英語新聞各主題中均可能出現(xiàn)的常見詞;行為者詞語場解釋了26.8%,其中專有人名解釋了21.5%的關鍵詞,出現(xiàn)頻率高的人名有OBAMA、BILL、JOBS, 關聯(lián)人物解釋了5.3%, 出現(xiàn)頻率高的關鍵詞有PEOPLE、WOMEN、KIDS等常見人物。 行為詞語場解釋了2.7%,出現(xiàn)頻率高的動詞有SAYS、SPENDING、KILLED、FIGHT。 由它們構成的語義場主體部分合計解釋了75.3%的關鍵詞, 而位于邊緣的“位置”、“時間”、“修飾”詞語場合計解釋了24.7%的關鍵詞。

從圖式模型的填充詞匯中可以看出, 英語新聞的語義場主題鮮明, 關聯(lián)詞匯中專有名詞眾多, 諸如機構名稱,組織名稱等;行為者詞匯數(shù)量多,大量專有人名出現(xiàn);行為詞較少,最常見的詞是SAYS,這符合新聞報道常引用第三人稱話語的特點;位置詞匯中出現(xiàn)大量專有地名,反映新聞事件的地域特點;時間詞匯中絕大部分為狹義時間, 如MONDAY、JUNE、THURSDAY, 而廣義時間較少,反映出新聞事件對時間的敏感性和精確性;在修飾詞匯中,數(shù)量詞多為MILLION、BILLION 等,反映新聞事件多具有轟動性和影響力大的特點。

五、研究結論與不足

本研究利用真實新聞語料進行大規(guī)模統(tǒng)計分析,通過對關鍵詞的提取,語義分析、加工,對詞語場進行詞語填充, 運用圖式理論構建英語新聞語義網絡模型。 通過提取出來的關鍵詞進行語義分析和標注,來填充詞語場并獲得語義場, 本文最終形成脈絡清晰的主題圖式模型。 它的構建不僅可以幫助語言學習者了解英語新聞的熱點和主題分布,而且減輕學習者記憶負擔,豐富學習者圖式和心理詞庫,改善詞匯識別能力,優(yōu)化學習者知識結構和語言認知能力,這些對大學英語詞匯教學具有積極的指導意義[11]。

由于本研究中僅采用了共時語料庫, 沒有考慮圖式內容的時效性,也沒有對比其與本族語新聞主題圖式的異同性,這些使得本研究具有一定的局限性,這也是未來研究的方向。

[1]周方珠.翻譯多元論[M]. 北京:中國對外翻譯出版社,2004:4.

[2]周學藝.美英報刊文章閱讀[M]. 北京: 北京大學出版社,2004:12.

[3]范勇.《紐約時報》涉華報道對中國特色詞匯翻譯策略之研究[J]. 解放軍外國語學院學報,2010,(5):82-87.

[4]Rumelhart D.The Architecture of Mind:A Connectionist Approach[M]. Mass: MIT Press,1989

[5]McCarhy.M.Discourse Analysis for Language Teachers[M].Cambridge:Cambridge University Press,1991.

[6]Carrell.P,Devine.J,Eskey.D.Interactive Approaches to Second Language [M]. Cambridge: Cambridge University Press,1988:158.

[7]周江林,張家強.基于語料庫的英語空間隱喻研究[J]. 解放軍外國語學院學報,2003,(5):27-31.

[8]桂世春.新編心理語言學[M].上海:上海外語教育出版社,2000:445.

[9]McCarhy.M.Vocabulary [M]. Oxford: Oxford University Press, 1990.

[10]李文中. 基于英語學習者語料庫的主題詞研究[J]. 現(xiàn)代外語,2003,(3): 284-293.

[11] 翟雪松, 林莉蘭. 翻轉課堂的學習者滿意度影響因子分析——基于大學英語教學的實證研究 [J]. 中國電化教育,2014,04:104-109+136.

猜你喜歡
語義詞匯英語
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
語言與語義
本刊可直接用縮寫的常用詞匯
“上”與“下”語義的不對稱性及其認知闡釋
讀英語
認知范疇模糊與語義模糊
酷酷英語林
本刊一些常用詞匯可直接用縮寫
語義分析與漢俄副名組合
外語學刊(2011年1期)2011-01-22 03:38:33
主站蜘蛛池模板: a在线亚洲男人的天堂试看| 国产成人麻豆精品| 亚洲天堂首页| 香蕉eeww99国产在线观看| 三上悠亚精品二区在线观看| 国产福利不卡视频| 毛片在线播放网址| 日韩黄色大片免费看| 玖玖精品在线| 国产精品密蕾丝视频| 午夜国产不卡在线观看视频| 国产一区二区三区在线精品专区 | 国产精品13页| 美女国产在线| 国产日本欧美亚洲精品视| 国产aaaaa一级毛片| 一本大道香蕉中文日本不卡高清二区 | 午夜a级毛片| 在线观看亚洲天堂| 欧美色丁香| 露脸国产精品自产在线播| 色偷偷av男人的天堂不卡| 国产精品成| 国产欧美在线视频免费| 国产美女叼嘿视频免费看| 欧美性猛交一区二区三区| 国产人成在线视频| lhav亚洲精品| 91久久天天躁狠狠躁夜夜| 91欧美在线| 久久特级毛片| 很黄的网站在线观看| 国产精品视频999| 777午夜精品电影免费看| 婷婷在线网站| 日韩 欧美 小说 综合网 另类 | 亚洲无线一二三四区男男| 最新无码专区超级碰碰碰| 九九热免费在线视频| 国产在线观看91精品| 色婷婷国产精品视频| 亚洲天堂视频在线免费观看| 最新国产午夜精品视频成人| 亚洲色成人www在线观看| 在线观看国产精美视频| vvvv98国产成人综合青青| 国产综合日韩另类一区二区| 伊人天堂网| 亚洲无码高清免费视频亚洲| 超碰91免费人妻| 亚洲综合九九| av一区二区人妻无码| 免费在线不卡视频| 不卡网亚洲无码| 99激情网| 狠狠干欧美| 久久久久无码精品| 农村乱人伦一区二区| 午夜视频免费试看| 91麻豆精品国产高清在线| 亚洲无码精品在线播放| 国产美女无遮挡免费视频| 久久久亚洲国产美女国产盗摄| 91久久大香线蕉| 亚洲综合在线最大成人| 欧美一区福利| 亚洲人成人无码www| www欧美在线观看| 天天色天天综合| 在线色综合| hezyo加勒比一区二区三区| 国产精品视屏| 91免费在线看| 久久美女精品| 欧美亚洲激情| 激情在线网| 九色综合伊人久久富二代| 亚洲精品在线91| 国产精品丝袜视频| 色综合久久88色综合天天提莫| 天堂岛国av无码免费无禁网站| 波多野结衣第一页|