999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于傳媒語料庫的漢語語體詞匯比較研究

2015-01-04 02:06:38宋婧婧
長沙大學學報 2015年6期
關鍵詞:詞匯

宋婧婧

(廈門理工學院外語系,福建廈門361024)

近30年來基于漢語語料庫的詞匯研究日趨增多,但仍有可拓展之處:其一是漢語學界在將語料庫、詞匯與語體進行比較研究方面存在不足,而英語界這一研究卻已成趨勢;其二是對語體間的差異性、比較性研究不足,構成語體的變量較多,找到具有可比性的語料不易。此外基于漢語口語語料庫的詞匯研究相對較少。

國外相關研究中,Ure[1]、Poulisse 和 Bongaert[2]等的研究表明,書面語篇與口語語篇在詞匯變化性與詞匯密度上存在較大的差異。此外,Biber[3]、胡顯耀[4]、桂詩春[5]也曾利用更多因子來進行語體研究。籍此建立語體區分指標,在封閉領域的不同語料中通過計量手段探討指標與語體的關系,是一種較新的嘗試。

一 語料的選取

(一)選取原因及意義

本研究選取有聲媒體電視訪談節目、平面媒體語料作為比照對象,并輔之以新聞播報語料作為參照系,其原因在于:(1)電視訪談節目代表著傳媒語場中最為口語化的一極;(2)平面媒體中的報紙為傳媒語料中書面語一極,尤其是以嚴謹正式著稱的《人民日報》語料;(3)參照系為新聞播報語料,其與訪談節目同樣以聲音為傳播媒介,但播報前的文字準備又賦予其嚴謹、正式的特征,正式程度甚至高于一般的書面表達,同時新聞聯播沒有交互性。此外,從產生途徑看,平面媒體作為有聲媒體的報道“母體”,是原型語用體式,這種關系使本研究更具有比照意義。

(二)語料選取與分詞

本研究選取了電視訪談節目語料(《魯豫有約》、《實話實說》、《7日7頻道》以及《面對面》四個欄目的轉寫語料)、平面媒體語料(選自《人民日報》等報紙)、新聞播報語料(選自中央電視臺《新聞聯播》節目)。三類語料均為200萬字左右,總量約為615萬字,平面媒體語料已是熟語料,電視訪談與新聞播報語料均經過機器分詞。其中電視訪談語料來自于“國家語言資源監測與研究中心有聲媒體語言分中心”。《人民日報》語料來自人民日報標注語料庫。

(三)人工干預

圖1 語料庫形式圖

人工干預重點排除機器分詞與詞性標注錯誤,主要具有但不限于如下四類:(1)音頻轉寫文本產生的錯誤(如錯別字);(2)語素組合多樣性引發的機器分詞錯誤;(3)自動分詞未識別專名(人名為主);(4)不合本語料處理的規則:如“愿不愿意”的原形應是“愿意不愿意”,處理方法為在“愿”后補上語素“意”,計為“愿意”一詞。人工干預可能無法排除所有的錯誤,但細微的差異不影響總體統計結果。

語料分析工具為access數據庫軟件,在其查詢功能無法完成的復雜計算時,以ultra edit的正則表達式作為補充。除去標點后的語料庫形式如圖1所示。

二 語體指標選取

本研究指標的擬定綜合了詞匯學、語體學以及語料庫語言學的研究成果,以及我們的先期研究。有些指標主要立足于英語或翻譯語料,未必適用于漢語原創語料;有些指標之間具有重復性,有些被證明與語體無顯著聯系,因此最終設計基本特征指標2個,語體區分指標5個,包括:

1.基本特征指標:即總詞量(形符)與詞種(類符),這是定量分析的基礎。

2.語體區分指標:此類指標與語體之間具有可能聯系。一般而言,口語使用詞匯通俗、非正式、隨意、變化少,書面語詞匯使用典雅、正式、嚴謹、豐富(由于語義精確)。合偶雙音詞覆蓋率指標為研究中的新嘗試,如表1所示:

表1 語體區分指標對應的語體特征表

三 語體指標統計結果

(一)基本指標分析

經統計各類語料的總詞量均在110-130萬之間,而詞種(即語料中出現的不同詞語)則差異較大,尤其是電視訪談與平面媒體的詞種相差將近一倍。由表2可見,語料的類符數為平面媒體>新聞播報>電視訪談,而形符數則是電視訪談>平面媒體>新聞播報。類符數量并不隨著形符增加而增加,兩者并不呈現正相關關系。

表2 三類語料的基本指標分析表

(二)語體區分特征指標分析

1.詞語變化性(type/token ration)

詞匯變化性(TTR)指語料的類符形符比,其公式為:

詞匯變化性(TTR)=類符(type)/形符(token ratio)×100%

在形符容量相當的情況下,使用越多的類符說明用詞豐富度越高。但由于形符數總是隨著語料總量的增加而擴大,而任何語言的詞種數量卻有限,語料達到一定容量時,類符的增長將逐漸減緩。由此STTR即標準TTR應運而生,它被用來先統計每千個詞語的TTR再計算均值。此外,一些語言(如英語)具有屈折形式,如 talk,talks,talked,talking實為同一詞位talk,還應進行削尾處理。但本研究所用語料中外語詞數量極少,且多為縮略語(如PVC,SARS等),無須做此處理。經統計,語料TTR與STTR結果如表3所示:

表3 詞匯變化性表

表3中TTR與STTR的趨勢完全一致,均為平面媒體最高、電視訪談最低,新聞播報與平面媒體語料相當接近。換言之,偏口語的語料詞語的重現率較高,用詞豐富度較低,而偏書面語的語料則相反,新聞播報介于兩者之間。總體看來,詞匯變化性提示了用詞的豐富度,可作為區分口語與書面語料的指標之一。

2.詞匯密度(lexical density)

詞匯密度指語篇中詞項與篇章單詞總數的比值。具體公式如下:

詞匯密度=詞項/篇章單詞總數×100%

詞項指實詞項,詞匯密度體現出篇章傳遞信息量的大小。Poulisse和Bongaert認為實義詞比虛詞傳遞的信息要多,因此篇章中的實詞越多,詞匯密度越大,傳遞的信息也越多。

對漢語實詞項認定的焦點在于副詞、代詞與語匯成分。王力[6]認為,“詞可分為兩大類:凡本身能表示一種概念者,叫做實詞;凡本身不能表示一種概念,但為語言結構的工具者,叫做虛詞。”從語法功能上看,實詞大多可單獨成句,可擔任主語、賓語或謂語,而虛詞則不然。故而我們將副詞列為虛詞,代詞和語匯列為實詞項統計。最終實詞包括名詞、動詞、形容詞、數量詞、區別詞、代詞以及語匯成分。各類語料中的詞匯密度如表4所示:

表4 詞匯密度表

詞匯密度結果顯示,在語料等量的情況下新聞播報傳輸的信息容量最大,平面媒體次之,電視訪談最少。本研究的結果顯示:(1)口語語料(電視訪談節目)的詞匯密度小于書面語料(平面媒體),這與Ure等人的研究結果基本相符。(2)新聞播報語料的詞匯密度之高說明了口語傳播渠道與口語體不能完全對等,真正的口語體還與準備性、交際場合的正式程度、交際目的有較大聯系。

胡顯耀[7]統計的漢語翻譯語料詞匯密度一般在50%-70%之間,低于本研究統計的結果。這可能與兩個原因有關:(1)傳媒語言講究簡明扼要,力求在限定的時間與空間(版面)中提供盡可能多的信息,可能使其具有相對較高的詞匯密度。(2)胡顯耀未將代詞歸入實詞,對漢語實詞判定標準的差異也在一定程度上影響了詞匯密度的高低。

3.合偶雙音詞

音節分析是一種具有漢語特色的指標,類似于英語中的詞長,卻又不完全等同,因為雙音化是漢語詞匯發展的結果,音節發展又與語體的豐富存在著錯綜復雜的關系。如馮勝利[8]將合偶雙音詞看作現代漢語書面語的衍生物。合偶雙音詞即一般強制地與另一個雙音詞配對的雙音詞,例如“承認”可搭配雙音詞為“承認錯誤”,卻不能與單音詞“錯”搭配為“承認錯”,根據其建立的440個合偶雙音詞表可進行語篇正式度的分析。我們設計的合偶雙音詞覆蓋率公式如下:

合偶雙音詞覆蓋率=合偶雙音詞總頻次/形符總數×100%

各類語料的統計結果具有較為顯著的差異。如表5所示,平面媒體的合偶雙音詞數量最多,約為電視訪談語料的2倍,而新聞播報與之較為接近,可見合偶雙音詞是現代漢語書面語的特征之一,體現了語料的正式程度。

表5 合偶雙音詞覆蓋率表

4.高頻詞與低頻詞覆蓋率

各語料庫的前10位高頻詞重復率高,且均為書口通用語詞,如“的”、“了”、“是”、“一”4個單音詞在各類語料中均為高頻詞。我們把覆蓋率公式設計為:高頻詞覆蓋率=Sum每個高頻詞頻次/形符總數×100%。總體而言,高頻詞覆蓋率越高說明語料更通俗易懂,而覆蓋率低則可能相反,這一指標揭示了語料的通俗度。其中電視訪談語料該值最高,10個高頻詞在語料中就有20%以上的覆蓋率。

低頻詞指的是在語料中僅出現一次的詞語,一次性詞的增加將促進類符的增加,并最終提升語料的復雜度,即理解語篇需要更多詞匯量。其覆蓋率計算公式為:Sum每個高頻詞頻次/形符總數×100%。如表6所示,該指標同樣為平面媒體最高,電視訪談語料最低。

表6 高低頻詞覆蓋率表

5.綜述

五類指標的排序如圖2所示,除指標4高頻詞覆蓋率之外,其余指標(1.詞匯變化性;2.詞匯密度;3.合偶雙音詞覆蓋率;5.低頻詞覆蓋率)均與書面語化程度正相關,與口語化程度負相關,均為平面媒體或新聞播報語料最高,電視訪談類語料最低。此外,除了詞匯密度外,1、3、5指標均為平面媒體值最高,新聞播報次之,且兩者的數值均較為接近,可見在同一語域中,書面語比口語具有較強的豐富度、正式度與復雜性。此外,新聞播報語料傳遞了更大的信息容量,因此詞匯密度略高于平面媒體語料。

圖2 語體指標綜合排序圖

四 結語

通過對語體相關指標進行定量研究,我們可以減少研究者的感性偏誤,利用特征的疊加效應獲得由定量到定性的結論。主要結論可概括如下:

1.語體區分不僅可依據傳統的主觀語感,也反映在客觀的定量統計上:詞匯變化性、詞匯密度、合偶雙音詞與低頻詞覆蓋率均與語篇的書面語程度呈正相關關系,而高頻詞覆蓋率則反之,可考慮將此類指標看作語體區分的部分特征。

2.所選語料同屬傳媒語場,使之具有可比性,但又因語旨、語式的差異存在著顯著差異:總體而言,偏書面語的平面媒體比偏口語的電視訪談體現了更為顯著的豐富度、信息量、正式度與復雜度,而電視訪談則更具通俗性。

3.作為參考的新聞播報語料雖為口頭傳播,卻在各項指標上體現了與平面媒體類似的特征,這與其準備程度高、場合正式以及缺乏交互性等原因息息相關,符合我們的預設。這一結果也證實了書面語與口語的區分不應單純依賴于傳播媒介,而是與準備性、交際場合、交互性等具有較強的聯系。

4.需要進一步關注具有漢語特色的指標。如音節在英語相關研究中主要體現為詞長,然而,在漢語語料中這一指標更具價值。音節發展與語體的豐富存在著錯綜復雜的關系,例如本研究中合偶雙音詞的使用比例就提示了語料的正式度,與語料書面語程度關系密切。

本研究還有可拓展之處,如:第一,可進一步增加指標,例如詞類中的嘆詞、語氣詞、話語標記與語體具有一定聯系;第二,可借助統計學方法,利用SPSS因子分析判斷指標與語體的相關性。總體而言,計量統計、多維度的語體分析方法應當更多地運用到研究中,結合語料中反復出現的現象來確定特征,并將特征與某一語體進行相關分析,以達到客觀描述語言現象的目的。

[1]Ure,J.Lexical density and register differentiation[A].Applications of linguistics:Selected papers of the second international congress of applied linguistics[C].Cambridge:CUP,1971.

[2]Poulisse N,Bongaert T.First language use in second language production[J].Applied Linguistics,1994,(15).

[3]Biber D.Variation across speech and writing[M].Cambridge:CUP,1988.

[4][7]胡顯耀.基于語料庫的漢語翻譯語體特征多維分析[J].外語教學與研究,2010,(6).

[5]桂詩春.基于語料庫的英語語言學語體分析[M].北京:外語教學與研究出版社,2009.

[6]王力.王力文集(卷1)[M].濟南:山東教育出版社,1984.

[8]馮勝利.漢語書面語初編[M].北京:北京語言大學出版社,2006.

猜你喜歡
詞匯
2021年本刊一些常用詞匯可直接用縮寫(二)
2021年本刊一些常用詞匯可直接用縮寫(一)
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2017年35期)2017-10-10 02:45:28
一些常用詞匯可直接用縮寫
山東醫藥(2017年33期)2017-10-09 12:31:41
詞匯小達人
一些常用詞匯可直接用縮寫
山東醫藥(2014年48期)2014-12-02 04:34:34
一些常用詞匯可直接用縮寫
山東醫藥(2014年34期)2014-12-02 04:33:52
主站蜘蛛池模板: 国产欧美高清| 98精品全国免费观看视频| 中文字幕资源站| 国产幂在线无码精品| 国产精品jizz在线观看软件| 久久动漫精品| 久久成人国产精品免费软件| 在线国产91| 青青国产在线| 国产噜噜噜| 色综合久久久久8天国| 亚洲六月丁香六月婷婷蜜芽| a天堂视频| 粗大猛烈进出高潮视频无码| 亚洲高清中文字幕在线看不卡| 黄色网页在线观看| 热久久这里是精品6免费观看| 精品无码一区二区在线观看| 国产精品hd在线播放| 精久久久久无码区中文字幕| 欧美日韩国产综合视频在线观看| 久久精品中文字幕免费| 午夜免费视频网站| 国产精品嫩草影院视频| 国产精品黄色片| 日韩在线第三页| 国产美女主播一级成人毛片| 免费无遮挡AV| 欧美一区二区三区香蕉视| 999精品免费视频| 精品福利网| 国产成+人+综合+亚洲欧美| 三区在线视频| 为你提供最新久久精品久久综合| 成人免费网站久久久| 91偷拍一区| 亚洲欧美另类日本| 日韩大片免费观看视频播放| 高清大学生毛片一级| 亚洲综合精品香蕉久久网| 国产日本一线在线观看免费| 色综合网址| 久久不卡精品| 精品国产美女福到在线不卡f| 国产精品香蕉在线观看不卡| 国产日韩av在线播放| 欧美综合区自拍亚洲综合绿色 | 色网站在线视频| 在线综合亚洲欧美网站| 国产一区二区三区夜色| 国产激情国语对白普通话| 超碰91免费人妻| 久久国产V一级毛多内射| 黄色在线不卡| 精品国产免费观看| 国产99精品久久| 国产99视频在线| 亚洲AV无码乱码在线观看裸奔| 99re在线观看视频| 国产免费自拍视频| 亚洲综合狠狠| 国产理论精品| 日韩黄色精品| www.精品视频| 国产成人精品一区二区不卡| 亚洲欧美不卡| 国产极品粉嫩小泬免费看| 久久久久久久久亚洲精品| 亚洲天堂网视频| 日韩美女福利视频| 97免费在线观看视频| 亚洲欧美综合在线观看| 婷婷在线网站| 日韩精品视频久久| 国产成人精品在线| 亚洲AV无码乱码在线观看代蜜桃 | 色婷婷色丁香| 伊人久综合| 久久不卡国产精品无码| 欧美va亚洲va香蕉在线| 国产波多野结衣中文在线播放| 伊人久久大香线蕉综合影视|