999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Heaps定律魯棒性在文本中統(tǒng)計(jì)驗(yàn)證與分析

2016-05-30 10:25:10王彩燕
藝術(shù)科技 2016年2期

摘 要:Heaps定律無疑是揭示人類文獻(xiàn)內(nèi)在規(guī)律的有力武器。本文運(yùn)用R語言和SPSS程序。通過對(duì)“20世紀(jì)百大英文小說”——讀者票選名單中的16個(gè)文本進(jìn)行統(tǒng)計(jì)分析以驗(yàn)證Heaps定律魯棒性。

關(guān)鍵詞:Heaps定律;魯棒性;Heaps指數(shù);新詞進(jìn)入率

1 Heap定律

作為復(fù)雜系統(tǒng)中的經(jīng)驗(yàn)法則,Heaps定律是揭示人類文獻(xiàn)內(nèi)在規(guī)律的有力武器。設(shè)為文本總詞數(shù)達(dá)到時(shí)的詞匯量,Heaps定律可以用公式表示為,其中和為經(jīng)驗(yàn)系數(shù),即隨著文本長度的增加,文本不斷地生成,文本詞匯量的增加率隨之邊際遞減,[1]Heaps指數(shù)因此也常常被稱為“新詞進(jìn)入率”。本文在英文文本背景中驗(yàn)證Heaps定律的魯棒性。

2 Heaps定律魯棒性在文本中的統(tǒng)計(jì)驗(yàn)證

2.1 動(dòng)蕩與多元的語言文學(xué)背景下的Heaps定律

所謂魯棒性,一般認(rèn)為是系統(tǒng)的健壯性。是系統(tǒng)在擾動(dòng)或不確定的情況下仍能保持其特征行為。本文所提Heaps定律的魯棒性指在動(dòng)蕩和多元的語言文學(xué)背景下,文本中的新詞進(jìn)入率,即heaps指數(shù),是否仍能保持其特征值。Heaps定律可以用公式表示為,其中和為經(jīng)驗(yàn)系數(shù)。介于當(dāng)時(shí),的值必然也為1,本文取以方便計(jì)算處理。

20世紀(jì)是人類歷史上最為動(dòng)蕩和多元的世紀(jì)。20世紀(jì)的文學(xué),亦相應(yīng)地呈現(xiàn)繽紛瑰麗的異彩,印證著百年來人類精神的坎坷征程。文學(xué)諸賢已先于我們對(duì)20世紀(jì)做出了極富洞見的解讀。[2]本文選取了“20世紀(jì)百大英文小說”——讀者票選名單中的16個(gè)文本(按年份排列,每十年中隨機(jī)抽取兩個(gè)文本做統(tǒng)計(jì)分析),以衡量Heaps定律的魯棒性。這16個(gè)文本均為英文文本,按照篇幅可分為短篇小說、中篇小說、長篇小說。統(tǒng)計(jì)文本涵蓋了各種類型,按照年代依次列表(見表1)。此外,本文使用C語言、SPSS程序來對(duì)文本進(jìn)行處理和統(tǒng)計(jì),考察一百年間英文文本中詞匯量隨著文本長度的增加的變化規(guī)律。

可以看出,上述英文文本的heaps指數(shù)穩(wěn)定在0.790.05,判定系數(shù)R2都不小于86%。由此可見,Heaps指數(shù)并沒有因世界環(huán)境,特殊國情而產(chǎn)生很大的波動(dòng),Heaps定律及Heaps指數(shù)在描述人類所使用的詞匯量—總詞量關(guān)系上具有魯棒性和普適性規(guī)律。

2.2 文本的排列順序?qū)ζ淇傮wHeaps指數(shù)的影響

表2展示了三個(gè)英文文本《Pride and Prejudice》《Iliad》《the Old Man and the Sea》各自的總詞量、詞匯量及其經(jīng)過SPSS程序統(tǒng)計(jì)分析所得的Heaps指數(shù)和判定系數(shù)R2。三個(gè)文本的Heaps指數(shù)仍穩(wěn)定在0.790.05的范圍內(nèi)。下面我們討論,調(diào)整三個(gè)文本的排列順序,觀察三個(gè)文本作為整體時(shí)其Heaps指數(shù)是否會(huì)發(fā)生較大波動(dòng),以衡量Heaps定律的魯棒性。

由表3可見,不論《Pride and Prejudice》《Iliad》《the Old Man and the Sea》三個(gè)文本的先后順序如何排列,若將三個(gè)文本作為一個(gè)整體來看,其希普斯指標(biāo)僅從0.750變化到了0.753。因而我們可以得出結(jié)論,幾個(gè)文本之間的排列順序幾乎不會(huì)影響到這幾個(gè)文本作為一個(gè)總體時(shí)的Heaps指數(shù)。

此外,三個(gè)文本作為一個(gè)整體而言,其heaps指數(shù)略小于每一部單獨(dú)文本的heaps指數(shù)。這一方面是因?yàn)殡S著文本長度的增加(三個(gè)文本的總詞量明顯大于其中任意一單獨(dú)文本的總詞量),文本中已出現(xiàn)過的詞也在增加,因而其整體上的新詞進(jìn)入率會(huì)減低;另一方面,三個(gè)文本中有大量的詞匯重復(fù),這些重復(fù)的詞匯在單獨(dú)一個(gè)文本中可能是作為新詞出現(xiàn),但在三個(gè)文本形成的整體中,其所謂新詞即不再為新詞,已在前文中出現(xiàn)過。

3 結(jié)語

本文統(tǒng)計(jì)分析了20世紀(jì)16個(gè)英文小說的Heaps指數(shù)(新詞進(jìn)入率)數(shù)據(jù)。盡管所選取的研究范圍時(shí)間跨度較大。但是從根本上,Heaps指數(shù)并沒有因世界環(huán)境,特殊國情而產(chǎn)生很大的波動(dòng)。本文還嘗試研究了將幾個(gè)文本作為一個(gè)整體以闡述heaps定律的魯棒性時(shí),內(nèi)部文本間的排列順序幾乎不會(huì)影響到這幾個(gè)文本作為一個(gè)總體時(shí)的新詞進(jìn)入率。本文的研究反映了人類文學(xué)文獻(xiàn)的冪率特性,Heaps定律在描述人類所使用的詞匯量—總詞量關(guān)系上具有魯棒性和普適性規(guī)律。

參考文獻(xiàn):

[1] 張翼飛. Heaps定律在中英文文本中的統(tǒng)計(jì)驗(yàn)證與分析[J].中國外資,2011(10):272.

[2] 吳元邁,陶潔,王守仁,何寧. 20世紀(jì)外國文學(xué)簡史[M].譯林出版社,2013.

作者簡介:王彩燕,上海大學(xué)圖書情報(bào)檔案系情報(bào)學(xué)專業(yè)研究生。

主站蜘蛛池模板: 国产成人麻豆精品| 欧美三级不卡在线观看视频| 国产人成乱码视频免费观看| 国产一区二区网站| 又黄又湿又爽的视频| 试看120秒男女啪啪免费| 国产精品午夜福利麻豆| 成年免费在线观看| 精品国产成人av免费| 亚洲欧洲日产国码无码av喷潮| 老司国产精品视频| 毛片基地视频| 老色鬼久久亚洲AV综合| 亚洲精品无码抽插日韩| 国产欧美日韩一区二区视频在线| 亚洲国产精品日韩av专区| 深夜福利视频一区二区| 亚洲Va中文字幕久久一区| 91极品美女高潮叫床在线观看| 色综合狠狠操| 国产粉嫩粉嫩的18在线播放91| 欧美全免费aaaaaa特黄在线| 99久久精彩视频| 毛片网站免费在线观看| 精品无码一区二区在线观看| 国精品91人妻无码一区二区三区| 亚洲成人www| 久久免费观看视频| 波多野结衣久久精品| 再看日本中文字幕在线观看| 亚洲αv毛片| 在线观看国产精美视频| 99re热精品视频国产免费| 视频在线观看一区二区| 亚洲精品无码av中文字幕| 99re经典视频在线| 欧美一区二区福利视频| 亚洲AⅤ波多系列中文字幕| 自拍亚洲欧美精品| 国产成人高清亚洲一区久久| 日本手机在线视频| 日韩国产亚洲一区二区在线观看| 高清免费毛片| 67194亚洲无码| 免费jizz在线播放| 色哟哟国产精品| 欧美成人午夜影院| 99青青青精品视频在线| 国产亚洲欧美在线专区| 日韩毛片免费视频| 亚洲娇小与黑人巨大交| 久草性视频| 国产综合精品一区二区| 国内精品自在欧美一区| 日韩精品视频久久| 久久精品日日躁夜夜躁欧美| 91亚洲精品第一| 国产成人喷潮在线观看| 91欧洲国产日韩在线人成| 久久99热这里只有精品免费看| 素人激情视频福利| 国产精品福利在线观看无码卡| 天天综合网色| 91丨九色丨首页在线播放| 日韩av手机在线| AV熟女乱| 国产精品一区二区不卡的视频| 一级毛片在线直接观看| 99精品视频在线观看免费播放| 国产色伊人| 全免费a级毛片免费看不卡| 午夜精品久久久久久久2023| 在线国产91| 午夜电影在线观看国产1区| 日本欧美视频在线观看| 亚洲综合精品香蕉久久网| 青青青草国产| 在线观看无码a∨| 久久青草免费91观看| 看国产一级毛片| 日韩午夜伦| 国产免费久久精品99re丫丫一|