999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Heaps定律魯棒性在文本中統(tǒng)計(jì)驗(yàn)證與分析

2016-05-30 10:25:10王彩燕
藝術(shù)科技 2016年2期

摘 要:Heaps定律無疑是揭示人類文獻(xiàn)內(nèi)在規(guī)律的有力武器。本文運(yùn)用R語言和SPSS程序。通過對(duì)“20世紀(jì)百大英文小說”——讀者票選名單中的16個(gè)文本進(jìn)行統(tǒng)計(jì)分析以驗(yàn)證Heaps定律魯棒性。

關(guān)鍵詞:Heaps定律;魯棒性;Heaps指數(shù);新詞進(jìn)入率

1 Heap定律

作為復(fù)雜系統(tǒng)中的經(jīng)驗(yàn)法則,Heaps定律是揭示人類文獻(xiàn)內(nèi)在規(guī)律的有力武器。設(shè)為文本總詞數(shù)達(dá)到時(shí)的詞匯量,Heaps定律可以用公式表示為,其中和為經(jīng)驗(yàn)系數(shù),即隨著文本長度的增加,文本不斷地生成,文本詞匯量的增加率隨之邊際遞減,[1]Heaps指數(shù)因此也常常被稱為“新詞進(jìn)入率”。本文在英文文本背景中驗(yàn)證Heaps定律的魯棒性。

2 Heaps定律魯棒性在文本中的統(tǒng)計(jì)驗(yàn)證

2.1 動(dòng)蕩與多元的語言文學(xué)背景下的Heaps定律

所謂魯棒性,一般認(rèn)為是系統(tǒng)的健壯性。是系統(tǒng)在擾動(dòng)或不確定的情況下仍能保持其特征行為。本文所提Heaps定律的魯棒性指在動(dòng)蕩和多元的語言文學(xué)背景下,文本中的新詞進(jìn)入率,即heaps指數(shù),是否仍能保持其特征值。Heaps定律可以用公式表示為,其中和為經(jīng)驗(yàn)系數(shù)。介于當(dāng)時(shí),的值必然也為1,本文取以方便計(jì)算處理。

20世紀(jì)是人類歷史上最為動(dòng)蕩和多元的世紀(jì)。20世紀(jì)的文學(xué),亦相應(yīng)地呈現(xiàn)繽紛瑰麗的異彩,印證著百年來人類精神的坎坷征程。文學(xué)諸賢已先于我們對(duì)20世紀(jì)做出了極富洞見的解讀。[2]本文選取了“20世紀(jì)百大英文小說”——讀者票選名單中的16個(gè)文本(按年份排列,每十年中隨機(jī)抽取兩個(gè)文本做統(tǒng)計(jì)分析),以衡量Heaps定律的魯棒性。這16個(gè)文本均為英文文本,按照篇幅可分為短篇小說、中篇小說、長篇小說。統(tǒng)計(jì)文本涵蓋了各種類型,按照年代依次列表(見表1)。此外,本文使用C語言、SPSS程序來對(duì)文本進(jìn)行處理和統(tǒng)計(jì),考察一百年間英文文本中詞匯量隨著文本長度的增加的變化規(guī)律。

可以看出,上述英文文本的heaps指數(shù)穩(wěn)定在0.790.05,判定系數(shù)R2都不小于86%。由此可見,Heaps指數(shù)并沒有因世界環(huán)境,特殊國情而產(chǎn)生很大的波動(dòng),Heaps定律及Heaps指數(shù)在描述人類所使用的詞匯量—總詞量關(guān)系上具有魯棒性和普適性規(guī)律。

2.2 文本的排列順序?qū)ζ淇傮wHeaps指數(shù)的影響

表2展示了三個(gè)英文文本《Pride and Prejudice》《Iliad》《the Old Man and the Sea》各自的總詞量、詞匯量及其經(jīng)過SPSS程序統(tǒng)計(jì)分析所得的Heaps指數(shù)和判定系數(shù)R2。三個(gè)文本的Heaps指數(shù)仍穩(wěn)定在0.790.05的范圍內(nèi)。下面我們討論,調(diào)整三個(gè)文本的排列順序,觀察三個(gè)文本作為整體時(shí)其Heaps指數(shù)是否會(huì)發(fā)生較大波動(dòng),以衡量Heaps定律的魯棒性。

由表3可見,不論《Pride and Prejudice》《Iliad》《the Old Man and the Sea》三個(gè)文本的先后順序如何排列,若將三個(gè)文本作為一個(gè)整體來看,其希普斯指標(biāo)僅從0.750變化到了0.753。因而我們可以得出結(jié)論,幾個(gè)文本之間的排列順序幾乎不會(huì)影響到這幾個(gè)文本作為一個(gè)總體時(shí)的Heaps指數(shù)。

此外,三個(gè)文本作為一個(gè)整體而言,其heaps指數(shù)略小于每一部單獨(dú)文本的heaps指數(shù)。這一方面是因?yàn)殡S著文本長度的增加(三個(gè)文本的總詞量明顯大于其中任意一單獨(dú)文本的總詞量),文本中已出現(xiàn)過的詞也在增加,因而其整體上的新詞進(jìn)入率會(huì)減低;另一方面,三個(gè)文本中有大量的詞匯重復(fù),這些重復(fù)的詞匯在單獨(dú)一個(gè)文本中可能是作為新詞出現(xiàn),但在三個(gè)文本形成的整體中,其所謂新詞即不再為新詞,已在前文中出現(xiàn)過。

3 結(jié)語

本文統(tǒng)計(jì)分析了20世紀(jì)16個(gè)英文小說的Heaps指數(shù)(新詞進(jìn)入率)數(shù)據(jù)。盡管所選取的研究范圍時(shí)間跨度較大。但是從根本上,Heaps指數(shù)并沒有因世界環(huán)境,特殊國情而產(chǎn)生很大的波動(dòng)。本文還嘗試研究了將幾個(gè)文本作為一個(gè)整體以闡述heaps定律的魯棒性時(shí),內(nèi)部文本間的排列順序幾乎不會(huì)影響到這幾個(gè)文本作為一個(gè)總體時(shí)的新詞進(jìn)入率。本文的研究反映了人類文學(xué)文獻(xiàn)的冪率特性,Heaps定律在描述人類所使用的詞匯量—總詞量關(guān)系上具有魯棒性和普適性規(guī)律。

參考文獻(xiàn):

[1] 張翼飛. Heaps定律在中英文文本中的統(tǒng)計(jì)驗(yàn)證與分析[J].中國外資,2011(10):272.

[2] 吳元邁,陶潔,王守仁,何寧. 20世紀(jì)外國文學(xué)簡史[M].譯林出版社,2013.

作者簡介:王彩燕,上海大學(xué)圖書情報(bào)檔案系情報(bào)學(xué)專業(yè)研究生。

主站蜘蛛池模板: 伊人久综合| 一本大道香蕉久中文在线播放| 亚洲国产清纯| 99热这里只有精品在线播放| 欧美一级高清片欧美国产欧美| 国产网站一区二区三区| 国产欧美一区二区三区视频在线观看| 国产在线无码av完整版在线观看| 欧美日韩国产在线观看一区二区三区| 日韩亚洲综合在线| 在线播放精品一区二区啪视频 | 思思热在线视频精品| 亚洲一区二区精品无码久久久| 国产成人精品优优av| 成年人福利视频| 六月婷婷精品视频在线观看| 日韩欧美中文亚洲高清在线| 亚洲国产中文在线二区三区免| 免费国产在线精品一区| 亚洲IV视频免费在线光看| 国产91特黄特色A级毛片| 国产一区在线视频观看| 高潮毛片免费观看| 视频二区欧美| 国产精品视频a| 不卡网亚洲无码| 91po国产在线精品免费观看| 无码精品国产dvd在线观看9久| 中文字幕人成乱码熟女免费| 午夜日韩久久影院| 欧美一级大片在线观看| 福利一区三区| 亚洲国产日韩欧美在线| 亚洲欧美国产五月天综合| 丰满少妇αⅴ无码区| 国产精品高清国产三级囯产AV| 国产在线观看精品| 色婷婷啪啪| 婷婷在线网站| 欧美激情,国产精品| 国产一区三区二区中文在线| 国产亚洲精品yxsp| 免费看av在线网站网址| 日韩在线第三页| 亚洲一区黄色| 四虎AV麻豆| 亚洲日本中文字幕乱码中文 | 欧美国产综合色视频| 亚洲成人在线免费| 大陆精大陆国产国语精品1024| 国产精品亚洲精品爽爽| 青青草国产在线视频| 精品国产成人高清在线| 青青青国产视频手机| 精品国产中文一级毛片在线看 | 日韩欧美国产成人| 久久综合亚洲鲁鲁九月天| 亚洲精品在线影院| 欧美高清三区| 欧美日韩亚洲综合在线观看| 中文一区二区视频| 青青草国产精品久久久久| 亚洲va视频| 亚洲精品第一页不卡| 九九九精品成人免费视频7| 香港一级毛片免费看| 国产视频入口| 国产精品自在在线午夜 | 97se亚洲综合在线韩国专区福利| 欧美黄网在线| 伊人无码视屏| 波多野结衣一区二区三视频| 全午夜免费一级毛片| 国产精品免费电影| 午夜福利亚洲精品| 国产久操视频| 国产91高清视频| 国产精品无码制服丝袜| 无码专区国产精品一区| 国产爽爽视频| 欧美人在线一区二区三区| 91精品免费高清在线|