999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多元零膨脹Poisson-Lindley分布

2022-06-24 09:01:54熊朝松黃希芬
高師理科學刊 2022年5期
關鍵詞:分析模型研究

熊朝松,黃希芬

多元零膨脹Poisson-Lindley分布

熊朝松,黃希芬

(云南師范大學 數學學院,云南 昆明 650500)

零值過多的多元計數數據出現在生活中的各個領域,這類數據成為了統計學研究的一個熱點.基于隨機表示提出了一個新的多元零膨脹Poisson-Lindley分布,主要用于研究存在過度分散的多元計數數據,進一步討論了其相關統計性質,構造EM算法獲得參數的極大似然估計.通過2組隨機模擬試驗驗證了參數估計方法能得到穩定有效的結果,真實數據分析結果表明,多元零膨脹Poisson-Lindley分布在數據處理中具有較強的實用性.

多元計數數據;隨機表示;多元零膨脹Poisson-Lindley分布;EM算法

實際生活中經常能觀測到許多非負整數的計數數據,這類數據廣泛存在于臨床醫學、公共衛生、生態環境、生物研究、金融保險、計量經濟學和農牧業等諸多領域,具有重要的研究價值和實際意義.目前,對于觀測到的計數數據,學者們普遍利用統計學中的經典離散分布進行分析研究,如Poisson分布和Negative Binomial分布等.然而,在生產生活中會產生各式各樣的數據,其中有很多數據不具備經典離散分布的結構,因此不能很好地被擬合分析.為了應對不同類型的計數數據,學者們通過廣義一般化、混合模型、復合技術和離散化連續分布等方法開發出了不同的離散分布,如廣義Poisson分布、有限維混合分布[1]、離散化泊松-指數混合分布[2]等.Sankaran[3]利用復合技術,在假設Poisson分布的參數服從Lindley分布[4]形式的條件下,得到了一個單參數的離散Poisson-Lindley分布.由于該分布的期望小于其方差,因此在擬合過度分散的計數數據時,具有很好的靈活性.在Sankaran提供的實例分析中Poisson-Lindley分布比Poisson分布擬合得更好,且與雙參數的Hermite分布和Negative Binomial分布的擬合效果大致相同.該離散分布的提出為模擬計數數據提供了一個新的有效思路,并在大量的實踐中驗證了其優秀的擬合效果[5-6].

在實際遇到的計數數據中,過量零的出現引起了人們的關注,這類數據中零值的數量超過了一般離散分布隨機產生的數量,呈現出過分散特征,學者們將此現象稱為零膨脹(zero-inflated,ZI)現象.用于分析零膨脹數據的零膨脹模型具有很長的研究歷史,最早可以追溯到20世紀60年代,直至今日仍是統計學研究的熱點.Cohen[7]討論了零膨脹Poisson(ZIP)分布;Lambert[8]等討論了帶有協變量的ZIP回歸模型并應用于制造缺陷數據;Minami[9]等研究了零膨脹Negative Binomial(ZINB)分布模型,并利用其對鯊魚捕獲數據進行建模分析;在文獻[3]提出的Poisson-Lindley分布模型的基礎上,Xavier[10]等拓展了適用于零膨脹和零欠缺(zero-deflated)情形的零修正Poisson-Lindley(ZMPL)分布模型,并在2組真實數據中驗證了ZMPL模型的良好效果.

在觀測到零膨脹計數數據的同時,往往包含了不同方面的記錄情況,同時這些不同方面的數據之間存在一定的關系.如在制造業中制造產品時發生不同類型缺陷的數量,在車禍事故中不同情況傷害(財產或人身)的數量等.此時如果分別使用一元的分布模型擬合多方面數據,得到的分析結果往往無法解釋其中隱藏的數據關聯,顯得過于片面,因此開發多元零膨脹計數模型是必要的.Li[11]等提出了一個多元零膨脹Poisson分布來建模分析制造業數據中過多零的情況;Gomez[12]等討論了Poisson-Lindley分布的多元情況,能夠應用于邊際過度離散的多元相關計數數據,并給出了該多元分布的相關性質和估計方法;Liu[13]等利用隨機表示構造了一種新的多元ZIP分布,相對于文獻[11]所給的多元零膨脹Poisson分布,該分布在數據分析中擬合性能更好.受到文獻[13]所考慮的多元零膨脹Poisson分布的啟發,本文利用隨機表示開構造了多元零膨脹Poisson-Lindley分布(多元ZIPL分布),來擬合更多的多元零膨脹計數數據.同時,給出多元ZIPL分布的相關統計性質及其參數估計方法,利用自助抽樣法構造估計的置信區間.最后,通過隨機模擬試驗和一組真實數據來評估多元ZIPL分布的性能.

1 多元零膨脹Poisson-Lindley分布

1.1 概率質量函數和累積分布函數

綜上可知

1.2 混合矩和矩生成函數

1.3 邊際分布

2 似然推斷

2.1 EM算法

對應的對數似然函數為

2.2 自助抽樣置信區間

3 隨機模擬

每組實驗重復進行1 000次模擬,計算出參數估計的平均偏差(BIAS)和均方誤差(MSE),最終結果見表1~2.

表1 第1組實驗二元ZIPL分布參數極大似然估計結果

表2 第2組實驗三元ZIPL分布參數極大似然估計結果

由表1~2可以看出,在不同組合下參數估計值均能收斂到給定的真值.同時,隨著樣本的增加,BIAS和MSE均在減小,表明參數估計的效果越來越好,越穩定地接近真實值.

4 實例分析

4.1 澳大利亞健康調查數據

利用本文提出的模型方法研究Cameron[15]等提供的一項健康調查數據的一個子集,過去兩天的處方藥總數和非處方藥物總數.網站http://cameron.econ.ucdavis.edu/racd2/RACD2programs.html可以獲取到關于原始數據集的具體細節.

表3 處方藥總數和非處方藥物總數的交叉表

各個參數的極大似然估計(MLE),自助抽樣樣本的標準差(SD),以及2種置信水平為95%自助抽樣置信區間見表4.

表4 參數的極大似然估計值及其置信區間

注:95%自助抽樣置信區間I由式(12)計算得到;95%自助抽樣置信區間II由式(13)計算得到.

4.2 模型選擇

分別使用了二元零膨脹Poisson分布[12]和二元Poisson-Lindley分布[13]擬合此數據集,并與本文提出的二元零膨脹Poisson-Lindley分布進行比較,采用Akaike 信息準則(AIC)和Bayes 信息準則(BIC)驗證本

文提出的模型的有效性.各模型模擬的AIC和BIC值見表5.

表5 模型選擇結果

由表5可以看出,二元零膨脹Poisson-Lindley分布的AIC和BIC值均小于其他2個模型,表明本文提出的分布模型擬合效果更好,更適用于該數據集.

5 結語

本文根據隨機表示提出了結構簡單、解釋性強的多元零膨脹Poisson-Lindley分布模型,研究了包括概率質量函數、累積分布函數,矩和矩生成函數,邊際分布等在內的統計性質.利用EM算法研究了多元零膨脹Poisson-Lindley分布似然推斷,推導出了方便計算的參數估計式,并通過2組仿真模擬驗證了估計的有效性.利用提出的模型進行實例分析,在與其它2種模型比較中,AIC和BIC模型選擇方法均選擇了本文所提出的二元零膨脹Poisson-Lindley分布.在今后的研究中,為了適應生活中更多的多元計數數據,可以考慮多元零調整Poisson-Lindley分布擬合零過多和零欠缺情況.

[1] 全星澄,李巍.基于EM算法的有限維混合分布參數估計研究[J].統計與決策,2017,33(12):25-29.

[2] 任美芳,劉祿勤.離散化泊松-指數混合分布的性質和參數估計[J].統計與決策,2019,35(19):25-29.

[3] Sankaran M.The discrete Poisson-Lindley distribution[J].Biometrics,1970,26(1):145-149.

[4] 劉晏辰,代瑩,王蓉華,等.Lindley分布的統計分析[J].統計與決策,2017,33(18):77-80.

[5] Ghitany M E,Al-Mutairi D K.Estimation methods for the discrete Poisson–Lindley distribution[J].Journal of Statistical Computation & Simulation,2009,79(1):1-9.

[6] Al-Babtain A A,Gemeay A M,Afify A Z.Estimation Methods for the Discrete Poisson-Lindley and Discrete Lindley Distributions with Actuarial Measures and Applications in Medicine[J].Journal of King Saud University - Science,2021,33(2):101224.

[7] Cohen A C.Estimation in mixtures of discrete distributions[C]//Classical and contagious discrete distributions.Calcutta: Statistical Pub. Society,1963:373-378.

[8] Lambert D,Zero-Inflated P R.With an Application to Defects in Manufacturing[J].Technometrics,1992,34(1): 1-14.

[9] Minami M,Lennert-Cody C E,Gao W,et al.Modeling shark bycatch:The zero-inflated negative binomial regression model with smoothing[J].Fisheries Research,2007,84(2):210-221.

[10] Xavier D,Santos-Neto M,Bourguignon M,et al.Zero-Modified Poisson-Lindley distribution with applications in zero-inflated and zero-deflated count data[J/OL].Methodology,2017(12)[2017-12-12].https://arxiv.org/abs/1712.04088.

[11] Li C S,Lu J C,Park J,et al.Multivariate Zero-Inflated Poisson Models and Their Applications[J].Technometrics,1999,41(1):29-38.

[12] Gomez-Deniz E,Sarabia J M,Balakrishnan N.A multivariate discrete Poisson-Lindley distribution:extensions and actuarial applications[J].ASTIN Bulletin,2012,42(2): 655-678.

[13] Liu Y,Tian G L.Type I multivariate zero-inflated Poisson distribution with applications[J].Computational Statistics & Data Analysis,2015,83:200-222.

[14] 王博.基于EM算法的多水平零膨脹負二項混合效應回歸模型的參數估計[J].高師理科學刊,2019,39(3):10-14.

[15] Cameron A C,Trivedi P K.Regression analysis of count data[M].2nd ed.New York:Cambridge university press,2013.

Multivariate zero-inflated Poisson-Lindley distribution

XIONG Chaosong,Huang Xifen

(School of Mathematics,Yunnan Normal University,Kunming 650500,China)

Multivariate count data with excessive zero values appear in various fields of life,and this kind of data has become a hot spot in statistical research.Based on random representation,a new multivariate zero-inflated Poisson-Lindley distribution is proposed,which is mainly used to study multivariate count data with excessive dispersion,and its related statistical properties are further discussed.Finally,the EM algorithm is constructed to obtain the maximum likelihood estimation of parameters.Two groups of random simulation experiments show that the parameter estimation method can obtain stable and effective results.The real data analysis results show that the multivariate zero-inflated Poisson-Lindley distribution has strong practicability in data processing.

multivariate count data;stochastic representation;multivariate zero-inflated Poisson-Lindley distri-

1007-9831(2022)05-0005-07

O212

A

10.3969/j.issn.1007-9831.2022.05.002

bution;EM algorithm

2021-12-03

熊朝松(1997-),男,湖北荊門人,在讀碩士研究生,從事數理統計研究.E-mail:chsoxiong@163.com

黃希芬(1988-),女,云南昆明人,講師,博士,從事生存分析研究.E-mail:xf_yellow@126.com

猜你喜歡
分析模型研究
一半模型
FMS與YBT相關性的實證研究
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
主站蜘蛛池模板: 午夜无码一区二区三区| 久草视频中文| 国产精品人莉莉成在线播放| 精品欧美视频| 国产又粗又猛又爽| 亚洲综合激情另类专区| 亚洲乱强伦| 免费国产小视频在线观看| 丝袜国产一区| 中文字幕无线码一区| 精品国产成人国产在线| 91久久偷偷做嫩草影院| 国产丝袜无码精品| 亚洲av片在线免费观看| 欧美成人区| 毛片免费高清免费| 国产第一页免费浮力影院| 欧洲成人在线观看| 午夜精品国产自在| 久久国产拍爱| 国产亚洲精品97AA片在线播放| 小说区 亚洲 自拍 另类| 久久精品国产亚洲麻豆| 91福利一区二区三区| 亚洲欧美日本国产综合在线| 亚洲综合精品第一页| 天天综合天天综合| 精品国产自| 最新国语自产精品视频在| 啦啦啦网站在线观看a毛片| 无码精品国产dvd在线观看9久| 亚洲欧美在线精品一区二区| 精品国产福利在线| 久久国产成人精品国产成人亚洲| 亚洲人成网址| 午夜a视频| a级毛片免费在线观看| 538国产视频| 婷婷综合色| 国产91在线|日本| 色偷偷一区二区三区| 国产视频久久久久| 成人无码区免费视频网站蜜臀| 日韩色图区| 色婷婷国产精品视频| 亚洲日韩第九十九页| 亚洲第一区在线| 伊人久热这里只有精品视频99| 亚洲天堂久久久| 制服丝袜 91视频| 一级毛片无毒不卡直接观看| 噜噜噜久久| 二级毛片免费观看全程| 亚洲黄网在线| 国产成人精品一区二区三在线观看| 国产在线精品香蕉麻豆| 国产激情影院| 欧美精品伊人久久| 欧美日韩一区二区在线播放| 日韩a级片视频| 日韩在线播放中文字幕| 国产精品视频白浆免费视频| 国产精品久久久久久搜索| 无码国内精品人妻少妇蜜桃视频| 欧美三級片黃色三級片黃色1| 91福利免费| 538精品在线观看| 国产成人一区二区| 一级毛片免费的| 91视频国产高清| 亚洲乱码在线播放| 国产精品99久久久久久董美香 | 91国内在线观看| 国产毛片高清一级国语| 国产精品国产三级国产专业不| 日韩二区三区| 国产精品亚洲精品爽爽| 91网红精品在线观看| 亚洲清纯自偷自拍另类专区| 国产精品成人一区二区不卡| 亚洲国产成人精品无码区性色| 国产在线精品99一区不卡|