999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MCMC方法的貝葉斯統計模型應用研究

2024-01-01 00:00:00張宗宇徐軍姜奎陳士超
景德鎮學院學報 2024年3期
關鍵詞:方法

摘"要:為驗證貝葉斯統計后驗分布計算的收斂性,文章研究并構建了線性回歸和時間序列兩類經典的貝葉斯統計模型?;隈R爾可夫鏈蒙特卡羅方法,運用birdextinct數據集驗證了貝葉斯線性回歸模型,并分析鳥類的平均滅絕時間與平均筑巢數、種群規模、棲息狀態三個量之間的關系。此外,根據19822021年居民消費指數(CPI)的序列,結合差分處理數據,建立了AR(p)時間序列預測模型。結果表明,貝葉斯線性回歸模型和貝葉斯時間序列預測模型的馬爾可夫鏈均收斂,且貝葉斯時間序列預測模型的預測誤差僅為0.78%。MCMC方法能有效應用于貝葉斯統計模型分析。

關鍵詞:MCMC 方法;貝葉斯統計;收斂性診斷;時間序列預測

中圖分類號:O212.8"""""文獻標識碼:A"""""""文章編號:20959699(2024)03007005

貝葉斯統計方法憑借其在先驗分布上的數據統計優勢,廣泛應用于經濟學、社會科學、自然科學、醫學和心理學等領域[1]。貝葉斯統計的關鍵計算包括兩個方面,其一是先驗分布的確定;其二是后驗分布的計算[2]。目前,先驗分布的確定方法主要包括:無信息先驗分布、共軛先驗分布、概率匹配先驗分布、參照先驗分布、專家經驗確定法、最大熵方法以及隨機加權法等[34]。而在貝葉斯統計方法上,以往一般采用步驟繁多、難度大的分析方法獲取信息,已經無法滿足現代信息計算技術和貝葉斯統計發展的需要[5]。為了解決這一問題,Metropolis等[6]學者另辟蹊徑,充分結合現代計算技術,基于馬爾可夫理論和蒙特卡羅模擬方法,使用馬爾可夫鏈蒙特卡羅(Markov Chain Monte Carlo,MCMC)方法,回避后驗分布中的計算難題,實現了對后驗分布的直接模擬和分析,以獲得相關統計特征值信息。王緒民等[7]采用BayesianMCMC算法,忽視先驗分布與似然函數的共軛性,從而減少計算冗余量,提高了水利工程報價數據分布的準確性。王若嬋等[8]通過MCMC算法與顫振裕度法結合,進行樣本采樣與概率分布獲取,實現了紊流激勵下顫振邊界結構數據的預測。胡紅波[9]研究了概率因素對不確定度概率的影響問題,利用MCMC算法提高抽樣樣本的相關性,從而實現復雜場合下不確定度樣本的預測。然而,已有的研究多集中于改進方法與聯合應用,尚未對貝葉斯統計方法在回歸分析與預測方面的應用進行深入研究[10]。

文中分別研究了貝葉斯線性回歸模型和貝葉斯時間序列預測模型。通過模型參數的收斂性與預測能力,為基于MCMC方法的貝葉斯統計模型的構建與應用研究提供了理論支撐。

1"相關理論

1.1"MCMC算法

MCMC算法由兩部分組成:蒙特卡羅模擬方法和馬爾可夫鏈。MCMC算法是通過計算假設概率來探討貝葉斯統計中的積分計算問題[9]。在給定概率密度函數f(x|θ)的情況下,需要求解g(θ)的期望值,可以用后驗分布表示為:

g∧θ=∫Θgθπθ|xdθ(1)

其中,g∧θ即為后驗分布的均值。顯然,此均值可由式(2)近似求得:

g-=1m∑mi=1g(θi)(2)

其中,θ1,θ2,…,θm取自后驗分布πθ|x的容量為m的樣本。

1.2"貝葉斯AR(p)模型

貝葉斯AR(p)模型稱為自回歸模型,描述的是當前值與歷史值之間的關系,并通過使用變量自身的歷史數據來預測模型。通常,一個隨機時間序列用一組按時間順序排列的隨機變量y1,y2,…,yt來表示,記為{yt},設θ1,θ2,…,θp為模型的自回歸系數,p為模型的階數,則其AR(p)模型[10]為:

yt=θ1yt-1+θ2yt-2+…+θpyt-p+εt(3)

其中,t=1,2,…,n。即在t時刻的隨機變量yt的取值是前p期yt-1,yt-2,…,yt-p的多元線性函數。誤差項是當期的隨機干擾εt,誤差項服從正態分布N(0,τ-1)且相互獨立,其中τ為εt的精度。在文中,假定AR(p)模型是一個平衡過程,并采用基于MCMC算法的貝葉斯隨機搜索模型選擇方法,建立特定數據序列的自回歸AR( p)模型[10]。設xt為原始數據,yt是對xt進行差分后的數據序列,將新得到的數據序列作為初始值y0,y1,…,yt-p,設θ=θ1,θ2,…,θpT,此時隨機變量yt服從正態分布,即:

yt|yt-1,yt-2,…,yt-p=Nθ1yt-1+θ2yt-2+…+θpyt-p,τ-1(4)

則模型的似然函數為:

Lθ,τ=fy1,y2,…,yn|θ,τ∝τ2πn2exp-τ2∑nt=1yt-θ1yt-1+θ2yt-2+…+θpyt-p。

模型的未知參數的先驗分布采用正態Gamma分布族,即對于給定的τ,參數θ的先驗分布為正態分布,精度參數τ的先驗分布為正態Gamma分布,即:

πθ,τ=πθ|τπτ(5)

其中,πθ,τ∝τ2exp-τ2θ-μTQθ-μ,πτ∝τα-1e-τβ。此處,超參數μ∈Rp,αgt;0,βgt;0。Q為p階正定矩陣。定義Y=y1,y2,…,ynT,根據貝葉斯定理,可得參數θ,τ的聯合后驗分布密度函數與參數先驗分布密度函數式(4)、模型擬合函數式(5)二者的乘積成正比,即:

πθ,τ|Y∝Lθ,τπθ,τ(6)

通過在區間0,SymboleB@上πθ,τ|Y對τ的積分,求出自回歸系數θ的后驗分布函數為:

πθ|Y=∫τgt;0πθ,τ|Ydτ(7)

類似地,將πθ,τ|Y對θ進行積分,則可得到參數τ的后驗分布密度函數為:

πτ|Y=∫θ∈Rpπθ,τ|Ydθ(8)

1.3"MCMC收斂性診斷

1.3.1"收斂性軌跡圖

軌跡圖(trace plot) [11]:根據迭代次數繪制生成的樣本路徑圖。在實際應用中,為避免出現鏈條落入目標局部分布區域,通??梢詮牟煌某跏键c出發同時生成多個馬爾可夫鏈。在經過若干次迭代后,如果它們的樣本軌跡圖基本穩定并重合,則可以認為抽樣已經收斂。

1.3.2"蒙特卡羅誤差

馬爾可夫鏈的收斂從初始點開始,隨著迭代次數的增加,波動逐漸減小。因此,通過參數或者其函數估計(即后驗樣本均值)的方差或標準差(稱為MC誤差)來評估對應馬爾可夫鏈的收斂性[12]。較小的MC誤差可以提高參數估計的準確性,通常情況下,模擬次數越多,蒙特卡羅誤差越小,模型的估計結果也就越準確。

2"基于MCMC方法的貝葉斯統計模型應用

2.1"基于MCMC方法的線性回歸模型

2.1.1"數據集

LearnBayes軟件包中的Birdextinct數據集包含了過去幾十年中在英國附近16個島嶼上62種鳥的四類數據:(1)在島上的平均滅絕時間(TIME);(2)平均筑巢數(NESTING);(3)種群規模(SIZE),分為“大”(用1表示)與“小”(用0表示)兩類;(4)棲息狀態(STATUS),分為“遷徙”(用1表示)與“久居”(用0表示)兩類。數據如表1所示,主要研究目的是找出該地區鳥類的滅絕時間與另外三個變量之間的關系。預測變量的顯著性分析如下:用y表示響應變量平均滅絕時間;用x1表示預測變量平均筑巢數;用x2表示預測變量種群規模;用x3表示預測變量棲息狀態。由于前期分析中發現變量y嚴重右偏,因此對其進行對數變換。將此問題歸為線性回歸模型:

Log(y)=β0+β1x1+β2x2+β3x3+ε(9)

其中,β0、β1、β2、β3為回歸系數常數,ε為誤差項。

2.1.2"建模與收斂性

對Birdextinct數據集進行線性回歸建模,結果如表2所示。

根據模型結果,可得到的回歸方程為y=04306+0.2651x1-0.6526x2+0.5047x3。從表2可知,種群的滅絕時間與筑巢數的關系高度顯著,表明筑巢數越多,種群滅絕時間越長;而種群規模和棲息狀態與種群滅絕時間的相關顯著性較弱,表明規模越大的鳥類其滅絕時間越短,而遷徙的鳥類其滅絕時間較長,其模型的模擬軌跡如圖1所示。

從圖1中可知,平均筑巢數的軌跡圖中的路徑沒有明顯的周期性和趨勢性。通過計算各個迭代次數的平均筑巢數,得到均值約為0.25<1.2[13],因此認為該馬爾可夫鏈是收斂的。

2.2"基于MCMC的貝葉斯時間序列預測模型

2.2.1"CPI數據集來源

本研究從國家統計局網站上獲取1982-2021年居民消費價格指數(CPI),部分數據如表3所示。在建立模型過程中,使用1982-2020年數據用作訓練集,2021年數據作為測試數據。

從表3可知,居民消費指數從1982年到2020年有明顯的上升趨勢,原始序列是非平穩的。

2.2.2"性能預測

對數據進行增項DF單位根檢驗(Augmented DickeyFuller test,ADF),ADF檢驗結果的p值為0999 0,顯著大于0.05。顯然,單位根檢驗沒有通過,證實原CPI序列是非平穩序列。為了進行時間序列分析,需要對數據進行一階差分,即Yt= Zt-Zt-1,得到序列{Yt1} ,對其進行ADF單位根檢驗時,檢驗結果的p值為0.974 7,此時序列仍然非平穩,因此需要進行二次差分以得到平穩序列{Yt}。通過二次差分變換后時間數據序列間的自相關系數(ACF)和偏自相關系數(PACF)結果如圖2所示。

從圖2可知,中國居民消費指數數據在經過二次差分變換后的序列具有1階自相關特征,得到適應的模型為AR(1),即yt=β1yt-1+εt。選擇正態-Gamma分布族作為未知參數初始值的先驗分布,即β1~N(10-6,0.1),τ~Gamma(10-5,10-3),其中τ=σ-1。在吉布斯采樣模擬過程中,為了確保參數的收斂性,首先進行1 000次預迭代,然后丟棄預迭代的值,重新執行99 000次迭代,可以得到β1的均值為-0.3423,95%置信區間為(-0.663 8,-0.021 0),結果如表4所示。

從表4可知,參數的蒙特卡羅誤差值均相對較小,因此可以認為馬爾可夫鏈收斂。根據參數估計,2021年CPI指數為2 334.4,與真實值2 352.8的誤差為0.78%。

2.2.3"收斂性診斷

將兩組不同初始值分別進行100 000次迭代分析,其中1 000次作為預迭代分析。如圖3所示,在迭代次數達20 000次后,β1和τ收斂性判斷圖中,兩者都接近為一條水平直線并重合,說明馬爾可夫鏈抽樣收斂。

3"結語

為研究MCMC 算法在貝葉斯統計模型中的應用,文章運用birdextinct數據集構建貝葉斯線性回歸模型,并對數據進行預處理,通過R語言程序對數據集進行收斂性診斷,研究鳥類的滅絕時間與其他三個量之間的關系。同時,選取1982-2021年居民消費價格指數(CPI)作為時間序列,結合差分處理數據建立AR(p)時間序列預測模型。根據參數估計得到2021年CPI數據為2 334.4,與真實值2 352.8的誤差為0.78%。通過貝葉斯線性回歸模型與AR(p)時間序列預測模型的案例分析,驗證了MCMC方法能有效解決貝葉斯統計問題。然而,文中使用的MCMC算法估計模型參數時主要采用了Gibbs抽樣方法,盡管該方法高效,但當某些條件后驗分布不是標準分布時不適用。因此,后續需要對數據集進行進一步分析,選取合適的先驗信息分布和初始值,以便更好地應用MCMC算法解決統計模型問題。

參考文獻:

[1]李貴玉,顧昕.貝葉斯統計方法的應用與現狀[J].心理學探新,2021,41(05):466473.

[2]孟光磊,叢澤林,宋彬,等.貝葉斯網絡結構學習綜述[J/OL].北京航空航天大學學報,124[20231129].https://link.cnki.net/doi/10.13700/j.bh.10015965.2023.0445.

[3]谷恒明.經典統計學與貝葉斯統計學在回歸模型中的比較研究[D].北京:軍事科學院,2018.

[4]梁瑛,季憲軍.小樣本合格率估計的隨機加權貝葉斯方法[J].統計與決策,2016(12):46.

[5]黨紅.貝葉斯統計中單參數后驗分布的精確計算方法[J].長治學院學報,2019,36(02):67.

[6]Metropolis N,Ulam S.The Monte Carlo method[J].Journal of the American Statistical Association,1949,44:335341.

[7]王緒民,鄭順超.基于BayesianMCMC算法的水利工程投標報價分布預測[J].水電能源科學,2023,41(09):155158,206.

[8]王若嬋,嚴剛,李揚,等.紊流激勵下基于貝葉斯統計推斷的顫振邊界預測方法研究[J].振動與沖擊, 2023,42(12):283289.

[9]胡紅波.MCMC方法在測量不確定度評估中的應用[J].計量技術,2020(05):8994,88.

[10]王婧,鮑貴.貝葉斯統計與傳統統計方法的比較[J].統計與決策,2021,37(01):2429.

[11]張航綺.利用蒙特卡羅法計算投資組合VaR:以嘉實新興產業股票(000751)為例[J].現代營銷(經營版),2022(03):9193.

[12]靳海強,文俊,王彤彤,等.基于改進方差特性二維混合抽樣蒙特卡羅法的多諧波源疊加研究[J].電網與清潔能源,2021,37(01):1623,31.

[13]Geman A, Rubin DB.Inference for iterative simulation using multiple sequences[J].Statistics Science,1992,7(04):457511.

責任編輯:肖祖銘

Research on the Application of Bayesian Statistical Model Based on MCMC Method

ZHANG Zongyu, XU Jun, JIANG Kui, CHEN Shichao

(School of Computer and Data Engineering, Bengbu College of Business and Industry, Bengbu 233000, China)

Abstract:To verify the convergence of Bayesian statistical posterior distribution calculation, two classic Bayesian statistical models, namely linear regression and time series, are investigated and constructed in this paper. Based on the Markov Chain Monte Carlo (MCMC) method, the Bayesian linear regression model is validated using the Birdextinct dataset to analyze the relationship between the average extinction time of birds and three variables: average number of nests, population size, and habitat status. Furthermore, based on the series of Consumer Price Index (CPI) from 1982 to 2021, an AR (p) time series forecasting model is established, incorporating differential processing data. The results indicate that both the Bayesian linear regression model and the Bayesian time series forecasting model have converged Markov chains, with the error of only 0.78% for the Bayesian time series forecasting model. The MCMC method can be effectively applied to analysis of Bayesian statistical models.

Keywords: MCMC method; Bayesian statistics; convergence diagnosis; time series forecasting

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 亚洲欧美h| 国产大片黄在线观看| 午夜视频免费试看| 中文一级毛片| 无码国产偷倩在线播放老年人| 九色最新网址| 亚洲成人免费看| 日韩不卡免费视频| 色婷婷成人网| 国产成人福利在线| 欧美a在线| 五月丁香伊人啪啪手机免费观看| 亚洲三级电影在线播放| 四虎国产在线观看| 人妻少妇乱子伦精品无码专区毛片| 国产精品无码AV片在线观看播放| 精品久久777| 亚洲第一成网站| 亚洲乱亚洲乱妇24p| 一区二区在线视频免费观看| 久久精品日日躁夜夜躁欧美| 波多野吉衣一区二区三区av| 国产精品第页| YW尤物AV无码国产在线观看| 天天色天天操综合网| 国产97公开成人免费视频| 久久网欧美| 亚洲区一区| 日本欧美在线观看| 日韩小视频在线播放| 91免费国产高清观看| 国产午夜精品鲁丝片| 四虎影视库国产精品一区| 99国产精品免费观看视频| 亚洲男人的天堂网| 国产色偷丝袜婷婷无码麻豆制服| 自慰高潮喷白浆在线观看| 精品三级在线| 亚洲精品午夜无码电影网| 毛片手机在线看| 亚洲男人的天堂在线| 婷婷亚洲视频| 亚洲视频免费在线看| 日韩亚洲综合在线| 91探花在线观看国产最新| 欧美成人精品在线| 成人在线欧美| 成人欧美日韩| 欧美国产精品不卡在线观看| 国产视频入口| 9丨情侣偷在线精品国产| 天天躁夜夜躁狠狠躁图片| 亚洲一级无毛片无码在线免费视频| 日日拍夜夜嗷嗷叫国产| 亚洲日韩第九十九页| 免费国产在线精品一区| 美女扒开下面流白浆在线试听| 国产美女自慰在线观看| 色天天综合| 国产精品密蕾丝视频| 亚洲熟女偷拍| 国产欧美日韩18| 五月婷婷伊人网| 日本一区中文字幕最新在线| 高潮毛片免费观看| 亚洲精品国产综合99| 一级在线毛片| 亚洲色欲色欲www网| 国产成人久视频免费 | 看国产毛片| 日韩国产精品无码一区二区三区| 92午夜福利影院一区二区三区| 高清国产在线| 亚洲成人精品| 欧美日韩一区二区在线播放| 高清国产在线| 国产日韩AV高潮在线| 亚洲有无码中文网| 亚洲成a∧人片在线观看无码| 女人爽到高潮免费视频大全| 日韩亚洲综合在线| 亚洲成a∧人片在线观看无码|