999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于美國抽煙數據的時空自回歸模型的統計推斷

2023-11-18 18:23:08吳越怡黃振生

吳越怡 黃振生

收稿日期: 2023-04-23

作者簡介:吳越怡(1999—),女,安徽六安市人,碩士研究生,主要從事非參數統計研究;通訊作者:黃振生(1976—),男,安徽濉溪縣人,教授,博士生導師,主要從事非參數統計研究.

引用格式:吳越怡,黃振生.基于美國抽煙數據的時空自回歸模型的統計推斷[J].安徽師范大學學報(自然科學版),2023,46(5):418-424.

DOI:10.14182/J.cnki.1001-2443.2023.05.002

摘要:針對目前文獻中大多數時空模型的建立大都需要提前指定相關的空間權重矩陣 ,而當空間權重矩陣形式設定錯誤時,模型的解釋性變得極為不可靠,預測能力也大大降低的問題,提出了更為一般的時空自回歸模型來擬合美國抽煙需求數據并進行單步與多步預測,模型將空間權重矩陣轉化為帶估的時空系數矩陣,采用基于Yule-Walker方程的廣義矩估計法和基于Yule-Walker方程的最小二乘兩種方法來估計系數矩陣,最終的兩種預測方法結果均表明建模效果較好。另外模型分析結果也表明:人均吸煙包數與人均可支配收入呈正相關關系,而人均吸煙包數與每包香煙的零售價格呈負相關關系,均與現實意義相符。

關鍵詞:時空數據;時空自回歸 ;Yule-Walker方程;廣義矩估計;香煙需求

中圖分類號:O212.1;F293.33 文獻標志碼:A 文章編號: 1001-2443(2023)05-0418-07

引言

近來隨著時空數據變得越來越豐富,時空建模在研究中受到越來越多的關注。時空觀測數據的廣泛可用性刺激了各學科的研究,如經濟學、環境科學、流行病學等。但與此同時,時空數據的生成規模和復雜程度遠遠超出了此前的想象。例如,有許多大規模的經濟研究是基于在人口普查區、城市或縣一級收集的面板數據進行的,這些數據具有隱含且復雜的空間結構。數據中的觀測值可以在空間或時間上定期或不定期分布。復雜的數據就需要足夠靈活的統計模型來適應潛在的規律,所以盡管近年來時空模型越來越流行,但增強時空建模和分析能力仍然是一個長期的挑戰。首先含有空間元素的模型可以被分為三類,分別為非面板空間(SD)模型、靜態面板空間(SPD)模型、空間動態面板(SDPD)模型。SD模型主要處理截面空間數據的空間交互效應和空間異方差。Cliff等人(1973)[1]、Kelejian和Prucha(1998,1999,2006)[3- 5]、Kelejian等人(2004)[6] 在SD模型方面做過深入的研究。具體來說,時空模型可能指SPD模型也有可能指SDPD模型。SPD模型的數據相比SD模型數據還在不同時間被觀測,Anselin(1988)[6]首先研究SPD模型。Baltagi等人(2003) [7]推導了空間誤差自相關的面板數據回歸模型的幾種拉格朗日乘子檢驗。Lee和Yu (2010b) [8]研究了具有固定效應和空間擾動相關的空間自回歸模型的擬極大似然估計的漸近性質。最近的進展是將SPD模型擴展為空間動態面板數據(SDPD)模型,即添加時間滯后項以說明不同個體之間的序列相關性。Yu等人[9]研究了具有固定效應的空間動態面板數據模型,并得到當個體數量和時間周期都很大時估計量的擬極大似然估計的漸近性質。此外,Baltagi等人(2007b) [10]考慮各空間單元具有時間序列相關和在各時間點存在空間依賴性的特點的空間面板數據回歸模型。此外,該模型還利用隨機效應允許空間單元的異質性,然后對該面板數據回歸模型進行拉格朗日乘數檢驗。Kapoor等人(2007) [11]考慮了一個誤差項在空間和時間上都是相關的面板數據模型。為了允許擾動項和其他隨機分量中存在不同的空間效應, Anselin(2001) [13]通過允許空間面板數據模型具有動態特征,將空間動態模型分為四類,即如果只考慮空間時間滯后,則為“純空間遞歸”;如果包括個體時間滯后和空間時間滯后,則稱為“時空遞歸”;“時間-空間同時”模型是指定了一個單獨的時間滯后和一個同期的空間滯后;如果把所有形式的滯后都包括在內,則是“時空動態”模型。Elhorst(2005) [14]使用無條件極大似然法估計帶有空間誤差的動態面板數據模型,Mutl(2006) [15]使用三步廣義矩法(GMM)研究該模型,Su和Yang(2007) [16]導出了上述模型在具有固定效應和隨機效應兩種情況下的估計量的擬極大似然估計。目前大多數時空模型文獻大都需要會指定相關的空間權重矩陣 [17],考慮到當空間權重矩陣形式設定錯誤時,模型的解釋性變得極為不可靠,預測能力也大大降低。所以應用Ma等人[17]提出的更為一般的時空自回歸模型來進行實例分析。

1 模型介紹

Ma等人[17]提出的一般時空自回歸模型同樣屬于SDPD模型。Lee和Yu(2010a)[12]首次總結有關文獻,并給出SDPD模型的一般形式:

[Ynt=λ0WnYnt+γ0Yn,t-1+ρ0WnYn,t-1+Xntβ0+cn0+αtoln+Vnt,t=1,2,…T]。

他們根據[An=In-λ0Wn-1γ0In+ρ0Wn]的特征值將SDPD模型分為三類:穩定、空間協整和爆炸性情形。[γ0]只捕捉動態效應,[ρ0]捕捉時空效應。由于存在固定的個體和時間效應,[Xnt]將不包括任何時間不變或個體不變回歸量。

近來,不少學者開始研究當不事先指定空間權重矩陣如何估計時空模型,即將空間權重矩陣轉化為帶估的時空系數矩陣。Dou等人[18]將傳統的面板數據的時空自回歸模型擴展到允許每個位置(或面板)的標量系數都彼此不同的情形。為了克服模型中固有的內生性,他們將最小二乘估計應用于Yule-Walker方程。在平穩過程和[α-]混合過程的設置下,在樣本大小和位置(或面板)數量都趨于無窮大的情況下,建立了估計量的漸近理論。Guo等人[19]研究了一類有帶狀系數矩陣的向量自回歸模型。該設置代表了高維時間序列的一種稀疏結構,但其隱含的自協方差矩陣不是帶狀的。當時間序列的組成部分被適當排序時,該稀疏結構也具有實際意義。他們建立了估計的帶狀自回歸系數矩陣的收斂速度,還提出了一個確定系數矩陣中帶寬度的貝葉斯信息準則,該準則被證明是一致的。他們通過研究帶向量自回歸過程的自協方差函數的近似帶結構,構造了自協方差矩陣的一致估計。Gao等人[20]提出了一類新的時空模型,其中自回歸系數矩陣是完全未知的,但假設是帶狀的,即非零系數只出現在主對角線周圍的窄帶內。這避免了主觀地指定空間權重矩陣的困難。該設置僅指定相鄰位置的自回歸。其思想基于這樣一個事實:在許多實際情況中,從鄰近地點收集信息就足夠了,從更遠地點收集的信息就會變得多余。由于空間自回歸模型的內生性,他們在Dou等人[18]研究成果的基礎上采用了一種基于Yule-Walker方程的廣義矩估計方法。此外,他們還研究了基于多個Yule-Walker方程的參數估計。當維數(即節點的數量)與樣本大小(即觀察到的時間序列的長度)一起發散時建立了估計的漸近性質。

在最新的研究中,Ma等人[17]認為時空模型中空間權重矩陣應該被估計出來,而非事先主觀給定。因為當空間權重矩陣形式設定錯誤時,模型的解釋性變得極為不可靠,預測能力也大大降低。另一方面哪種權重矩陣是最好的選擇并不總是顯而易見的,因此,事先指定空間權重然后產生的模型可能會失去適應底層空間依賴結構的能力。為此,Ma等人[17]提出了高維時空模型的一般形式,在此,空間權重矩陣轉化為帶估的時空系數矩陣。他們提出了一種向前向后搜索算法來估計時空系數矩陣結構,并引入了機器學習中的Bagging 方法來改進基于Yule-Walker方程的廣義矩估計方法,并探討了相應的理論性質。他們把該方法應用到社交網絡數據中來幫助構造更加清晰的社交網絡結構。

本文的實例數據來自1963—1992年美國的10個州的香煙需求數據。相關數據可在網站(https://www.regroningen.nl/elhorst)查詢。而在相關文獻中對這一數據集的統計建模與推斷都會提前設定空間權重矩陣。所以本文考慮在這一數據集的統計分析中將空間權重矩陣轉化為帶估的時空系數矩陣,應用Ma等人[17]提出的一般時空模型,做出相關的統計推斷與預測。結果也表明Ma等人[17]提出的一般時空自回歸模型對該香煙需求數據的建模較為貼切。

2 模型分析

由于實例分析的需要,首先引入Ma等人[17]提出的一般時空模型:

[yt=Ayt+Byt-1+xtβ+εt]。 (2.1)

其中,[yt=y1,t,y2,t,…yp,tT]表示在時刻[t]從p個位置(或節點)收集的觀測值,[εt=ε1,t,ε2,t,…εp,tT]滿足條件[Eεt=0],[varεt=Σε],和[covyt-j,εt=0j≥1],[Σε]是未知正定矩陣。[xt=x1,t,x2,t,…xp,tT∈Rp*d]為時變矩陣,[xt]為外生變量,滿足[covxt,εt=0],[covxt,εt-1=0],并且[xt,yt]為嚴平穩過程。[xt]的第[i]行可以表示為[xi,t=xi,t,1,xi,t,2,…xi,t,dT∈Rd*1]。[β]是回歸系數的[d*1]向量。假定[A=ai,j]和[B=bi,j]是[p*p]未知系數矩陣,以及[ai,i=01≤i≤p]。[A]捕獲不同位置(或節點)之間的空間依賴性,[B]捕獲動態空間依賴性。

為了表述方便,將Ma等人[17]的估計方法簡述如下:

式(2.1)中[yt]的第[i]個分量可以分別表示為:

[yi,t=j=1pai,jyj,t+j=1pbi,jyj,t-1+xi,tTβ+εi,t,i=1,2,…p]。

通過兩步剖面操作,上式可以轉化為:

[yi,ta=aTiyi,ta+bTiyi,tb+εi,t,i=1,2,…p]。

經過整理可以得到[yi,ta=aTiyi,ta+bTiyi,tb+εi,t],其中,[yi,ta=yi,t-xi,t-1Tβa,yi,tb=yi,t-xi,t-1Tβb],[βa=Exi,t-1Txi,t-1Exi,t-1Tyi,t],[βb'=Exi,t-1Txi,t-1Exi,t-1Tyj,t-1]。

將[p]個等式整合即可得:

[yta=Ayta+Byt-1b+εt]。 (2.2)

接下來采用基于Yule-Walker方程的最小二乘估計法。令[Σ1a'=covyta',yt-1b'],[Σ0b'= covyt-1b',yt-1b'],則式(2.2)可以得到的Yule-Walker估計方程為

[Σ1a=AΣ1a+BΣ0b]。

估計方程的第[i]行可以寫為[Σ1Tei=Σ1Tai+Σ0bi≡Xiθi],[i=1,2,…p]。

其中,[ei]是[p*1]的單位向量,[AT=a1,a2,…ap],[BT=b1,b2,…bp],[θi=θi,1,θi,2,…θi,τiT]是將[ai]和[bi]中非零元素疊加得到的[τi*1]向量,[Xi∈Rp*τi]是由[Σ1a'T,Σ0b']相關列組成。

其中,[Σ1a'=1nt=2nyta'yt-1b'T,Σ0b'=1nt=2nyt-1b'yt-1b'T],則廣義Yule-Walker估計值[θi=XiTXi-1XiTYi,i=1,2,…p]。可以發現[θi]可以看作是加權矩陣為[W=Ip]的GMM估計器,據此再提出一種改進的估計方法,即基于Yule-Walker方程的廣義矩估計法,將權重[W]分成兩種情況討論,當[p?n],權重[W=Σ0b'-1],當[p]與[n]比較靠近或者[p]大于[n]可以選擇[IP]作為權重(只要[p=On])。結合所有的[θi,i=1,2,…p]就可以估計出[ai]和[bi]。進而系數矩陣[A]和[B]就可以被估計出。[β]可由[yt-Ayt-Byt-1]對[xt]進行回歸估計得到。

3 實例分析

香煙需求數據來自1963—1992年美國的10個州。變量及其意義見表1。相關數據可在網站(https://www.regroningen.nl/elhorst)查詢。將所有變量數據采取對數化處理后,通過繪制一階差分后的變量間的時間序列圖判斷出各序列均成為平穩時間序列。時間序列圖見圖1,圖2,圖3(以兩個州為例)。其中,ddmand代表一階差分后的人均吸煙包數,ddprice代表一階差分后的每包香煙的零售價格,ddyt代表一階差分后的人均可支配收入。

由于一階差分后的[yt,ct,pt]均為平穩時間序列,各變量均符合應用模型的假設條件。影響抽煙需求量[ct]的影響因素設為[xt],[xt]由人均可支配收入[yt]以及每包香煙的零售價格[pt]構成。嘗試借助Ma等人[17]提出的一般時空模型來擬合1963—1989年美國的10個州抽煙需求數據,估計方法分別應用基于Yule-Walker方程的最小二乘估計法(方法一)和基于Yule-Walker方程的廣義矩估計法(方法二)。得到[yt]和[pt]前的系數值分別見表2和表3。估計得到的[A]捕獲十個州的抽煙需求量的空間依賴性,[B]捕獲十個州的抽煙需求量的時空依賴性。[A]和[B]的可視化圖見圖4和圖5。

[待估參數 [β1] [β2] 值 0.1351 -0.4060 ][待估參數 [β1] [β2] 值 0.1350 -0.4062 ][表2 未知參數估計值(方法一)

Table 2 Unknown parameter estimation value (Method 1)][表3 未知參數估計值(方法二)

Table 3? ? Unknown parameter estimation value (Method 2)]

從表2和表3都可以分析出人均吸煙包數與人均可支配收入呈正相關關系,而人均吸煙包數與每包香煙的零售價格呈負相關關系。從10個州的總體情況看,每包香煙的零售價格相比人均可支配收入更能影響香煙的需求量。并可見兩種估計方法得到的估計值基本一致。

圖4和圖5分別展示了基于Yule-Walker方程的最小二乘估計法(方法一)和基于Yule-Walker方程的廣義矩估計法(方法二)得到的關于系數矩陣[A]和[B]的估計值,可見兩種方法的得到的對于兩個系數矩陣的估計基本一致,并且可知不同州之間的抽煙需求量會在空間和時間上互相影響,這種影響有可能是正的,也有可能是負的,影響大小也有不同。

接下來利用1963—1990年美國的10個州抽煙需求數據,估計方法采用基于Yule-Walker方程的廣義矩估計法,分別進行多步預測與一步預測,來最終得到對1990-1992年各州的人均抽煙包數的預測值,并與收集的真實數據進行對比。各州的總體預測結果見表4和表5。圖6給出多步預測情況下的1990-1992年各州抽煙需求量的預測結果與真實值的對比圖。

表4給出多步預測的情況下1990—1992年美國10個州的人均抽煙包數的絕對預測誤差以及標準差。表5給出單步預測的情況下1990—1992年美國10個州的人均抽煙包數的絕對預測誤差以及標準差。容易發現單步預測相比多步預測預測效果更好,這也與直觀理解相符合。從圖6可以更直觀看出10個州的預測效果均比較良好,并且在多步預測的情況下,對于第一年的預測效果最好,預測誤差隨著預測年份的遞增也在增加。

4 結論

由于現有文獻面對時空數據建立模型大多會事先指定空間權重矩陣,但當空間權重矩陣形式設定錯誤時,模型的解釋性變得極為不可靠,預測能力也會在很大程度上降低,并且選擇哪種權重矩陣并不總是顯而易見,所以本文采用Ma等人[17]提出的一般時空模型,將其應用于1963-1992年間美國10個州的香煙需求數據進行數據分析。預測結果表明,不提前設定空間權重矩陣,應用一般時空模型直接進行分析達到了很好的預測效果。從估計未知系數的結果來看,人均吸煙包數與人均可支配收入呈正相關關系,而人均吸煙包數與每包香煙的零售價格呈負相關關系,均與現實意義相符。

參考文獻:

[1] CLIFF A D. Spatial autocorrelation[R]. London:Pion,1973: 10-20.

[2] TOSTESON T D, BUONACCORSI J P, DEMIDENKO E, et al.? Measurement error and confidence intervals for ROC curves[J]. Biom J, 2005,47: 409-416.

[3] KELEJIAN H H, PRUCHA I R. A generalized spatial two-stage least squares procedure for estimating a spatial autoregressive model with autoregressive disturbances[J]. The Journal of Real Estate Finance and Economics, 1998, 17: 99-121.

[4] KELEJIAN H H, PRUCHA I R. A generalized moments estimator for the autoregressive parameter in a spatial model[J]. International Economic Review, 1999, 40(2):509-533.

[5] KELEJIAN H H, PRUCHA I R. On the asymptotic distribution of the Moran I test statistic with applications[J]. Journal of Econometrics, 2001, 104(2): 219-257.

[6] ANSELIN L. Spatial Econometrics: Methods and Models[M]. Media:Springer Science & Business, 1988:25-100.

[7] BALTAGI B H, Song S H, Koh W. Testing panel data regression models with spatial error correlation[J]. Journal of Econometrics, 2003, 117(1): 123-150.

[8] LEE L F, YUB J. Estimation of spatial autoregressive panel data models with fixed effects [J]. Journal of Econometrics, 2010, 154: 165.

[9] YU J, DE JONG R, LEE L. Quasi-maximum likelihood estimators for spatial dynamic panel data with fixed effects when both n and T are large[J]. Journal of Econometrics, 2008, 146(1): 118-134.

[10] BALTAGI B H, SONG S H, JUNG B C, et al. Testing for serial correlation, spatial autocorrelation and random effects using panel data[J]. Journal of Econometrics, 2007, 140(1): 5-51.

[11] KAPOOR M, KELEJIAN H H, Prucha I R. Panel data models with spatially correlated error components[J]. Journal of Econometrics, 2007, 140(1): 97-130.

[12] YU J, DE JONG R, Lee L. Estimation for spatial dynamic panel data with fixed effects: The case of spatial cointegration[J]. Journal of Econometrics, 2012, 167(1): 16-37.

[13] ANSELIN L. Spatial econometrics, a companion to theoretical econometrics[M]. Hoboken NJ: Blackwell Publishing Ltd, 2001:310-330.

[14] ELHORST J P. Specification and estimation of spatial panel data models[J]. International Regional Science Review, 2003, 26(3): 244-268.

[15] MUTL J, PFAFFERMAYR M. The Hausman test in a Cliff and Ord panel model[J]. The Econometrics Journal, 2011, 14(1): 48-76.

[16] SU L, YANG Z. Instrumental variable quantile estimation of spatial autoregressive models[J]. Working Papers,2011,5(1): 1-30.

[17]YM A , SG B , HW C . Sparse spatio-temporal autoregressions by profiling and bagging[J]. Journal of Econometrics, 2021,232(1): 132-147.

[18] DOU B, PARRELLA M L, YAO Q. Generalized Yule–Walker estimation for spatio-temporal models with unknown diagonal coefficients[J]. Journal of Econometrics, 2016, 194(2): 369-382.

[19] GAO Z, MA Y, WANG H, et al. Banded spatio-temporal autoregressions[J]. Journal of Econometrics, 2019, 208(1): 211-230.

[20] GUO S, WANG Y, YAO Q. High-dimensional and banded vector autoregressions[J]. Biometrika, 2016,103(4):889-903.

Inference of a Spatio-Temporal Autoregressive Model Based on US Smoking Data

WU Yue-yi , HUANG Zhen-sheng

(School of Mathematics and Statistics, Nanjing University of Science and Technology, Nanjing 210094,China)

Abstract: In view of the establishment of most of the spatiotemporal models in the current literature, most of them need to specify the relevant spatial weight matrix in advance, and when the spatial weight matrix form is set incorrectly, the explanatory nature of the model becomes extremely unreliable, and the prediction ability is greatly reduced, a more general spatiotemporal autoregressive model is proposed to fit the US smoking demand data and make single-step and multi-step prediction, and the model converts the spatial weight matrix into a space-time coefficient matrix with estimation. The generalized moment estimation method based on Yule-Walker equation and the least squares method based on Yule-Walker equation were used to estimate the coefficient matrix, and the final results of both prediction methods showed that the modeling effect was better. In addition, the model analysis results also show that the per capita number of smoking packs is positively correlated with per capita disposable income, while the per capita number of smoking packs is negatively correlated with the retail price of each pack of cigarettes, which is consistent with practical significance.

Key words: spatio-temporal data; spatio-temporal autoregression; Yule-Walker equation; generalised moments estimation; cigarette demand

(責任編輯:馬乃玉)

主站蜘蛛池模板: 亚洲va欧美ⅴa国产va影院| 中文字幕亚洲综久久2021| 免费激情网址| 欧美爱爱网| 国产视频大全| 日韩不卡高清视频| 日韩av在线直播| 一级毛片免费高清视频| 最新午夜男女福利片视频| 久久96热在精品国产高清| 国产亚洲精品自在线| 九色在线观看视频| 欧美成人午夜影院| 久久情精品国产品免费| 亚洲伦理一区二区| 国产正在播放| 国产麻豆精品在线观看| 性激烈欧美三级在线播放| 国产a v无码专区亚洲av| av手机版在线播放| 99人体免费视频| 国产青青草视频| 亚洲色偷偷偷鲁综合| 亚洲国产成人精品青青草原| 最新亚洲av女人的天堂| 天天躁夜夜躁狠狠躁图片| 精品久久久久无码| 国产不卡一级毛片视频| 国产黄在线免费观看| 欧美中文字幕第一页线路一| 九九香蕉视频| 一级毛片免费不卡在线视频| 曰韩人妻一区二区三区| 亚洲天堂免费| 青草娱乐极品免费视频| 九九视频免费在线观看| 国产成人高清在线精品| 欧美日韩91| 国产无人区一区二区三区| 亚洲无卡视频| 国产福利一区二区在线观看| 亚洲视频色图| 国产日韩AV高潮在线| 国产精品久久久久无码网站| 热久久综合这里只有精品电影| 久久国产精品国产自线拍| 啪啪永久免费av| 又粗又大又爽又紧免费视频| 久久毛片网| 91久久夜色精品国产网站| 玖玖免费视频在线观看| 波多野结衣AV无码久久一区| 五月天在线网站| 亚洲第一成网站| 九九视频免费看| 国产三级精品三级在线观看| 欧美精品在线视频观看| 97在线国产视频| 国产区福利小视频在线观看尤物| 亚洲成在线观看| 欧美一级高清片久久99| 国产无码网站在线观看| 久久精品无码中文字幕| 香蕉视频在线观看www| 久久综合丝袜日本网| 日韩精品无码不卡无码| 国产成人高清在线精品| 色综合色国产热无码一| 国产成熟女人性满足视频| 免费jizz在线播放| 欧美中文字幕在线播放| 欧美区一区二区三| 国产黄在线观看| 成人午夜视频网站| 欧美全免费aaaaaa特黄在线| 天堂网亚洲综合在线| 中文字幕欧美成人免费| 看看一级毛片| 91在线免费公开视频| 精品视频一区二区观看| 国产女人18毛片水真多1| 日韩视频免费|