999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

空間分層數(shù)據(jù)無(wú)條件模型的改進(jìn)及其估計(jì)

2016-11-28 02:07:28閔素芹何曉群
統(tǒng)計(jì)與決策 2016年20期
關(guān)鍵詞:模型

閔素芹,何曉群

(1.中國(guó)傳媒大學(xué)理學(xué)院,北京100024;2.西京學(xué)院應(yīng)用統(tǒng)計(jì)科學(xué)研究中心,西安710123)

空間分層數(shù)據(jù)無(wú)條件模型的改進(jìn)及其估計(jì)

閔素芹1,何曉群2

(1.中國(guó)傳媒大學(xué)理學(xué)院,北京100024;2.西京學(xué)院應(yīng)用統(tǒng)計(jì)科學(xué)研究中心,西安710123)

抽樣調(diào)查中得到的數(shù)據(jù)經(jīng)常既包含個(gè)體信息又包含地理單元信息,形成以地區(qū)集聚的分層數(shù)據(jù)。空間分層數(shù)據(jù)中地理單元間往往具有空間依賴性,區(qū)別于傳統(tǒng)的分層數(shù)據(jù)。分析空間分層數(shù)據(jù)時(shí)需要首先建立無(wú)條件模型用作初步分析。因此,在傳統(tǒng)分層無(wú)條件模型中引入完全空間自回歸模型來(lái)表達(dá)空間相關(guān)性,建立空間分層數(shù)據(jù)的無(wú)條件模型,并研究其估計(jì)方法,借助參數(shù)估計(jì)值可做模型選擇。

無(wú)條件模型;空間依賴性;分層數(shù)據(jù);EM算法

0 引言

社會(huì)科學(xué)研究中,樣本往往來(lái)自不同的層次和單位,很多研究中采取的抽樣方式為分層隨機(jī)抽樣,在這樣的抽樣設(shè)計(jì)下,個(gè)體的特征會(huì)產(chǎn)生集聚現(xiàn)象,由此得到的數(shù)據(jù)帶來(lái)了分層的結(jié)構(gòu)。比如,在抽樣調(diào)查中,數(shù)據(jù)往往既包含個(gè)人信息,又有關(guān)于所在地區(qū)的信息。可以把這樣的數(shù)據(jù)結(jié)構(gòu)分層,個(gè)人信息看作第一層,地區(qū)作為第二層,即個(gè)人嵌套于地區(qū)。分層線性模型適用于處理此類數(shù)據(jù),隨著計(jì)算機(jī)技術(shù)水平的飛速發(fā)展,其估計(jì)方法的計(jì)算問(wèn)題得以解決,近年來(lái)在社會(huì)科學(xué)和行為科學(xué)領(lǐng)域應(yīng)用越來(lái)越廣泛。

分層數(shù)據(jù)分析中經(jīng)常將無(wú)條件模型用作初步分析,它可以提供兩個(gè)層次中結(jié)果的變化信息。如Frenzel等(2007)[1]、Espelage等(2011)[2]、Simms(2014)[3]的研究中都首先運(yùn)用無(wú)條件模型計(jì)算組內(nèi)方差、組間方差、及組內(nèi)相關(guān)系數(shù)(ICC),得出造成因變量的組間變異是不可忽略的,從而有必要進(jìn)一步建立一般分層模型。Neupert等(2015)基于對(duì)51名60~96歲的老年人380天每天一次的追蹤調(diào)查數(shù)據(jù),運(yùn)用分層模型研究應(yīng)激預(yù)應(yīng)對(duì)如何影響老年人的身體健康、記憶力減退等問(wèn)題。重復(fù)測(cè)量的個(gè)體變化數(shù)據(jù)即縱向數(shù)據(jù),將每一個(gè)人的多次測(cè)量視為嵌套于這個(gè)人。在利用分層線性模型時(shí),層-1為重復(fù)觀察模型,層-2為關(guān)注個(gè)體間差異的個(gè)人層次模型。研究中運(yùn)用無(wú)條件模型分析了每天的應(yīng)激預(yù)應(yīng)對(duì)觀測(cè)數(shù)據(jù)存在顯著的個(gè)體內(nèi)方差,結(jié)果表明每個(gè)人的應(yīng)激預(yù)應(yīng)對(duì)是動(dòng)態(tài)變化的[4]。

在抽樣調(diào)查中采用分層抽樣設(shè)計(jì)時(shí),層的劃分常常按照行政區(qū)劃進(jìn)行,這樣得到的數(shù)據(jù)既包含個(gè)體信息,又包含關(guān)于區(qū)域、城鎮(zhèn)、市、省等的地理單元信息,就形成了以地區(qū)集聚的分層數(shù)據(jù)。空間分層數(shù)據(jù)因?yàn)榈乩韱卧g往往具有空間自相關(guān)性,區(qū)別于傳統(tǒng)的分層數(shù)據(jù)。Ancelin也提到空間統(tǒng)計(jì)所面臨的挑戰(zhàn)時(shí)指出按一層觀測(cè)值(如:空間單元層)進(jìn)行的分析,不能提供低層(如個(gè)體行為)有用的信息[5]。由于傳統(tǒng)分層模型假定地區(qū)間(組間)相互獨(dú)立,而地理單元之間的空間相關(guān)性使得層-2模型殘差的假設(shè)分布不再成立,從而估計(jì)出現(xiàn)問(wèn)題。在分析空間分層數(shù)據(jù)時(shí),也需要首先建立無(wú)條件模型。本文在分層模型中引入完全空間自回歸模型來(lái)表達(dá)空間相關(guān)性,改進(jìn)了傳統(tǒng)分層數(shù)據(jù)的無(wú)條件模型,并研究其估計(jì)方法,依據(jù)參數(shù)估計(jì)值選擇是否需要采用考慮空間效應(yīng)的分層模型。

1 空間分層數(shù)據(jù)無(wú)條件模型的構(gòu)建

無(wú)條件模型是最簡(jiǎn)單的分層線性模型,這種情況下層-1和層-2模型都不含自變量,模型為:

γ00代表總體中結(jié)果的總平均數(shù),ξ0j為第j個(gè)組的隨機(jī)效應(yīng),假定其均值為0,方差為τ00,σ2代表組內(nèi)變化, τ00則捕獲了組間變化。

對(duì)于空間分層數(shù)據(jù),層-2模型殘差分布的假設(shè)不再成立,殘差的空間模式存在空間依賴性,引入能夠描述空間自相關(guān)的項(xiàng)能有效的克服模型的缺陷。

在分析空間分層數(shù)據(jù)時(shí),空間自相關(guān)反映為鄰近地區(qū)β0間的依賴性,即地區(qū)1的β01,地區(qū)2的β02,…,地區(qū)J的β0J存在空間自相關(guān)。本文考慮在層-2模型中引入空間效應(yīng),空間效應(yīng)用完全空間自回歸模型來(lái)表達(dá)。此時(shí),層-1模型與傳統(tǒng)分層模型(1)一致,其中,yij是因變量, β0j是截距項(xiàng),εij是隨機(jī)誤差項(xiàng)。

若以矩陣向量的方式表達(dá),則式(1)為:

而空間分層數(shù)據(jù)中β0具有空間效應(yīng),此時(shí),層-2模型為:

此模型為完全空間自相關(guān)模型,不包含解釋變量。其中,ρ表示空間自相關(guān)系數(shù),W表示J×J的空間權(quán)重矩陣,通常是二元對(duì)稱矩陣,表達(dá)J個(gè)地理單元的空間鄰近關(guān)系。

綜上,帶空間效應(yīng)的兩層模型的無(wú)條件模型表達(dá)為:

模型中,ρ>0表示該地區(qū)被結(jié)果變量的值與其相似的地區(qū)所包圍,即:結(jié)果變量高值的地區(qū)被其他相似的高值地區(qū)所包圍,低值被低值所包圍。另一方面,ρ<0表示高值的地區(qū)被低值地區(qū)所包圍。ρ=0則表示沒有空間依賴,此時(shí)模型為普通的帶隨機(jī)效應(yīng)的單因素方差分析模型。

2 無(wú)條件空間分層模型的最大似然估計(jì)

空間分層數(shù)據(jù)的無(wú)條件模型層-1無(wú)自變量,層-2為完全自回歸模型。與傳統(tǒng)兩層模型相比,增加了空間效應(yīng)表示部分,其中空間權(quán)重矩陣W是已知的,多了一個(gè)需要估計(jì)的參數(shù)ρ。要通過(guò)最大似然估計(jì)方法估計(jì)模型中的參數(shù)ρ,σ2,μ,τ。

下面給出期望最大化(EM)算法。期望最大化算法認(rèn)為y是觀測(cè)數(shù)據(jù),ξ是缺失數(shù)據(jù)。因此,完整數(shù)據(jù)為(y,ξ),ρ,σ2,μ,τ是需要被估計(jì)的參數(shù)。

2.1 最大化步(M Step)

ξ是未知的層-2模型的誤差項(xiàng)向量,其假設(shè)為:

因此,給定β0,σ2后y的條件分布為:

因E[y|ρ,σ2,μ,τ]=Uμ1J,V[y|ρ,σ2,μ,τ]=τU(I-ρW)-1(I-ρW)-1TUT+σ2IN,故,當(dāng)ρ,σ2,μ,τ也為已知的情況下,y的條件分布為:

而且,cov(y,ξ)|ρ,σ2,μ,τ=cov(Uμ1J+U(I-ρW)-1ξ+ε,ξ)=E[(Uμ1J+U(I-ρW)-1ξ+ε-Uμ1J)ξT]=τU(I-ρW)-1

所以,y與ξ的聯(lián)合分布為:

完整數(shù)據(jù)的似然函數(shù)取自然對(duì)數(shù),得:

而,ln f(y,ξ|ρ,σ2,μ,τ)=ln l(ρ,σ2,μ,τ|y,ξ)對(duì)數(shù)似然函數(shù)ln l(ρ,σ2,μ,τ|y,ξ)分別對(duì)ρ,σ2,μ,τ偏微分,

但是,無(wú)法給出ρ的顯式表達(dá)。所以,考慮結(jié)合運(yùn)用Fisher得分算法。得分向量為:

各分量由式(13)至式(15)給出。

Hessian矩陣為:

Fisher得分方法需要求二階導(dǎo)數(shù)的期望矩陣,

2.2 期望步

由式(10),根據(jù)正態(tài)分布剖分定理,y為已知的條件下ξ的條件分布的條件期望向量和條件方差協(xié)方差矩陣分別為:

將式(21)記為a,式(22)記為B。故,若y與ρ,σ2,μ,τ已知,由式(21)、(22),ξ的事后條件分布為:

2.3 EM算法

(1)給出初始值ρ(0),(σ2)(0),μ(0),τ(0);記ρ(k),(σ2)(k),μ(k),τ(k)是第k+1次迭代開始時(shí)參數(shù)的估計(jì)值;

(2)估計(jì)完整數(shù)據(jù)的充分統(tǒng)計(jì)量:E(ξ|y,ρ,σ2,μ,τ),E(ξTξ|y,ρ,σ2,μ,τ)

式(24)與式(25),這些期望值根據(jù)前一步迭代得到的ρ(k),(σ2)(k),μ(k),τ(k)值求得;

(4)將新的參數(shù)估計(jì)值代入到步驟(2)中,重復(fù)上述步驟,M步和E步不斷地迭代交互運(yùn)算,直到所估計(jì)的參數(shù)值都很接近,或每次迭代運(yùn)算的對(duì)數(shù)似然函數(shù)值變化很小,就達(dá)到收斂。可以通過(guò)計(jì)算每一步迭代的對(duì)數(shù)似然值來(lái)加以監(jiān)測(cè)。

3 結(jié)論

根據(jù)參數(shù)ρ的值與其顯著性可以反映鄰近地區(qū)β0間的依賴性,根據(jù)σ2,τ的估計(jì)值,計(jì)算組內(nèi)相關(guān)系數(shù)如果空間自回歸系數(shù)ρ顯著不為零,則認(rèn)為空間自相關(guān)需要考慮,ICC≥0.059表示組間差異不可忽略[6]。此時(shí),需要進(jìn)一步建立空間分層模型進(jìn)行后續(xù)分析。若ρ=0,ICC≥0.059則表示沒有空間依賴性,但組間變異不可忽略,此時(shí)應(yīng)選用傳統(tǒng)分層線性模型進(jìn)行后續(xù)分析。

[1]Frenzel A C,Pekrun R,Goetz T.Perceived Learning Environment and Students'Emotional Experiences:AMultilevel Analysis ofMathematics Classrooms[J].Learningand Instruction,2007,17(5).

[2]Espelage D,Green H,Polanin J,w illingness to Intervene in Bullying Episodes Among Middle School Students Individual and Peer一group Influences[J].The Journalof Early Adolescence,2011,(11).

[3]Simms K.Are Expectations About Health Care Universal?The International Evidence[J].Global Journal of Business and Social Science, 2014,1(10).

[4]NeupertSD,EnnisG E,Ramsey JL,etal.Solving Tomorrow's Problems Today?Daily Anticipatory Copingand Reactivity to Daily Stressors[J].The Journals of Gerontology Series B:Psychological Sciences and Social Sciences,2015,(3).

[5]Anselin L.The Future of Spatial Analysis in The Social Sciences[J]. Geographic Information Sciences,1999,5(2).

[6]溫福星.階層線性模型的原理與應(yīng)用[M].北京:中國(guó)輕工業(yè)出版社,2009.

(責(zé)任編輯/亦民)

O212

A

1002-6487(2016)20-0016-03

北京高等學(xué)校“青年英才計(jì)劃”項(xiàng)目(y ETP0611);中國(guó)傳媒大學(xué)優(yōu)秀中青年教師培養(yǎng)工程(y XJS2013330);中國(guó)傳媒大學(xué)理工科規(guī)劃項(xiàng)目(XNL1402)

閔素芹(1978—),女,山東青州人,博士,副教授,研究方向:統(tǒng)計(jì)模型理論與應(yīng)用。何曉群(1954—),男,陜西西安人,教授,博士生導(dǎo)師,研究方向:應(yīng)用數(shù)理統(tǒng)計(jì)。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产精品太粉嫩高中在线观看| 亚洲αv毛片| 91在线一9|永久视频在线| 欧美另类一区| 精品欧美日韩国产日漫一区不卡| 国产成人1024精品下载| 免费观看欧美性一级| 国产精品无码久久久久久| 九色视频线上播放| 国产性爱网站| 91精选国产大片| 无码一区中文字幕| 全部免费毛片免费播放| 伊人蕉久影院| 日本亚洲最大的色成网站www| 国产福利免费视频| 欧美 国产 人人视频| 久久精品国产精品一区二区| 亚洲伦理一区二区| 婷婷中文在线| h视频在线播放| 99久久国产综合精品女同| 这里只有精品在线播放| 亚洲av无码久久无遮挡| 国产精品一区不卡| 国产成人无码AV在线播放动漫| 精品伊人久久久久7777人| 欧美国产在线看| 毛片免费在线| 一区二区三区四区精品视频| 亚瑟天堂久久一区二区影院| 怡春院欧美一区二区三区免费| 玖玖精品视频在线观看| 国产精品999在线| 黄色一级视频欧美| 好紧太爽了视频免费无码| 久久国语对白| 国产97公开成人免费视频| 中文字幕日韩欧美| 欧美日一级片| 女人18毛片一级毛片在线| www.精品国产| 91口爆吞精国产对白第三集| 亚洲熟女中文字幕男人总站| 国模视频一区二区| 999精品免费视频| 激情乱人伦| 亚洲国产午夜精华无码福利| 国产剧情国内精品原创| 久久久久人妻精品一区三寸蜜桃| 人妻出轨无码中文一区二区| 国内精品九九久久久精品| 国产九九精品视频| 国产欧美另类| AV不卡无码免费一区二区三区| 久久久亚洲国产美女国产盗摄| 国产成人欧美| 无码专区在线观看| 久久精品国产91久久综合麻豆自制| 国产69囗曝护士吞精在线视频| 97视频免费在线观看| 亚洲综合专区| 色综合国产| 91啦中文字幕| 亚洲欧美激情另类| 色噜噜狠狠色综合网图区| 四虎国产在线观看| 国产精品视屏| 激情在线网| 99九九成人免费视频精品| av午夜福利一片免费看| 一本大道无码高清| 国产精品美人久久久久久AV| 亚洲男人的天堂久久精品| AV无码无在线观看免费| 国产AV无码专区亚洲A∨毛片| 国产在线自在拍91精品黑人| 91在线视频福利| 国产精品xxx| 国产成人毛片| 91精品人妻互换| 国产毛片高清一级国语 |