999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

部分線性模型下Adaptive Dantzig Selector方法的漸近正態(tài)性

2018-06-23 12:22:54李丹丹劉琳
關(guān)鍵詞:方法模型

李丹丹,劉琳

(廣西大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,廣西 南寧 530004)

1 引言

變量選擇是進(jìn)行數(shù)據(jù)分析以及統(tǒng)計(jì)建模過程中比較重要的部分.近年來,由于大量超高維數(shù)據(jù)的涌現(xiàn),變量選擇引起了學(xué)者的高度重視.隨著研究的不斷深入,越來越多的變量選擇方法與相對(duì)應(yīng)的算法被提出.其中最典型的代表是Lasso(Least Absolute Shrinkage and Selection Operator)方法.Lasso[1]方法的提出迅速引起了很多學(xué)者的關(guān)注,在研究的過程中Lasso方法的局限性也突顯出來,文獻(xiàn)[2]指出Lasso方法給出的估計(jì)不具有相合性以及大樣本性質(zhì).為了解決這一問題,文獻(xiàn)[3]提出DS(Dantzig Selector)方法,并研究了DS估計(jì)損失的非漸進(jìn)界,但沒有得出其漸進(jìn)性質(zhì).之后文獻(xiàn)[4]和文獻(xiàn)[5]分別提出了處理超高維數(shù)據(jù)的ADS(Adaptive Dantzig Selector)方法和DASSO算法.在目前的文獻(xiàn)中對(duì)ADS方法的研究仍較少,現(xiàn)考慮當(dāng)維數(shù)隨樣本數(shù)以指數(shù)速度增長(zhǎng)時(shí),在部分線性模型下ADS方法的漸近正態(tài)性質(zhì).

2 ADS方法及其性質(zhì)

2.1 部分線性模型下 ADS估計(jì)的定義

設(shè)X=(X1,X2,···,Xp)T是p維協(xié)變量,Y是響應(yīng)變量,β=(β1,β2,···,βp)T為p維非零的參數(shù)向量,g(t)為未知的非參數(shù)函數(shù),且g(·)光滑,ε是隨機(jī)誤差,E(ε/X,t)=0,則部分線性模型[6]形式如下:

對(duì)(1)式兩邊分別求關(guān)于t的條件期望,得到

聯(lián)立(1)(2)兩式可得

下面利用核估計(jì)方法,令mX(t)=E(X/t),mY(t)=E(Y/t),其中mX(t),mY(t)的估計(jì)

K(·)為核函數(shù),h為窗寬.下面定義部分線性模型的DS[7]估計(jì)為:

其中,λ為調(diào)整參數(shù).令

定義 2.1部分線性模型下的ADS估計(jì),

則所求解為ADS估計(jì)值,記為

此時(shí)非參數(shù)部分g(t)的估計(jì)為選取權(quán)重函數(shù)令W=diag(ω1,ω2,···,ωp),其中是的相合估計(jì),f(·)是正的減函數(shù),且f(0)=∞.

2.2 ADS估計(jì)的漸近正態(tài)性

設(shè)真實(shí)參數(shù)值稀疏,其中

首先給出半?yún)?shù)模型中的正則條件:

1 設(shè)核函數(shù)K(·)關(guān)于原點(diǎn)對(duì)稱,支撐區(qū)間為[?1,1],存在常數(shù)M1和M2,有 0≤M1≤M2,使得

2

3t的密度函數(shù)不為0,與mX(t),mY(t)都是二階導(dǎo)數(shù)連續(xù)有界,其中mX(t),mY(t)估計(jì)選擇的窗寬h的階數(shù)為

接下來給出四個(gè)條件假設(shè):

(a)假設(shè)誤差項(xiàng)ε1,···,εn獨(dú)立同分布,并對(duì)某常數(shù)1≤d≤2,L>0和K,對(duì)任意的x≥0和i=1,2,···,εi,p(|εi|>x)≤Kexp(?Lxd)的尾概率均滿足,使維數(shù)p隨著樣本數(shù)n以指數(shù)速度exp(nα)增長(zhǎng),其中0<α<1.

(b)假設(shè)初始估計(jì)滿足其中ηj是依賴于β的未知常數(shù),滿足如下不等式

(c)設(shè)q為通過變量選擇得到的變量個(gè)數(shù),記為|A|.由q=O(nc1),0

成立,其中k為常數(shù),Σ是p×p維矩陣,ΣAA是Σ中|A|×|A|維子矩陣組成,0

(d)設(shè)

其中XAi表示矩陣XA的第i列.

說明:假設(shè)條件(a)保證了維數(shù)p隨著樣本數(shù)n以指數(shù)速度exp(nα)增長(zhǎng),對(duì)于(b)中系數(shù)的初始估計(jì)的取法,Huang[8]提出在適當(dāng)條件下可以用邊際回歸估計(jì)量來作為ALasso(Adaptive Least Absolute Shrinkage and Selection Operator)方法的初始估計(jì),類似的方法,可在(b)中取

先用邊際回歸估計(jì)量得到回歸系數(shù)的初始估計(jì)再用來作為ADS方法的權(quán)重,結(jié)合(c)(d)假設(shè)可得在部分線性模型下ADS方法的漸近正態(tài)性,下面給出具體的證明.

定理 2.1若及假設(shè)條件(a)至(d)成立時(shí),p隨著樣本數(shù)n以指數(shù)速度exp(nα)增長(zhǎng),其中0<α<1.則部分線性模型ADS參數(shù)估計(jì)量滿足

證明根據(jù)設(shè)(4)式的解為其中

I為單位陣,K=(Kij)n×n.由假設(shè)條件 (a)至(d),則有

根據(jù)條件(d),令則

所以由slutsky定理,得

通過上述得到維數(shù)p關(guān)于樣本數(shù)n以指數(shù)速度增加時(shí),在部分線性模型下ADS方法具有漸近正態(tài)性,即在處理超高維稀疏數(shù)據(jù)時(shí),可以達(dá)到有效降維和確保模型準(zhǔn)確率的目的.下面通過數(shù)值模擬來驗(yàn)證該方法的可行性與優(yōu)越性.

3 數(shù)值模擬

假設(shè)數(shù)據(jù)取自模型為

其中g(shù)(t)=sin(2πt),t服從 [0,1]上的均勻分布ε~N(0,1),真實(shí)參數(shù)β有六個(gè)非零分量β=(1,3,1,3,1/2,1/2,0,···,0)取n=50,非參數(shù)估計(jì)核函數(shù)為Epanechnikov核,K(μ)=0.75(1?μ2)+,調(diào)整參數(shù)采用BIC懲罰參數(shù)選取法,取維數(shù)p=100,500,在R軟件編輯程序,并重復(fù)運(yùn)行1000次,取其非零系數(shù)估計(jì)結(jié)果的平均數(shù)進(jìn)行匯總為如表1所示.

表1 兩種方法的系數(shù)估計(jì)平均值

通過數(shù)值模擬結(jié)果可以看出,當(dāng)p?n時(shí),ADS方法得到的估計(jì)值與Lasso方法相比更接近真值,故驗(yàn)證了該方法的優(yōu)良性.

下面通過實(shí)例進(jìn)一步驗(yàn)證在大眾點(diǎn)評(píng)網(wǎng)數(shù)據(jù)中的可行性.

4 實(shí)例分析

本文將 ADS方法用于大眾點(diǎn)評(píng)網(wǎng)數(shù)據(jù) (http://www.dianping.com/beijing),數(shù)據(jù)集共由1000多家美食類商家數(shù)據(jù)組成,主要選取了消費(fèi)者關(guān)心的信息指標(biāo)以及直接影響消費(fèi)者決策判斷的數(shù)據(jù)進(jìn)行收集.將銷售量作為響應(yīng)變量記為:Y,將店鋪星級(jí)、店鋪動(dòng)態(tài)評(píng)分(即口味、環(huán)境、服務(wù))、人均消費(fèi)價(jià)格、好評(píng),一般,差評(píng)的數(shù)量,以及32種菜系等40個(gè)指標(biāo)作為協(xié)變量記為:X1,X2,X3,···,X39,X40.通過分析,可得Y與X符合部分線性模型條件,找出與Y存在較顯著的非線性關(guān)系的協(xié)變量,將其作為非參數(shù)模型中g(shù)(·)的協(xié)變量.在R軟件中,可利用LARS算法與DASSO算法,同時(shí)采用五折交叉驗(yàn)證法選取懲罰參數(shù)λ,結(jié)果如表2所示,其中兩種方法系數(shù)估計(jì)值全為0的已略去.

表2 模型非零系數(shù)的估計(jì)值

將預(yù)測(cè)模型代入檢測(cè)集中得出模型的驗(yàn)證結(jié)果如表3所示:

表3 兩種方法驗(yàn)證結(jié)果比較

在表3中,CSR(Correct Selection Rate)表示模型選擇的正確率,即在檢測(cè)集中能正確預(yù)測(cè)出的個(gè)數(shù)/檢測(cè)集的總個(gè)數(shù),MSE(Mean Square Error)表示均方誤差值表示檢測(cè)集中的數(shù)據(jù),表示預(yù)測(cè)結(jié)果取整后的值,N(Number)表示模型中被選入變量的個(gè)數(shù).從表3的驗(yàn)證結(jié)果中可以看出:

1.對(duì)于CRS值,Lasso方法所對(duì)應(yīng)的CRS值為80.95%小于ADS方法的83.72%;

2.對(duì)于MSE值,模型中Lasso方法對(duì)應(yīng)的MSE值是大于ADS方法的MSE值;

3.對(duì)于N值,在模型中Lasso方法比ADS方法在變量選擇時(shí)多選入了2個(gè)變量,且ADS方法能從40個(gè)變量中準(zhǔn)確的選出7個(gè)對(duì)銷售量有顯著影響的特征變量.

結(jié)合上述結(jié)論,得出ADS方法在實(shí)際應(yīng)用中的可行性以及高精準(zhǔn)性.

5 結(jié)論

本文首先給出部分線性模型下ADS方法的定義,并證明了在超高維情況下,p維數(shù)隨樣本數(shù)n以指數(shù)速度增長(zhǎng)時(shí),在部分線性模型下ADS方法的漸近正態(tài)性質(zhì).然后通過數(shù)值模擬并結(jié)合大眾點(diǎn)評(píng)網(wǎng)美食店鋪的數(shù)據(jù),通過比較ADS方法與Lasso方法的計(jì)算結(jié)果,進(jìn)一步驗(yàn)證了在部分線性模型下ADS方法在處理超高維稀疏性數(shù)據(jù)時(shí)的大樣本性質(zhì),以及在實(shí)際應(yīng)用中的可行性以及高精準(zhǔn)性.

[1]Tibshirani R.Regression shrinkage and selection via the Lasso[J].Journal of the Royal Statistical Society,2011,73(3):273-282.

[2]Zhao P,Yu B.Stagewise Lasso[J].Journal of Machine Learning Research,2014,8(12):2701-2726.

[3]Candes E,Tao T.The Dantzig Selector:statistical estimation whenpis much larger thann[J].The Annals of Statistics,2007,35(6):2392-2404.

[4]Dicker L,Lin X.Parallelism,uniqueness,and large-sample asymptotics for the Dantzig selector[J].Canadian Journal of Statistics,2013,41(1):23-35.

[5]James G M,Radchenko P.A generalized Dantzig selector with shrinkage tuning[J].Biometrika,2009,96(2):323-337.

[6]董凱.高維數(shù)據(jù)部分線性模型的變量選擇[D].北京:北京工業(yè)大學(xué)圖書館,2012.

[7]Li F.Variable selection and parameter estimation for partially linear models via Dantzig selector[J].Metrika,2013,76(2):225-238.

[8]Huang J,Ma S.Adaptive lasso for sparse high-dimensional regression models[J].Statistica Sinica,2006,18(4):1603-1618.

[9]Dicker L H.Regularized Regression Methods for Variable Selection and Estimation[D].Boston:Harvard University,2010.

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
學(xué)習(xí)方法
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 免费一级毛片在线播放傲雪网| 亚洲最黄视频| 国产成人免费高清AⅤ| 嫩草国产在线| 5555国产在线观看| av在线5g无码天天| 亚洲三级视频在线观看| 国产精品白浆无码流出在线看| 不卡无码网| 91破解版在线亚洲| 无码有码中文字幕| 在线日韩日本国产亚洲| 无码精品一区二区久久久| 亚洲三级色| 99在线观看免费视频| 重口调教一区二区视频| 亚洲女同一区二区| 精品免费在线视频| 国产视频自拍一区| 一级香蕉人体视频| 成人亚洲国产| 天天综合色天天综合网| 久久久久久久97| 亚洲无码精品在线播放| 在线人成精品免费视频| 99热这里都是国产精品| 黄色三级网站免费| 久久综合亚洲色一区二区三区| 国产精品美女免费视频大全| 国产中文一区a级毛片视频| 成人国产精品网站在线看| 中文字幕亚洲专区第19页| 免费a级毛片18以上观看精品| 久久综合九色综合97网| 色婷婷综合激情视频免费看| 亚洲第一成年网| 无码AV动漫| 国产99精品视频| 国产原创第一页在线观看| 97视频在线精品国自产拍| 98精品全国免费观看视频| 97一区二区在线播放| 亚洲第一极品精品无码| 久久伊人操| 亚洲第一极品精品无码| 午夜啪啪福利| 中国精品久久| 亚洲国产天堂在线观看| 新SSS无码手机在线观看| 国产欧美日韩va另类在线播放| 欧美日韩一区二区三区四区在线观看| 成人年鲁鲁在线观看视频| 97在线公开视频| 天堂网亚洲系列亚洲系列| 免费jjzz在在线播放国产| 又大又硬又爽免费视频| 波多野结衣中文字幕一区二区| 无码国内精品人妻少妇蜜桃视频| 久久久亚洲色| 欧美国产日韩在线观看| 5555国产在线观看| 青草国产在线视频| 91久久夜色精品国产网站| 免费三A级毛片视频| 国产综合精品日本亚洲777| 午夜福利无码一区二区| 国产成人1024精品| 日本久久久久久免费网络| 中文字幕人成人乱码亚洲电影| 国产99精品视频| AV网站中文| 人妻精品久久无码区| 亚洲高清免费在线观看| 在线观看国产一区二区三区99| 欧洲高清无码在线| 国产对白刺激真实精品91| 国产成人8x视频一区二区| 欧美精品亚洲日韩a| 成年A级毛片| 久久亚洲高清国产| 欧美第二区| 免费看美女毛片|