999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

函數型Logistic回歸模型研究與應用

2022-02-28 08:45:58羅幼喜
湖北工業大學學報 2022年1期
關鍵詞:分類方法模型

鄧 楠,羅幼喜

(湖北工業大學理學院,湖北 武漢 430068)

隨著在許多領域對數據質量的要求都越來越高,對數據的分析也從低頻數據分析向高頻數據分析進行跨越,但在很多情形,我們獲得的數據都為離散的數據,無法完全捕捉數據的信息。基于此,Ramsay于1982年提出了函數型數據分析(FDA)[1]。與傳統數據分析相比,FDA具有更多優越性,它通過對數據進行曲線性質的分析進而挖掘出更多重要的信息。在函數型數據分析中,函數型Logistic回歸是函數型線性回歸模型的一個重要應用。它針對響應變量為二分類數據,協變量為函數型數據建立回歸模型,利用樣本曲線的信息來預測某件事情發生的可能性,通過函數型變量隨時間的變化預測二元響應變量的變化。在國外,Ratcliffe等[2]基于模擬的胎兒心率軌跡構建了函數型Logistic回歸模型,將函數協變量和回歸函數用傅里葉基函數進行展開,對極大似然估計的計算使用改進的Fisher評分算法,并將此模型應用到胎兒出生風險預測。Kim等[3]考慮若函數數據高度混合,則基于整個區域的分類是無效的,因此提出了基于區間的函數型數據分類方法。該方法利用融合的Lasso懲罰自動選擇函數數據中信息最豐富的片段,同時利用函數邏輯回歸對選擇的片段進行分類。Denhere[4]考慮了當存在異常曲線時對未加處理的數據進行函數型主成分Logistic回歸不能得到良好的結果,提出了一種基于穩健主成分的函數型Logistic回歸模型。Mousavi等[5]則對許多情況下對函數協變量(作為輸入)和二元響應(作為輸出)之間的關系感興趣,由此通過3種方法對該模型的參數估計結果進行比較,并判斷這些方法正確分類的能力。在國內,王惠文等[6]針對同時包含數值型多元變量和函數型協變量的廣義線性回歸模型,采用非參數方法得到了參數部分和非參數部分的估計量,并給出了一種重加權算法進行參數求解,解決了含數值型和函數型混合數據類型自變量的回歸問題,由此擴展了函數型線性模型的應用范圍。孟銀鳳等[7]針對傳統函數Logistic模型泛化性能不高的問題,通過求解優化問題提出了線性正則化的函數Logistic回歸模型。梳理文獻發現,盡管已有文獻給出了函數型Logistic回歸模型的不同分析方法和應用實例,但通過貝葉斯方法對其分類性能的研究還較少。Crainiceanu等[8]曾介紹了在貝葉斯框架下函數型數據的分析方法,使用WinBugs對函數型數據進行分析,但未研究Logistic回歸模型的分類性能,Zhu等[9]則提出了針對二元響應變量和多元函數型協變量的貝葉斯變量選擇模型,并將其應用于宮頸癌診斷,但其對函數型Logistic回歸模型進行Probit變換時,未考慮Logit變換,因此本文考慮在貝葉斯框架下對函數型Logistic回歸模型進行Logit變換并對其分類性能進行研究。

1 函數型Logistic回歸模型

yi=πi+εi,i=1,2,…,N

(1)

其中:

πi=P[Y=1|]xi(t):t∈T}]=

i=1,…,N

(2)

α為實數參數,β(t)為參數函數,εi(i=1,2,…,N)為N個獨立且均值為零的隨機擾動項。等價地,通過Logit變換,式(2)可以表示為:

i=1,…,N

(3)

假設選取K個主成分基函數對回歸系數函數β(t)和函數數據x(t)進行展開,則

(4)

(5)

寫成矩陣形式表示為:l=α1+Cb,其中b=(b1,…,bK)T,1=(1,1,…,1)T,C=(cik)N×K為函數主成分得分,其計算方法為:

且滿足

從而在獨立條件下,模型的似然函數可以表示為:

(6)

2 基于Polya-Gamma變換的條件后驗分布推導

雖求得函數型Logisic回歸模型的似然函數,但由于一般先驗和模型似然函數的非共軛性較難求得參數后驗,因此考慮通過引入Polson[13]等提出的Polya-Gamma數據增強算法。Polya-Gamma數據增強算法對于不同模型都求得了更簡單且有效的后驗分布。該數據增強算法表示為:

記ω~PG(b,0),b>0表示服從參數為(b,0)的Polya-Gamma分布,其密度函數

則對于所有a∈R,有下列恒等式成立:

(7)

其中,κ=a-b/2,且p(ω∣ψ)~PG(b,ψ)。該數據增強算法有效規避了常用先驗分布與函數型Logistic回歸模型似然函數的非共軛性,從而在Polya-Gamma變換下,函數型Logistic回歸模型的似然函數可以改寫為:

(8)

(9)

則b的條件后驗可表示為:

(10)

即b,ω的聯合后驗為:

(11)

P(ωi|·)=PG(1,ηi)

(12)

(13)

(14)

則α得條件后驗為:

(15)

(16)

1)ωi|else~PG(1,ηi),其中ηi=αi+cib;

3 數值模擬

3.1 數據生成

首先生成獨立同分布的函數型隨機變量xi,再根據函數型Logistic回歸模型生成響應變量yi。該數據生成方法仿照文獻[5]設計,具體數據生成為:

i=1,2,…,150,j=1,2,…,256,tij∈[0,10]

(18)

i=1,2,…,150

(19)

其中β(t)為區間T=[0,10]上的已知函數,考慮β1(t)=sin(tπ/3),β2(t)=-d(t∣2,0.3)+3d(t∣5,0.4)+d(t∣7.5,0.5),其中d(·∣μ,σ)為服從均值為μ方差為σ的正態分布,采用主成分基函數進行擬合,模擬結果如圖1所示。在這里α設為0.5,使用截斷點0.5作為分割,即

則Y=1,否則Y=0[14],圖2為參數函數為β1(t)時模擬生成的150條曲線中的40條樣本曲線。

圖 1 模擬參數函數曲線

圖 2 模擬函數曲線

3.2 模擬結果

為了檢驗該方法的分類能力,在測量誤差分別為0和0.5的情況下對模型進行驗證。由于為二分類問題,根據樣本的實際標簽與分類器給出的預測標簽,可將樣本分為4種,分別為TruePositive(正類預測為正類的個數為TP)、FalseNegative(正類預測為負類的個數為FN)、FalsePositive(負類預測為正類的個數為FP)、TrueNegative(負類預測為負類的個數為TN)。根據上述定義,可對模擬生成的100個數據集給出4個分類指標,分別是精度(Acc)、準確率(Pre)、召回率(Rec)、F1得分(F1),其計算公式分別為[7]:

同時將此方法(Bayesian Fuctional Logistic Regression,BFLR)與普通Logistic回歸(Logistic Regression,LR)、支持向量機(Support Vector Machine,SVM)、決策樹(Decision Tree,DT)、條件推斷樹(Conditonal Inference Tree,CIT)方法進行比較。

通過對比函數Logistic回歸模型與其他分類方法在模擬數據上的分類性能,發現基于BPLR模型的方法對于數據的分類情況明顯優于其他方法,在4個分類性能指標上都有更高的準確率。樣本路徑圖、樣本密度圖和樣本自相關函數圖表明,在經過預燒期后算法已趨于穩定達到收斂,證明該抽樣算法在數據分類上的有效性。

表1 模擬數據分類性能

圖 3 N=150,b的樣本路徑

圖 4 N=150,b的樣本密度圖

圖 5 N=150,b的自相關函數

4 實際數據分析

以Tecator數據為例,該數據可在R軟件包“fda.usc”[15]中進行下載。Tecator數據集由215個碎肉樣本對波長為850~1050 nm的近紅外吸收光譜曲線及其脂肪含量構成,每條吸收光譜曲線觀測了100個通道,其中有138塊碎肉樣本的脂肪含量Fat低于20%,77塊碎肉樣本的脂肪含量Fat高于20%。以此將Tecator數據集分為兩類,圖6給出了每類的各30條樣本曲線。通過函數主成分分析發現T,ecator數據集前3個主成分已經達到99%的累積方差貢獻率,因此選取前三個主成分基函數構建函數型Logistic回歸模型。該模型可以表示為:

圖 6 Tecator數據集

圖 7 各分類器ROC曲線

其中初始值α設為0.5,bk=(0,0,0),k=1,2,3,cik為前三個主成分得分。

為檢驗模型的分類能力,畫出模型的ROC曲線。結果顯示,基于貝葉斯分析的函數型Logistic回歸模型對Tecator數據集的分類效果最優,其AUC面積達到了0.984,說明模型具有較高的分類準確率。與其他方法在4個指標上的分類性能相比,盡管BFLR方法在準確率上表現不如普通Logistic回歸、決策樹和條件推斷樹,但在精度、召回率和F1得分上都顯著優于其他方法,因此總體來說與其他模型相比擁有更好的分類能力。

表2 Tecator數據集分類性能

5 結束語

本文面向函數型數據的二分類問題,提出一種基于Logit變換的函數型Logistic回歸模型,并通過模擬數據和實際數據分析驗證了其分類能力。與其他模型的分類性能相比,在該模型上的分類結果均優,但不足是本文考慮的是單變量函數型回歸變量的情形,針對多元函數型回歸變量以及包括普通數據的函數型Logistic回歸模型可為后續研究。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 国产美女在线观看| 黄色国产在线| 国产成人h在线观看网站站| 呦视频在线一区二区三区| 婷婷午夜天| 91无码人妻精品一区二区蜜桃| av一区二区无码在线| 国产成人综合在线视频| 日韩欧美国产精品| 成人在线综合| 一本大道AV人久久综合| 欧美成人手机在线观看网址| 亚洲va在线观看| 亚洲v日韩v欧美在线观看| 国产一区二区三区免费| 91午夜福利在线观看| a亚洲天堂| 性做久久久久久久免费看| 青草视频网站在线观看| 国产精品浪潮Av| 国产成人亚洲精品色欲AV | 亚洲侵犯无码网址在线观看| 欧美色视频在线| 欧美午夜理伦三级在线观看| 91麻豆国产精品91久久久| 熟妇丰满人妻av无码区| 日本午夜精品一本在线观看| 亚洲精品无码人妻无码| 自偷自拍三级全三级视频| 欧美精品xx| 久久亚洲美女精品国产精品| 国产v精品成人免费视频71pao| 国产丝袜一区二区三区视频免下载| 日韩精品久久无码中文字幕色欲| 性视频久久| 国产欧美专区在线观看| 国产精品视频a| 日韩欧美中文在线| 在线看AV天堂| 久久久久中文字幕精品视频| 国产一区亚洲一区| 国产成人8x视频一区二区| 青草视频久久| 亚洲成人精品| 国产精品九九视频| 日本亚洲国产一区二区三区| 国产欧美日韩91| 亚洲成人免费看| 青青青国产免费线在| 欧美日韩国产成人高清视频| 国产女同自拍视频| 国产成人区在线观看视频| 美女被操黄色视频网站| 2019年国产精品自拍不卡| 99re视频在线| 久久精品中文字幕免费| 国产成人1024精品| 日本午夜精品一本在线观看 | 黄色在线不卡| 国产麻豆va精品视频| 欧美精品色视频| 青青久视频| 美女高潮全身流白浆福利区| 亚洲美女久久| 日韩乱码免费一区二区三区| 欧美日韩高清在线| 91口爆吞精国产对白第三集| 日韩欧美国产三级| 伊人久久青草青青综合| 免费观看亚洲人成网站| 欧美有码在线观看| 久久国产精品夜色| 婷五月综合| 久久久久久久蜜桃| 国产丝袜第一页| 国产欧美另类| 精品久久香蕉国产线看观看gif| 青青草一区| 日韩在线播放中文字幕| 日本爱爱精品一区二区| 国产毛片片精品天天看视频| 精品福利一区二区免费视频|