999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

2016-07-31 21:17:08曹昌杰
中國科技信息 2016年14期
關鍵詞:分類方法模型

曹昌杰

成都理工大學管理科學學院

基于判別分析與Logistic回歸組合模型的蠓蟲分類方法

曹昌杰

成都理工大學管理科學學院

蠓蟲分類問題究其本質是一個典型的數據二分類問題。在傳統上采用判別分析或Logistic回歸的方式進行分類判別時,往往因為其算法本身的局限性而出現誤判且無法避免。本文在前人的研究基礎上提出了判別分析修正下的Logistic回歸方法和Logistic修正下的判別分析方法解決蠓蟲分類問題。在通過誤判率的比較和對異常數據的感知等前提下,為蠓蟲避害提供一種較為可靠的篩選方式。

縱觀為數不多的蠓蟲分類問題的研究,何水明為克服傳統BP算法中存在網絡學習速度慢的問題,提出了一種將同倫與BP算法互相結合的改進算法來進行蠓蟲分類;馮增哲等運用支持向量機算法,將蠓蟲分類這一個二分類問題轉化為一個二次規劃及其對偶規劃問題進行求解;王琪運用模糊聚類從而獲得模糊模式,并通過貼進度模式識別判斷蠓蟲的分類情況。但事實上,上述算法總存在著運算時間過長等各類局限性,特別地,是無法得到個體指標及其所屬類別之間的函數解析式,用以滿足簡明的判斷蠓蟲分類這一需求,并且對樣本數據中的異常數據點無法做出異常感知。

針對以上問題,我們采用將Logistic回歸和判別分析相結合的方式,力求簡便有效的找出一種蠓蟲分類方式,為蠓蟲避害找到一條較為便捷的途徑。

判別分析修正下的Logistic回歸方法

由于傳統Logistic回歸方法的局限性,本文提出判別分析修正下的Logistic回歸方法對其進行改進,即對蠓蟲數據采用Logistic回歸方法進行處理,但對易發生誤判的蠓蟲數據引入判別分析進行處理。主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)for 1 to n do.

d)對差值的絕對值的大小進行排序,得到差值的中位數M1

f)end for

g)若找到類似的數據點則采用判別分析方法進行分類判別;否則,仍然采用Logistic回歸方法進行分類判別

e)因為蠓蟲分類問題本身是二分類問題的特殊性,在判斷出蠓蟲樣本數據不屬于無害類(Af類)蠓蟲時,即已判定該蠓蟲屬于有害類(Apf類)蠓蟲。

Logistic回歸修正下的判別分析方法

判別分析是通過得到某個樣本數據與各樣本重心之間的馬氏距離確定樣本數據所屬的類別。若某類樣本數據的離散程度過大,與該樣本重心之間馬氏距離較大的一些樣本數據可能會出現誤判的情況。基于這樣的思想,利用Logistic回歸修正判別分析方法,主要步驟如下:

a)設n為需要進行分類的蠓蟲數據的樣本容量

b)根據蠓蟲數據進行馬氏距離判別分析,形成兩類樣本數據

c)for 1 to n do

d)在上述通過分類所得到兩類樣本數據中,分別在各類數據中,計算本類樣本數據與各自樣本重心的馬氏距離,分別記為,我們將它們分別記X1、X2類

e)將X1類和X2類的數據分別進行大小排序,找到兩類數據的中位數,分別記為

g)end for

h)將通過上述過程被記錄下來的數據點進行Logistic回歸方法進行分類,否則,仍然采用判別分析進行分類

實例論證

本文使用的蠓蟲數據是由生物學家W.L.Grongan和W.W.Wirt在1981年根據蠓蟲的觸角長度和翼長加以區分而得到,我們用上述方法將蠓蟲數據進行分類,并將分類數據與原數據進行比較,通過觀察誤判率即可對分類方法做出有效評判。其中,無害蠓蟲用Af標記,有害蠓蟲用Apf標記。

判別分析修正下的Logistic回歸方法

根據蠓蟲數據計算得出Logistic回歸函數模型如下:

并由上式可得各蠓蟲數據分類為無害蠓蟲的概率分別是:

1號: 0.7465,2號:0.8332,3號:0.7365,4號:0.7660,5號:0.6884,6號:0.7515,7號:0.5332,8號:0.3558,9號:0.2361,10號:0.4076,11號:0.4955,12號:0.2605,13號:0.2585,14號:0.1882,15號:0.3915

利用上述數據可得,M1=0.198107.

在判斷出可能得到誤判的誤判點之后,利用判別分析再對這些數據點進行判別分析,并最終得到誤判率為5.56%。即7號蠓蟲的分類出現錯誤。

從該類組合方法模型的判斷過程中,我們一共對6個可能出現誤判的點進行了重新判定,該類組合方法模型感知到蠓蟲數據中的第7點為異常數據,與事實相符。

Logistic回歸修正下的判別分析方法

根據蠓蟲數據可知,各個蠓蟲樣本數據點對其樣本重心的馬氏距離分別是:

表1 1-6號蠓蟲對于Apf類蠓蟲樣本重心的馬氏距離

表2 7-15號蠓蟲對于Af類蠓蟲樣本重心的馬氏距離

則由表1、表2可得,M21=1.2393,M22=1.1345.通過選擇并記錄下的數據點,將其進行Logistic回歸,得到Logistic回歸函數模型如下:

根據最終判別結果可知,該方法的誤判率是13.89%.

結論

通過將兩類組合模型的蠓蟲分類方式分別應用于經典蠓蟲數據,本文得出以下結論:

就兩類組合模型自身比較而言,判別分析修正下的Logistic回歸方法具有更低的誤判率,而誤判率本身也是人為修改數據所致,可見,該組合模型不僅能夠準確的判斷出蠓蟲分類,還能對數據的異常數據做出異常感知。可見,判別分析修正下的Logistic回歸方法是一種較為有效的蠓蟲分類方法。

曹昌杰(1995-)男,現主要從事數據分析學習。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: AV熟女乱| 欧美激情视频一区二区三区免费| 欧美色伊人| 9966国产精品视频| 中文精品久久久久国产网址| 亚洲AV成人一区二区三区AV| 国产精品久久久久久搜索| 日韩免费中文字幕| 少妇精品网站| 久久不卡精品| 国产内射一区亚洲| 欧美黑人欧美精品刺激| 热久久综合这里只有精品电影| 无码aaa视频| 国产中文在线亚洲精品官网| 國產尤物AV尤物在線觀看| 国产尹人香蕉综合在线电影| 2020精品极品国产色在线观看| 精品久久久久无码| 91啪在线| 欧美激情成人网| 欧美不卡视频在线| 秋霞国产在线| 国产高清色视频免费看的网址| 伊人色婷婷| 999国内精品视频免费| 久久这里只有精品国产99| 亚洲精品男人天堂| 蝌蚪国产精品视频第一页| 波多野结衣视频网站| 欧美一级一级做性视频| 国产91九色在线播放| 亚洲性色永久网址| 久久久四虎成人永久免费网站| 国产黄视频网站| 最新国产在线| 亚洲三级视频在线观看| 第一区免费在线观看| 国产在线98福利播放视频免费| 人人91人人澡人人妻人人爽| 97精品伊人久久大香线蕉| 国模沟沟一区二区三区| 97久久精品人人| 亚洲电影天堂在线国语对白| 久久久精品国产亚洲AV日韩| 亚洲综合中文字幕国产精品欧美| 国产99精品视频| 亚洲精品你懂的| 欧美一级专区免费大片| 91福利一区二区三区| 另类综合视频| a级毛片网| 亚洲欧洲日产国码无码av喷潮| 国产免费羞羞视频| 国产在线拍偷自揄拍精品| 99热国产这里只有精品无卡顿" | 午夜三级在线| 在线观看亚洲人成网站| 亚洲丝袜中文字幕| 青青青亚洲精品国产| 国产成人精品三级| 黄色免费在线网址| 国产啪在线| 日韩精品毛片人妻AV不卡| 在线中文字幕日韩| 日韩欧美中文| 国内老司机精品视频在线播出| 67194在线午夜亚洲| 亚洲乱码视频| 国产精品尤物在线| 亚洲精品高清视频| 91精品情国产情侣高潮对白蜜| 国产高清在线丝袜精品一区| 久久精品最新免费国产成人| 国产主播喷水| 99久久免费精品特色大片| 欧美激情成人网| 国产幂在线无码精品| 国产农村妇女精品一二区| 老色鬼久久亚洲AV综合| 亚洲欧洲日韩国产综合在线二区| 99国产精品一区二区|