999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于二次鄰近算法和支持向量機(jī)算法的質(zhì)量判別算法研究

2019-09-10 15:25:31徐夢(mèng)琳韓馳劉經(jīng)緯
現(xiàn)代信息科技 2019年6期

徐夢(mèng)琳 韓馳 劉經(jīng)緯

關(guān)鍵詞:多元統(tǒng)計(jì)分析;支持向量機(jī)算法;二次鄰近算法;判別分析

中圖分類號(hào):TP274+.3;TP391.1 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)06-0104-02

Keywords:multivariate statistical analysis;support vector machine algorithm;quadratic proximity algorithm;discriminant analysis

0 ?引 ?言

葡萄酒質(zhì)量的鑒別在過去需要耗費(fèi)大量的人力,因此通過算法分析葡萄酒的各個(gè)屬性來判別葡萄酒的質(zhì)量是十分必要的。在實(shí)際分析過程中,利用線性判別分析算法對(duì)白葡萄酒質(zhì)量進(jìn)行判別時(shí),測(cè)試集誤差率達(dá)到了47.8%。利用鄰近算法判別時(shí),測(cè)試集誤差率達(dá)到了37.9%。利用樸素貝葉斯算法判別時(shí),測(cè)試集誤差率達(dá)到了55.3%;對(duì)于紅葡萄酒,利用線性判別分析算法判別時(shí),測(cè)試集誤差率達(dá)到了40.2%。利用鄰近算法判別時(shí),測(cè)試集誤差率達(dá)到了30%。利用樸素貝葉斯算法判別時(shí),測(cè)試集誤差率達(dá)到了44.8%。盡管紅葡萄酒的判別結(jié)果明顯好于白葡萄酒,但對(duì)于這兩種葡萄酒而言這些常見的判別方法都出現(xiàn)了極高的錯(cuò)誤率,因此對(duì)葡萄酒質(zhì)量判別瓶頸的研究就顯得十分重要。

1 ?研究方法

1.1 ?有序多分類邏輯回歸算法

有序多分類邏輯回歸算法將因變量劃分為程度各異的等級(jí),對(duì)這多個(gè)等級(jí)進(jìn)行Logistic回歸模擬。并且和普通邏輯回歸一樣,有序多分類邏輯回歸算法也是廣義線性回歸。在本文中將質(zhì)量評(píng)分3~9分看作有大小關(guān)系的等級(jí)序列,利用有序多分類邏輯回歸算法探究評(píng)分之間的大小關(guān)系是否為造成葡萄酒判別錯(cuò)誤率高的原因。

1.2 ?二次鄰近算法

傳統(tǒng)鄰近算法是將被判別的樣本放入訓(xùn)練集建立的預(yù)測(cè)模型中,根據(jù)樣本周圍其他數(shù)據(jù)樣本的分布來確定此樣本自身的分布。其中的參數(shù)k是用來確定樣本周圍其他數(shù)據(jù)樣本的個(gè)數(shù),其取值會(huì)影響模型的判別結(jié)果,k值太大判別結(jié)果會(huì)出現(xiàn)過擬合,而k值太小判別結(jié)果會(huì)不精確。本文利用循環(huán)遍歷嘗試所有可能的值來確認(rèn)參數(shù)k的取值。

二次鄰近算法是對(duì)傳統(tǒng)鄰近算法的改進(jìn)。針對(duì)葡萄酒數(shù)據(jù)集,傳統(tǒng)的鄰近算法并不管用。但是通過對(duì)傳統(tǒng)鄰近算法的分析可以推測(cè),傳統(tǒng)鄰近算法判別錯(cuò)誤率極高的原因可能在于對(duì)質(zhì)量等級(jí)為5、6、7分的中等葡萄酒的判別結(jié)果相互的混淆。為了提高判別精度,探究葡萄酒質(zhì)量判別的瓶頸,提出了二次鄰近算法。即,提取出第一次鄰近算法判別結(jié)果中混淆嚴(yán)重的部分,將其放入新建立的預(yù)測(cè)模型中進(jìn)行再一次的鄰近算法的判別。在本文中,第二次鄰近算法的預(yù)測(cè)模型是利用實(shí)際質(zhì)量等級(jí)為5、6、7分的葡萄酒觀測(cè)數(shù)據(jù)建立的。在最終結(jié)果中,包含使用兩次鄰近算法的易混淆部分的結(jié)果以及第一次鄰近算法的易區(qū)分部分的結(jié)果。

1.3 ?支持向量機(jī)

支持向量機(jī)是深度學(xué)習(xí)算法的一種,支持向量機(jī)是通過引入核函數(shù),將樣本空間映射到高維特征空間中,從而使在起始的樣本空間非線性可分轉(zhuǎn)化為在高維特征空間中線性可分。[1]在支持向量機(jī)中核函數(shù)的選擇直接關(guān)系到判別模型的建立,常用的核函數(shù)有線性核、多項(xiàng)式核、高斯核、Sigmoid核。核函數(shù)的選取需要結(jié)合數(shù)據(jù)自身的情況。

2 ?模型驗(yàn)證

2.1 ?數(shù)據(jù)處理

本文使用的Wine Quality數(shù)據(jù)集由葡萄牙吉馬良斯米尼奧大學(xué)的Paulo Cortez提供。數(shù)據(jù)集中的葡萄酒源自Vinho Verde地區(qū),由于紅、白葡萄酒之間差異較大,使用紅葡萄酒和白葡萄酒樣品創(chuàng)建了兩個(gè)數(shù)據(jù)集。輸入包括客觀測(cè)試(例如:PH值),輸出基于傳感數(shù)據(jù)(葡萄酒專家至少進(jìn)行3次評(píng)估的中位數(shù))。每位專家都對(duì)葡萄酒質(zhì)量進(jìn)行評(píng)分介于0分(非常差)和10分(非常優(yōu)秀)之間。

每條數(shù)據(jù)有12個(gè)屬性值——固定酸度、揮發(fā)性酸度、檸檬酸、殘?zhí)恰⒙然铩⒂坞x二氧化硫、二氧化硫總量、密度、PH值、硫酸鹽、酒精。白葡萄酒包括4898條觀測(cè)數(shù)據(jù),紅葡萄酒數(shù)據(jù)集包括1599條觀測(cè)數(shù)據(jù)。并分別取這兩種葡萄酒的70%的觀測(cè)數(shù)據(jù)作為訓(xùn)練集用于模型建立,30%的觀測(cè)數(shù)據(jù)作為測(cè)試集用于模型驗(yàn)證。因變量質(zhì)量評(píng)分實(shí)際在白葡萄酒數(shù)據(jù)集中只包含3~9分,在紅葡萄酒數(shù)據(jù)集中只包含3~8分,都不服從正態(tài)分布。

2.2 ?有序多分類邏輯回歸算法

有序多分類邏輯回歸的白葡萄酒模型預(yù)測(cè)結(jié)果在訓(xùn)練集中錯(cuò)誤率就已經(jīng)達(dá)到了47.8%,測(cè)試集錯(cuò)誤率為47.7%。并且實(shí)際質(zhì)量評(píng)分為5分的白葡萄酒訓(xùn)練集數(shù)據(jù)有51.7%被判斷為6、7分,實(shí)際質(zhì)量評(píng)分為6分的白葡萄酒訓(xùn)練集數(shù)據(jù)有23.8%被判斷為5分和7分,實(shí)際質(zhì)量評(píng)分為7分的白葡萄酒訓(xùn)練集數(shù)據(jù)有77.4%被判斷為6分和7分,白葡萄酒測(cè)試集結(jié)果與訓(xùn)練集類似。對(duì)于紅葡萄酒數(shù)據(jù)集,訓(xùn)練集錯(cuò)誤率為40.1%,測(cè)試集錯(cuò)誤率為40%。實(shí)際質(zhì)量評(píng)分為5分的紅葡萄酒訓(xùn)練集數(shù)據(jù)有23.7%被判斷為6、7分,實(shí)際質(zhì)量評(píng)分為6分的紅葡萄酒訓(xùn)練集數(shù)據(jù)有37%被判斷為5分和7分,實(shí)際質(zhì)量評(píng)分為7分的紅葡萄酒訓(xùn)練集數(shù)據(jù)有78.4%被判斷為6分和7分,紅葡萄酒測(cè)試集結(jié)果與訓(xùn)練集也類似。

分析數(shù)據(jù)發(fā)現(xiàn),盡管紅葡萄酒數(shù)據(jù)集的錯(cuò)誤率低于白葡萄酒,但是有序多分類邏輯回歸對(duì)于這兩種葡萄酒的判別結(jié)果均不理想,因此葡萄酒等級(jí)的有序并不是造成葡萄酒判別錯(cuò)誤率高的根本原因。同時(shí)觀察本次模型預(yù)測(cè)結(jié)果可以猜測(cè),葡萄酒判別錯(cuò)誤率高的根本原因可能評(píng)分為5、6、7分的中等葡萄酒極易混淆。

2.3 ?二次鄰近算法

第一次使用鄰近算法的白葡萄酒數(shù)據(jù)集錯(cuò)誤率最小在k值取1時(shí),此時(shí)測(cè)試集錯(cuò)誤率最小,為37.9%。由于評(píng)分為5、6、7分的白葡萄酒相互混淆,將第一次鄰近算法判別的結(jié)果放入利用實(shí)際評(píng)分為5、6、7分的白葡萄酒觀測(cè)數(shù)據(jù)建立的二次模型中預(yù)測(cè),結(jié)果仍不理想。原因在于:(1)盡管對(duì)評(píng)分為5、6、7分的白葡萄酒數(shù)據(jù)進(jìn)行了單獨(dú)的第二次鄰近算法建模,但錯(cuò)誤率仍然達(dá)到了33.7%;(2)第二次鄰近算法的結(jié)果必然涵蓋了對(duì)非中等質(zhì)量葡萄酒的誤判。對(duì)紅葡萄酒二次鄰近算法建模的結(jié)果也不理想,第一次對(duì)所有觀測(cè)數(shù)據(jù)建模的錯(cuò)誤率達(dá)到了31%,單獨(dú)對(duì)中等質(zhì)量的紅葡萄酒建模后的判別錯(cuò)誤率仍有28%,最終二次建模的結(jié)果也不理想。錯(cuò)誤率高的原因和白葡萄酒類似。二次鄰近算法的模型預(yù)測(cè)結(jié)果驗(yàn)證了有序多分類邏輯回歸算法中做出的猜想——中等質(zhì)量的葡萄酒的判別是葡萄酒判別過程中的瓶頸。

2.4 ?支持向量機(jī)算法

為了進(jìn)一步確定葡萄酒判別的瓶頸,對(duì)于紅、白葡萄酒數(shù)據(jù)集進(jìn)行了進(jìn)一步的支持向量機(jī)模型預(yù)測(cè)分析。白葡萄酒利用支持向量機(jī)算法建模時(shí),發(fā)現(xiàn)不改變不同質(zhì)量評(píng)分白葡萄酒之間的權(quán)重比時(shí),訓(xùn)練集錯(cuò)誤率為38%,測(cè)試集錯(cuò)誤率為43%。而不斷增加評(píng)分為5、6、7分的白葡萄酒的權(quán)重,錯(cuò)誤率會(huì)逐漸減小。最終利用支持向量機(jī)算法模型預(yù)測(cè)的白葡萄酒訓(xùn)練集錯(cuò)誤率降到了3.6%,測(cè)試集錯(cuò)誤率為37.7%。對(duì)紅葡萄酒進(jìn)行支持向量機(jī)算法模型預(yù)測(cè)產(chǎn)生的結(jié)果類似,不調(diào)整權(quán)重時(shí),訓(xùn)練集錯(cuò)誤率為31.1%,測(cè)試集錯(cuò)誤率為37.3%。增大評(píng)分為5、6、7分的紅葡萄酒的權(quán)重后,訓(xùn)練集錯(cuò)誤率減至1.1%,測(cè)試集誤差為41.9%。調(diào)整權(quán)重之后的判別結(jié)果可能是出現(xiàn)了過擬合現(xiàn)象,但是調(diào)整懲罰系數(shù)之后,訓(xùn)練集和測(cè)試集結(jié)果仍然存在比較大的差異。因此支持向量機(jī)算法模型預(yù)測(cè)的結(jié)果說明,中等質(zhì)量的葡萄酒極易在算法中相互混淆的原因是,中等質(zhì)量的葡萄酒的差異不大并且具備各自的特點(diǎn)。

3 ?結(jié) ?論

本文對(duì)于常見多元統(tǒng)計(jì)分析方法在葡萄酒質(zhì)量判別過程中存在較大誤差的情況進(jìn)行了分析。通過有序多分類邏輯回歸算法、二次鄰近算法、支持向量機(jī)算法對(duì)葡萄酒質(zhì)量判別的瓶頸進(jìn)行了研究。結(jié)果表明紅葡萄酒相對(duì)白葡萄酒而言容易判別,但紅、白葡萄酒的評(píng)分依據(jù)是十分相似的。綜合兩種葡萄酒判別的結(jié)果,發(fā)現(xiàn)葡萄酒質(zhì)量判別的瓶頸在于中等質(zhì)量的葡萄酒在模型預(yù)測(cè)的過程中極易產(chǎn)生混淆。在葡萄酒釀造過程中,多種醇類物質(zhì)和脂類物質(zhì)貢獻(xiàn)了葡萄酒的香氣,并且不同的釀造方法,存放時(shí)間都對(duì)葡萄酒和口感和質(zhì)量產(chǎn)生影響。[2]因此,由于影響葡萄酒質(zhì)量的因素太多,低等葡萄酒的各個(gè)理化指標(biāo)都無優(yōu)勢(shì),而高等葡萄酒各個(gè)指標(biāo)都有明顯優(yōu)勢(shì),都易于辨別;中等質(zhì)量葡萄酒只是相對(duì)于低等質(zhì)量葡萄酒而言某些理化指標(biāo)有優(yōu)勢(shì),且不同品牌的中等葡萄酒優(yōu)勢(shì)各異,難以辨別。

參考文獻(xiàn):

[1] 楊浩,孟娜,王婧,等.基于支持向量機(jī)的京津冀城市群熱環(huán)境時(shí)空形態(tài)模擬 [J].地球信息科學(xué)學(xué)報(bào),2019,21(2):190-200.

[2] 房玉林,王華,張莉,等.不同釀造工藝對(duì)毛葡萄酒香氣的影響 [J].農(nóng)業(yè)工程學(xué)報(bào),2007(9):246-250.

作者簡(jiǎn)介:徐夢(mèng)琳(1998-),女,漢族,江西南昌人,本科在讀,研究方向:大數(shù)據(jù)分析。

主站蜘蛛池模板: 欧美日韩亚洲综合在线观看| 99青青青精品视频在线| 在线观看91香蕉国产免费| 在线播放国产一区| 国产亚洲精品自在久久不卡| 国产区免费| 58av国产精品| 四虎AV麻豆| YW尤物AV无码国产在线观看| 全午夜免费一级毛片| 无码AV日韩一二三区| 在线精品自拍| 国产精品亚洲αv天堂无码| 日韩av电影一区二区三区四区| 少妇极品熟妇人妻专区视频| 国产福利免费视频| 波多野结衣二区| 国产福利免费视频| 国产www网站| 9久久伊人精品综合| 亚洲天堂色色人体| 国产伦精品一区二区三区视频优播| 无码中文字幕精品推荐| 女同国产精品一区二区| 亚洲午夜福利精品无码不卡| 99无码熟妇丰满人妻啪啪 | 国产成人精品在线| 亚洲天堂日韩在线| 亚洲国产中文综合专区在| 久久精品这里只有精99品| 六月婷婷精品视频在线观看| 国国产a国产片免费麻豆| 亚洲精品成人片在线播放| 91网址在线播放| 激情六月丁香婷婷四房播| 国产精品自在在线午夜区app| 亚洲第一成年网| 男女精品视频| 老司机午夜精品网站在线观看 | 国产精品lululu在线观看| 国产亚洲精| 又猛又黄又爽无遮挡的视频网站| 久久99精品久久久久纯品| 国产91成人| 韩日无码在线不卡| 亚洲精品自拍区在线观看| 精品亚洲欧美中文字幕在线看| 国产一区亚洲一区| 国产久草视频| 国产男女免费视频| 国产精品人人做人人爽人人添| 国产成人综合亚洲欧美在| 波多野结衣一区二区三区AV| 色综合狠狠操| 国产乱人伦精品一区二区| 亚洲精品无码在线播放网站| 无码人中文字幕| 91极品美女高潮叫床在线观看| 精品国产aⅴ一区二区三区| 国产黄色片在线看| 免费jjzz在在线播放国产| 亚洲欧洲日产国产无码AV| 免费观看成人久久网免费观看| 久久夜色精品| 四虎国产在线观看| 欧美人人干| 婷婷亚洲天堂| 97在线观看视频免费| 四虎AV麻豆| 國產尤物AV尤物在線觀看| 久久黄色一级片| 国产肉感大码AV无码| 岛国精品一区免费视频在线观看 | 精品超清无码视频在线观看| 97视频在线精品国自产拍| 国产精品香蕉在线| 国产乱子伦无码精品小说| 3D动漫精品啪啪一区二区下载| 成人福利在线观看| 毛片最新网址| 中文字幕无码av专区久久| 国产aaaaa一级毛片|