999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高維多元數據的酒體感官評價可視分析

2021-06-25 10:23:14張貴宇庹先國曾祥林彭英杰付朝帥
食品工業科技 2021年9期
關鍵詞:分類評價質量

張貴宇,庹先國 ,曾祥林,彭英杰,王 昆,陳 霏,付朝帥

(1.人工智能四川省重點實驗室,四川宜賓 644000;2.四川輕化工大學自動化與信息工程學院,四川宜賓 644000;3.西南科技大學信息工程學院,四川綿陽 621010)

酒的主要質量指標可分為感官指標和理化指標兩類。感官評價是利用人的感覺器官(眼睛、鼻子和舌頭)觀色、聞香、品味來鑒別酒質量的一門檢測技術[1]。通過酒的品評來指導生產工藝,例如對新酒的品評能夠發現釀酒工藝是否正常、發酵是否正常、操作是否精細;勾調品評是品評工作的核心,能夠使酒達到更好的口感效果,更好的品質,更加穩定、更顯和諧平衡,風格多樣化[2-3]。酒中具有多種呈味物質,包括使人感到甜味的糖和醇類等化合物,引起酸味的有機酸等,這些呈味物質不同比例和濃度的組合,直接影響酒的風格和質量。呈味物質氣味的相互作用包括累加作用、協同作用、融合作用和掩蓋作用,酒的感官評價的優劣正是取決于呈香物質構成的氣味之間的平衡程度,即呈香物質按一定的比例、濃度和相互作用方式來達到令人感覺舒適和愉快的程度[4-7]。雖然人的嗅覺和味覺靈敏度較高,但感官評價易受地域、民族、習慣、個人愛好、心理和健康情況等因素的影響,只能實現定性分析,難以用直觀的數字表達。儀器的檢測分析可對酒的理化指標進行定量分析,但儀器檢測分析易受香味物質的濃度、溫度、溶劑、易位和復合香等指標的影響[8-9],只能準確測定含量,對呈香呈味特征及其變化規律難以表達。因此,針對酒體中眾多的呈香呈味物質,結合感官評價,研究一種基于數據驅動的分析評價方法,對提高酒質量評價的準確性和穩定性具有重要意義。

隨著計算資源和傳感技術的不斷升級,數據量呈現大規模的增長,數據維度也越來越高,快速分析復雜高維多元數據已成為目前研究的熱點方向。基于統計和基本分析技術的可視化系統分析能力已經不能滿足高維多元數據分析。數據多元化、非結構化、異構性等復雜程度的增加,單一的可視化方法也無法滿足數據分析的需求。因此,高性能的高維數據分析方法和工具得到快速發展,采用連通散點圖、動態直方圖、歸一化和離群點檢測/去除等視點可視方法來實現對大型、高維多元數據集的圖形可視化,廣泛應用于天文學、量子化學、流體動力學、機器學習、生物信息學、金融以及信息技術服務器日志挖掘等領域[10-16]。在食品研究領域,Hao等[17]將可視化分析技術與區塊鏈相結合,利用熱圖顯示不合格產品的區域,遷移圖技術分析風險區域之間的關系,再通過力指向圖來追蹤特定產品軌跡。Cruz等[18-19]將可視分析方法應用于生物數據分析,使用協調的多個視圖來表示高維多變量數據,特別是時間序列的基因表達、蛋白質相互作用網絡和生物通路。在酒的感官評價和理化數據分析中,Cortez等[20]開展了利用酒的理化指標數據建立人的偏好分類模型,分別采用了支持向量機、多元回歸和神經網絡方法,以數據驅動的測試方法可以提高品酒師的速度和質量,降低僅憑品酒師的經驗和知識造成的人為因素影響。Bai等[21-23]根據理化性質對紅酒進行分類,首先,采用因子分析法對多元理化指標變量進行降維,再對觀測值進行K-均值聚類分析,實現紅酒的分類方法。除理化指標,酒體顏色是感官品嘗過程中一個重要的質量參數,利用折線圖和誤差線分析比色法與感官評價的相關關系。采用PCA(Principal Components Analysis,主成分分析)對顏色參數進行多元分析,獲得主成分載荷圖對酒的不同風格和等級進行劃分[24-25]。

目前,基于大數據和可視分析技術在釀酒技術方面的研究與應用相對較少。本文將感官評價和理化指標相結合,針對酒的高維多元理化指標數據提出一種可視化分析方法,挖掘理化指標之間的復雜相關性,以及理化指標與感官評價數據的相關性。構建可以用于酒體質量等級分類的評價模型,實現以離散理化指標數據的綜合性分析對酒進行質量分級,達到感官評價標準,提高酒質量評價的準確性和穩定性。

1 數據與方法

1.1 數據來源

采用的葡萄酒樣本數據集引自Paulo Cortez公開數據庫,數據集包括4898個樣本的理化指標數據和感官評價數據,11項理化指標包括非揮發性酸(fixed acidity)、揮發性酸(volatile acidity)、檸檬酸(citric acid)、殘 糖(residual sugar)、氯 化 物(chlorides)、游離二氧化硫(free sulfur dioxide)、總二氧化硫(total sulfur dioxide)、密度(density)、pH、硫酸酯(sulphates)和酒精(alcohol)。感官評價中由品酒師對樣品進行3~9級的等級評分,每個樣品由至少3名品酒師進行盲評,并取中位值作為最終評定等級。各等級的樣本數量分布如表1所示。

表1 各等級的樣本數量分布Table 1 Sample size distribution for each grade

1.2 數據分析

1.2.1 理化指標相關性分析 采用和弦圖闡釋理化指標與感官評定等級的相關性。和弦圖是一種顯示數據間相互關系的可視化方法,節點數據沿圓周徑向排列,節點之間使用帶權重(寬度)的弧線鏈接,即弧線寬度越大,相關性越強,由和弦圖直觀獲得理化指標對感官等級的影響規律。再采用散點矩陣分析方法進一步獲得理化指標數據之間的相關性,對相關性進行量化。

1.2.2 感官等級評定中理化指標的重要性分析 基于大數據視角對酒體的高維多元理化指標數據集進行優化,采用主成分分析算法抽象提取數據集的主要特征,并評估各理化指標參數的重要性,實現高維多元理化指標數據集的降維。

1.2.3 酒體質量分類分析方法 采用隨機森林算法構建酒的質量評價模型。隨機森林是一種較新的機器學習模型,由多個決策樹組成。單個決策樹的分類能力較小,但擁有大量決策樹的隨機森林可以通過每一棵樹的分類結果,選取其中最可能的分類,可有效提高分類效果。隨機森林質量分析模型訓練過程如圖1所示。

圖1 隨機森林質量分析模型訓練流程圖Fig.1 Training flowchart of random forest quality analysis model

首先,將樣本數據輸入到初始默認設置的每棵決策樹;然后,對數據特征進行分類,并對每個特征進行評分;最終集成所有的分類投票結果,確定隨機森林的最優決策樹數量和決策樹節點分支變量數量,將投票次數最多的指定為最終的輸出。

2 結果與分析

2.1 理化指標相關性分析

數據集中隨機抽取866個4~8 級的樣本數據,等級分別命名為Q5、Q4、Q3、Q2和Q1,對各理化指標數據按照四分位點由小到大劃分為4個區間,理化指標與感官評定等級的相關性規律通過和弦圖闡釋,如圖2所示。

圖2 等級與理化指標的和弦圖Fig.2 Chord diagram of grade and physical and chemical indicators

如圖2所示,以理化指標酒精度alcohol為例,由 小 到 大 分 為alcohol1、alcohol2、alcohol3和alcohol4共4個區間,隨Q1~Q5質量等級的變化,酒精度分布逐漸向alcohol1區間(最低酒精度區間)偏移,如圖中B、E的局部放大圖所示,可直觀觀察到隨質量等級的降低,酒精度分布逐漸向低酒精度區間偏移。

進一步分析理化指標間的耦合關系,采用散點矩陣分析方法對理化指標的相關性進行量化,如圖3所示。

圖3 理化指標的散點矩陣圖Fig.3 Scattered matrix diagram of physical and chemical indicators

圖3(A)下三角的散點矩陣顯示理化指標之間的相關性,上三角通過相關系數(絕對值)文字大小顯示相關性的強弱。以圖3(A)中框選為例進行分析,如橢圓框內的點分布于一條帶狀區域內,說明密度與殘糖具有較強的線性或非線性相關性;矩形框內的點呈現無規律分布,表明檸檬酸與總二氧化硫的相關性較?。涣呅慰騼鹊狞c沿軸分布,表明酒精度與硫酸酯為相對獨立的屬性。圖3(A)展示理化指標之間的相關性強弱,通過圖3(B)橢圓矩陣相關性的正負關系,藍色表示正相關,紅色表示負相關,橢圓的寬度越窄相關性越強。

2.2 高維多元理化數據特征提取

2.2.1 主成分降維算法 由圖3可知,理化指標之間具有復雜的耦合關系,首先對高維參數進行優化。PCA通過線性變換將高維數據變換到一個新的坐標系,獲得若干個新的、獨立不相關的綜合參數——主成分,用少數幾個綜合指標來代替原來的指標數據,并且盡量多的反映原來指標所表示的特征。PCA算法中采用方差來度量提取數據特征的多少,要求在約束條件下方差達到最大值,以保證涵蓋的信息量最多。

酒的理化指標數據具有不同的量綱,經標準化預處理后定義為X=(x1, x2, ···, xp),將X變換為一組獨立不相關的綜合參數(成分)y1, y2, ···, yp,使得yi為X的線性組合:

利用RStudio數據可視化與數據挖掘專用軟件進行PCA降維分析,通過“碎石圖”可以獲得各成分的貢獻率,即表達原數據總體特征的比例,如圖4所示。

圖4 成分貢獻率Fig.4 Component contribution rate

PCA分析共獲得10個成分,選取前6個作為主成分,能夠表達原數據集85.17%的特征信息,6個主成分的系數矩陣如表2所示。

2.2.2 理化指標的重要性分析 根據主成分的特征根和得分系數矩陣,通過式(2)和(3)計算的各理化指標參數的權重。

α為主成分得分系數矩陣,σ為主成分對應的方差,β為各指標數據的綜合等分系數,ω為理化指標參數的權重,即重要性系數。i是理化指標數量,j是主成分數量。

圖5中,“底紋”柱狀圖代表權重較大的6個理化指標,即對酒體質量的影響較大,因此,作為數據優化后的關鍵指標參數。

2.3 酒體質量分類模型的驗證與分析

在數據特征提取的基礎上降低了數據集維度。為提高模型的訓練效果,篩選樣本較多的Q2、Q3和Q4三個等級的數據。保留樣本數據的6個關鍵指標參數,通過標準化后的二維分布情況可見三個等級樣本數據的耦合情況具有較強的交叉,如圖6所示。

利用R語言的randomForest軟件包建立隨機森林模型。在隨機數模型訓練過程中,決策樹節點分支的變量數量和決策樹的數量是影響模型效果的主要因素。采用變量數量遞增訓練法,選取最優模型。選取4535個樣本集,通過比較決策樹節點分支變量數量為1時,模型的誤判率最低。如圖7所示,對決策樹的數量進行分析,當決策樹數量達到約380時,模型誤差趨于穩定。因此,通過以上分析,決策樹節點變量數量為1和決策樹數量為380構建隨機森林模型。

酒體質量分類模型的預測效果如表3所示。選取的4535個樣本集中,包含Q2、Q3、Q4等級樣本數量分別為880、2198、1457個。Q2等級樣本數量較少,分類誤差較高,達到40.9%,Q3、Q4等級分類誤差分別為17.9%、29.2%,總體分類誤差26.0%。

表2 成分得分系數矩陣Table 2 Component score coefficient matrix

圖5 理化指標權重Fig.5 Physical and chemical index weight

圖6 三個質量等級酒的理化指標數據分布Fig.6 Data distribution of physical and chemical indicators of three quality grade of wine

圖7 決策樹數量與誤差關系圖Fig.7 The relationship between the number of decision trees and the error

表3 6項關鍵指標參數的決策樹模型分類預測效果Table 3 Classification and prediction effect of decision tree model established by using key indicator parameters

保留原數據集中11 項理化指標,選取4000 個樣本集,包含Q2、Q3、Q4等級樣本數量分別為780個、1943個、1277個,采用隨機森林質量分析模型進行等級預測,決策樹節點變量數量為1和決策樹數量為400是獲得最優模型,預測結果如表4所示。Q2等級樣本數量較少,分類誤差較高,達到47.4%,Q3、Q4等級分類誤差分別為15.7%、29.8%,總體分類誤差26.4%

表4 全部指標參數的決策樹模型分類預測效果Table 4 Classification and prediction effect of decision tree model based on all index parameters

數據集優化前后,各等級樣本數據的分類預測結果相近,總體分類預測結果基本相同,降維優化并未影響分類誤差,說明密度、殘糖、揮發性酸、酒精度、硫酸酯和非揮發性酸與質量等級具有較強的相關性和預測性,可以表達原始數據集的絕大部分特征。

3 結論

采用可視分析技術挖掘酒體感官評價中的隱性知識,提出一種基于數據驅動的酒質量評價方法。通過可視化圖模型闡釋高維多元理化指標參數之間的相關性,以及理化指標與酒質量等級之間的相關性。在此基礎上,采用基于PCA方法提取數據集特征信息,對理化指標的重要性進行量化分析,篩選關鍵指標作為構建質量分類評價模型的參數。最后采用隨機森林建立酒質量評價模型,模型的預測效果與包含全部理化指標的模型預測效果基本一致,說明優化后的關鍵指標參數包含了原數據集的大部分特征信息?;诟呔S多元的可視分析方法可以解決感官評價不能定量,和復雜理化分析不能定性的問題。與傳統的感官評價相比,具有更高的穩定性和可靠性,可應用于輔助品酒師和釀造師進行酒質量評定和生產工藝優化。

猜你喜歡
分類評價質量
“質量”知識鞏固
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
分類算一算
質量守恒定律考什么
做夢導致睡眠質量差嗎
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
質量投訴超六成
汽車觀察(2016年3期)2016-02-28 13:16:26
基于Moodle的學習評價
主站蜘蛛池模板: 国产精品第一区在线观看| 国产AV无码专区亚洲精品网站| 99人妻碰碰碰久久久久禁片| 激情爆乳一区二区| 欧美日韩在线国产| 亚洲无码高清一区二区| 亚洲人成网站18禁动漫无码| 国产精品私拍在线爆乳| 波多野结衣在线se| 热99re99首页精品亚洲五月天| 91啦中文字幕| 亚洲精品无码AV电影在线播放| 国产成人综合日韩精品无码首页| 午夜福利免费视频| 就去吻亚洲精品国产欧美| 国产色婷婷视频在线观看| 中国国产A一级毛片| 无码免费的亚洲视频| 美女被操黄色视频网站| 国产精品自在在线午夜| 最新国产高清在线| 亚洲国产成人麻豆精品| 中文字幕一区二区人妻电影| 精品無碼一區在線觀看 | 欧美a在线视频| 色成人综合| 国产成人啪视频一区二区三区| 日本亚洲欧美在线| 久久精品aⅴ无码中文字幕| 91在线播放免费不卡无毒| 99精品一区二区免费视频| 午夜免费小视频| 激情无码字幕综合| 一本综合久久| 2021国产在线视频| h视频在线观看网站| 亚洲乱码精品久久久久..| 欧美一区日韩一区中文字幕页| 99一级毛片| 日韩精品无码不卡无码| 91精品免费高清在线| 国产午夜精品鲁丝片| 国产精品网拍在线| 亚洲毛片一级带毛片基地| 国产探花在线视频| 天堂网亚洲系列亚洲系列| 国产精品区视频中文字幕 | 久久精品国产精品青草app| 婷婷色丁香综合激情| 久久大香香蕉国产免费网站| 国产女人18毛片水真多1| 国产在线视频导航| 在线免费看片a| 免费无码网站| 91九色国产porny| 久久香蕉国产线看精品| 亚洲国产精品VA在线看黑人| 丁香婷婷久久| 日韩精品无码免费一区二区三区| 欧美黄网在线| 天堂成人在线| 欧美69视频在线| 欧美精品成人| 欧美a在线视频| 亚洲成人高清无码| 波多野吉衣一区二区三区av| 东京热av无码电影一区二区| 97国产一区二区精品久久呦| 久久久久免费看成人影片| 国产系列在线| 久久99国产视频| 巨熟乳波霸若妻中文观看免费 | 中文纯内无码H| 国产成人高清亚洲一区久久| 免费毛片视频| 中文字幕无码电影| 无码人妻免费| 无码一区中文字幕| 中文成人在线视频| 农村乱人伦一区二区| 日韩天堂在线观看| 人人爱天天做夜夜爽|