999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于分類-回歸決策樹的烤煙產區識別模型

2014-11-24 06:33:49張毅李強王政張一揚周冀衡
中國煙草學報 2014年6期
關鍵詞:化學特征分析

張毅,李強,王政,張一揚,周冀衡

1湖南農業大學生物科學技術學院,湖南省長沙市芙蓉區農大路1號 410128;

2湖南農業大學煙草研究院,湖南省長沙市芙蓉區農大路1號 410128;

3廣西中煙工業有限責任公司,廣西壯族自治區南寧市北湖南路28號 530001

一種基于分類-回歸決策樹的烤煙產區識別模型

張毅1,2,李強2,王政3,張一揚2,周冀衡1,2

1湖南農業大學生物科學技術學院,湖南省長沙市芙蓉區農大路1號 410128;

2湖南農業大學煙草研究院,湖南省長沙市芙蓉區農大路1號 410128;

3廣西中煙工業有限責任公司,廣西壯族自治區南寧市北湖南路28號 530001

為建立不同產區及風格烤煙煙葉與化學指標之間的關系,對2005~2009年湖南省、河南省、福建省和云南省等4省份共計1040份煙葉樣品的21種化學成分進行檢測,并利用Mining Tree模型進行分類-回歸決策樹(C&RT analysis)數據分析。結果表明:(1)從21個煙葉化學成分中,共篩選出14個特征化學指標,其中鉀和硝酸根為4省煙葉共有特征化學指標;(2)湖南、河南、福建和云南4省份識別概率最高的特征化學指標分段組合(Segment)分別為:還原糖(≤24.93%)、鉀(>1.98%)、pH值(≤5.37)(p=0.658);鉀(≤1.98%)、灰分(>11.03%)、水溶性灰份堿度(≤0.49)、硝酸根(≤0.06%)(p=0.776);還原糖(>24.93%)、鉀(>1.98%)、硝酸根(≤0.06%)、蛋白質(>5.01%)(p=0.914);鉀(≤1.98%)、灰分(≤11.03%)、水溶性總糖(>28.94%)、硫酸根(≤1.43%)(p=0.957)。分類-回歸決策樹方法在建立烤煙化學成分識別模型中具有重要的應用價值。

烤煙;產區;化學指標;識別;分類-回歸決策樹分析;Mining Tree模型

煙葉質量與風格特色主要受煙葉外觀質量、物理特性與化學成分等三個方面因素的影響,其中化學成分是煙葉質量與風格特色形成的物質基礎[1-2],是定位煙葉質量風格的重要指標之一[3]。在生產中,通常以單個或多個化學成分的含量以及多種化學成分的比例來表征煙葉質量風格[4]。例如,劉金霞等[5]研究發現濃香型煙葉總氮、煙堿、降煙堿含量較高,而清香型煙葉的總糖、還原糖含量較高。云南清香型煙葉的特征化學指標可以歸納為糖堿比10-15、煙堿2%左右、總糖25%左右[6]。因此,實現定量化煙葉特征化學成分指標對于理解煙葉質量及風格形成具有重要的意義。

由于煙葉的化學成分指標多而復雜,通常利用相關分析[3]、通徑分析[3]、逐步判別分析[7]、因子分析[8]、聚類分析[9]等多種數量統計方法進行煙葉特征化學指標的分析與篩選。然而,由于各個化學成分指標間關系的不確定性與復雜性,導致這些統計方法很少能實現對煙葉特征化學成分進行定量化和篩選,更難以系統性地建立煙葉的特征化學指標識別模型。分類-回歸決策樹(Classification and Regression Tree approaches,C&RT)分析提供了一種可以從大量指標中篩選出特征指標并進行定量化的方法[10],它分析過程不需要預先了解相關自變量間的內在聯系,同時由于采取非參數性檢驗,自變量可以是連續變量或者分類變量,非常便于數據的挖掘與分析[11]。本研究利用基于分類-回歸決策樹方法的Mining Tree模型對不同省份煙葉化學成分進行分析,篩選出不同區域煙葉的特征化學指標,以期為理解煙葉質量與風格特色的形成機理與調控措施的研究提供理論與技術支持。

1 材料與方法

1.1 煙葉樣品

本論文研究中共收集到本課題組以及合作伙伴2005~2009年在湖南省、河南省、福建省和云南省等4省份所開展煙葉試驗中的1040份烤煙煙葉樣品,其中各省分別有169、142、210、519份樣品。主要的烤煙品種為K326、中煙101、中煙100、云煙87、云煙85、紅花大金元、NC89、NC82、翠碧1號、G80等10個品種,煙葉等級為X2F、C2F、C3F、B2F等4個等級。

為了對Mining Tree模型所篩選出的煙葉特征化學指標正確性進行驗證,選取《中國煙草科學技術數據庫》(http://sjk.ztri.com.cn/tobacco/index.jsp)之“煙葉主要化學成份分析數據庫”中湖南省、河南省、福建省、云南省等4省份2006~2007年共計331個煙葉樣品進行特征化學成分指標正確性的驗證。在驗證煙葉樣品數據庫中,烤煙品種為K326、中煙100、云煙87、云煙85、紅花大金元、NC82、翠碧1號、G80等8個品種,煙葉等級為X2F、C2F、C3F、B2F等4個等級。

1.2 煙葉化學成分指標

研究共選取水溶性總糖、總植物堿、蛋白質、總氮、還原糖、總揮發酸、總揮發堿、石油醚提取物總量、醚提取物中性總量、醚提取物酸性總量、醚提取物堿性總量、pH值、鉀(K2O)、氯離子、硝酸根、硫酸根、灰份、水溶性灰份堿度、氮堿比、糖堿比、鉀氯比等21個化學指標進行區域煙葉特征化學指標的分析與篩選。相關化學指標的測定方法參照文獻[12-14]進行。

1.3 Mining Tree模型

Mining Tree是PS-Explore NC軟件中數據分析模塊之一,它提供了一種簡單易用從大批量數據組中挖掘數據組間相互關系與未知趨勢的工具[15]。Mining Tree模型基于分類-回歸決策樹方法(C&RT,Classification and RegressionTree)進行數據的統計分析[10-11],它通過結合逐步線性回歸與回歸樹[16]方法去識別出相關的自變量[16]。如圖1所示,Mining tree模型通過對多個有效自變量(諸如A、B、C、D等)按一定規則進行連續二分處理(successive dichotomy),最終完成對因變量X的產生進行合理的分析與解釋[11,17]。即在對自變量進行連續二分處理過程中,產生不同的自變量分段組合(Segment,SNr.),以分段SNr.5為例,概率p值為自變量A(數值≤…)、B(數值≤…)、C(數值>…)可以解釋因變量X的概率,分析過程如下圖1所示。

圖1 Mining Tree模型數據分析示意圖Fig.1 Mining Tree model for data analysis

在Mining Tree模型分析中,自變量可以是連續變量或者分類變量,連續變量、分類變量分別采用F-test、Chi2-test方法進行顯著性檢驗分析[11],本研究中顯著性檢驗水平為P<0.05。由于因變量可能受到眾多自變量的影響,在模型對自變量進行連續二分處理中,本研究中自變量可以解釋的最小分段大小(segment size)設置為因變量總樣本數的5%,即自變量最低可以解釋因變量的5%形成原因。

2 結果與分析

2.1 煙葉化學成分指標

不同省份煙葉化學成分數據的統計分析見表1。

煙葉水溶性總糖含量湖南省(25.66%)和河南省(23.91%)均低于福建省(30.63%)和云南省(30.22%)。

湖南省煙葉的總植物堿(2.88%)、總氮(2.59%)、總揮發堿(0.35%)、石油醚提取物總量(6.28%)、水溶性灰份堿度(0.81)、氮堿比(0.96)等6項化學指標數值最高;

河南省煙葉的醚提取物中性總量(11.3 mg/g)、醚提取物酸性總量(127.99 μg/g)、氯離子(0.40%)、灰分(12.69%)等4項化學指標數值最高;

福建省煙葉的蛋白質(5.19%)、還原糖(27.60%)、總揮發酸(0.31%)、醚提取物堿性總量(5.75%)、鉀(2.77%)、硫酸根(1.74%)、糖堿比(11.73%)、鉀氯比(12.09%)等8項化學指標數值最高;

云南省煙葉僅有pH值(5.45)、硝酸根(0.10%)等2項化學指標數值最高。

表1 不同省份煙葉主要化學指標描述性統計Tab.1 Statistical summary of chemical components of flue-cured tobacco of different provinces %

2.2 煙葉特征化學指標

利用Mining Tree模型對不同省份煙葉21個化學指標進行分類-回歸決策樹(C&RT analysis)統計分析,如表2所示,4個省份共篩選出14個煙葉特征化學指標。對于不同省份煙葉特征化學指標數量,湖南省篩選出8個特征化學指標,河南省煙葉篩選出6個特征化學指標,福建省煙葉篩選出5個特征化學指標,云南省煙葉篩選出9個特征化學指標。

在所有篩選出來的特征化學指標中,鉀和硝酸根這兩個指標為4省煙葉共有的特征化學指標。醚提取物酸性總量和鉀氯比兩個指標為湖南省煙葉所獨有,總植物堿為河南省煙葉所獨有,水溶性總糖和硫酸根兩個指標為云南省煙葉所獨有。

2.3 煙葉特征化學指標定量化

利用Mining Tree模型對湖南省煙葉特征化學成分進行定量化分析,共產生18個分段組合(Segment),各分段組合對于湖南省煙葉的識別概率p最高為0.658,其特征化學指標分段組合為:還原糖(≤24.93%)、鉀(>1.98%)、pH值(≤5.37)。利用該分段組合從4省煙葉中篩選出湖南省煙葉的正確率為65.8%。

對于河南省煙葉,Mining Tree模型共計算出13個分段組合,各分段組合的識別概率p最高為0.776,其特征化學指標分段組合為:鉀(≤1.98%)、灰分(>11.03%)、水溶性灰份堿度(≤0.49)、硝酸根(≤0.06%)。

表2 不同省份烤煙煙葉主要特征化學指標Tab.2 Specific-chemical component of flue-cured tobacco of different provinces

表3 湖南省煙葉特征化學成分指標的定量化Tab.3 Overview of specific-chemical component of flue-cured tobacco of Hunan Province

表4 河南省煙葉特征化學成分指標的定量化Tab.4 Overview of specific-chemical component of flue-cured tobacco of Henan Province

對于福建省煙葉,Mining Tree模型共計算出16個分段組合,各分段組合的識別概率最高為0.914,其特征化學指標分段組合為:還原糖(>24.93%)、鉀(>1.98%)、硝酸根(≤0.06%)、蛋白質(>5.01%)。

對于云南省煙葉,Mining Tree模型共計算出22個分段組合,各分段組合的識別概率最高為0.957,其特征化學指標分段組合為:鉀(≤1.98%)、灰分(≤11.03%)、水溶性總糖(>28.94%)、硫酸根(≤1.43%)。

表5 福建省烤煙煙葉特征化學成分指標的定量化Tab.5 Overview of specific-chemical component of flue-cured tobacco of Fujian Province

表6 云南省煙葉特征化學成分指標的定量化Tab.6 Overview of specific-chemical component of flue-cured tobacco of Yunnan Province

2.4 模型指標驗證

為了進一步驗證Mining Tree模型分析結果的正確性,在《中國煙草科學技術數據庫》中“煙葉主要化學成份分析數據庫”中選取湖南省、河南省、福建省、云南省等四省份煙葉進行特征化學成分指標正確性的驗證。在煙葉特征化學成分指標正確性校驗中,分別選取在模型計算中識別概率(p)最高的分段組合進行不同省份煙葉特征化學成分指標正確性檢驗。

表7 不同省份煙葉特征化學成分指標正確性校驗Tab.7 Validation of results of specific-chemical component of flue-cured tobacco of different provinces

如表7所示,從331個校驗煙葉樣品中,湖南省、河南省、福建省、云南省的單個分段組合的鑒別率(從總樣本中成功篩選出的目標樣本數占總樣本數的百分率)分別為23.40%、27.66%、35.19%、18.58%,其中河南省分段鑒別正確概率達到1,高于模型分段識別概率(0.658);湖南省、福建省分段的鑒別正確概率略高于模型計算的分段識別概率;云南省分段的鑒別正確概率(0.912)略低于模型分段識別概率(0.957)。

3 討論與結論

研究表明,不同省份煙葉的特征化學成分指標有較大的差別,而且特征化學成分指標的數量也有較大的差別。其中,總植物堿、水溶性總糖分別為河南省、云南省煙葉所獨有的特征化學成分指標,這部分解釋了河南省、云南省煙葉分別作為典型性濃香型、清香型煙葉代表的原因。特征化學成分指標數量的影響一方面受到自變量與因變量之間的相關性影響,另一方面還會受到樣本量大小的影響[11]。在4個省份中,利用Mining Tree模型分析所產生的分段組合數以云南省煙葉最多(22個分段組合),以河南省煙葉最少(13個分段組合),這主要是受到數據樣本量大小的影響(519 vs.142)。

在模型指標校驗中,單個分段組合從大樣本數據中的鑒別率在18%~35%間,總體上處于較高的水平,未來在構建地區烤煙化學指標識別特征模型時,可以考慮適當增加分段組合數,以提高識別模型的鑒別率。同時,在構建烤煙化學指標識別模型中,還應該適當對分段組合數量進行敏感性分析,從而能更好的建立烤煙化學指標識別模型。

總體上,分類-回歸決策樹方法可以很好的從眾多化學成分指標中篩選和定量化出煙葉特征化學成分指標,這為進一步理解和分析煙葉質量和風格特色的形成提供了有力的方法與工具支持。同時,在本研究中,僅對區域間煙葉的特征化學成分的差異進行分析,未對煙葉品種、部位等級等方面的影響進行分析研究,未來在系統性建立區域煙葉特征化學成分數據庫中應當適當加以考慮。

[1]唐遠駒.煙葉風格特色的定位[J].中國煙草科學,2008,29(3):1-5.

[2]杜文,譚新良,易建華,等.用煙葉化學成分進行煙葉質量評價[J].中國煙草學報,2007,13(6):25-31.

[3]吳春,王軼,蒲文宣,等.中間香型煙葉特色彰顯度與主要化學成分的相關及通徑分析[J].中國煙草科學,2012,33(4):1-6.

[4]李長江,溫曉霞,孫渭,等.陜南主栽煙草品種化學成分綜合評價與分析[J].西北農林科技大學學報:自然科學版,2013,41(7):67-74.

[5]劉金霞,李元實,黃飛,等.不同香型烤煙化學成分含量的差異研究[J].河南農業科學,2012,41(9):50-52.

[6]張崇范.對煙葉質量的再認識[J].中國煙草,1993,4:12-14.

[7]畢淑峰,朱顯靈,馬成澤.逐步判別分析在中國烤煙香型特色鑒定中的應用[J].熱帶作物學報,2006,27(4):104-107.

[8]于建軍,郭瑋,畢慶文,等.烤煙主要化學成分因子分析和綜合評價[J].浙江農業學報,2010,22(2):244-248.

[9]李國棟,胡建軍,周冀衡,等.基于主成分和聚類分析的烤煙化學品質綜合評價[J].煙草科技 2008,12:5-9,13.

[10]Sonquist J A,Morgan J N.The Detection of Interaction Effects - A Report on a Computer Program for the Selection of Optimal Combinations of Explanatory Variables [M].Ann Arbor: University of Michigan,1964.

[11]Kuchenbuch R O,Uwe B.Re-visiting potassium- and phosphate-fertilizer responses in field experiments and soiltest interpretations by means of data mining [J].Journal of Plant Nutrition and Soil Science,2011,174(2):171-185.

[12]張槐苓.煙草分析與檢驗[M].鄭州:河南科學技術出版社,1994.

[13]肖協忠.煙草化學[M].北京:中國農業科技出版社,1997.

[14]王瑞新.煙草化學[M].北京:中國農業出版社,2003.

[15]VGSPS mbH.PS-Explore-Handbuch [M].Neustadt/Wied,2007.

[16]Lobell D B,Ortiz-Monasterio J I,Asner G P,et al.Combining field surveys,remote sensing,and regression trees to understand yield variations in an irrigated wheat landscape [J].Agronomy Journal,2005,97(1): 241-249.

[17]Strobl C,Malley J,Tutz G.An Introduction to Recursive Partitioning [EB/OL].[2009].http://www.stat.unimuenchen.de.

A classification and regression decision tree method-based model for identifying tobacco growing areas

ZHANG Yi1,2,LI Qiang2,Wang zheng3,ZHANG Yiyang2,ZHOU Jiheng1,2
1 College of Bioscience and Biotechnology,Hunan Agricultural University,Changsha 410128,China;
2 Tobacco Research Institute,Hunan Agricultural University,Changsha 410128,China;
3 China Tobacco Guangxi Industrial Co.Ltd.,Nanning,530001,China

An identification model of chemical components in flue-cured tobacco was established through classification and regression decision tree method (C&RT analysis) based on a database composed of 1040 samples (21 chemical components were tested) of fluecured tobacco collected during 2005 to 2009 in Hunan,Henan,Fujian,and Yunnan provinces Results showed that: (1) a total of 14 specificchemical components were selected from 21 chemical components,among which K2O and NO3-components were selected in each province; (2) Specific-chemical component segments of highest identification rate branch calculated by the Mining Tree model based on C&RT analysis in Hunan,Henan,Fujian,and Yunnan provinces were: reducing sugar (≤ 24.93%),K2O (>1.98%),pH (≤ 5.37) (p=0.658);K2O (≤1.98%),ash (>11.03%),water soluble ash alkalinity (≤0.49),NO3-(≤0.06%) (p=0.776); reducing sugar (>24.93%),K2O (1.98%)>,NO3

-(≤0.06%),protein (>5.01%) (p=0.914); K2O (≤1.98%),ash (≤11.03%),water dissoluble sugar (>28.94%),SO42-(≤1.43%) (p=0.957),respectively.Experimental results validated the significance of applying classification and regression decision tree method in establishing an identification model of chemical components in flue-cured tobacco.

flue-cured tobacco; chemical component; classification and regression decision tree method; Mining Tree model

10.3969/j.issn.1004-5708.2014.06.005

TS411,TS42 文獻標志碼:A 文章編號:1004-5708(2014)06-0028-06

廣西中煙工業有限責任公司項目(1212013022 );紅云紅河煙草(集團)有限責任公司項目(HYHH2012YL03)

張毅(1985—),博士,講師,主要研究方向為養分資源管理、煙草營養,Email:zyi1219@163.com

周冀衡(1957—),本科,教授,主要研究方向為煙草生理與生物化學,Email:jhzhou2005@163.com

2013-11-12

猜你喜歡
化學特征分析
隱蔽失效適航要求符合性驗證分析
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
抓住特征巧觀察
奇妙的化學
奇妙的化學
奇妙的化學
電力系統及其自動化發展趨勢分析
奇妙的化學
主站蜘蛛池模板: 国产jizzjizz视频| 亚洲三级视频在线观看| 久久综合九色综合97网| 成人国产免费| 色婷婷成人| 亚洲婷婷六月| av在线手机播放| 最新无码专区超级碰碰碰| 国产精品视频久| 亚洲国产中文欧美在线人成大黄瓜 | 欧美综合在线观看| 国产区福利小视频在线观看尤物 | 日本不卡在线| 国产福利免费在线观看| 国产小视频在线高清播放| 国产成人精品高清不卡在线| 日韩av手机在线| 国产区人妖精品人妖精品视频| 蜜臀AVWWW国产天堂| 熟女视频91| 亚洲天堂网视频| 青青国产视频| 91偷拍一区| 中文字幕 91| 亚洲伊人久久精品影院| 啪啪永久免费av| 伊人国产无码高清视频| 国产人成在线视频| 亚洲午夜久久久精品电影院| 91成人在线观看视频| 欧美在线视频不卡| 亚洲天堂精品在线| 亚洲an第二区国产精品| 国产欧美日韩资源在线观看| 蜜臀av性久久久久蜜臀aⅴ麻豆| 亚洲日韩精品综合在线一区二区| 成人午夜免费观看| 亚洲日本在线免费观看| 亚洲天堂伊人| 日韩欧美中文字幕一本| 亚洲中文精品久久久久久不卡| 国产欧美高清| 亚洲男人在线| 久久无码av三级| 天天干天天色综合网| 中文字幕在线日本| 日韩AV手机在线观看蜜芽| 亚洲天堂视频在线播放| 国产亚洲精品自在线| 呦女亚洲一区精品| 无码一区中文字幕| 亚洲性一区| 国产女人在线视频| 日韩欧美高清视频| 日韩成人在线网站| 亚洲另类色| 福利国产微拍广场一区视频在线| 久久精品人人做人人综合试看| 国产办公室秘书无码精品| 啊嗯不日本网站| 精品一区国产精品| 乱人伦99久久| 国产午夜无码专区喷水| 亚洲性影院| 亚洲欧美另类专区| 国产激情无码一区二区APP| 国产精品免费p区| 无码国内精品人妻少妇蜜桃视频| 国产精品第5页| 国产欧美日韩视频怡春院| 午夜欧美在线| 四虎国产成人免费观看| 亚洲天堂首页| 国产jizz| 久久国产精品77777| 99热这里只有免费国产精品| 国产真实二区一区在线亚洲| 国产亚洲视频中文字幕视频| 996免费视频国产在线播放| 久久免费精品琪琪| 免费看一级毛片波多结衣| 福利视频久久|