杜國榮,馬莉,馬雁軍,劉德水,3,史素娟,矯海楠,黃越*
基于近紅外光譜和K線圖的煙絲總糖實時監測方法
杜國榮1,2,馬莉2,馬雁軍2,劉德水2,3,史素娟2,矯海楠2,黃越1,2*
1 中國農業大學食品科學與營養工程學院,北京海淀區清華東路17號 100083;2 上海煙草集團有限公司技術中心北京工作站,北京通州區萬盛南街99號 101121;3 北京生命科技研究院有限公司,北京 102211
【背景和目的】針對傳統生產過程監控中對特定化學成分的變化趨勢往往無法實時獲取和判斷的問題,提出一種基于金融領域中K線圖計算和趨勢判斷的質量監控方法。【方法】通過顏色趨勢和長短均線策略實現對批次內、批次間結果的比對分析并預測未來批次走勢,并與常用的誤差棒圖和箱線圖進行對比分析。【結果】牌號A和B的煙絲總糖趨勢判斷準確率最高分別為 75.00%和84.62%,采用K線圖能判斷批次前期、后期的物料化學成分變化。【結論】該方法具有較好的直觀性和時效性,對同類產品的其他生產指標監控具有良好的拓展應用價值。
煙絲;K線圖;過程監控;總糖含量;近紅外光譜
煙絲的質量控制對于卷煙生產非常重要,如何監控煙絲化學成分的變化是實現質量控制和管理的重要環節。近紅外光譜具有樣品前處理簡單、不需要破壞樣品,檢測速度快,易于實現原位實時分析等優點而備受關注[1-3]。近紅外光譜已廣泛應用于煙草行業的各個領域[4-7]。實時分析后的結果可用于快速獲取物料的實時品質,對產品質量的穩定控制有重要的指示作用。實時分析結果的展示方法大多采用點線圖,批次統計結果大多使用柱狀圖、誤差棒圖等方式[7-8]。批次內數據的點線圖可以反應出當前批次化學成分的變化情況,但是因為沒有歷史批次信息,無法看出當前批次和歷史批次的對比情況。多批次的點線趨勢圖[9]、箱線圖[10]或誤差棒圖[11]可以反應出歷史批次成分的變化趨勢,但無法及時查看當前批次的波動情況。
K線圖是金融領用常用的一種技術指標[12-15],最早出現在日本,用于預測大米價格的走勢。K線圖也稱為蠟燭圖,指基于市場特定交易品種的最高價、最低價、開盤價、收盤價4項數據構成的類似于蠟燭形狀的圖形。如果收盤價高于開盤價,則蠟燭圖中空,被稱為陽線[15-16],國內大多用紅色實體表示;反之,則蠟燭圖為實心,被稱為陰線,國內常用綠色實體表示。基于趨勢、反轉理論,結合K線圖和常用的技術指標如移動平均線、平滑異同移動均線、KDJ隨機指標、相關性等,可以快速判斷市場行情的走勢[16]。
煙絲常規化學成分,如總糖、總植物堿、氯、鉀等,是煙絲質量重要的品質指標[17],使用近紅外技術在離線和在線的場景對其實現快速測定。為提高方法準確度,在數據處理時常使用光譜預處理[18-19]、異常樣品識別[20-21]、變量篩選[22-24]等技術以獲取更加穩健的模型。鑒于現有監測結果實時顯示方法較單一,且無法同時對批次內、批次間結果進行快速比對分析,難以快速預測未來批次走勢,本研究以生產過程煙絲總糖含量為研究對象,提出一種基于K線圖的煙絲化學成分監測方法。通過對兩種牌號連續多批次的結果分析,快速判斷批次內、批次間的變化情況及未來批次走勢,具有較好的潛在應用價值。
傅里葉變換近紅外光譜儀(布魯克Matrix-E,德國),連續流動分析儀(Seal AA3,德國)。高純度蒸餾水(≥18 MΩ),冰醋酸(≥99.5%),鹽酸(36%),氫氧化鈉(98%),對羥基苯甲酸酰肼(98%),聚乙氧基月桂醚(Brij 35)溶液,硫氰酸汞溶液,硝酸鐵溶液,氯化鈉溶液等根據實際條件配制。
選取制絲生產過程中間環節的特定時段的煙絲作為分析對象。使用在線傅里葉變換近紅外光譜儀采集370個煙絲樣品的原位近紅外光譜。儀器采用漫反射模式,波數范圍為12000~4000 cm-1,波數間隔約為4 cm-1,共獲得2074個波長點,掃描次數64次,分辨率8 cm-1。按照行業標準[25]YC/T 159—2002測定樣品總糖含量。按照4:1將樣品分為建模集和驗證集,分別含有樣品269個和68個。
牌號A煙絲采集2017年3月4日至2022年7月19日期間的煙絲總糖數據,其中包含該牌號煙絲的生產日期有108 d,其中平均每個批次持續約50 min,最終采集牌號A煙絲合計186個批次的近紅外光譜19802條。牌號B煙絲采集2017年2月21日至2022年7月14日期間的煙絲總糖數據,其中包含該牌號煙絲的生產日期有135 d,平均每個批次持續約50 min,最終采集牌號B煙絲合計339個批次的近紅外光譜36224條。
建模計算使用近紅外光譜儀配套軟件OPUS 6.5(布魯克,德國),計算及作圖采用Python v3.8.8軟件。
K線構造方法采用IQR法去除異常點,IQR為第三四分位數Q3減去第一四分位數Q1的差,大于Q3+1.5*IQR或小于Q1-1.5*IQR的值被認為是異常值。批次前1/2時間的預測指標的中位值作為開盤價,批次后1/2時間的預測指標的中位值作為收盤價,批次數據的90%分位數作為最高價,10%分位數作為最低價。
使用K線圖方法進行判斷時,若前1/2批次的數值大于后1/2的數值,則K線為實心綠柱,反之K線實心紅柱。通過K線是否陰線或者K線顏色可以快速判斷批次前期和后期化學成分變化情況,通過觀察K線的上下影線可以快速觀察出當前批次數據的上10%分位數和下10%分位數。通過構建長短均線,可以用于判斷未來批次數據走勢。當短期均線從下至上穿過長期均線時,未來批次數據有上升的可能,本研究用下穿進行表示;反之,當短期均線從上至下穿過長期均線時,未來數據有下降的可能,用上穿進行表示。本文長期和短期均線計算參數分別選取20和5,該參數可以通過歷史數據進行設置。
預處理方法為一階導數和多元散射校正組合方法,選擇的波段為7502.1~6098.1 cm-1和5450.1~4246.7 cm-1,如圖1A所示,灰色區域為經過預處理后的光譜選定波段區域。在此波段范圍內建立偏最小二乘回歸(PLS)模型(圖1B),模型參數和結果見表1,可知建立模型回歸系數2為99.47%,預測均方根誤差RMSEP為0.385,殘差預測偏差RPD值遠大于3,具有較好的預測能力。

圖1 建模變量分布和模型驗證結果統計圖

表1 煙絲中總糖PLS模型參數統計表
圖2為牌號A的混合煙絲中總糖成分的K線圖,共186個批次。其中,藍色線為5批均線,黃線為20批均線。可以看出該牌號所有批次中煙絲總糖值最小為22.5(質量分數%),最大為28.3。經統計得到,5批均線從上向下穿過20批均共有8次,統計穿越點前5批的5批均值和后5批的5批均值結果見表2。可以看出,8次中有6次突破后的均值小于突破前,準確率為75.00%。短期均線從下向上穿過長期均線一共8次,其中5次判斷正確,隨后均值上升,正確率為62.50%。

圖2 牌號A煙絲總糖含量變化K線圖
通過圖2可以快速判斷出批次生產工程中總糖的變化。批次前期物料總糖低于批次后期時K線主體為藍色,反之為黃色。批次前期和后期總糖變化越大,K線主體柱越長。通過K線圖的上下影線可以快速判斷批次中的極端數值。如圖2中第二個批次,測定值最小值為22.84,最大值為28.17,極差為5.33,明顯不同于其它批次。將該批次數據做折線圖(圖3),該批次持續時間較長,有928個數據點,合計檢測時間接近618 min。經核查該批次數據的批次信息有誤,實際為6個不同的批次,且生產的物料也有所不同,因此批次上下影線差異很大。此外,K線圖也能了解到生產調整或配方調整的實際工況,如在140批次后,總糖數據有明顯的升高,從24%一直增加到27%,可以回溯數據了解到這個階段其實是原料配方的調整階段,從圖中可以明顯看到配方調整前后的目標成分的變化情況。

圖3 牌號A煙絲第二批次總糖含量變化圖
圖4為牌號B的混合煙絲總糖的K線圖,一共339個批次。從K線顏色看出,大部分批次的后期比前期的總糖值要高。同樣地,短期均線和長期均線交叉時數據變化情況見表3。可知,短期均線從上向下穿過長期均線13次,其中11次發生了批次數據數值下降情況,準確率為84.62%。短期均線從下向上穿過長期均線12次,其中10次發生了批次數據數值上升的情況,準確率為83.33%。

圖4 牌號B煙絲總糖含量變化K線圖
表3 牌號B短期均線上下穿長期均線前后總糖變化統計表

Tab.3 Statistics of changes in total sugar before and after the short-term average crossing the long-term average of brand B
采用生產物料質量監控中常用的趨勢變化分析誤差棒圖、箱線圖與K線圖方法進行對比。圖5分別為牌號A和B歷史批次中煙絲總糖含量變化的誤差棒圖。為便于和K線圖比較,圖中誤差棒的上下限分別為批次下十分位和上十分位值。通過誤差棒圖的上下限可以快速判斷批次內總糖的波動情況,通過誤差棒的走勢也可以分析批次的走勢。但是通過誤差棒圖無法快速判斷批次前期、后期總糖的變化情況。如采用K線圖結合長短均線可以更準確的預測未來批次的走勢,通過顏色判斷批次前后總糖的大小變化和數值大小,其相比于誤差棒圖更具有優勢。

圖5 牌號A和B的煙絲總糖含量變化誤差棒圖
圖6分別為牌號A和B的箱線分析圖。從箱線圖的主體可以看出批次數據的上下四分位位置,從上下箱線可以看出批次數據的上下限。和誤差棒圖類似,箱線圖也可用于直觀表達批次總糖的走勢和批次內數據的波動大小,但是無法判斷批次前期、后期的物料化學成分變化。對于最新批次的實時變化情況,這兩種方法的圖形表現都稍遜于K線圖方法。

圖6 牌號A和B的煙絲總糖含量變化箱線圖
本研究以生產過程煙絲總糖含量為研究對象,提出一種基于金融領域K線圖的煙絲化學成分監測方法。正如金融研究中監測實時股票數據,本方法可以實現快速判斷煙絲生產中特定批次的目標成分含量數值的變化情況。同時,通過顏色趨勢可以快速判斷特定批次前期和后期的變化,方便直觀地進行當前批次和歷史批次對比。最后,結合金融領域的長短均線策略,本方法可用于對批次數據走勢的快速判斷,其中,對于A牌號批次趨勢判斷的最高準確率為75.00%;對于B牌號批次趨勢判斷的最高準確率為84.62%。本研究也將現行常用的生產批次監控方法與本方法進行了比對,結果表明本方法在直觀性和實用性上仍具有較大的應用潛力。該方法可用于煙絲其他指標的實時分析如總煙堿、氯、鉀等,具有良好的擴展性。
[1] Shao X G, Bian X H, Liu J J, et al. Multivariate calibration methods in near infrared spectroscopic analysis[J]. Anal. Methods, 2010, 2(11): 1662-1666
[2] Pasquini C. Near infrared spectroscopy: A mature analytical technique with new perspectives e A review[J]. Anal. Chim. Acta, 2018, 1026: 8-36.
[3] 褚小立,陳瀑,李敬巖,等. 近紅外光譜分析技術的最新進展與展望[J]. 分析測試學報,2020, 39(10): 1181-1188.
CHU Xiaoli, CHEN Pu, LI Jingyan, et al. Progresses and perspectives of near infrared spectroscopy analytical technology[J]. J. Instrum. Anal, 2020, 39(10): 1181-1188.
[4] 張翼,楊征宇,葛炯,等. 近紅外分析技術在煙草中的應用[J].計算機與應用化學,2016, 33(02): 251-254.
ZHANG Yi, YANG Zhengyu, GE jiong, et al. The application of near-infrared spectroscopy in tobacco[J]. Comput. Appl. Chem, 2016, 33(02): 251-254.
[5] 邱軍,張懷寶,宋巖,等. 近紅外光譜分析技術在煙草行業的應用[J]. 中國煙草科學,2008, 01: 55-59.
QIU Jun, ZHANG Huaibao, Song Yan, et al. Application of near infrared spectroscopic analytical techniques in tobacco industry[J]. Chin. Tobacco Sci, 2008, 1: 55-59.
[6] 劉華友,周順峰,朱傳才,等. 基于在線近紅外光譜分析的原煙精選均質化調控方法[J]. 安徽農業科學,2021, 49(03): 193- 195.
LIU Huayou, ZHOU Shunfeng, ZHU Chuancai, et al. Raw tobacco selective homogenization regulation method based on online NIRS[J]. J. Anhui Agric. Sci, 2021, 49(3): 193-195.
[7] 王毅,馬翔,溫亞東,等. 近紅外光譜與多元統計方法用于生產過程實時分析[J]. 光譜學與光譜分析,2013, 33(5): 1226-1229.
WANG Yi, MA Xiang, WEN Yadong, et al. Near infrared spectroscopy and multivariate statistical process analysis for real-time monitoring of production process[J]. Spectrosc. Spec. Anal, 2013, 33(5): 1226-1229.
[8] 李偉,馮洪濤,周桂圓,等. Hotelling T2結合多組分NIR校正模型在卷煙生產過程質量監測中的應用[J]. 煙草科技,2014,324: 5-9.
LI Wei, FENG Hongtao, ZHOU Guiyuan, et al. Quality Monitoring in Cigarette Manufacturing Process by Combining Hotelling T2 Statistics and Multicomponent NIR Calibration Model[J]. Tobacco Sci. Tech, 2014, 324: 5-9.
[9] Wang Y, Han F, Zhu L, et al. Line graph or scatter plot? Automatic selection of methods for visualizing trends in time series[J]. IEEE Transactions on Visualization and Computer Graphics, 2018, 24(2):1141-1154.
[10] Larson H J. Moving beyond the bar plot and the line graph to create informative and attractive graphics[J]. Modern Lang. J, 2017, 101(1): 244-270.
[11] Kim J, Lee J S, Jang S J. Drawing guideline for 'hip and pelvis': plot with error bar [J]. Hip Pelvis, 2020, 32(4): 161-169.
[12] Lee K H, Jo G S. Expert system for predicting stock market timing using a candlestick chart [J]. Expert Syst. Appl, 1999, 16(4): 357-364.
[13] Hung C C, Chen Y J. DPP: Deep predictor for price movement from candlestick charts[J]. PLoS ONE 16(6): e0252404.
[14] Lan Q, Zhang D, Xiong L L. Reversal pattern discovery in financial time series based on fuzzy candlestick lines[J]. Syst. Eng. Proc, 2011, 2: 182-190.
[15] Ho T T, Huang Y. Stock price movement prediction using sentiment analysis and candlestick chart representation[J]. Sensors, 2021, 21(23): 7957.
[16] 呂濤,郝泳濤. 基于K線序列相似性搜索的股票價格預測[J]. 計算機應用,2017, 37(S2): 229-235.
LV Tao, HAO Yongtao. Stock price prediction based on K-line series similarity search[J]. J. Comput. Appl. 2017, 37(S2): 229- 235.
[17] 李跑,馬雁軍,馬莉,等. 基于近紅外漫反射光譜和化學計量學方法的曬紅煙常規化學指標的快速測定[J]. 湖南農業大學學報(自然科學版),2018,44(03):251-255.
LI Pao, MA Yanjun, MA Li, et al. Rapid determination of routine chemical index in dark sun-cured tobacco by near-infrared diffuse reflectance spectroscopy and chemometrics methods[J]. J. Hunan Agric. Univ, 2018, 44(03): 251-255.
[18] Shao X G, Leung A K, Chau F T. Wavelet: a new trend in chemistry[J]. Accounts Chem. Res, 2003, 36(4): 276-283.
[19] Bian X H, Wang K Y, Tan E X. A selective ensemble preprocessing strategy for near-infrared spectral quantitative analysis of complex samples[J]. Chemometr. Intel. Lab. Syst, 2020, 197(15): 103916.
[20] Liu Z C, Cai W S, Shao X G. Outlier detection in near-infrared spectroscopic analysis by using Monte Carlo cross-validation[J]. Sci. China, Series B-Chem, 2008, 51(8): 751-759.
[21] 王家俊,李正風,王蘿萍,等. 蒙特卡洛交叉驗證用于偏最小二乘建模數據質量的評價. 計算機與應用化學,2015, 32(12): 1530-1536.
WANG Jiajun, LI Zhengfeng, WANG Luoping, et al. Evaluation of calibration data for partial least squares modeling by using Monte Carlo cross validation. Comput. Appl. Chem, 2015, 32(12): 1530-1536.
[22] Shao X G, Du G R, Jing M, et al. Application of latent projective graph in variable selection for near infrared spectral analysis[J]. Chemometr. Intel. Lab. Syst, 2012, 114: 44-49.
[23] Li P, Du G R, Ma Y J. A novel multivariate calibration method based on variable adaptive boosting partial least squares algorithm[J]. Chemometr. Intel. Lab. Syst, 2018, 176:157-161.
[24] Li P, Du G R, Cai W S. Rapid and nondestructive analysis of pharmaceutical products using near-infrared diffuse reflectance spectroscopy[J]. J. Pharm. Biomed. Anal, 2012, 70: 288-294.
[25] YC/T 159—2002,煙草及煙草制品水溶性糖的測定連續流動法[S].
YC/T 159-2002,Tobaccoa ndt obaccop roducts-Detelrminationo fw ater solubles ugars- Continuousf low method[S].
K-line tracking method of total sugar changes in cut tobacco
DU Guorong1,2, MA Li2, MA Yanjun2, LIU Deshui2,3, SHI Sujuan2, JIAO Hainan2, HUANG Yue1,2*
1 College of Food Science and Nutritional Engineering, China Agricultural University, Beijing 100083, China;2 Technology Center, Shanghai Tobacco Group Beijing Cigarette Factory Co., Ltd., Beijing 101121, China;3 Beijing Life Science Academy(BLSA), Beijing 102211, China
The change of total sugar content in cut tobacco in the cigarettes production is one of the main indicators affecting the stability of the product. Aiming at the problem that the change trend of specific chemical components cannot be obtained and judged in real time in traditional production process monitoring, this study proposed a quality monitoring method based on K-line chart calculation and trend judgment from the financial field. First, based on the data of cut tobacco obtained by online near-infrared spectroscopy, the total sugar content of 525 batches from two brands was analyzed before and after the short-term moving average or the long-term moving average. Comparative analysis of intra-batch and inter-batch results and prediction of future batch trends were successfully realized. Results showed that the highest accuracy rates of judging the trend of total sugar in cut tobacco of brands A and B were 75.00 % and 84.62 %, respectively. Subsequently, the commonly used error bar chart and boxplot were compared with the K-line analysis and the results revealed that the K-line combined with the long and short moving averages can accurately predict the trend of future batches better. This approach has good intuition and timeliness, and has a good expansion and application value for the monitoring of other indicators of similar products.
cut tobacco; K-line; process monitoring; total sugar; near infrared spectroscopy
Corresponding author. Email:huangyue@cau.edu.cn
北京市自然科學基金項目(No. 8222070);興化健康食品產業研究基金(No. 201905);上海煙草集團有限責任公司科技項目(No. K2015-2-017p);上海煙草集團北京卷煙廠有限公司科技項目(No. TP2019-C1)
杜國榮(1984—),博士,高級工程師,主要研究方向為分析化學,Tel:010-59028225,Email:nkchem09@126.com
黃越(1985—),博士,副教授,主要研究方向為食品質量監控和智能化檢測,Tel:15810052357,Email:huangyue@cau.edu.cn
2022-09-27;
2023-06-06
杜國榮,馬莉,馬雁軍,等. 基于近紅外光譜和K線圖的煙絲總糖實時監測方法[J]. 中國煙草學報,2023,29(5). DU Guorong, MA Li, MA Yanjun, et al. K-line tracking method of total sugar changes in cut tobacco[J]. Acta Tabacaria Sinica, 2023,29(5). doi:10.16472/j.chinatobacco.2022.T0274