孫欽乾,劉萌萌,鄭煥祺,周玉成
(1.山東建筑大學,山東 濟南 250101;2.山東省產品質量檢驗研究院)
氣候艙法是應用廣泛的建材及家具的甲醛釋放量檢測方法之一,因其具有檢測環境與待檢樣品實際使用環境類似的優點,已經逐漸主導未來檢測甲醛的發展方向[1-2]。但氣候艙法存在檢測時間長的問題,如,JIS A1911-2015《Determination of the emission of formaldehyde by building materials and building related products-Large chamber method》標準規定的測試時間最長可達28 天。而建立預測模型來預測艙內甲醛濃度成為了節約時間成本、減少電力消耗的有效途徑。例如已有一階衰減模型[3]、灰色模型[4]及傳質模型[5]等預測模型的應用。但上述模型多應用于建材的VOC釋放量預測,專用于人造板家具甲醛釋放量的預測模型較少。近年來,支持向量機因其性能的優越性,已獲得諸多應用。如使用SVM 解決液壓泵壽命預測問題[6]、衛星熱平衡溫度預測問題[7]及巖體高邊坡位移預測問題[8]。上述文獻中所用數據與氣候艙內甲醛濃度變化規律類似,都是具有單調趨勢的時間序列。基于上述因素,本文將SVM 應用到甲醛濃度預測中來。
研究表明,采用降噪算法對數據進行處理后再采用SVM 建模會取得更優的預測結果[9]。互補集合經驗模態分解[10]可以對非線性、非平穩數據進行自適應分解,將噪聲與有效信息進行分離,適用于甲醛濃度數據的降噪。采用智能優化算法優化SVM 參數也是提升模型預測精度的有效手段。遺傳算法、退火算法等智能優化算法已被大量學者所采用。多種群遺傳算法在遺傳算法的基礎上進行了優化,降低了陷入局部最優的可能性[11],適合對SVM進行參數尋優。
本文采用CEEMD 算法對甲醛濃度數據進行降噪處理,利用MPGA 優化SVM 參數,建立CEEMDMPGA-SVM 預測模型,對氣候艙內家具的甲醛濃度進行預測。
理想條件下氣候艙內甲醛濃度變化趨勢是一條會在短時間快速達到峰值,隨后開始逐漸衰減的曲線。但受艙內溫濕度波動及檢測誤差等因素的影響,使得檢測數據會存在失真,呈現出一定的波動性。選用合適的濾波方法濾除干擾成分,有助于提高SVM模型的預測性能。CEEMD 算法對經驗模態分解(Empirical Mode Decomposition,EMD)進行了優化,在EMD 基礎上采用多次增添白噪聲的方法較好的解決了模態混疊問題,避免了噪聲和有效信息無法被正確的分離的問題。
本文采用CEEMD 算法對甲醛濃度數據進行降噪,步驟如下。
⑴設某家具的甲醛濃度數據序列為C,將C中加入k次幅值相同但正負相反的隨機白噪聲+ni(t)及-ni(t),可得

⑶通過公式⑵對分解后的第j個IMF分量IMFj進行求解。

其中,IMFij與IMF-ij分別表示第i次加入正白噪分解后獲得第j個IMF分量與第i次加入負白噪聲后分解獲得的第j個IMF分量。分解后的趨勢項R可通過公式⑶進行求解

其中,Ri與R-i分別代表第i次加正白噪聲、負白噪后分解后獲得相應的趨勢項。經公式⑵與公式⑶的集總平均后,添加的正負白噪聲被相互抵消。
⑷C經過CEEMD 分解后,波動項與趨勢項實現了大致分離。得到若干個IMF分量及趨勢項R。通過極值點數量的多少可判斷該分量波動性的強弱,將極值點數量與數據總量之比大于0.2 的IMF分量進行剔除。而對于波動較小的IMF分量不做處理,以免因造成有效信息的損失。將剩余IMF分量與趨勢項R進行重組即可得到降噪后的甲醛濃度數據序列。
支持向量機的回歸預測算法被稱為支持向量回歸,SVM 的基本原理是將訓練數據轉化到一個高維度的空間中。建立一個超平面ωTx+b=0,使樣本xi滿足公式⑷的約束條件

其中,ωT代表該超平面的法向量,b是常數項,ε是容忍偏差,ξ與是松弛變量。
超平面兩側間距ε之間的范圍被稱為間隔帶,SVM 的目地是使樣本數據全部落入間隔帶內,但這往往難以實現,因此引入松弛變量ξ與,容許少量樣本數據不在間隔帶內。SVM 要求使間樣本點盡可能在間隔帶內的同時,還要求總體損失最小,這就變成了一個如公式⑸所示的最優化問題。

其中,c為懲罰系數,決定了SVM對不在間隔帶內的樣本數據的敏感程度,由人工設定。
對式⑸中相關參數可采用拉格朗日乘子法求解。參數確定后,即可獲得SVM模型函數:

其中,?表示將數據轉化到到高維度空間的操作。
將數據轉換到高維度空間可能會極大的增加計算量。為解決這一問題,SVM 引入核函數的概念,避免在高維空間中進行計算。高斯核函數是泛化性最好應用最廣泛地核函數,其表達式如公式⑺所示。

其中,g值由人工設定。
本文使用MPGA 算法對c,g進行尋優,計算SVM對訓練集的均方誤差(Mean Square Error,MSE)。將MSE作為MPGA算法的尋優標準,MSE定義如下:

其中,m為訓練集數據總量,yi為第i個數據的實際值,f(xi)為SVM 擬合值。通過MPGA 算法選擇使MSE最小的c,g值,并以此訓練SVM,提高SVM 模型的預測性能。使用SVM預測甲醛濃度的過程如下。
⑴ 設濾波后的甲醛濃度序列為Cw,Cw=[c(1),c(2),…,c(t),…,c(T)]。c(t)為t時刻測得的甲醛濃度。對Cw進行重構,如公式⑼所示

其中,n是嵌入維數,其值可根據公式(8)進行確定,選擇使MSE最小的n。
⑵將X的每一行做為SVM的一個輸入,Y與之相對應的每一行做為其標簽。訓練SVM,建立甲醛歷史濃度值與將來濃度值間的映射關系。
⑶通過T和之前時刻的歷史濃度數據預測T +1時刻的甲醛濃度值。即,=f(c(T),c(T-1),...,c(T-n+1))。作為輸入數據可實現對c(T+2)的預測。即,c(T),...,c(T-n+2)),以此類推,最終可獲得T+l時刻的甲醛濃度預測值,實現l步預測。
主要實驗設備:30m3氣候艙。紫外分光光度計。雙路大氣采樣器。
實驗樣品 家具1:人造板衣柜;家具2:人造板儲物柜。
實驗步驟①預處理:將待測樣品在接近實際檢測要求的溫濕度環境中環境下放置120小時。②啟動氣候艙,設置艙內溫度為(23.0±2)℃,濕度為45%±10%,換氣率為1h-1。③將預處理完成試樣轉移至氣候艙內中心位置,以實驗樣品放入氣候艙時為0時刻,第一天在1、3、5、6、7、8、10、13、15、19 小時抽取試樣,此后每日取樣三次,本文實驗持續時間為七天。④使用酚試劑分光光度法對試樣的甲醛濃度進行測定。⑤重復上述步驟,繼續新樣品檢測。
使用家具1 的甲醛濃度數據進行建模,前四天甲醛濃度數據為訓練集,后三天數據為測試集。實驗初期,艙內甲醛濃度存在較短暫的上升期,該部分數據并未參與建模。采用CEEMD 對訓練集數據進行分解,對缺失的夜間檢測數據,采用三次Hermite 插值進行補齊。將極值點數量與數據總量之比大于0.2 的分量IMF1及IMF2剔除后重組剩余IMF分量及趨勢項R。圖1展示了濾波后的甲醛濃度數據序列與原始數據序列的對比,其中,“o”為原始數據,“*”為濾波后數據。

圖1 濾波數據與原始數據對比圖
再次對濾波后數據進行三次Hermite 插值,將其變為等間距序列,并進行歸一化。利用MPGA 優化SVM參數。參數值如表1所示。

表1 參數取值表
用上述參數訓練CEEEMD-MPGA-SVM,模型的預測效果如圖2所示。

圖2 CEEMD-MPGA-SVM模型預測結果圖(家具1)
圖2中“*”為原始數據,“◇”為本文模型為對訓練集的擬合結果,“o”表示對測試集的預測結果。從圖2可以觀察到預測結果與實際數據基本吻合。為了進一步證明CEEMD-MPGA-SVM 的泛化能力及預測效果,分別采用該模型與MPGA-SVM、SVM 及應用較廣的一階衰減模型對家具1 及家具2 甲醛釋放濃度進行預測。預測結果如表2所示。

表2 CEEMD-MPGA-SVM、MPGA-SVM、SVM及一階衰減模型預測結果對比
從表2 可以看出CEEMD-MPGA-SVM 對預測效果最佳,證明了本模型的優越性。MPGA-SVM 模型預測結果遜于本文模型,這是因為訓練集中包含噪聲,使得SVM 在訓練時對噪聲進行了擬合,影響了預測效果。單一SVM 模型預測同樣不佳,不加選擇的采用默認參數進行建模具有一定盲目性。一階衰減模型的預測效果最差,該模型嚴重了低估甲醛濃度值。
針對氣候艙法存在檢測周期長,耗能大的問題,本文提出了CEEMD-MPGA-SVM 甲醛濃度預測模型。采用CEEMD 算法對采集的甲醛濃度數據中的噪聲和有效信息進行了充分的分離,降低了噪聲對SVM的干擾,提高了模型的抗干擾性能。為驗證CEEMDSVM 模型的泛化能力及預測性能,使用本模型及現有模型分別對兩種不同家具的甲醛濃度進行預測,本文提出的預測模型預測效果最佳,預測誤差在6%以內,這對縮短氣候艙法檢測周期及節能減排具有一定積極意義。本研究僅對氣候艙內甲醛濃度進行了預測,在未來可進一步研究,將其推廣到室內環境的甲醛預測中來。