余羅兼, 童昕, 沈國浪, 李占福
(1. 華僑大學(xué) 機(jī)電及自動(dòng)化學(xué)院, 福建 廈門 361021;2. 福建工程學(xué)院 機(jī)械與汽車工程學(xué)院, 福建 福州 350108)
隨著我國城鎮(zhèn)化水平及基礎(chǔ)設(shè)施建設(shè)的快速發(fā)展,天然砂消耗量急速增長,天然河砂資源日趨緊缺.人工砂的重要性也就日趨明顯,將充當(dāng)混凝土細(xì)骨料的補(bǔ)充材料、甚至完全取代天然砂[1].在巖石分類的研究上,最為傳統(tǒng)的做法就是采用人工方式在偏光顯微鏡下對(duì)巖石薄片圖像進(jìn)行人工鑒定,這需要專業(yè)人員進(jìn)行判讀,工作量大且易受到主觀因素影響[2].劉鳳英等[3]提出采用BP神經(jīng)網(wǎng)絡(luò)對(duì)巖石的氧化物含量為特征量建立分類模型.袁穎等[4]提出采用主成分分析的遺傳算法和支持向量機(jī)相結(jié)合的算法,同樣對(duì)巖石的氧化物含量為特征量建立分類模型.Harmon等[5]采用激光誘導(dǎo)擊穿光譜系統(tǒng)(LIBS)采集巖石光譜數(shù)據(jù),結(jié)合偏最小二乘判別分析法(PLS-DA)識(shí)別火山巖的類型.
人工砂開采后需要經(jīng)過機(jī)械破碎、篩分等工序制成機(jī)制砂.在破碎、篩分的過程中,自然可以形成一些表征人工砂石骨料特征的物理量.因此,本文提出采用遺傳算法(GA)-支持向量機(jī)(SVM)分類模型,對(duì)破碎、篩分后的人工砂石骨料物理特征量進(jìn)行訓(xùn)練,建立骨料分類模型.

圖1 GA優(yōu)化SVM算法流程Fig.1 Flow chart of GA optimized SVM algorithm
支持向量機(jī)(SVM)是由Vapnik等提出的一種研究小樣本、小概率事件的,基于統(tǒng)計(jì)學(xué)習(xí)理論的神經(jīng)網(wǎng)絡(luò)模型[6].其基本思想就是通過一個(gè)非線性映射,將數(shù)據(jù)映射到高維特征空間,將實(shí)際問題轉(zhuǎn)化為一個(gè)帶不等式約束的二次規(guī)劃問題[7],即尋找一個(gè)最優(yōu)超平面進(jìn)行分類[8].
遺傳算法(GA)是基于達(dá)爾文生物進(jìn)化過程啟發(fā)的優(yōu)化算法[9].其將每一個(gè)解t看作染色體中的基因編碼,通過反復(fù)的基因重組、突變等操作生產(chǎn)新的基因編碼,最終求得O(t)的最優(yōu)解t*.
GA優(yōu)化支持向量機(jī),主要是優(yōu)化SVM的懲罰參數(shù)C和核參數(shù)g,其算法流程如圖1所示.具體有如下5個(gè)主要步驟.
步驟1對(duì)數(shù)據(jù)進(jìn)行預(yù)處理.對(duì)訓(xùn)練樣本數(shù)據(jù)和測試樣本數(shù)據(jù)進(jìn)行歸一化處理,消除量綱差異.
步驟2染色體編碼與種群初始化.對(duì)SVM的懲罰參數(shù)C和核參數(shù)g進(jìn)行二進(jìn)制編碼[10],并產(chǎn)生初始化種群.
步驟3GA判斷優(yōu)化是否終止.對(duì)種群進(jìn)行選擇、交叉、變異、計(jì)算適應(yīng)度,直至滿足GA終止條件,輸出此次優(yōu)化的最優(yōu)參數(shù).
步驟4SVM精度判定.將最優(yōu)懲罰參數(shù)C和核參數(shù)g代入SVM中進(jìn)行分類,判斷是否符合給定精度;如不滿足,重新進(jìn)行步驟3.
步驟5測試集進(jìn)行分類.將滿足精度的GA-SVM分類模型對(duì)測試集進(jìn)行分類,輸出結(jié)果.

圖2 砂石顆粒破碎試驗(yàn)臺(tái)Fig.2 Gravel crushing test equipment
實(shí)驗(yàn)的人工砂石骨料分別取自寧夏的花崗巖、福鼎的石灰石和浙江的灰綠巖,在砂石顆粒破碎試驗(yàn)臺(tái)(圖2)上進(jìn)行單核破碎實(shí)驗(yàn).


表1 三種巖石破碎物理特征量Tab.1 Three physical characteristics of rock fragmentation
模型建立硬件環(huán)境為Win10,i5,8 GB內(nèi)存,軟件環(huán)境基于MATLAB2018a運(yùn)行.GA-SVM分類模型數(shù)據(jù)采用表1的數(shù)據(jù),每種石頭試件樣品做30組破碎實(shí)驗(yàn),每組破碎實(shí)驗(yàn)數(shù)據(jù)中有10個(gè)特征量,三種石頭試件樣品總共90組數(shù)據(jù);然后,隨機(jī)選擇63組作為訓(xùn)練數(shù)據(jù)集,剩余27組測試數(shù)據(jù)集,并對(duì)其進(jìn)行歸一化處理.
核函數(shù)的選擇對(duì)支持向量機(jī)的性能有著至關(guān)重要的作用,如果核函數(shù)選擇不合適,意味著將樣本映射到一個(gè)不合適的特征空間,將會(huì)導(dǎo)致其性能不佳[11].因此,需要進(jìn)行核函數(shù)選擇的對(duì)比分析.常見的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù),以及Sigmoid核函數(shù).選擇不同的核函數(shù)對(duì)分類結(jié)果進(jìn)行對(duì)比分析,結(jié)果如表2所示.

表2 不同核函數(shù)下的SVM分類效果Tab.2 SVM classification effect under different kernel functions
從表2可知:選用線性核函數(shù)的分類正確率平均值為62.963%,訓(xùn)練平均時(shí)間為36.30 s;而選用徑向基核函數(shù)的分類正確率平均值為66.667%,訓(xùn)練平均時(shí)間為11.83 s.在正確率平均值上,兩者相差不是很大,但在訓(xùn)練平均時(shí)間上,徑向基核函數(shù)訓(xùn)練更快.徑向基核函數(shù)相比線性核能夠處理分類標(biāo)注和屬性的非線性關(guān)系,同時(shí)具有簡單實(shí)用、普適性好的優(yōu)點(diǎn)[12].其他兩種核函數(shù)的正確率平均值遠(yuǎn)遠(yuǎn)低于徑向基核函數(shù).因此,確定SVM的核函數(shù)選擇徑向基核函數(shù).
支持向量機(jī)可以以交叉驗(yàn)證法的準(zhǔn)確率作為適應(yīng)度函數(shù).交叉驗(yàn)證是消除取樣隨機(jī)性造成訓(xùn)練偏差的方法,使用交叉驗(yàn)證能夠有效評(píng)價(jià)訓(xùn)練模型性能,提升模型穩(wěn)定性與泛化能力[13-14].采用K折交叉驗(yàn)證方法,核函數(shù)選擇徑向基核函數(shù),支持向量機(jī)暫未經(jīng)過GA優(yōu)化,分別將K取5和10,驗(yàn)證分類效果,結(jié)果如表3所示.
從表3可知:當(dāng)K取5,8,10時(shí),其正確率平均值分別為70.370%,56.790%,58.025%,訓(xùn)練時(shí)間分別為11.969,21.034,26.401 s.因此,選用五折交叉驗(yàn)證.未經(jīng)GA優(yōu)化的選擇徑向基核函數(shù)、五折交叉驗(yàn)證的SVM分類結(jié)果,如圖3所示.

表3 不同K值下的SVM分類結(jié)果Tab.3 SVM classification results at different K values

(a) 訓(xùn)練集 (b) 測試集圖3 未經(jīng)GA優(yōu)化的選擇徑向基核函數(shù)的SVM分類結(jié)果Fig.3 SVM classification results of RBF kernel function without GA optimization

圖4 GA適應(yīng)度變化曲線Fig.4 GA fitness curve
選用徑向基核函數(shù)的SVM,懲罰參數(shù)C和核參數(shù)g對(duì)SVM的泛化性能有很大的影響[15],因此,采用遺傳算法GA對(duì)其進(jìn)行尋優(yōu).配置SVM核函數(shù)為徑向基核函數(shù),進(jìn)行五折交叉驗(yàn)證,參數(shù)組合尋優(yōu)空間范圍為[0,100],種群規(guī)模選擇為50,進(jìn)化迭代次數(shù)為300次,交叉概率和變異概率選擇默認(rèn)值,結(jié)果分別如圖4,5所示.

(a) 訓(xùn)練集 (b) 測試集圖5 經(jīng)GA優(yōu)化的選擇徑向基核函數(shù)的SVM分類結(jié)果Fig.5 SVM classification results with RBF kernel function optimized by GA
從圖4可知:遺傳算法適應(yīng)度隨著迭代次數(shù)的增加而增加,當(dāng)?shù)降?8次的時(shí)候收斂至穩(wěn)定值,可得最優(yōu)懲罰參數(shù)Cbest=1.319 5,gbest=0.217 6.
對(duì)比圖3和圖5可知:在人工砂石骨料分類的模型建立基礎(chǔ)上,與未經(jīng)GA優(yōu)化的SVM相比,經(jīng)過GA優(yōu)化的SVM的巖石識(shí)別正確率提升了約11%,正確率達(dá)到了88.89%.在測試集樣本中,花崗巖的識(shí)別正確率同為100%,識(shí)別錯(cuò)誤的地方都存在于石灰石與輝綠石上.
文中研究了人工砂石骨料分類識(shí)別的方法.在分析了傳統(tǒng)巖石分類工作量任務(wù)大、主觀因素強(qiáng),所提巖石分類方法預(yù)處理成本高等缺點(diǎn)的基礎(chǔ)上,提出了一種能夠直接從破碎工序上識(shí)別骨料成分的算法模型.實(shí)驗(yàn)結(jié)果表明:基于GA-SVM的人工砂石骨料分類模型能夠較好地識(shí)別人工砂石骨料成分,相比BP、PLS算法具有優(yōu)勢,為人工砂石骨料特征上的研究提供了一種新思路.在未來的研究工作中,需要將GA-SVM模型運(yùn)用在其他常見的人工砂石骨料上,進(jìn)行分類模型的建立,進(jìn)一步驗(yàn)證此方法的有效性,為砂石骨料的智能加工打下基礎(chǔ).