向+東++陳+宇++陳廣勝



摘要:針對傳統木材紋理分類的準確率低且難度大的問題,依據LBP(局部二值)算子和AD-ABOOST(自適應增強)算法理論,提出了LBP-ADABOOST模型對木材紋理進行識別分類,通過均勻旋轉不變特性與原始LBP算子相融合,提取紋理的特征值,結合自適應增強算法,從而訓練得到每類紋理所對應的分類器模型參數,構造分類器,實現對木材紋理準確高效分類,實驗結果表明相比于BP神經網絡,SVM支持向量機等分類算法,該模型的實驗結果誤差率為4%左右,準確率高,實用性強,
關鍵詞:木材紋理分類;LBP算子;ADABOOST算法;分類器
DOI:IO.15938/j.jhust.2015.02.011
中圖分類號:TP391.4
文獻標志碼:A
文章編號:1007-2683(2015)02-0057-06
0 引 言
木材紋理分類是木材優化利用過程的重要部分,木材紋理結構精細復雜、無規律的天然屬性,使得紋理分類一直是木材學的前沿課題.針對不同的研究,國內外學者提出了不同的特征提取及紋理分類算法,非負矩陣分解,灰度共生矩陣法,馬爾可夫隨機場,尺度不變特征變換法等存特征提取方面取得了一定的突破,而常用的分類算法有BP神經網絡,SVM支持向量機,決策樹,極限學習機等.大多紋理分類模型基于以上算法的結合,且取得了一定的成果,此外,我國對于木材紋理分類的研究起步較晚,初期主要是對國外的經驗總結,優化傳統的分類算法,現階段我國的紋理分類技術發展較好,但也存在一定缺陷,主要由于實際應用的訓練樣本在個體之間存在著差異,導致分類算法對分類結果的差異性較大.如何提高木材紋理分類的準確性至關重要,也將是本文的重點.
近些年,一種簡單高效的紋理特征分析方法——局部二值模式(logical binary pattern,LBP)成為了眾多學者研究的對象,在描述、提取局部紋理特征方面取得了很好的效果.此外,Adaboost自適應增強算法是通過訓練樣本特征得到弱分類器,對弱分類器的線性組合得到最終的強分類器,進行分類學習,其在機器學習和數據挖掘方面應用較廣.基于以上表述,本文采用LBP與ADABOOST的融合嘗試進行木材紋理分類,且這種分類算法在木材紋理分類方面應用極少.經實驗,本文提出的基于LBP-ADABOOST模型的木材紋理分類算法達到預期目的,并且正確率明顯高于BP神經網絡,SVM支持向量機,不失為木材紋理分類提供一種有效方法.
1 特征提取
局部二值模式(logical binary pattern,LBP)最早是由Ojala等在1996年提出,是一種描述圖像局部紋理特征的算子,原始的LBP算子定義為在3×3的窗體內,以窗體中心像素為閾值,與相鄰的8個像素的灰度值比較,若周圍像素值大于中心像素值,則該像素點的位置被標記為1,反之為0.這樣,3×3領域內的8個點可產生8bit的無符號數,即得到該窗體的LBP值,并用這個值來反映該區域的紋理信息,如圖l所示:
隨著LBP算子在圖像中的應用,擴展定義一個半徑為R(R>O)的圓形鄰域,B(B>O)個鄰域像素點均勻分布在圓周上面.設定該鄰域中心像素值是C,則C可用該鄰域內的B+1個像素的函數來定義,即其中:gc為中心像素值;g0,g1,gb-1為B個鄰域像素值.中心像素的坐標是(Xc,Yc),則其鄰域坐標(Xi,Yi)為:
當坐標(Xi,Yi)不在中心,通過雙線性內插法,將鄰域的像素值減去中心的像素值計算得到局部的紋理特征像素值C:
假定在實際情況中中心像素值與鄰域像素值的差值g0-gc,gb-1-gc獨立于gc,則(3)可表示為:
由于c(g。)代表的是中心點的像素值,與圖像的局部紋理特征無必然聯系,故可以忽略不計,得到:
上式(5)中的像素差值描述了每個紋理模式,若紋理不受像素值單調變化,只須考慮差值符號即可:
由此可以得到一個B為二進制數,乘以相應的權重2i求和得到LBP特征值:
原始LBP算子是灰度不變的,但不是旋轉不變的,圖像經過旋轉后可得到不同的LBP值.為了便于描述圖像信息,針對圖像旋轉之后還可以得到相同的LBP值,Maenpaa等人提出具有旋轉不變的LBP算子(rotation invariant LBP),不斷旋轉圓形鄰域得到LBP值,取其最小的作為鄰域的LBP值,表述如下式:其中ROI(x,i)是旋轉函數,表示將x的二進制數按位循環右移i次,
但隨著鄰域采點集數的增加,二進制模式的種類急劇增加,達到2B個,這種數量無論是對紋理特征的提取,紋理的分類都是不利的.針對二進制模式的降維問題,Ojala提出一種均勻模式(uniform pat-tern).均勻模式即根據編碼模式出現頻率的高低,在圓形二進制編碼中,至多有兩個0到1或1到0的變化,表示如下:
上式的結果滿足U≤2的模式時稱為均勻模式,用LBP表示,通過改進,二進制的模式減少,且不會丟失信息,使得原來2B種減少到B(B-1)+2種,降低了特征矩陣的維數.
基于以上兩種性質的優越性,可以將LBP的旋轉不變性與均勻模式結合得到更好的效果,稱為旋轉不變均勻模式用符號LBPriu2表示,定義如下:其中:U(LBPb,r)的計算方法是(10)的表述,該模式下不儀保留了圖像的紋理特征,而且鄰域二進制編碼的種類降到了B+2種,大幅減少了特征總量,本文采用了旋轉不變均勻模式LBP算子提取特征值,并對比了幾種模式下不同分布情況,如圖2所示.可以看出LBP算子在均勻旋轉不變模式下的特征維數相對較少,同時保留了圖像信息,效果最佳,
2 算法原理
1995年SChapire和Freund提出的Adaboost算法,相對于Boosting算法,其自適應在于:前一個分類器分錯的樣本會被用來訓練下一個分類器.Asaboost算法訓練弱分類器的錯誤率相對較大,但是只要它的分類效果比隨機猜測效果要好即可接受,通過對弱分類器的線性組合得到最終的強分類器.同時,Adaboost算法也是一種迭代算法,它允許在每一輪的訓練中加入一個新的弱分類器,直到達到某個預定足夠小的錯誤率.每次訓練樣本都被賦予一個權重,表明它被某個分類器選人訓練集的概率,如果某個樣本特征已經被準確的分類,那么存構造下一個分類器的時候,它再次被選人訓練集的概率會被降低;相反,若沒有準確的分類,那么他的權重就會得到提高,選人下一個分類器訓練集的慨率增大.通過上述迭代過程,Adaboost算法主要將聚焦那些較“困難”的分類樣本上面.