李歲月,陳 柳
(武漢理工大學 自動化學院,湖北 武漢 430070)
建筑物輪廓的提取和分類識別在軍事目標識別、城市建設、抵御和減少災難等上有很高的應用[1],提高建筑物的提取精度和效率對城市規劃、三維城市重建等有重要意義。搭載在無人機上的電荷耦合器件(Charge Coupled Device,CCD)攝像機能輕易地捕捉到大量的地物和空間信息[2],但受環境因素影響較大,城鄉建筑密度差異較大,分布不規則導致不利于紋理[3]的分析。因此,作為無人機視覺系統中最為重要的技術,利用數字圖像圖像處理技術和前沿的計算機視覺理論來實現復雜環境下的建筑物檢測與提取具有重要意義。
本次研究用于獲取數據源采用的是普通民用大疆精靈系列精靈3無人機,于2017年冬季在武漢市某實驗小區上的70~200米的飛行高度上收集的一組航拍圖像。無人機在作業時受到航拍姿態、天氣和高度等因素影響,會有模糊等崎變的現象發生,在進行特征提取之前要進行預處理,才能排除干擾提取出更多的特征,使算法更加高效。
采用限制對比度自適應直方圖均衡重新分布亮度比例來提高無人機圖像的對比度,能夠保留圖像的細節特征。對比度受限的自適應直方圖均衡化(Contrast Limited Adaptive Histogram Equalization,CLAHE)是對自適應直方圖均衡化(Adaptive Histgram Equalization,AHE)的優化,能夠抑制AHE放大同區域間噪聲的影響,CLAHE算法原理是預先設置一定的閾值裁剪直方圖來抑制放大的幅度,并將裁剪掉的部分均勻地分布到直方圖的其他部分。算法過程為:首先把源圖像分為3塊;其次,統計每個子塊的直方圖,裁剪門限值后對直方圖均衡化;最后,線性插值重構、重鏈接,則得到最后的圖像方法。
極大值穩定區域(Maximally Stable Extremal Regions,MSER)[5]是一種類似分水嶺圖像的分割與匹配算法,近年來MSER多應用于場景文本檢測并取得了非常好的效果。最大極穩定區域是指對于A1,A2,……,An-1,An,n∈N包含局部極值區域集,滿足An-1∈An,若區域變化率在nmax處取得極小值時,則區域Anmax為最大極穩定區域。極值區域反映的就是集合中的像素灰度值總大于或小于其鄰域區域像素的灰度值。MSER對每一個局部極值區域進行閾值劃分,尋找一系列閾值集來實現局部圖像變換。對于最大極穩定區域,通過局部閾值集操作,區域內的像素數量變化是最小的。
David Nister等[8]2008年發表的論文中改進了Matas等人于2002年提出的MSER算法,該算法計算的時間復雜度要比原著MSER算法小得多,其數學公式為
Qi表示閾值為i時的某一連通區域,?為灰度閾值的微小變化量,qi為閾值是i時的區域Qi的變化率。當qi為局部極小值時,則Qi為最大穩定極值區域。
對預處理之后的無人機圖像建筑區域的MSER特征的提取步驟如下:
像素點排序,極值區域生成,穩定區域判定,區域擬合,區域歸一化。為了同時得到圖像的最大和最小灰度,可以預先將圖像的灰度反轉:Ir=255-I,再進行一遍算法檢測。利用檢測到的灰度以及反值灰度提取出MSER特征點,在此基礎上進行位移操作,在檢驗的圖像中利用橢圓標記計算出圖像的穩定區域的數量,作為提取的MSER特征。
分析本次實驗圖像可知信息清晰、地物結構明顯的特點可知,圖片中包含的目標信息有限,以目標提取物為主,干擾因素如植被、道路、陰影占據較少的信息量。對于分類較少的場景,模糊均值聚類(Fuzzy C-Means,FCM)方法具有速度快、提取效率高、無需進行訓練的優勢,FCM算法可以通過對目標函數的優化而得到各個樣本點對全部類中心的隸屬度,來判斷樣本點所屬類別,以此來對數據進行分類。所以本文選擇基于 FCM 聚類算法來對建筑物進行聚類提取。其算法流程如下:用0~1之間的隨機數初始化隸屬矩陣U,數據的隸屬度和為1;計算聚類中心Ci,i=1......C;計算價值函數,若價值函數小于某個確定的閾值,或者相比上次的改變量小于某個閾值,則停止算法;重新計算U矩陣,進行第二步操作。
在初始化聚類中心后,執行此迭代過程,以此確保FCM收斂于一個最優解。
MSER特征經過聚類之后,產生了若干個聚類中心,也就是說實驗圖片中含有若干棟建筑物,實驗結果說明,經過此種柔性的聚類劃分,可以迅速地得出建筑物的數量。
傳統的sobel,prewitt和新興的canny邊緣檢測方法,經過實驗發現難免還是會存在一些問題,尤其是在解決針對此實驗的情況下,還是不能達到預期的處理效果,在檢測精度以及抗噪能力方面還是有些不足。
對聚類分出來的值進行準確的描述成為提高提取準確率的關鍵,數學形態學被證明為是對建筑圖像區域提取其中有效的方法[4]。利用數學形態學對圖像進行提取的方法是:通過選取恰當的結構元素,膨脹操作,將膨脹后的圖像與原圖像做減法即可得到圖像梯度邊緣。
將聚類之后的圖像對圖像進行交替的開閉濾波以平滑圖像,并用橢圓結構元素分別進行邊緣檢測,最終的圖像邊緣是這些方向邊緣的加權和。
將本文算法提取結果與將人工目釋標注出的建筑區域作基準數據的提取結果進行比較。不同樣本數據的提取結果如表1所示,平均正確率達到了90.36%,誤檢率比較低,漏檢率偏高,這是因為在無人機圖像中建筑區域偏大,灰度變化不明顯,另外建筑邊緣有部分樹木等遮擋物,也是造成誤檢的原因。
表1 不同樣本數據的提取結果
綜上分析,在對無人機圖像進行預處理之后,利用MSER算法對圖像進行特征檢測,采用FCM聚類算法劃分建筑物個數,最后利用形態學來描述建筑區域的算法取得了90.36%的準確率,對無人機圖像建筑區域提取是不錯的方法。另外,在森林地區由于樹木之間的遮擋、城市人造目標例如汽車、水泥路等造成局部存在穩定區域,會對建筑區域檢測提取造成誤擾。如何對無人機圖像特征進行準確的劃分研究以及如何優化MSER特征提取和增強本文算法的穩定性是以后研究工作的方向 。
[參考文獻]
[1]KAAMIN M,IDRIS N A,BUKARI S M,et al.Visual inspection of historical buildings using micro UAV[C].MATEC Web of Conferences, 2017(103):7003.
[2]NISTéR D,STEWéNIUS H.Linear time maximally stable extremal regions[C].Marseille:European Conference on Computer Vision,2018(10):183-196.
[3]SHI C,WANG C,XIAO B,et al.Scene text detection using graph model built upon maximally stable extermal regions[J].Pattern Recognition Letters,2013(2):107-116.
[4]LEFEVRE S,WEBER J.Automatic building extraction in VHR images using advanced morphological operators[J].Urban Remote Sensing Joint Event,2007(20):1-5.