韓家明,楊忠,陳聰,張秋雁,張馳,賴尚祥,李宏宸,方千慧
1.南京航空航天大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 211106
2.貴州電網(wǎng)有限責(zé)任公司 電力科學(xué)研究院,貴州 貴陽(yáng) 550002
隨著無(wú)人機(jī)技術(shù)的迅速發(fā)展及其在諸多領(lǐng)域中廣闊的應(yīng)用前景[1?4],基于視覺導(dǎo)航的無(wú)人機(jī)自主著陸技術(shù)也得到了廣泛的研究。其中,通過(guò)著陸標(biāo)識(shí)的引導(dǎo)實(shí)現(xiàn)無(wú)人機(jī)的著陸已取得了諸多成果并得到了工程應(yīng)用。文獻(xiàn)[5]中通過(guò)漸近式圖像搜索算法提取降落平臺(tái)各級(jí)圖案的輪廓信息,并利用航跡規(guī)劃方法完成無(wú)人機(jī)在移動(dòng)平臺(tái)上的降落。文獻(xiàn)[6]中通過(guò)支持向量機(jī)(support vector machine,SVM)訓(xùn)練離線分類器,準(zhǔn)確識(shí)別著陸標(biāo)識(shí),并利用改進(jìn)的中值流跟蹤算法對(duì)著陸地標(biāo)進(jìn)行目標(biāo)跟蹤。隨著卷積神經(jīng)網(wǎng)絡(luò)的迅速發(fā)展,基于深度學(xué)習(xí)的方法已逐漸融入到無(wú)人機(jī)視覺導(dǎo)航與自主著陸領(lǐng)域研究中。文獻(xiàn)[7]中通過(guò)橢圓輪廓檢測(cè)與卷積神經(jīng)網(wǎng)絡(luò),快速預(yù)測(cè)出正確的無(wú)人機(jī)著陸標(biāo)識(shí)邊界,并實(shí)現(xiàn)無(wú)人機(jī)的自主著陸。本文設(shè)計(jì)了基于深度學(xué)習(xí)的實(shí)時(shí)目標(biāo)檢測(cè)算法,并通過(guò)圖像分割算法獲取無(wú)人機(jī)著陸標(biāo)識(shí)輪廓信息,減少了環(huán)境因素干擾、降低了圖像處理的運(yùn)算量,對(duì)于無(wú)人機(jī)著陸效率的提升有著十分重要的意義。
著陸標(biāo)識(shí)是基于視覺的無(wú)人機(jī)自動(dòng)著陸的關(guān)鍵部分之一,著陸標(biāo)識(shí)的選取直接影響到無(wú)人機(jī)著陸的效率與成功率。著陸標(biāo)識(shí)的設(shè)計(jì)需考慮以下因素:
1)圖案簡(jiǎn)單直觀,便于視覺系統(tǒng)快速處理;
2)具備足夠的特征,易于辨識(shí),能和背景較好地區(qū)分開;
3)能夠提供足夠的無(wú)人機(jī)著陸所需的引導(dǎo)信息;
4)能夠間接提供位置信息,便于無(wú)人機(jī)的位姿估計(jì)。
本文中采用了一種六邊形著陸標(biāo)識(shí),由一個(gè)六邊形、2 個(gè)直徑較大的圓、一個(gè)直徑較小的圓和一個(gè)等邊三角形組成。著陸標(biāo)識(shí)的主體顏色為紅色,識(shí)別程度較強(qiáng),受光照影響較小。著陸標(biāo)識(shí)中有3 個(gè)直徑不同的同心圓,便于后續(xù)算法在無(wú)人機(jī)不同的飛行高度更好地檢測(cè)出著陸標(biāo)識(shí)中的圓和圓心,防止輪廓信息的遺失。此外,為便于后續(xù)輪廓分割,每個(gè)部分之間用白色進(jìn)行隔斷[8],如圖1(a)所示。為了驗(yàn)證本文中算法的魯棒性,采用一種H 型無(wú)人機(jī)著陸標(biāo)識(shí)[9],如圖1(b)所示。

圖1 本文中著陸標(biāo)識(shí)
本文選擇YOLO 系列算法[10]中的Tiny-YOLO網(wǎng)絡(luò)并進(jìn)行優(yōu)化,Tiny-YOLO 擁有更少的卷積層、更快的檢測(cè)速度以及不錯(cuò)的檢測(cè)精度,可以滿足無(wú)人機(jī)著陸時(shí)視覺導(dǎo)航的實(shí)時(shí)性要求。
Tiny-YOLO 主干網(wǎng)絡(luò)中有7 個(gè)3×3 卷積層,激活函數(shù)為L(zhǎng)eaky ReLU,并通過(guò)批標(biāo)準(zhǔn)化(batch normalization,BN)層進(jìn)行批歸一化處理;6 個(gè)最大池化層,前5 個(gè)為步長(zhǎng)為2 的最大池化層,最后一個(gè)為步長(zhǎng)為1 的最大池化層。網(wǎng)絡(luò)輸入尺寸為416×416 個(gè)像素,在經(jīng)過(guò)5 個(gè)步長(zhǎng)為2 的最大池化層和1 個(gè)步長(zhǎng)為1 的最大池化層后,最終得到的特征圖大小為13×13 像素。網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示。

圖2 Tiny-YOLO 結(jié)構(gòu)
圖2 中虛線框內(nèi)為Tiny-YOLO 的骨干網(wǎng)絡(luò),Conv 代表卷積層,maxpooling 代表最大池化層,Tiny-YOLO 通過(guò)在主干網(wǎng)絡(luò)后接上一定數(shù)量的卷積層和預(yù)測(cè)層構(gòu)成檢測(cè)模塊并對(duì)目標(biāo)進(jìn)行預(yù)測(cè),預(yù)測(cè)信息包括目標(biāo)的類別、置信度以及坐標(biāo)信息。
YOLO 算法中使用由維度聚類得到的先驗(yàn)框,對(duì)邊界框進(jìn)行預(yù)測(cè)。YOLO 中損失函數(shù)包括坐標(biāo)誤差CoodERR、IoU(intersection over union)誤差I(lǐng)oUErr 和分類誤差ClassErr 3 部分,為

本文引入GIoU[11](generalized intersection over union)損失代替YOLO 中的IoU 損失,保留了IoU 對(duì)尺度變化不敏感的優(yōu)點(diǎn),同時(shí)考慮預(yù)測(cè)框與真實(shí)框之間的重疊區(qū)域和非重疊區(qū)域,更好地反映二者的重合度,提升網(wǎng)絡(luò)的精確度。在訓(xùn)練過(guò)程中,引入mixup 數(shù)據(jù)增強(qiáng)方法[12]構(gòu)造新的樣本數(shù)據(jù),通過(guò)數(shù)據(jù)增廣的方法進(jìn)一步提升網(wǎng)絡(luò)的精確度。
3.1.1 自下而上的特征增強(qiáng)
本文在Tiny-YOLO 中嵌入PANet[13](path aggregation network)結(jié)構(gòu),融合了淺層的特征與高層次的語(yǔ)義特征對(duì)特征進(jìn)行復(fù)用。PANet 中,骨干網(wǎng)絡(luò)產(chǎn)生特征圖通過(guò)卷積層減小尺寸;再與下采樣的特征圖通過(guò)側(cè)向連接進(jìn)行相加操作;最后通過(guò)一個(gè)卷積層生成新的特征圖。其中,每個(gè)候選區(qū)域的特征網(wǎng)絡(luò)為新生成的特征圖上池化而生成。
通過(guò)網(wǎng)絡(luò)中具有較大的感受野和豐富的上下文信息的高層次特征與具有高定位精度的低層次特征融合,選擇有效信息并進(jìn)行預(yù)測(cè),對(duì)不同尺寸目標(biāo)檢測(cè)的魯棒性更好,進(jìn)一步提升網(wǎng)絡(luò)模型的檢測(cè)精度。
為了充分利用骨干網(wǎng)絡(luò)中提取的淺層特征,本文中采用了特征塊(feature block)結(jié)構(gòu)對(duì)特征進(jìn)一步提取,如圖3 所示。通過(guò)借鑒MatrixNet[14]的思想,設(shè)計(jì)了密集特征塊(dense feature block)結(jié)構(gòu),如圖4 所示。

圖3 特征塊結(jié)構(gòu)

圖4 密集特征塊結(jié)構(gòu)
通過(guò)將密集特征塊和特征塊輸出進(jìn)行融合并進(jìn)行自適應(yīng)池化,從骨干網(wǎng)絡(luò)中引出的第2、4、6、8、10 層卷積層作為PANet 的輸入。嵌入的PANet結(jié)構(gòu)如圖5 所示。
在Tiny-YOLO 中嵌入PANet 結(jié)構(gòu),可以彌補(bǔ)Tiny-YOLO 網(wǎng)絡(luò)骨干網(wǎng)絡(luò)較淺、特征提取不夠充分的問(wèn)題。本文中構(gòu)造的著陸標(biāo)識(shí)檢測(cè)網(wǎng)絡(luò)Mark-YOLO 結(jié)構(gòu)如圖6 所示。

圖5 本文中PANet 結(jié)構(gòu)

圖6 Mark-YOLO 網(wǎng)絡(luò)結(jié)構(gòu)
3.1.2 網(wǎng)絡(luò)裁剪
在無(wú)人機(jī)等計(jì)算資源受限的平臺(tái)上部署深度學(xué)習(xí)網(wǎng)絡(luò)模型時(shí),需要減少模型所需資源消耗。本文對(duì)卷積層的通道進(jìn)行裁剪,獲取高效的目標(biāo)檢測(cè)模型。
網(wǎng)絡(luò)中每個(gè)卷積層后面都有一個(gè)BN 層,加速網(wǎng)絡(luò)收斂并提高網(wǎng)絡(luò)的泛化能力。BN 層使用小批量(mini-batch)處理靜態(tài)化卷積特征,BN 的計(jì)算方法為

在網(wǎng)絡(luò)模型按通道進(jìn)行稀疏訓(xùn)練過(guò)程中,為將重要通道與不重要通道區(qū)分開,通過(guò)L1 正則化來(lái)進(jìn)行通道稀疏性訓(xùn)練,獲得按通道的稀疏性;采用BN 層中的比例因子 γ作為通道重要性的指標(biāo),為每個(gè)通道分配一個(gè)比例因子,比例因子的絕對(duì)值與通道重要性成正比,裁剪過(guò)程中通過(guò)每個(gè)通道的比例因子決定裁剪與否。稀疏性訓(xùn)練后,引入全局閾值來(lái)確定是否裁剪特征通道,控制裁剪率。同時(shí)引入局部安全閾值,防止卷積層通道被過(guò)度裁剪,維持網(wǎng)絡(luò)結(jié)構(gòu)的完整性。如果特征通道的縮放比例小于全局閾值和本地安全閾值中的最小值,則對(duì)特征通道進(jìn)行裁剪。
由于網(wǎng)絡(luò)檢測(cè)性能對(duì)通道裁剪較為敏感,因此,完成神經(jīng)網(wǎng)絡(luò)的通道裁剪后,需要對(duì)裁剪的模型執(zhí)行微調(diào)操作,使裁剪后的模型從暫時(shí)的性能下降中恢復(fù)。一般采用增量裁剪的策略,逐步對(duì)網(wǎng)絡(luò)進(jìn)行裁剪,增量裁剪策略可以防止過(guò)度裁剪,避免過(guò)度裁剪可能導(dǎo)致的無(wú)法恢復(fù)的網(wǎng)絡(luò)性能的大幅下降,最后獲取最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)與權(quán)重[15]。網(wǎng)絡(luò)裁剪的整體流程如圖7 所示。

圖7 網(wǎng)絡(luò)裁剪流程
3.2.1 灰度化與閾值分割
為減少無(wú)人機(jī)拍攝圖像處理的運(yùn)算量,首先通過(guò)加權(quán)平均法對(duì)圖像進(jìn)行灰度化處理。加權(quán)平均法使用不同的權(quán)值對(duì)R、G、B 3 個(gè)顏色分量進(jìn)行加權(quán)平均,得到灰度圖像。加權(quán)平均法為
Gray(x,y)=0.299R(x,y)+0.578G(x,y)+0.114B(x,y)
式中:Gray(x,y)為得到的灰度圖像;R、G、B分別為3 個(gè)顏色通道的像素分布函數(shù)。
其次,通過(guò)閾值分割對(duì)灰度圖像進(jìn)行處理。閾值分割使圖像中僅存在2 個(gè)灰度級(jí),保留有用的前景目標(biāo)區(qū)域,去除無(wú)用的背景信息,同時(shí)經(jīng)過(guò)處理后的圖像數(shù)據(jù)量更少。本文使用Otsu 法[16]對(duì)圖像進(jìn)行閾值分割,通過(guò)對(duì)圖像進(jìn)行直方圖分析,得出差別最大的2 組像素集合,并依據(jù)此時(shí)的圖像中目標(biāo)和背景的類間方差確定閾值對(duì)圖像進(jìn)行分割。
3.2.2 著陸標(biāo)識(shí)輪廓提取
著陸標(biāo)識(shí)輪廓提取分為邊緣檢測(cè)與輪廓擬合2 部分。
Canny 邊緣檢測(cè)算法[17]具有低錯(cuò)誤率、定位精度良好、邊緣點(diǎn)響應(yīng)單一的優(yōu)點(diǎn)。利用Canny算法對(duì)圖像進(jìn)行邊緣檢測(cè)可以分為4 個(gè)步驟:1)采用高斯濾波器對(duì)圖像進(jìn)行平滑處理,濾除圖像的噪聲;2)采用Sobel 算法計(jì)算圖像中每個(gè)像素點(diǎn)的梯度強(qiáng)度和方向;3)采用NMS(non maximum suppression)算法,消除邊緣檢測(cè)帶來(lái)的雜散響應(yīng);4) 采用雙閾值檢測(cè)確定真實(shí)和潛在的邊緣,即一個(gè)高閾值和一個(gè)低閾值的雙閾值法來(lái)區(qū)分邊緣像素。
輪廓擬合中,本文采用Hough 變換對(duì)著陸標(biāo)識(shí)中的直線和圓進(jìn)行檢測(cè)。Hough 變換檢測(cè)直線方法中,為避免直線斜率不存在時(shí)產(chǎn)生的參數(shù)問(wèn)題,將用斜率k和截距b表示的直線方程式映射到參數(shù)空間中:

通過(guò)這種映射關(guān)系可以將每一條直線與一對(duì)參數(shù)(r,θ)相關(guān)聯(lián)。經(jīng)過(guò)Hough 變換后,平面直角坐標(biāo)系下直線的位置參數(shù)斜率k和截距b可由極坐標(biāo)系下一對(duì)參數(shù)(ri,θi)唯一確定。Hough 變換后,參數(shù)空間上中各正弦曲線都會(huì)交于同一點(diǎn)(rj,θj)。通過(guò)對(duì)參數(shù)空間中各正弦曲線經(jīng)過(guò)的每一點(diǎn)進(jìn)行權(quán)值統(tǒng)計(jì),并求取權(quán)值峰值點(diǎn),即可確定平面直角坐標(biāo)系中的直線[18]。
Hough 變換圓檢測(cè)與直線檢測(cè)思想相似。平面坐標(biāo)系中的圓由圓心的橫、縱坐標(biāo)a、b,圓的半徑r3 個(gè)位置參數(shù)確定:

平面直角坐標(biāo)系中圓上任意一點(diǎn)(xi,yi)映射到參數(shù)空間中對(duì)應(yīng)一個(gè)通過(guò)ai、bi、ri這3 個(gè)參數(shù)確定的圓,圓心為ri。由于圓的半徑未知,坐標(biāo)(xi,yi)映射到參數(shù)坐標(biāo)系中為圓錐體。平面坐標(biāo)系中同一個(gè)圓上的點(diǎn)映射到三維參數(shù)坐標(biāo)系中的各圓錐體,會(huì)有共同的交點(diǎn),交點(diǎn)的坐標(biāo)為圓的位置參數(shù)ai、bi、ri的值[19]。通過(guò)對(duì)參數(shù)空間中的圓錐體上各點(diǎn)進(jìn)行權(quán)值統(tǒng)計(jì),并求取權(quán)值峰值點(diǎn),即可確定平面直角坐標(biāo)系中的圓。
本文在開源的深度學(xué)習(xí)框架Darknet 上搭建與訓(xùn)練Mark-YOLO 模型。訓(xùn)練中采用了圖像隨機(jī)調(diào)整曝光、飽和度、色調(diào)等方法對(duì)數(shù)據(jù)進(jìn)行隨機(jī)擴(kuò)充。此外,在訓(xùn)練時(shí),每迭代10 次改變模型的輸入尺寸,使模型對(duì)于不同尺寸的圖像具有更好的檢測(cè)效果。為加快模型的收斂速度與檢測(cè)準(zhǔn)確率,本文中采用遷移學(xué)習(xí)的方式對(duì)模型進(jìn)行訓(xùn)練,使用在ImageNet 上進(jìn)行預(yù)訓(xùn)練的分類模型權(quán)重。
本文分別在PASCAL VOC 數(shù)據(jù)集以及無(wú)人機(jī)著陸標(biāo)識(shí)數(shù)據(jù)集上進(jìn)行訓(xùn)練與驗(yàn)證。其中無(wú)人機(jī)著陸標(biāo)識(shí)數(shù)據(jù)集由3 部分組成,分別為無(wú)人機(jī)在室內(nèi)場(chǎng)景、室外場(chǎng)景拍攝的圖像以及人工進(jìn)行數(shù)據(jù)擴(kuò)充得到的圖像。數(shù)據(jù)集中包括H 型地標(biāo)與六邊形地標(biāo)2 類,訓(xùn)練集共包含2 262 張圖片,測(cè)試集共包含618 張圖片。
本文參考文獻(xiàn)[20]中聚類方法進(jìn)行邊界框聚類分析,考慮到Mark-YOLO 中在3 種尺度上進(jìn)行跨尺度預(yù)測(cè),選取了9 個(gè)候選框,分屬3 個(gè)檢測(cè)尺度。
分別在數(shù)據(jù)集上訓(xùn)練了YOLOv2-tiny、YOLOv3-tiny、YOLOv3-tiny-3l 與本文中提出的Mark-YOLO網(wǎng)絡(luò),并將訓(xùn)練完成的網(wǎng)絡(luò)權(quán)重在測(cè)試集上進(jìn)行測(cè)試。統(tǒng)計(jì)4 種網(wǎng)絡(luò)在PASCAL VOC 數(shù)據(jù)集上的mAP(mean average precision)如表1 所示。

表1 PASCAL VOC 數(shù)據(jù)集測(cè)試結(jié)果 %
統(tǒng)計(jì)4 種網(wǎng)絡(luò)在無(wú)人機(jī)著陸地標(biāo)數(shù)據(jù)集上測(cè)試結(jié)果如表2 所示。

表2 無(wú)人機(jī)著陸標(biāo)識(shí)數(shù)據(jù)集測(cè)試結(jié)果 %
統(tǒng)計(jì)4 種網(wǎng)絡(luò)的BFLOPs(billion floating-point operations per second)和權(quán)重大小如表3所示。

表3 網(wǎng)絡(luò)的BFLOPs 和權(quán)重大小
由表1~3 中結(jié)果可得,在PASCAL VOC 數(shù)據(jù)集與無(wú)人機(jī)著陸標(biāo)識(shí)數(shù)據(jù)集上,本文中Mark-YOLO均取得了最高的mAP 值。通過(guò)自下而上的特征增強(qiáng)方法更加充分地利用了網(wǎng)絡(luò)的淺層特征,同時(shí)損失函數(shù)優(yōu)化以及訓(xùn)練過(guò)程中數(shù)據(jù)優(yōu)化方法的加入使得網(wǎng)絡(luò)模型的精度獲得了提升。
網(wǎng)絡(luò)裁剪過(guò)程中,首先在Darknet 框架中進(jìn)行訓(xùn)練,選取最優(yōu)的網(wǎng)絡(luò)模型權(quán)重;再在pytorch 框架中進(jìn)行100 個(gè)epoch 的稀疏訓(xùn)練,稀疏訓(xùn)練系數(shù)為0.000 1;稀疏訓(xùn)練完成后在pytorch 框架中進(jìn)行模型的剪枝操作,選取總裁剪比例分別為0.5、0.6、0.7、0.75、0.8、0.85 對(duì)Mark-YOLO 網(wǎng)絡(luò)進(jìn)行裁剪,剪枝完成后在Darknet 框架中進(jìn)行網(wǎng)絡(luò)的微調(diào),補(bǔ)償裁剪過(guò)程中的精度損失,獲取最優(yōu)的網(wǎng)絡(luò)模型。裁剪后的網(wǎng)絡(luò)在無(wú)人機(jī)著陸地標(biāo)數(shù)據(jù)集上測(cè)試結(jié)果如表4 所示。

表4 網(wǎng)絡(luò)裁剪后測(cè)試結(jié)果 %
統(tǒng)計(jì)模型的BFLOPs 和權(quán)重大小如表5 所示。

表5 網(wǎng)絡(luò)裁剪后模型大小對(duì)比
由表4、5 中結(jié)果可知,裁剪后網(wǎng)絡(luò)模型的精度有少量的下降,但網(wǎng)絡(luò)的參數(shù)量大幅降低,權(quán)重也大幅減小。裁剪率超過(guò)0.75 后,網(wǎng)絡(luò)模型的權(quán)重大小下降已經(jīng)不再明顯,但網(wǎng)絡(luò)模型的mAP出現(xiàn)了較大的下降,說(shuō)明裁剪率超過(guò)0.75 的網(wǎng)絡(luò)模型已不能很好地表征數(shù)據(jù),因此,本文中采用裁剪率為0.75 的模型作為裁剪結(jié)果。
裁剪后的模型BFLOPs 為0.933,相對(duì)于Mark-YOLO 網(wǎng)絡(luò)下降了89.0%;網(wǎng)絡(luò)模型權(quán)重大小為2.49 MB,相對(duì)于Mark-YOLO 網(wǎng)絡(luò)下降了94.6%。最終得到的網(wǎng)絡(luò)結(jié)構(gòu)如圖8 所示。原骨干網(wǎng)絡(luò)中的卷積層通道數(shù)量得到了有效的裁剪,減少了網(wǎng)絡(luò)的參數(shù)量和計(jì)算量,對(duì)于深度模型向無(wú)人機(jī)平臺(tái)的移植具有重要的意義。

圖8 裁剪后網(wǎng)絡(luò)結(jié)構(gòu)
本文中的無(wú)人機(jī)著陸標(biāo)識(shí)分割算法分為著陸標(biāo)識(shí)檢測(cè)階段與標(biāo)識(shí)分割階段。算法整體的流程如下:
1)將無(wú)人機(jī)拍攝的圖像輸入目標(biāo)檢測(cè)模型中,獲取著陸標(biāo)識(shí)的類別和預(yù)測(cè)框;
2)輸出著陸標(biāo)識(shí)預(yù)測(cè)框的坐標(biāo),將其設(shè)定為ROI(region of interest)區(qū)域;
3)在ROI 區(qū)域內(nèi)進(jìn)行灰度化處理,并利用Ostu 算法對(duì)ROI 區(qū)域內(nèi)進(jìn)行分割,去除背景干擾;
4)利用Canny 邊緣檢測(cè)算法與Hough 變換提取圖像的邊緣,確定著陸標(biāo)識(shí)中的直線與圓輪廓。
本文對(duì)無(wú)人機(jī)飛行情況下著陸標(biāo)識(shí)的分割效果進(jìn)行驗(yàn)證,在無(wú)人機(jī)不同飛行高度采集包含著陸標(biāo)識(shí)的圖像,飛行高度分別約為3、5、7、10 m,分別對(duì)應(yīng)近距離、中距離與遠(yuǎn)距離。其中,檢測(cè)出的直線輪廓用黃色標(biāo)出,檢測(cè)出的圓輪廓使用藍(lán)色標(biāo)出,圓心用黑色標(biāo)出。
由圖9~12 中的無(wú)人機(jī)著陸標(biāo)識(shí)分割結(jié)果可得,無(wú)人機(jī)飛行高度約為3 m 時(shí),著陸標(biāo)識(shí)屬于較大目標(biāo);隨著無(wú)人機(jī)高度的變化,無(wú)人機(jī)著陸標(biāo)識(shí)在圖中的大小也發(fā)生變化,高度約為10 m 時(shí),著陸標(biāo)識(shí)在圖中占據(jù)了很小的比例,屬于較難識(shí)別的小目標(biāo)。對(duì)于不同高度下的無(wú)人機(jī)著陸標(biāo)識(shí),本文中提出的算法都可以很好地檢測(cè)到降落標(biāo)識(shí),取得很好的分割結(jié)果,提取出降落標(biāo)識(shí)的圖案輪廓,有效地避免了環(huán)境因素帶來(lái)的干擾。

圖9 高度約為3 m 分割結(jié)果

圖10 高度約為5 m 分割結(jié)果

圖11 高度約為7 m 分割結(jié)果

圖12 高度約為10 m 分割結(jié)果
本文基于YOLO 目標(biāo)檢測(cè)算法,設(shè)計(jì)了無(wú)人機(jī)視覺導(dǎo)航著陸標(biāo)識(shí)的檢測(cè)與分割算法。
1)對(duì)目標(biāo)檢測(cè)算法進(jìn)行了優(yōu)化,并針對(duì)無(wú)人機(jī)平臺(tái)硬件計(jì)算能力較弱的問(wèn)題,對(duì)網(wǎng)絡(luò)模型進(jìn)行通道裁剪,減少網(wǎng)絡(luò)模型的參數(shù)量,同時(shí)保證網(wǎng)絡(luò)較高的準(zhǔn)確率。
2)通過(guò)目標(biāo)檢測(cè)算法獲取包含著陸標(biāo)識(shí)的ROI 區(qū)域,并在ROI 區(qū)域內(nèi)進(jìn)行灰度化處理、Ostu閾值分割、邊緣提取,利用Hough 變換檢測(cè)著陸標(biāo)識(shí)中的直線與圓,得到無(wú)人機(jī)著陸標(biāo)識(shí)的輪廓信息。
本文通過(guò)引入實(shí)時(shí)的目標(biāo)檢測(cè)算法,可以有效地避免復(fù)雜環(huán)境的干擾,減少后續(xù)圖像分割過(guò)程的計(jì)算量,對(duì)于搭載高分辨率圖像傳感器的無(wú)人機(jī)實(shí)現(xiàn)視覺導(dǎo)航著陸具有重要研究意義與工程實(shí)踐價(jià)值。