智能化技術(shù)在農(nóng)業(yè)機(jī)械設(shè)備中的應(yīng)用,可以深化農(nóng)業(yè)自動(dòng)化改革,提升農(nóng)業(yè)生產(chǎn)效率與質(zhì)量。深度學(xué)習(xí)算法作為人工智能技術(shù)之一,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),通過(guò)大數(shù)據(jù)樣本訓(xùn)練,調(diào)整樣本權(quán)重,提升神經(jīng)網(wǎng)絡(luò)的自主學(xué)習(xí)能力,保證機(jī)械設(shè)備的自主識(shí)別能力與自動(dòng)化水平。將其應(yīng)用于采摘機(jī)器人系統(tǒng),可以幫助采摘機(jī)器人系統(tǒng)有效識(shí)別果實(shí)大小、成熟度等,判斷是否采摘,啟動(dòng)相應(yīng)操作任務(wù)。
一、基于YOLO算法的農(nóng)業(yè)機(jī)械自動(dòng)化控制系統(tǒng)
(一)判斷依據(jù)及算法改進(jìn)
采摘機(jī)器人要具備自主導(dǎo)航、自動(dòng)識(shí)別與作業(yè)、自動(dòng)監(jiān)測(cè)等基礎(chǔ)功能,滿足農(nóng)業(yè)生產(chǎn)的自動(dòng)化需求。同時(shí),該設(shè)備還要具備自主學(xué)習(xí)能力,提升果實(shí)識(shí)別能力[1]。采摘機(jī)器人果實(shí)識(shí)別流程如下:
初始化 $$ 圖像采集 $$ 神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)算法訓(xùn)練 $$ 圖像特征提取 $$ 圖像大小識(shí)別 $$ 成熟度等級(jí)識(shí)別 $$ 采摘。
1.判斷依據(jù)。采摘機(jī)器人是否采摘果實(shí),判斷依據(jù)是果實(shí)成熟度,通過(guò)果實(shí)大小、顏色識(shí)別進(jìn)行確定。采摘機(jī)器人利用神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)訓(xùn)練,提取果實(shí)輪廓特征,確定果實(shí)位置、識(shí)別果實(shí)顏色,獲取果實(shí)成熟度。
2.算法改進(jìn)。為提升采摘機(jī)器人工作精度,需要對(duì)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法進(jìn)行改進(jìn),得到深度學(xué)習(xí)算法,形成多層次的神經(jīng)網(wǎng)絡(luò)算法,讓采摘機(jī)器人具備類(lèi)人思維,提升自主識(shí)別精準(zhǔn)度。
(二)基于深度學(xué)習(xí)的模型
采摘機(jī)器人以YOLO算法為基礎(chǔ),通過(guò)邏輯判斷進(jìn)行決策。神經(jīng)網(wǎng)絡(luò)作為智能算法,在采摘機(jī)器人中的應(yīng)用,可以讓機(jī)器人系統(tǒng)決策更加精準(zhǔn)、可靠。
1.樣本訓(xùn)練。通過(guò)生物神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建,訓(xùn)練大數(shù)據(jù)樣本,提升采摘機(jī)器人的自主決策、預(yù)測(cè)與識(shí)別能力。生物神經(jīng)網(wǎng)絡(luò)中神經(jīng)元相互關(guān)聯(lián),信息在神經(jīng)元上傳遞,樣本的權(quán)重在智能化訓(xùn)練中可以調(diào)整,保持神經(jīng)網(wǎng)絡(luò)良好的自適應(yīng)與自主學(xué)習(xí)能力[2]。
2.誤差信號(hào)反向傳播。采摘機(jī)器人系統(tǒng)中人工神經(jīng)網(wǎng)絡(luò)算法的應(yīng)用,難點(diǎn)問(wèn)題是視覺(jué)與語(yǔ)音識(shí)別。神經(jīng)網(wǎng)絡(luò)算法具備雙向傳播功能,對(duì)比期望與實(shí)際輸出值,反向傳播誤差信號(hào),時(shí)間與期望輸出值通過(guò)權(quán)值的調(diào)整與修正不斷接近,提升機(jī)器人系統(tǒng)的精準(zhǔn)度。
3.多層網(wǎng)絡(luò)。深度機(jī)器學(xué)習(xí)算法利用神經(jīng)網(wǎng)絡(luò)算法構(gòu)造多層網(wǎng)絡(luò),底層到高層的語(yǔ)義通過(guò)復(fù)雜映射,更容易建立起深層的網(wǎng)絡(luò)結(jié)構(gòu)。深層次的網(wǎng)絡(luò)結(jié)構(gòu)可以提取出高層的特征信息,在圖處理與語(yǔ)音識(shí)別中,通過(guò)深度學(xué)習(xí),讓機(jī)器人系統(tǒng)具備自主識(shí)別與學(xué)習(xí)能力。
4.局部最優(yōu)解。深度學(xué)習(xí)算法中深度置信網(wǎng)絡(luò)是其中的重要模型之一,具有良好的收斂性,局部最優(yōu)解較多。玻爾茲曼機(jī)屬于隨機(jī)動(dòng)力系統(tǒng),其他變量會(huì)影響每個(gè)變量的狀態(tài),使用概率無(wú)向圖模型描述玻爾茲曼機(jī),玻爾茲曼機(jī)存在k個(gè)節(jié)點(diǎn)(變量),要求能滿足3個(gè)性質(zhì)。
第一,隨機(jī)變量屬于二值的,可以使用二值的隨機(jī)向量表示隨機(jī)變量,可觀測(cè)變量、隱變量分別表示為V、H。第二,全部節(jié)點(diǎn)連接在一起,節(jié)點(diǎn)中的變量都依賴(lài)于其他變量。第三,變量之間相互影響,形成對(duì)稱(chēng)的關(guān)系。玻爾茲曼機(jī)的變量有6個(gè),分別為x1、x2,x3,x4,x5,x6o 玻爾茲分布 + 得到隨機(jī)向量X的聯(lián)合概率,并確定能量函數(shù),定義變量之間的連接權(quán)重、狀態(tài)和變量的偏置。
通過(guò)能量函數(shù)分析,可以明確農(nóng)業(yè)機(jī)械自動(dòng)化控制系統(tǒng)運(yùn)行過(guò)程中,對(duì)賦予權(quán)重較多的變量進(jìn)行分析,如果發(fā)生的偏置較多,則可以確定出最大影響因素。當(dāng)給定變量為組觀測(cè)值時(shí),在模型的深度學(xué)習(xí)下,分析權(quán)重,得到學(xué)習(xí)網(wǎng)絡(luò)的最優(yōu)權(quán)重,為決策者提供參考。
二、基于YOLO算法的農(nóng)業(yè)機(jī)械自動(dòng)化控制系統(tǒng)設(shè)計(jì)
基于YOLO算法的農(nóng)業(yè)機(jī)械自動(dòng)化控制系統(tǒng)設(shè)計(jì),要能實(shí)現(xiàn)基本的功能,比如視覺(jué)識(shí)別、定位與導(dǎo)航、數(shù)據(jù)采集等。系統(tǒng)設(shè)計(jì)分為兩個(gè)部分,即硬件設(shè)計(jì)與軟件設(shè)計(jì),具體如下:
(一)硬件設(shè)計(jì)
1.主控板。主控芯片為針對(duì)果實(shí)4B開(kāi)發(fā)板,屬于易于使用的計(jì)算機(jī)主板,具有較大的存儲(chǔ)空間與較強(qiáng)的處理性能,且接口多,便于擴(kuò)展。
2.視覺(jué)系統(tǒng)。攝像頭與處理單元的性能較強(qiáng),可以對(duì)農(nóng)作的果實(shí)圖形信息有效捕捉,采取的目標(biāo)識(shí)別與分類(lèi)算法為基于卷積神經(jīng)網(wǎng)絡(luò)的YOLO算法,高效處理圖片,便于精準(zhǔn)定位果實(shí)[3]。
3.機(jī)械手臂。機(jī)器人自動(dòng)采摘的部件是機(jī)械手臂,多個(gè)關(guān)節(jié)與執(zhí)行器組成機(jī)械手臂,移動(dòng)與旋轉(zhuǎn)靈活。在算法的精準(zhǔn)控制下,機(jī)械手臂可以完成相應(yīng)的操作與目標(biāo)。
4.傳感器和導(dǎo)航系統(tǒng)。設(shè)置傳感器與導(dǎo)航系統(tǒng),感知環(huán)境信息,規(guī)劃最佳路線。
5.電源和供電系統(tǒng)。為保證機(jī)器人的正常、連續(xù)運(yùn)行,設(shè)置電源及供電系統(tǒng),在穩(wěn)定供電基礎(chǔ)上,可以結(jié)合實(shí)際情況動(dòng)態(tài)電力輸出。
(二)軟件設(shè)計(jì)
采摘機(jī)器人系統(tǒng)軟件設(shè)計(jì),采用基于卷積神經(jīng)網(wǎng)絡(luò)的YOLO算法,構(gòu)建導(dǎo)航地圖,在農(nóng)作物產(chǎn)地可以靈活、自主移動(dòng),果實(shí)自標(biāo)的識(shí)別與記錄則通過(guò)圖像處理算法完成。視覺(jué)系統(tǒng)可以轉(zhuǎn)換坐標(biāo)系,形成果實(shí)空間坐標(biāo)點(diǎn),機(jī)械臂在果實(shí)坐標(biāo)點(diǎn)的分析下,可以得到最優(yōu)行動(dòng)路線,關(guān)節(jié)電機(jī)得到指令后在指定目標(biāo)點(diǎn)開(kāi)展相應(yīng)的操作,利用手眼協(xié)同控制系統(tǒng),末端執(zhí)行相應(yīng)的動(dòng)作,比如采摘姿態(tài)、抓取等,抓取過(guò)程中要對(duì)采摘狀況進(jìn)行實(shí)時(shí)反饋,并在夾住果實(shí)后,可以自動(dòng)松開(kāi)投入容器中[4]。系統(tǒng)軟件在復(fù)雜的壞境中,會(huì)遇到光線、障礙物等阻礙,導(dǎo)致目標(biāo)物識(shí)別率下降,所以還需加人YOLO算法進(jìn)行識(shí)別,提升果實(shí)識(shí)別的精準(zhǔn)度。
三、基于YOLO算法的農(nóng)業(yè)機(jī)械自動(dòng)化控制系統(tǒng)實(shí)現(xiàn)
(一)數(shù)據(jù)集劃分與標(biāo)注
分類(lèi)與整理相應(yīng)的采摘果實(shí)數(shù)據(jù),劃分為訓(xùn)練集與驗(yàn)證集,對(duì)不同的數(shù)據(jù)進(jìn)行標(biāo)注。訓(xùn)練果實(shí)圖像數(shù)據(jù)2000張,劃分驗(yàn)證集為: 80% 用于訓(xùn)練集,20% 用于驗(yàn)證集,數(shù)據(jù)的標(biāo)注可以使用Labelimg完成,可以將果實(shí)數(shù)據(jù)分為成熟、半成熟與不熟三種,圖像中的果實(shí)標(biāo)點(diǎn)連接與框選采用YOLO的標(biāo)注格式完成,得到2000張圖形的模型訓(xùn)練數(shù)據(jù)集。為豐富數(shù)據(jù)集,需要加入沒(méi)有處理過(guò)的500張圖像,將這部分圖像作為測(cè)試用的數(shù)據(jù)集。數(shù)據(jù)集劃分的步驟如下:
1.數(shù)據(jù)集組織。圖像文件的格式為jpg與png,有相應(yīng)的標(biāo)簽,可以對(duì)圖像中的目標(biāo)位置與類(lèi)別進(jìn)行描述[5]。YOLO將標(biāo)簽文件格式標(biāo)注為txt,可以在不同的目標(biāo)檢測(cè)任務(wù)中應(yīng)用。
2.劃分比例選擇。訓(xùn)練集、驗(yàn)證集的比例需合理劃分,一般為8:2,按照數(shù)據(jù)量和任務(wù)特性對(duì)比例進(jìn)行調(diào)整。
3.數(shù)據(jù)集劃分代碼。數(shù)據(jù)集在代碼的編寫(xiě)下合理劃分,分為訓(xùn)練集和驗(yàn)證集,兩個(gè)數(shù)據(jù)集可以在不同的便箋文件中移動(dòng)。
4.文件夾結(jié)構(gòu)。建立images和labels子文件夾用于管理,images用于圖像存儲(chǔ),labels屬于標(biāo)簽文件。兩個(gè)數(shù)據(jù)集都有文件夾結(jié)構(gòu)。
5.隨機(jī)化和保持一一對(duì)應(yīng)。數(shù)據(jù)集在劃分之前,隨機(jī)化處理數(shù)據(jù)集,隨機(jī)選擇兩個(gè)數(shù)據(jù)集的樣本。圖像和標(biāo)簽在劃分?jǐn)?shù)據(jù)集過(guò)程中需保持一一對(duì)應(yīng),確保訓(xùn)練和驗(yàn)證能夠一致。
6.數(shù)據(jù)集劃分結(jié)果驗(yàn)證。為了驗(yàn)證劃分是否符合要求,需要通過(guò)文件數(shù)量的檢查,判斷是否保持一對(duì)應(yīng)的圖像和標(biāo)簽關(guān)系。
(二)數(shù)據(jù)集與預(yù)處理
采取增強(qiáng)和降噪處理輸入的圖像,每張圖像都可以在神經(jīng)網(wǎng)絡(luò)模型下得到有效訓(xùn)練,并能將關(guān)鍵的特征提取出來(lái),因此做好數(shù)據(jù)預(yù)處理十分必要。對(duì)數(shù)據(jù)的預(yù)處理主要有數(shù)據(jù)集蒸餾、圖像濾波去噪等。在較大的數(shù)據(jù)集中通過(guò)數(shù)據(jù)集蒸餾轉(zhuǎn)換為較小的數(shù)據(jù)集,保持?jǐn)?shù)據(jù)分布的合理性,提升訓(xùn)練的速度與效果[6]。數(shù)據(jù)增強(qiáng)可以采用Mosaic,訓(xùn)練集圖像選擇后,通過(guò)縮放、排布等手段進(jìn)行處理,數(shù)據(jù)集中檢測(cè)物體的背景與小自標(biāo)得到豐富,針對(duì)復(fù)雜場(chǎng)景,也可以保證良好的檢測(cè)效果。
(三)復(fù)雜環(huán)境下的實(shí)時(shí)識(shí)別與檢測(cè)
為對(duì)果實(shí)進(jìn)行實(shí)時(shí)識(shí)別與檢測(cè),要改進(jìn)識(shí)別與檢測(cè)方法,構(gòu)建YOLO網(wǎng)絡(luò)模型,加入可變形卷積模塊,動(dòng)態(tài)調(diào)整可變形卷積核的大小、位置,便于精準(zhǔn)識(shí)別與檢測(cè)果實(shí),針對(duì)檢測(cè)結(jié)果實(shí)施成熟度計(jì)劃,成熟的果實(shí)二維坐標(biāo)與深度距離等可以在RGB-D深度相機(jī)的應(yīng)用下確定。在檢測(cè)過(guò)程中,對(duì)果實(shí)的檢測(cè)精度達(dá)到 85% 以上,處理速度則達(dá)到了20fps。
(四)三維定位
在確定果實(shí)類(lèi)別、檢測(cè)框與二維坐標(biāo)基礎(chǔ)上,果實(shí)出現(xiàn)重疊粘連時(shí)就會(huì)出現(xiàn)復(fù)雜場(chǎng)景,比如西紅柿發(fā)生重疊與粘連,難以精準(zhǔn)定位果實(shí)。因此不僅要對(duì)果實(shí)的成熟度進(jìn)行計(jì)算,判斷是否符合要求,還要確定果實(shí)的三維坐標(biāo),判斷果實(shí)是否有最近的直線距離,通過(guò)這樣的方式可以保證果實(shí)采摘的合理性與有序性。果實(shí)三維坐標(biāo)信息可以由RGB-D深度色彩攝像頭定位,色彩圖像與深度圖像之間的關(guān)系形成映射,并與之前檢測(cè)到的結(jié)果進(jìn)行融合,可以分離復(fù)雜背景點(diǎn)云與果實(shí)點(diǎn)云。果實(shí)區(qū)域點(diǎn)云則可以在云濾波的方式下獲取,確實(shí)的點(diǎn)云通過(guò)RANSAC算法深度擬合后,確定出果實(shí)的三維坐標(biāo)與形狀。在點(diǎn)云數(shù)據(jù)的生成過(guò)程中,要求拍攝環(huán)境穩(wěn)定,獲取果實(shí)的彩色圖像信息。
(五)剪枝模式建模
設(shè)置標(biāo)準(zhǔn)化軌道在農(nóng)作物內(nèi)側(cè),對(duì)6種機(jī)器人的剪枝模式進(jìn)行建模,得到6種角度與方式。以西紅柿的采摘為例,為避免傷害西紅柿,要采取剪夾一體化設(shè)計(jì),通過(guò)剪枝手采摘西紅柿。在復(fù)雜環(huán)境下,機(jī)器人的適應(yīng)性較強(qiáng),采摘目標(biāo)的枝條中間點(diǎn)坐標(biāo)在獲取后,可以在剪枝模式的應(yīng)用下,完成剪枝與采摘工作。
四、結(jié)論
農(nóng)業(yè)生產(chǎn)領(lǐng)域中智能化技術(shù)的應(yīng)用,極大提升了農(nóng)業(yè)生產(chǎn)效率,助力現(xiàn)代化農(nóng)業(yè)改革。機(jī)器人采摘系統(tǒng)作為典型的現(xiàn)代化農(nóng)業(yè)設(shè)備之一,基于卷積神經(jīng)網(wǎng)絡(luò)的YOLO算法,具有自主學(xué)習(xí)能力、自適應(yīng)能力,可以有效識(shí)別自標(biāo)果實(shí),精準(zhǔn)開(kāi)展果實(shí)采摘工作。機(jī)器人采摘系統(tǒng)通過(guò)深度學(xué)習(xí),可以形成類(lèi)人思維,不斷提升工作質(zhì)量與效率。該設(shè)備自動(dòng)化控制技術(shù)的實(shí)現(xiàn)與應(yīng)用,代表著我國(guó)現(xiàn)代化農(nóng)業(yè)技術(shù)水平不斷提高,有助于推進(jìn)現(xiàn)代化農(nóng)業(yè)高效發(fā)展。
參考文獻(xiàn):
[1]張偉榮,陳學(xué)庚,齊江濤,等.基于深度學(xué)習(xí)和高斯過(guò)程回歸的玉米冠下視覺(jué)導(dǎo)航路徑提取方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2024,55(07):15-26.
[2]王凱,王彥婷,胡延明.基于模糊神經(jīng)網(wǎng)絡(luò)的農(nóng)機(jī)自動(dòng)轉(zhuǎn)向系統(tǒng)的設(shè)計(jì)[J].農(nóng)機(jī)化研究,2024,46(01):225-229.
[3]汪斌斌,楊貴軍,楊浩,等.基于YOLO_X和遷移學(xué)習(xí)的無(wú)人機(jī)影像玉米雄穗檢測(cè)J」農(nóng)業(yè)工程學(xué)報(bào),2022,38(15):53-62.
[4]武錦龍,吳虹麒,李浩,等.基于改進(jìn)DeepLabV3 + 的蕎麥苗期無(wú)人機(jī)遙感圖像分割識(shí)別方法研究[J]農(nóng)業(yè)機(jī)械學(xué)報(bào),202455(05):186-195.
[5]王楠,李震,李佳盟,等.融合多光譜成像與深度學(xué)習(xí)的作物植株葉綠素檢測(cè)系統(tǒng)研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(S02):260-269.
[6]宋蘇.深度學(xué)習(xí)背景下計(jì)算機(jī)視覺(jué)算法應(yīng)用探究——評(píng)《深度學(xué)習(xí)與計(jì)算機(jī)視覺(jué):算法原理,框架應(yīng)用與代碼實(shí)現(xiàn)》[J].科技管理研究,2024,44(01):10003.
(作者單位:甘肅省甘南藏族自治州舟曲縣江盤(pán)鎮(zhèn)農(nóng)業(yè)綜合服務(wù)中心)