999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于聯邦學習的玉米葉片病害識別方法

2024-10-29 00:00:00趙盎然蘭鵬任洪澤吳勇孫豐剛

關鍵詞:病害識別;聯邦學習;異構數據;梯度更新;自監督學習;玉米葉片

玉米作為我國的主要糧食作物,近年來,其葉片病害呈重發態勢,嚴重影響作物產量[1]。病害快準識別有助于及時診斷葉片受災狀況,開展針對性病害防治,指導后續種植管理,以降低農業經濟損失、促進農業發展。

當下,以深度學習為代表的人工智能算法在病害識別方面取得積極進展。杜甜甜等[2]通過改進RegNet結合遷移學習增強模型特征提取能力,提高對馬鈴薯等農作物病害程度識別準確率。孫俊等[3]在MobileNet-V2模型基礎上,嵌入輕量化坐標注意力機制識別玉米等葉片病害,可有效平衡模型復雜度和識別準確率。王澤鈞等[4]提出融合注意力機制和多尺度特征的輕量化模型LMA-CNNs,兼顧識別準確率和模型參數量。深度學習模型在農業病害識別領域潛力巨大,但性能卻嚴重依賴于大規模數據集。實際應用中,病害數據通常具有分散性且缺少有效互通,形成“數據孤島”。基于本地數據所形成的局部模型難以擬合種類繁多、特征多樣的病害樣本,若對分散數據進行集中訓練則會急劇增大數據傳輸、存儲和處理壓力,甚至造成數據泄露。將聯邦學習引入玉米葉片病害識別模型訓練過程,利用不同區域農場的病害數據執行本地模型訓練,以模型共享的方式訓練全局模型,從而提高玉米葉片病害識別的準確性和泛化能力。另一方面,深度學習所需人工參與數據標注的屬性更加強化資源共享和數據規模對其發展的影響。而自監督技術利用數據自身信息進行特征學習和模型訓練,降低標注數據需求,輔助解決病害識別問題。Monowar等[5]提出一種自監督聚類模型,在多種作物葉片病害分類中取得優秀性能。Li等[6]全面介紹了在農業應用中以自監督學習為代表的標簽高效技術方案,用以解決收集、處理和標記數據集昂貴且耗時的問題。

聯邦學習通過本地訓練、云端聚合的方式形成全局模型,避免用戶數據上傳[7],可有效降低數據傳輸帶寬限制和數據泄露風險。Zhang等[8]提出一種基于聯邦隨機森林的玉米產量預測算法,性能不僅優于本地訓練模型,且與傳統集中范式隨機森林方法相比,準確性幾乎無損。Kumar等[9]提出一種基于深度隱私編碼的聯邦學習框架以最大限度地降低智慧農業中安全風險和數據隱私侵犯。Yu等[10]針對農業物聯網中邊緣計算設備能源和通信資源有限的問題,提出能量感知設備調度的聯邦學習框架,提升了模型收斂速度、建模精度,降低了通信成本。然而,現有聯邦學習研究多面向處理數據分布與資源差異問題[11,12],缺少應對數據特征差異[13(]分辨率不同、收集環境差異)與數據種類缺失異構的方案。

本文提出基于聯邦學習的玉米葉片病害識別方法,針對數據種類缺失異構利用損失函數梯度更新策略,達成模型訓練過程趨于穩定的同時學習識別本地缺失病害權重信息,提升模型泛化準確率。針對數據特征差異通過DeepClusterv2[14]算法在服務器端對初始模型進行數據通用低維特征提取的自監督預訓練,緩解模型過度擬合本地特征差異數據,提高模型性能和收斂速度。

1 試驗數據

本文所采用的玉米葉片病害數據來自于“AIChallenger”農作物病害程度數據集,詳見表1。根據病害種類可劃分為5種:灰斑病、銹病、葉斑病、矮花葉病、健康;依據病害嚴重程度可細化為:灰斑病(一般):G(G)、灰斑病(嚴重):G(S)、銹病(一般):R(G)、銹病(嚴重):R(S)、葉斑病(一般):S(G)、葉斑病(嚴重):S(S)、矮花葉病:D、健康:H。玉米葉片病害數據樣例如圖1所示。

數據處理可使模型學習同類數據的不變互信息(Invariantmutualinformation)[15],但數據集規模較小時,過多處理反而會引入一定噪聲[16,17],丟失原始數據部分特征信息。因此,本文采用兩種處理方式:1)歸一化:為避免特征差異數據的不同尺度導致優化算法不穩定,采用數據各維度像素特征的均值與方差歸一化;2)中心裁剪:為去除數據非相關信息、減少計算復雜度,采用與模型輸入維度尺寸匹配的中心裁剪。

2 算法與模型設計

2.1 模型結構

本文選擇原始ResNet50作為基礎模型[18],其殘差網絡有效解決深層網絡中的梯度問題,使其特征表達能力隨著網絡層數的增加而提高,簡單易用亦可擴展到其他作物,其主干網絡為圖2中的Bottleneck層。

自監督預訓練階段,以最大化互信息為導向的訓練方式使模型Bottleneck層可以取得捕獲數據的低維通用表示[19],而聚類層其自發實現的聚類、偽標簽標注和分類操作實現模型的訓練閉環。因預訓練數據無真實標簽標注,在后續聯邦訓練中只保留Bottleneck層,如圖2(a)所示。聯邦訓練階段模型參數權重中Bottleneck層為通用特征提取器,為保留預訓練模型學習到的通用特征表示,防止本地數據破壞其通用互信息的提取能力,需在聯邦訓練伊始增設新的全連接層作為分類器以重新構建全局模型,使用微調實現分類層與Bottleneck層前期分步訓練,避免Bottleneck層參數權重在訓練初期過度擬合用戶數據,丟失其原有特性,如圖2(b)所示。

2.2 基于FedAvg的聯邦學習框架

聯邦學習是一種分布式機器學習技術,可在多個擁有本地數據的用戶之間進行分布式訓練,通過聚合模型參數構建全局模型,因無需上傳本地數據可實現數據隱私保護和共享計算的平衡。聯邦學習訓練過程包含5個步驟:服務器模型下發、本地訓練、模型上傳、聚合和模型迭代,如圖3所示。基于聯邦學習的農作物病害識別場景下,通常優先選擇使用平均算法FedAvg[7]的聯邦架構,其對非極端異構設備和不平衡數據等情況有較高的訓練穩定性,對網絡帶寬和計算資源需求較低。

基于FedAvg的聯邦學習框架因計算節點與服務器中心物理地址不同導致高通信成本,連續通信輪次之間需執行多個梯度優化,使其不同于分布式學習優化,需解決因聯邦用戶數據缺失異構及數據特征差異帶來的模型優化問題。由此,提出針對性解決上述問題的廣義聯邦平均算法G-FedAvg。

2.3 廣義聯邦平均算法

2.3.1 聯邦異構限制性更新 聯邦學習具備利用局部信息學習全局信息的泛化能力,但本地數據類型缺失導致模型參數權重偏離全局最優點,產生用戶模型漂移,對聯邦學習性能和收斂產生較大影響[20]。

為保證聯邦學習在數據缺失異構環境下的模型性能與收斂性,需對模型全局損失函數梯度更新進行約束。本文在聯邦學習收斂性證明[21]基礎上,對其更新策略和具體實施做出改進,提出公式(1)所示聯邦限制更新策略,聯合數據類型缺失用戶訓練全局泛化模型。改進措施為簡化參數設置,降低工程復雜度,將服務器與聯邦用戶雙側學習率優化歸約為聯邦用戶的單側學習率優化。實施策略中,模型、數據和其他參數相互影響且具有一定梯度更新冗余,其參數選擇應以實際訓練損失為依據。

其中f為損失函數,f0為初始損失值,f*最優損失值,c為常數,η為學習率,E為本地迭代次數,T為訓練輪數,φ為問題實例參數,L為模型參數權重與梯度間的利普西茨常數,λ為冗余系數。

依據利普西茨連續梯度,將聯邦優化問題轉化為優化其損失值上界,在梯度下降中控制更新步長,逐輪降低損失函數期望。聯邦學習連續通信輪次之間的多個局部SGD步驟近似看作傳統分布式學習中全局損失的單個優化步驟,其每次迭代會對模型權重進行更新,如公式(1)所示,合理控制其更新步長,使模型在非過擬合學習的同時保持收斂性。

2.3.2 聯邦自監督預訓練 自監督學習[22]是一種無需人工標注標簽的深度學習方法,利用數據自身信息進行訓練,能有效解決監督學習標注數據不足問題。監督學習針對基于標記數據先驗知識的專用信息提取,與其標注限制相比,自監督可學習數據通用特征表示。對一個卷積神經網絡而言,淺層的卷積層、池化層可視為特征提取器,而深層的全連接層,可視為分類器。卷積神經網絡中淺層(靠近輸入)編碼的是可通用的復用特征,而深層(靠近輸出)編碼的是更專業的分類特征[23,24]。因為預訓練操作使淺層網絡獲得提取數據通用特征的能力,其后續的圖像識別、目標檢測等訓練任務水平可以得到有效提升[25,26]。

本文使用一種聚類與深度學習結合的自監督預訓練算法DeepCluster-v2。針對DeepCluster[27]離線連續聚類無相關性和隨機初始化問題[28]導致訓練不穩定進行優化。其學習方式包含數據編碼特征聚類和模型參數反向傳播兩個過程,結構如圖4所示。

(1)特征向量聚類

數據經模型降維生成特征向量,其聚類結果用于產生數據偽標簽參與模型后續自監督訓練。隨機篩選K個特征向量作為原型矩陣,每個特征向量即為聚類中心向量。將特征向量與原型矩陣求內積以衡量兩者的相似度,將同一聚類的特征向量取平均作為新的聚類中心向量,如公式(2)所示,其中,zi為特征向量,ck為聚類中心向量,C為聚類原型矩陣,k為特征向量zi與原型矩陣C內積的最大分量,用以偽標簽分類索引。

由圖4所示,卷積網絡模塊為模型的主體部分,分類模塊由3個聚類原型矩陣構成,特征向量聚類需進行多次循環迭代,并將最終聚類結果作為分類依據。

(2)模型參數更新

將聚類偽標簽作為數據標注參與常規模型訓練。相較于傳統監督學習訓練過程中的標簽,自監督深度聚類的偽標簽完全在訓練中生成,其損失函數如公式(3)所示。

其中q為特征向量經聚類后形成的數據偽標簽,模型依據偽標簽標注學習不同類別數據間的特征信息權重。改進后的DeepCluster-v2的多聚類頭屬性使模型的低維通用信息盡可能由淺層網絡習得,更加強化其互信息提取能力。

2.3.3 算法流程 本文廣義聯邦平均算法的實現分為服務器端和用戶端兩部分,本文按照算法流程順序給出如下執行過程:(1)服務器端執行自監督預訓練完成模型參數初始化,選擇參與聯邦學習的用戶并下發模型。

(2)用戶端接收服務器下發的全局模型,判斷是否為初次迭代,并行參與本地模型微調或常規訓練。

(3)聯邦用戶本地模型完成指定訓練輪數,上傳至服務器。

(4)服務器端接收各用戶本地模型,根據聯邦用戶的本地數據量加權聚合模型參數,聚合模型作為新的全局模型下發至各用戶。

(5)順序執行上述4個算法流程,循環迭代算法流程(2)—(4)直至模型收斂,其具體實現細節見表2。

3 試驗與結果分析

3.1 試驗環境與參數

本文試驗的GPU為NVIDIAGeForceRTX4060Ti16G,采用深度學習框架Pytorch1.13.1,Python版本為3.8.0,使用深度神經網絡加速庫CUDA11.6.0,cuDNN8.9.0。試驗內容主要包含兩個部分,病害種類識別和病害嚴重程度識別,后者是在前者基礎上的進一步試驗,用以分辨農作物的病害嚴重程度。

試驗中設置10個虛擬用戶用以模擬參與訓練的農場,并將數據集隨機劃分作為聯邦用戶的本地私有數據,每次迭代訓練批次大小為64。初始階段使用ImageNet自監督預訓練權重作為模型基礎參數,聯邦用戶接收全局模型并進行微調[29]。因Adam優化器損失函數的極小值選擇理論[30],致使微調訓練階段與測試階段識別準確率不匹配,故模型優化采用隨機梯度下降SGD最小化損失函數,優化器動量Momentum參數設置為0.9。

3.2 試驗結果

(1)與集中學習對比試驗

本部分將所提聯邦學習與集中學習進行對比試驗,以驗證聯邦學習本地訓練、模型共享的優勢。對比集中學習模型為:CDCNNv2[31]和PD2SE-Net50[32],兩者均是基于ResNet50的改進模型。

表3為本文算法G-FedAvg與集中學習模型在病害種類識別和病害程度識別準確率的對比試驗結果。此外,考慮到集中學習需要將用戶數據上傳至中心服務器,但由于隱私、數據資產保護要求及通信資源限制,集中學習訓練方式難以實現。對比試驗也考慮了僅利用單一用戶本地數據完成聯邦學習基礎ResNet50模型訓練的情況,對應表3中“單一本地用戶”的情況。試驗是對集中學習與聯邦學習過程的簡化仿真,真實應用場景中集中學習的數據上傳與聯邦學習的模型傳輸難以模擬,無法有效比較各學習方法的效率,因此后續試驗結果沒有訓練時長對比。

在病害識別準確率方面,所提算法GFedAvg較集中學習模型CDCNNv2和PD2SENet50分別提升0.68%和0.22%,較單一本地用戶模型ResNet50提升10.2%;在病害程度識別準確率方面,所提算法G-FedAvg較集中學習模型CDCNNv2和PD2SE-Net50分別提升2.72%和1.59%,較單一本地用戶模型ResNet50提升14.29%。數據特征差異使模型在訓練過程逐漸偏離最優解,但G-FedAvg打破潛在特征學習定式,掌握整體數據特征分布,其全局聚合優化隱式地進行優化方向糾偏,使本地模型聚合后產生優化方向的修正[33],使模型朝著最優解方向發展。表明現階段深度學習數據驅動的重要性,反映出聯邦學習模型能夠有效融合各方本地數據信息。

(2)與傳統聯邦學習對比試驗

本部分試驗目的是驗證本文算法G-FedAvg在數據獨立同分布設置下對比傳統聯邦學習是否存在性能提升,其中,獨立同分布即數據集隨機均勻劃分給各聯邦用戶。圖5為本文算法GFedAvg與傳統聯邦學習模型Vanilla-FedAvg[7,33]關于病害種類識別與病害嚴重程度識別準確率對比結果。

現實數據的特征差異使得聯邦學習無法如同理論分析的平穩、健壯[34],本文提出G-FedAvg模型框架,從訓練源頭避免因全局模型的隨機初始狀態使得用戶模型快速擬合本地數據致使全局聚合模型性能下降與收斂速度變慢。由圖5所示,G-FedAvg全局聚合模型初始階段的識別準確率遠高于Vanilla-FedAvg,表現出良好的用戶模型漂移抑制效果,有效避免因全局聚合對用戶模型訓練方向頻繁修正所造成的識別準確率波動,加速全局模型優化進程。

結果表明本文算法G-FedAvg利用自監督預訓練緩解用戶模型過度擬合特征差異數據造成的優化方向偏差,彌合本地模型與全局模型權重差異,有效提升識別準確度與收斂速度的同時顯著降低準確率波動。

(3)數據種類缺失異構環境下聯邦學習試驗

本部分試驗目的為,聯邦用戶在數據種類缺失環境下,進行聯邦學習模型聚合訓練,識別全種類測試集,驗證其泛化準確率。試驗設置如下,每個用戶隨機缺失三類病害種類與四類病害嚴重程度數據,且用戶數據彼此不存在交集,數據分布具體明細見表4。因監督學習的局限性,不參與聯邦學習的本地用戶進行病害識別僅限于用戶所擁有的部分類別數據,本地模型無法識別劃分未經訓練數據類別。

圖6-7分別為數據種類缺失異構環境下病害及其程度識別的泛化準確率對比試驗,具體結果如表5所示,所提算法G-FedAvg的病害及其程度識別的泛化準確率較單一本地用戶模型ResNet50分別提升55.78%和41.15%,表明聯邦學習切實提升了全局模型的泛化能力,有效解決數據種類缺失異構環境下模型訓練的難點。

為進一步驗證所提方案的泛化能力,將損失函數梯度更新策略和初始模型自監督預訓練應用至FedProx[35],形成G-FedProx,并將原方案與本文方案進行對比,FedProx為聯邦異構環境常用算法,表5給出各方案泛化識別準確率對比結果。本文所提方案G-FedAvg的病害及其程度識別的泛化準確率在數據種類缺失異構場景下較Vanilla-FedAvg分別提升33.56%和10.66%,改進后的G-FedProx的病害及其程度識別的泛化準確率較原方案分別提升22.91%-30.84%和7.71%-11.79%,由表5可知,G-FedAvg相較FedProx的泛化識別準確率提升同樣明顯。由圖6a、圖7a訓練損失值對比反映出G-FedAvg作為一種底層基礎架構有效緩解模型關于本地特征差異數據的過擬合問題,而由圖6b、圖7b識別準確率的提高則充分反映出其對模型性能的優化。

4 結論

本文將聯邦學習理論框架應用至農作物病害識別場景中,在保證參訓用戶數據資產安全和數據隱私的前提下通過共享模型參數實現病害識別模型訓練,得出如下結論:

(1)基于聯邦學習玉米葉片病害識別方法的性能對比集中范式,病害識別準確率領先0.22%-0.68%,病害程度識別準確率領先1.59%-2.72%。聯邦學習參訓用戶本地私有數據無需上傳,減輕數據傳輸、存儲和處理壓力,避免了數據泄露風險,其用戶規模和數據來源得以極大擴充,使得基于聯邦學習的玉米葉片病害識別方法在未來更具優勢。

(2)限制性損失函數梯度更新策略和自監督預訓練使病害數據種類缺失異構的用戶在穩定訓練的前提下快速學習到全種類的病害泛化信息,緩解本地模型擬合特征差異數據所造成的性能下降,并使其在初始階段便可捕獲數據的通用低維表示信息。在數據缺失異構場景下,病害識別準確率提升33.56%,病害程度識別準確率提升10.66%,收斂速度有效提升,準確率波動顯著降低。

本文提出基于G-FedAvg算法的聯邦學習玉米葉片病害識別方法,對玉米葉片的病害及其嚴重程度進行識別,使模型從準確率、收斂速度、訓練平穩度、泛化準確率等方面均得到提升,順應當前數據驅動的基于深度學習的農作物病害識別技術發展趨勢。

主站蜘蛛池模板: 尤物视频一区| 国产肉感大码AV无码| 亚洲无线一二三四区男男| 色妞www精品视频一级下载| 久久人人妻人人爽人人卡片av| 中文字幕人成人乱码亚洲电影| 婷婷六月天激情| 老色鬼欧美精品| www亚洲精品| 国产91精品调教在线播放| 国产一级视频在线观看网站| 国产凹凸一区在线观看视频| av一区二区三区在线观看 | 国产a在视频线精品视频下载| 亚洲天堂高清| 国产成人精品免费av| 9999在线视频| 亚洲日韩在线满18点击进入| 色婷婷综合在线| 日韩在线观看网站| 91久久青青草原精品国产| 99热这里只有精品在线观看| 欧美精品H在线播放| 国产综合精品日本亚洲777| 久久久久88色偷偷| 乱人伦视频中文字幕在线| 国内精品视频在线| 免费国产高清精品一区在线| 国产特级毛片| 激情综合五月网| 国产91精品最新在线播放| 欧美一区日韩一区中文字幕页| 国产 日韩 欧美 第二页| 狠狠色丁香婷婷综合| 久久亚洲综合伊人| 亚洲av日韩综合一区尤物| 91无码网站| 日本在线免费网站| 欧美日韩成人在线观看| 无码人中文字幕| 亚洲一区波多野结衣二区三区| 91精品日韩人妻无码久久| 亚洲一区二区视频在线观看| 午夜精品区| 亚洲一级毛片免费观看| 亚洲人成影视在线观看| 欧美a在线| 亚洲网综合| 亚洲综合亚洲国产尤物| 色呦呦手机在线精品| 欧美精品一区二区三区中文字幕| 久久亚洲精少妇毛片午夜无码| 91区国产福利在线观看午夜 | 毛片网站在线播放| 欧美成在线视频| 精品少妇人妻无码久久| 色妞www精品视频一级下载| 91免费精品国偷自产在线在线| 国产99视频在线| 2021国产精品自产拍在线观看| 国产成人无码播放| 国产又粗又猛又爽| 天堂成人av| 91麻豆精品视频| 国产女人爽到高潮的免费视频| 成人午夜天| 色综合久久88| 狠狠色噜噜狠狠狠狠色综合久| 九色在线观看视频| 999国产精品| 亚洲成网站| 亚洲精品国产精品乱码不卞| 亚洲二区视频| 99视频精品在线观看| 欧美中文字幕在线播放| 四虎影视无码永久免费观看| 97se亚洲综合在线| 国产人人射| 伊人成人在线视频| 日韩福利视频导航| 福利小视频在线播放| 久久精品丝袜|