李光輝 王哲旭 徐 匯 劉 敏
(江南大學人工智能與計算機學院,無錫 214122)
果樹根系的粗細和深度能反映出果樹的生長和健康狀況,也影響著水果的產量與品質。根系在植物個體中扮演著至關重要的角色,它可以為植物提供生長所需的水和營養物質,同時還有支撐、固定植物體的作用,但根系相較于果樹的枝干或冠層更加難以觀察和取樣,導致根系研究落后于植物的地上部分。當前的根系檢測方法基本分為兩類,破壞性檢測和無損檢測(Non-destructive testing, NDT)[1]。傳統的破壞性檢測可以精確獲得根系直徑信息,但費時耗力且可能對根系造成不可逆的破壞,在果樹和古樹名木的根系檢測中不可取。探地雷達(Ground penetrating radar, GPR)作為一種新興的無損檢測技術,具有定位準確、速度快、使用靈活和探測精度高等特點,相對于其他無損檢測方法(例如X射線斷層掃描、核磁共振方法、聲學方法和電阻率層析成像等)有著操作簡單、攜帶便捷、可重復測量等優點,因此被廣泛應用于探測淺層地下的未知物體[2-6]。探地雷達在樹木根系和樹干檢測中也發揮著重要的作用,探地雷達檢測根系的物理基礎是根系與周圍土壤含水率差異,即根系含水率明顯高于周圍土壤,使得兩者的相對介電常數有著較大差異[7-15]。目前利用探地雷達進行植物根系探測研究主要集中在根系形態繪圖、根生物量估計和根的定位等方面,使用探地雷達定量地預測樹根半徑仍然是一個難題[16-19]。
崔喜紅等[20]通過實驗建立了一個基于探地雷達波形信號的根徑和根生物量的估測模型,在根徑大于0.005 m的情況下,R2達到0.85。近些年,深度學習和探地雷達技術開始密切結合,2019年,GIANNAKIS等[21]提出了一種基于深度學習的探地雷達快速正向求解器。王澤鵬等[22]提出了一種基于YOLOv3的樹根自動識別和參數估計的方法。對根雙曲線的識別準確率和召回率分別達到96.62%和86.94%,根系參數預測的總平均相對誤差在10.57%以內。目前,大多數基于探地雷達的深度學習方法都是用探地雷達二維數據(B-Scan)作為基礎開展研究[23-27],B-Scan數據是由實數組成的二維數組,與數字圖像相似。因此這類方法能發揮深度學習在圖像目標識別和分類方面的性能優勢,但對于根系半徑和深度來說,預測精度相對較低。對于根系半徑的預測大多數使用數學方法,需要人工成本,且魯棒性較低[28-31]。
為了解決以上問題,本文以探地雷達檢測根系的一維數據(A-Scan)為研究對象,提出一種基于探地雷達和卷積神經網絡的樹木根系半徑和深度的預測方法。使用注意力機制和卷積神經網絡實現對樹根半徑和深度的預測,利用不同半徑和不同深度的埋根實驗獲得的實測數據對本文方法的預測性能和魯棒性進行評估與分析。
注意力機制由MNIH等[32]首次提出并應用在圖像分類領域,之后在機器學習領域快速發展。注意力機制源于人類視覺系統的處理機制,人類在處理視覺信息時會自動過濾掉不重要的信息,選擇性去關注重點的目標區域,極大地提高了視覺信息處理效率和準確性。而注意力機制應用在基于神經網絡的回歸模型上還比較少,其本質是對輸入數據的特征信息重新分配權重,為重要特征分配更大的權重,突出關鍵特征對模型的影響,以此大大提高模型收斂速度,用較小的計算資源換取模型性能的顯著提升。
注意力機制主要有3個階段,第1階段計算出輸入數據和標簽數據的特征相似度,激活函數(Activation)設置為sigmoid,將A-Scan數據和標簽導入多層神經網絡(Multi-layer perceptron, MLP)進行計算。特征相似度計算公式為
simi(inputsi,labels)=MLP(inputsi,labels)
(1)
式中 simi——特征相似度函數
inputsi——輸入數據
labels——標簽值
MLP(·)——MLP網絡
第2階段根據第1階段計算出的特征相似度進行數值轉換。通過引入Softmax進行計算,一方面可以完成歸一化操作,將原來的特征相似度整理成所有元素權重之和為1的概率分布,另一方面,可以通過Softmax的內在機制突出重要元素的權重。特征權重系數αi計算方法為
(2)
第3階段把第2階段得到的特征權重系數乘到輸入數據中,獲得重新分配權重的輸入數據。對特征權重系數進行加權求和即可得到Attention數值。計算方法為
xnewi=αixi
(3)
(4)
式中xi——原始輸入數據
xnewi——分配權重的輸入數據
本文提出的預測方案是由2個預測模型組成,一個用于預測根系半徑(AC-Net-R),另一個用于預測根系深度(AC-Net-D)。它們是基于注意力機制和卷積神經網絡的深度學習模型,以數值化的A-Scan數據作為輸入,首先,通過注意力模塊突出重要特征信息;然后,使用卷積層來提取特征信息,池化層可以減小網絡結構的參數并保持特征不變,提高模型泛化能力;最后,通過全連接層將前面卷積層所學到的局部特征綜合為A-Scan數據的全局特征。至此,所構建的模型可以自動學習獲取根系半徑或深度的主要特征,完成對根系半徑或深度的預測。根徑預測模型和深度預測模型如圖1所示,圖中Attention表示注意力模塊;Conv1D,n表示卷積核尺寸;MaxPooling1D,/3表示步長為3的最大池化層;Dense,m中的m表示全連接層節點數量;Output為輸出預測值。激活函數可以使神經網絡逼近任何非線性函數,增強模型學習能力。因此,深度神經網絡中激活函數的選擇對模型性能有著重要影響。在本模型中,卷積層激活函數都是ReLU,全連接層激活函數都是PReLU,PReLU可解決模型梯度消失和梯度爆炸的問題,最后一層激活函數是linear,用于連續值預測。

圖1 預測模型
注意力模塊(Attention)結構如圖2所示,圖中αi(i=1,2,…,3 000)為特征權重系數,“⊙”為逐個元素相乘,數值化的A-Scan數據通過2個由3 000個節點組成的全連接層計算得到特征權重系數,將權重系數與數值化A-Scan數據逐個元素相乘得到重新分配權重的A-Scan數據,以達到突出關鍵特征的目的。

圖2 注意力模塊結構圖
本文方法流程如圖3所示,共分為10步:使用gprMax生成仿真數據集完成模型的調參和訓練,然后用真實的數據測試模型的可靠性和魯棒性,在導入模型之前需要先將原始的B-Scan圖像數值轉換成矩陣,再通過去除直達波和標準化操作完成對原始數據的預處理,然后提取出雙曲線頂點的A-Scan數據,最后導入訓練好的模型進行預測得到預測結果。

圖3 方法流程圖
本文利用絕對誤差、均方根誤差、最大誤差[28]和決定系數[20]來評價模型在仿真數據和實測數據上的預測效果。絕對誤差是指預測值與真實值之差的絕對值;均方根誤差可以評價模型預測的穩定性;最大誤差是指一組數據中最大的絕對誤差;決定系數常用于評價回歸模型的擬合程度,決定系數越接近于1表示擬合程度越好。
一個標簽良好、均勻分布的訓練集在訓練過程中至關重要,在很大程度上影響深度學習模型的整體性能[33]。為了預測樹根半徑,從真實數據中獲取數據集耗時費力,需要人工埋根數千次,同時需要保證根的半徑和深度的不同。為了克服這個困難,采用仿真數據集,可以保證標簽的準確和數據集的數量。
仿真數據使用基于時域有限差分(Finite difference time domain, FDTD)方法求解麥克斯韋方程的開源軟件gprMax生成[34],仿真數據的參數設置如表1所示,設置沙土的介電常數為3~6 F/m的隨機數,根系的相對介電常數為15~21 F/m的隨機數,根的半徑為5~30 mm的隨機數,深度為 0~300 mm 的隨機數。仿真數據中使用的天線是由地球物理探測公司(GSSI)制造的400 MHz商用GPR天線。圖4表示生成一條A-Scan數據所需的空間模型縱向切面圖,其中GSSI 400MHz天線放置在地面,位于被測根系的正上方。測得的單個A-Scan作為數據集中的一條數據,而不需要一個完整的 B-Scan數據,這樣可以減少生成仿真數據所需的計算需求。樹根被建模為圓柱形,同時與探地雷達天線保持平行。探地雷達天線與樹根之間的介質設置為沙土,沙土與干土相對介電常數相差不大(干土相對介電常數為3 F/m),且在實地埋根實驗時不容易結塊產生空氣縫隙,以此來充分模擬實際根系在地下緊貼土壤生長的情況。訓練集由3 100條A-Scan數據組成,每條數據有3 000個特征。訓練集分為3部分,65%的數據用于訓練,15%的數據用于驗證,20%的數據用于測試。本文所有的訓練和驗證都是在半徑5~30 mm和深度0~300 mm范圍內進行。

表1 參數設置

圖4 生成一條A-Scan所需的模型
實驗運行環境為Intel Core(TM)i9-9900X @ 3.50 GHz處理器,內存64 GB,Nvidia RTX2080Ti顯卡,12 GB顯存。開發環境為Matlab 2020a、Python 3.6。模型的損失函數使用均方誤差并采用Adam最小化實際值與預測值之間的均方誤差,其中有偏一階矩估計的指數衰減因子為0.9,有偏二階矩估計的指數衰減因子為0.999,2個預測模型的學習率為0.000 3。模型迭代2 000次,每批次樣本數量為64。在訓練過程中,記錄每次迭代損失值和決定系數,如圖5、6所示,半徑預測的模型訓練損失值和驗證損失值在第150次迭代附近下降迅速,在1 000次迭代之后,損失值趨于穩定。R2在第100次迭代附近快速上升,在750次迭代之后,R2曲線逐漸逼近1。深度預測模型的損失值和R2曲線在第1 500次迭代之前有明顯的振蕩,但在之后逐漸趨于穩定,曲線的其他走勢特點與半徑預測模型相近,所以不再贅述。

圖5 根系半徑模型損失和決定系數變化曲線

圖6 根系深度模型損失和決定系數變化曲線
圖7為模型在仿真數據上的預測效果,預測使用訓練集中不包含的600條仿真數據,當預測值和真實值越相近時,數據點就會越靠近y=x直線,也就表示模型預測效果和擬合程度越優。從圖7可以看出,模型擬合程度較好,其中根系深度預測模型擬合程度較好。

圖7 預測結果
將本文提出的預測模型與其他常用回歸模型進行比較,比較結果如表2所示。在使用相同訓練集和測試集的情況下,本文提出的模型半徑預測最大誤差為2.9 mm,R2為0.990,均方根誤差為0.000 68 m,能夠準確預測出樹根半徑,相較于其他模型,最大誤差、決定系數和均方根誤差都有明顯優勢。深度預測最大誤差為11.2 mm,R2為0.999,均方根誤差為0.002 0 m,雖然決定系數只略高于其他模型,但最大誤差和均方根誤差明顯優于其他模型,說明模型在擬合效果相差不大的情況下,有著更佳的預測精度和預測穩定性。由此可知,本文提出的預測方案在根系半徑和深度預測上是可行和有效的。同時,通過訓練好的模型,可以實現對根系半徑和深度的快速預測,節省了大量人工成本。

表2 不同模型性能比較
2.4.1數據采集
為了進一步驗證本文預測方案的泛化能力,采用人工埋根的方式采集數據進行測試,實測數據采集使用美國GSSI公司的SIR-3000型探地雷達,如圖8所示,雷達天線設置為400 MHz頻率。實驗場地位于江南大學西北操場沙坑,沙坑土質較為均一,本實驗期間未發生降雨,沙土含水率穩定,沙坑實驗區域的沙土含水率使用國產FY886型水分測試儀測得,為5.70%,介電常數為4.97 F/m[42],符合夏季暴曬后干燥沙土的實際情況。同時選擇介電常數與活根相近的樹枝代替真實根系,并通過測量根的前中后3個位置計算平均值得到根系半徑。選取5個半徑不同的樣本根系作為實驗對象,如表3所示,在2個不同深度的實驗坑中完成兩組實地埋根實驗,最后采集到10條A-Scan數據用于測試。

圖8 探地雷達檢測設備

表3 樣本根系數據
圖9為深度不同的2個實驗坑,其中圖9a的深度約為100 mm,圖9b的深度約為200 mm,埋入根后單獨測量每條根的深度。

圖9 實驗現場
2.4.2數據預處理
由于實測數據含有雜波,與仿真數據存在較大差別,所以需要通過數據預處理減少噪聲對預測結果的影響。如圖10所示,圖10a為一個樹根的實測B-Scan圖像,在圖中可以明顯看到直達波,也就是圖中的水平黑帶,這是雷達信號未經過反射和折射直接到達地面而產生的波,而在仿真數據中,默認雷達是貼緊地面的,已經消除直達波,所以需要消除實測數據中的直達波[43],圖10b為消除直達波后的效果。圖10c為經過標準化后的結果,由于實測數據和仿真數據之間特征取值范圍差異較大,因此,經過標準化處理之后,實測數據會在模型上有更好的預測效果,通過對比可以發現,標準化之后的B-Scan圖像雙曲線變得更加清晰明顯,有數據增強的效果。

圖10 數據預處理示例
2.4.3預測結果
通過數據預處理后,將實測數據導入之前訓練好的模型,得到的預測結果如表4所示,使用本文方案對根系半徑預測的最大誤差和平均相對誤差為1.56 mm、6.45%,對根系深度預測的最大誤差和平均相對誤差分別為9.90 mm和5.21%,總平均相對誤差為5.83%。利用實測數據得到的預測結果表明,提出的方法能成功預測出接近真實值的半徑和深度信息。因為實測數據量遠小于仿真數據量,所以實測數據預測結果會略優于仿真數據預測結果。2組實驗表示樣本根系在淺層和深層的預測效果,其中,根系深度單獨測量,與實驗坑深度相近但不相同,樣本根系半徑和深度基本覆蓋了模型訓練集的設定范圍。

表4 樣本根系預測結果
訓練集很大程度上影響著深度學習模型的性能,優質且數量大的訓練集可以明顯提升模型預測效果。在訓練集中加入真實的A-Scan數據可以提升模型在實測數據上的魯棒性。一個由真實數據組成、特征空間覆蓋全面的數據集能夠為相關的研究工作提供極大的幫助和支持。
高頻雷達信號可以有效提升雷達的垂直分辨率,獲取更多的地下信息,但在傳播過程中會損失大量信號,很難實現對深層根系檢測,在淺層根系檢測中,高頻雷達的優勢明顯,可以大大降低對細根預測的誤差,提升整體預測精度。
土壤含水率和同質性會影響電磁波的傳播,當土壤含水率較高時,使得土壤相對介電常數升高,其與根系相對介電常數差值變小,反射信號的強度變弱,即在B-Scan中的雙曲線變得模糊,降低模型預測精度,而土壤同質性差會產生雜波增加模型預測難度,在圖10b中可以看到除反射雙曲線外的其他深色區域,這就是由土壤異質產生的雜波。通過大量實驗發現,在實地埋根實驗中使用干土作為介質會遇到干土結塊導致出現大量空氣縫隙的問題,空氣縫隙的出現會產生雜波增加模型預測難度,因此,為了減小預測誤差可以使用含水率較低、材質均一、相對介電常數相近的干燥沙土完成實測數據的采集。
根與土壤的相對介電常數差值越大反射信號越強。在研究過程中發現,使用干枯樹枝代替根系所采集到的雷達圖像,其反射雙曲線非常模糊,甚至難以找到,為雙曲線頂點A-Scan數據的提取增加難度,人工標定的準確率降低,而新鮮的樣本根系水分含量充足,相對介電常數較高,采集得到的反射雙曲線更加清晰。因此,在實地實驗中,選用更貼近真實情況的新鮮根系作為實驗樣本將會減小模型預測誤差。同時,本文在訓練集中添加了不新鮮根系的樣本,以此來增加模型的泛化能力。
(1)提出了一種基于探地雷達和卷積神經網絡的根系半徑和深度預測方法,可實現對根系半徑和深度的準確預測。
(2)在仿真實驗中,半徑和深度預測的最大誤差分別為2.9 mm和11.2 mm,遠遠優于其他常用回歸模型;在實測實驗中,半徑和深度預測的最大誤差分別為1.56 mm和9.90 mm,總平均相對誤差為5.83%,證明采用本文的預測方案可以準確預測出根系半徑和深度。
(3)通過實驗發現,相比于B-Scan圖像,A-Scan數據包含更多有關半徑和深度的信息,且更容易被深度模型學習到,因此,使用A-Scan數據作為數據集更容易訓練出精度高、魯棒性強的根系半徑和深度預測模型。從訓練數據可發現,本文模型應用范圍為根系半徑5~30 mm,根系深度 0~300 mm,本文方法適用于雙曲線頂點處A-Scan數據,因此,偏離該前提或超出模型應用范圍都有可能導致模型預測錯誤和不穩定。