




基金項(xiàng)目:塔里木大學(xué)校長基金項(xiàng)目;項(xiàng)目名稱:南疆核桃樹生長模型研究;項(xiàng)目編號(hào):TDZKYB202202。
作者簡介:陳杰(1981—),男,講師,碩士;研究方向:農(nóng)業(yè)信息化,模型。
摘要:文章提出了一種利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的核桃樹生長模型來預(yù)測核桃樹的樹高、胸徑的方法,通過優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值建立GA-BP模型,與多元線性回歸模型的預(yù)測結(jié)果進(jìn)行比較。結(jié)果表明:采用遺傳算法優(yōu)化后的模型具有更高的預(yù)測精度,對(duì)核桃樹生長預(yù)測具有指導(dǎo)意義。
關(guān)鍵詞:遺傳算法;DB神經(jīng)網(wǎng)絡(luò);GA-BP模型;核桃樹生長模型
中圖分類號(hào):S6641文獻(xiàn)標(biāo)志碼:A
0引言
新疆南部地區(qū)(以下簡稱“南疆”)日照時(shí)間長、光熱資源豐富,為核桃的生長提供了絕佳的自然條件。核桃樹作為南疆地區(qū)的主要經(jīng)濟(jì)樹種,其主要種植產(chǎn)區(qū)為和田、喀什、阿克蘇等地區(qū)。核桃樹的樹高、胸徑等因素是研究人員分析核桃樹生長情況的重要指標(biāo),需要測量和采集相關(guān)數(shù)據(jù)以研究核桃樹的生長發(fā)育情況。傳統(tǒng)的測量方式是使用人工測量的方法獲取樹高和胸徑等數(shù)據(jù),然后對(duì)數(shù)據(jù)進(jìn)行測量和圖表繪制。通常傳統(tǒng)測量方法需要使用大量的人力進(jìn)行測量和繪制工作,測量過程中難以避免出現(xiàn)費(fèi)用高、數(shù)據(jù)完整性較差、測量難度大等諸多問題,在進(jìn)行大規(guī)模核桃園區(qū)的信息采集與研究過程中容易出現(xiàn)因?yàn)槿藶槭д`導(dǎo)致研究出錯(cuò)的情況。
近年來,諸多研究人員開始研究基于計(jì)算機(jī)技術(shù)研究樹木的三維結(jié)構(gòu)模型。Shlyakhter等[1]于2001年提出通過所拍攝的照片來重建樹木三維結(jié)構(gòu)模型,首先利用圖像分割技術(shù)來重建樹體框架,但具體的細(xì)節(jié)部分仍然由L-system輔助完成。Tan等[2]通過大量樹木拍攝的圖像信息,利用圖像分析技術(shù)求解出點(diǎn)云模型重建可見枝干結(jié)構(gòu),然后使用程序修復(fù)模型的缺陷,再利用圖像分割技術(shù)和圖像渲染技術(shù)對(duì)枝干結(jié)構(gòu)進(jìn)行圖像渲染,得出所拍樹木的三維結(jié)構(gòu)。邵俊飛等[3]總結(jié)了傳統(tǒng)測量工具存在的不足,對(duì)傳統(tǒng)測量工具進(jìn)行改良,結(jié)合傳感器技術(shù)實(shí)現(xiàn)了胸徑卡尺的數(shù)字化,提高了測量準(zhǔn)確性。臧顥等[4]建立了描述樹高和胸徑的關(guān)系的非線性混合效應(yīng)模型,該模型能夠用于多種樹木樹高和胸徑計(jì)算。
本文結(jié)合多項(xiàng)核桃樹生長影響因子研究了一種基于GA-BP神經(jīng)網(wǎng)絡(luò)的南疆核桃樹生長模型,用于預(yù)測南疆果園核桃樹的樹高、胸徑。基本研究思路為:首先,收集核桃樹生長的因子數(shù)據(jù);然后,將數(shù)據(jù)帶入設(shè)計(jì)好的4層BP神經(jīng)網(wǎng)絡(luò)模型,通過多次模型迭代完成數(shù)據(jù)預(yù)測。由于BP神經(jīng)網(wǎng)絡(luò)的梯度下降算法存在訓(xùn)練效率低、容易陷入局部最優(yōu)解等問題,為了改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的運(yùn)算效率、提高準(zhǔn)確度,本研究在模型計(jì)算中使用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)模型。
1材料與方法
11研究區(qū)概況與供試材料
實(shí)驗(yàn)依托新疆生產(chǎn)建設(shè)兵團(tuán)第一師阿拉爾市三團(tuán)核桃實(shí)驗(yàn)站進(jìn)行,三團(tuán)位于塔克拉瑪干沙漠的北部邊沿,團(tuán)部地理坐標(biāo)為40°22′30″N,80°03′45″E,海拔1049m,行政區(qū)域面積49214km2。該地屬暖溫帶大陸性干旱荒漠氣候,最高氣溫439℃,最低氣溫-288℃,年平均氣溫1153℃,年均無霜期195d,年均降水量735mm,全年太陽輻射總量5930MJ/m2,日照時(shí)數(shù)為266866h,年平均風(fēng)速108m/s,平均氣壓8968hPa,平均蒸發(fā)量174875mm,是降水量的238倍[5]。年均相對(duì)濕度531%。實(shí)驗(yàn)站主栽“溫185”經(jīng)濟(jì)林木,園區(qū)于2018年開始植苗建園,2020年開始進(jìn)行核桃主干修型,株行距40m×15m。
12數(shù)據(jù)來源
實(shí)驗(yàn)于2022年3—11月開展,在園區(qū)中選擇5株核桃樹作為樣本記錄其胸徑和樹高,同時(shí)選取同一園區(qū)的降水(mm)、氣壓(mbar)、太陽輻射(W/m2)、空氣溫度(℃)、空氣相對(duì)濕度(%)、風(fēng)速(m/s)、風(fēng)向(deg)、紫外線指數(shù)(UVI)、葉面溫度(℃)、土壤濕度(%)、土壤溫度(℃)等進(jìn)行記錄。實(shí)驗(yàn)同時(shí)獲取兵團(tuán)南疆特色果樹生產(chǎn)工程實(shí)驗(yàn)室的歷史數(shù)據(jù),共獲取3872條數(shù)據(jù)(包含48條異常數(shù)據(jù)),選取2816條數(shù)據(jù)訓(xùn)練模型,1008條數(shù)據(jù)檢驗(yàn)?zāi)P汀?/p>
13數(shù)據(jù)處理
實(shí)驗(yàn)首先需要進(jìn)行數(shù)據(jù)篩選工作,以便于尋找到影響核桃樹生長的主要因子,減輕預(yù)測模型的計(jì)算量。由于場地相關(guān)條件限制,實(shí)驗(yàn)選擇了上述11種環(huán)境因子進(jìn)行皮爾遜相關(guān)系數(shù)計(jì)算,通過計(jì)算相關(guān)系數(shù)R的絕對(duì)值來分析環(huán)境因子的相關(guān)度,R的絕對(duì)值越接近1說明相關(guān)性越高。最終,經(jīng)過計(jì)算的相關(guān)系數(shù)R絕對(duì)值如圖1所示。根據(jù)圖1中相關(guān)系數(shù)計(jì)算結(jié)果,實(shí)驗(yàn)選取了降水、空氣濕度、空氣相對(duì)濕度、風(fēng)速、紫外線指數(shù)、葉面溫度、土壤溫度、土壤濕度8項(xiàng)環(huán)境因子的數(shù)據(jù)作為GA-BP神經(jīng)網(wǎng)絡(luò)模型的數(shù)據(jù)來源。
14研究方法
BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)基于均方差進(jìn)行反向傳播訓(xùn)練。模型在本質(zhì)上計(jì)算實(shí)際輸出值和期望輸出值之間的均方差,使用梯度下降算法對(duì)均方差進(jìn)行優(yōu)化以求出最優(yōu)解。輸入信號(hào)通過輸入層、隱含層和輸出層進(jìn)行正向傳播和反向調(diào)整,經(jīng)過不斷迭代運(yùn)算調(diào)整各個(gè)神經(jīng)元節(jié)點(diǎn)之間的連接強(qiáng)度,使數(shù)據(jù)的均方差沿梯度方向下降。通過輸入層、隱含層、輸出層的反復(fù)學(xué)習(xí)訓(xùn)練,最終確定與最優(yōu)解相對(duì)應(yīng)的權(quán)值和閾值。BP神經(jīng)網(wǎng)絡(luò)也具有學(xué)習(xí)效率低和計(jì)算不穩(wěn)定的缺點(diǎn),故而實(shí)驗(yàn)引入遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)優(yōu)化。優(yōu)化方法一般為:首先,對(duì)遺傳算法的個(gè)體進(jìn)行相應(yīng)編碼,使個(gè)體包含神經(jīng)網(wǎng)絡(luò)的相關(guān)數(shù)據(jù)值;然后,使用適應(yīng)度函數(shù)計(jì)算相關(guān)個(gè)體的適用概率,通過模擬現(xiàn)實(shí)中的遺傳和進(jìn)化算法進(jìn)行選擇操作、交叉操作和變異操作;最后,尋找到合適的最優(yōu)個(gè)體。GA-BP神經(jīng)網(wǎng)絡(luò)模型的基本步驟如下:
(1)種群初始化。種群初始化的主要工作是對(duì)個(gè)體進(jìn)行編碼,個(gè)體可以認(rèn)為是一個(gè)實(shí)數(shù)串,數(shù)據(jù)部分由輸入層權(quán)值、隱含層閾值、隱含層權(quán)值、輸出層閾值編碼組成。
(2)適應(yīng)度計(jì)算。在本模型中,使用線性尺度變換將個(gè)體的相關(guān)數(shù)據(jù)值代入BP神經(jīng)網(wǎng)絡(luò)計(jì)算結(jié)果,求出計(jì)算結(jié)果與期望結(jié)果之間的誤差絕對(duì)值之和,在此基礎(chǔ)上添加一個(gè)偏置值作為個(gè)體適應(yīng)度值。
(3)選擇操作。使用排序選擇方法對(duì)個(gè)體進(jìn)行適應(yīng)度排序,將排序后的個(gè)體設(shè)置不同的優(yōu)先級(jí),優(yōu)先選擇優(yōu)先級(jí)較高的個(gè)體進(jìn)行交叉操作。
(4)交叉操作。由于個(gè)體采用實(shí)數(shù)串編碼,故而設(shè)計(jì)實(shí)數(shù)交叉法進(jìn)行交叉操作。具體為隨機(jī)選擇編號(hào)為x的個(gè)體和編號(hào)為y的個(gè)體在j點(diǎn)進(jìn)行交叉,交叉后的個(gè)體作為優(yōu)先個(gè)體進(jìn)行計(jì)算。
(5)變異操作。隨機(jī)選擇個(gè)體x在j點(diǎn)的值進(jìn)行變異產(chǎn)生新個(gè)體。
15核桃樹生長模型構(gòu)建
根據(jù)上述描述,設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下:
(1)神經(jīng)網(wǎng)絡(luò)輸入層有8個(gè)節(jié)點(diǎn),對(duì)應(yīng)8個(gè)相關(guān)因子。輸入層與隱含層的數(shù)據(jù)轉(zhuǎn)換如公式(1)所示。
αk=∑ni=1uixi+b(1)
其中,n為輸入層節(jié)點(diǎn)數(shù)量,b為偏置量,xi為輸入數(shù)據(jù),ak為輸入層第k個(gè)神經(jīng)元的輸出數(shù)據(jù)。
(2)為提高計(jì)算精度設(shè)置2層隱含層,其中隱含層1有11個(gè)節(jié)點(diǎn),隱含層2有5個(gè)節(jié)點(diǎn)。隱含層1和隱含層2的數(shù)據(jù)轉(zhuǎn)換如公式(2)所示。
βk=∑ni=1vif(αi)+b(2)
其中,n為隱含層1節(jié)點(diǎn)數(shù)量,b為偏置量,ai為輸入數(shù)據(jù),βk為隱含層2第k個(gè)神經(jīng)元的輸出數(shù)據(jù)。f函數(shù)為隱含層的激活函數(shù)Sigmoid函數(shù)。
(3)經(jīng)網(wǎng)絡(luò)輸出層有2個(gè)節(jié)點(diǎn),對(duì)于2個(gè)預(yù)測結(jié)果。隱含層2與輸出層的數(shù)據(jù)轉(zhuǎn)換如公式(3)所示。
γk=∑ni=1wif(βi)+b(3)
其中,n為隱含層2節(jié)點(diǎn)數(shù)量,b為偏置量,βi為輸入數(shù)據(jù),γk為輸出層第k個(gè)神經(jīng)元的輸出數(shù)據(jù)。f函數(shù)為隱含層的激活函數(shù)Sigmoid函數(shù)。
2結(jié)果與分析
在獲取到核桃樹生長模型后,使用剩余的1008條數(shù)據(jù)進(jìn)行數(shù)據(jù)驗(yàn)證。使用線性回歸算法比較預(yù)測結(jié)果與實(shí)測結(jié)果,根據(jù)線性回歸算法的結(jié)果繪制線性回歸圖,如圖2所示。預(yù)測結(jié)果與實(shí)測結(jié)果的回歸系數(shù)較為接近于1,說明預(yù)測結(jié)構(gòu)與實(shí)測結(jié)果的相似性較高。
采用相同的驗(yàn)證數(shù)據(jù)建立線性回歸模型,比較GA-BP模型與多元線性回歸模型的R2、MSE和MAE來檢驗(yàn)?zāi)P偷木冉Y(jié)果如表1所示。GA-BP模型的R2值明顯高于線性回歸模型,MSE和MAE明顯低于線性回歸模型,說明核桃樹生長模型的預(yù)測準(zhǔn)確性遠(yuǎn)高于多元線性回歸模型。通過數(shù)據(jù)比較說明GA-BP模型效果顯著,樹高、胸徑的預(yù)測值與實(shí)測值無明顯差異,變化趨勢基本相同。
3結(jié)語
本文分析了南疆核桃樹在傳統(tǒng)測量上遇到的費(fèi)用高、數(shù)據(jù)完整性較差、測量難度大等諸多問題,研究了一種基于GA-BP神經(jīng)網(wǎng)絡(luò)的核桃樹生長模型。模型首先通過相關(guān)性分析選取了8個(gè)相關(guān)性較強(qiáng)的因子,然后利用選擇的數(shù)據(jù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),根據(jù)BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效率低和計(jì)算不穩(wěn)定的缺點(diǎn),使用GA算法進(jìn)行優(yōu)化,最終完成GA-BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建。本文將核桃樹生長模型與其他模型進(jìn)行實(shí)驗(yàn)結(jié)果比較,發(fā)現(xiàn)本文提供的方法具有更高的準(zhǔn)確性。然而,本模型還有改進(jìn)的空間,比如:因?yàn)闂l件限制,模型在因子選擇時(shí)沒有考慮肥料和人工的影響,因子選擇較少,數(shù)據(jù)量不足等問題。
參考文獻(xiàn)
[1]SHLYAKHTERI,ROZENOERM,DORSEYJ,etal.Reconstructing3Dtreemodelsfrominstrumentedphotographs[J].IEEEComputerGraphicsandApplications,2001(3):53-61.
[2]TANP,F(xiàn)ANGT,XIAOJ,etal.Singleimagetreemodeling[J].AcmTransactionsonGraphics,2008(5):1-7.
[3]邵俊飛,徐華東,徐偉通,等.數(shù)顯樹木胸徑測量儀結(jié)構(gòu)設(shè)計(jì)及工作原理分析[J].森林工程,2015(4):98-100.
[4]臧顥,雷相東,張會(huì)儒,等.紅松樹高-胸徑的非線性混合效應(yīng)模型研究[J].北京林業(yè)大學(xué)學(xué)報(bào),2016(6):8-16.
[5]郭眾仲,宋全偉,張銳,等.新疆溫185核桃主干形樹形栽培模式營造技術(shù)[J].新疆農(nóng)墾科技,2017(3):16-17.
(編輯王永超)