





摘要:基于BP神經(jīng)網(wǎng)絡(luò)算法,探討了樹狀結(jié)構(gòu)智能找形分析的方法與應(yīng)用。通過建立BP神經(jīng)網(wǎng)絡(luò)模型,利用其優(yōu)秀的非線性映射和學(xué)習(xí)能力,實現(xiàn)了對樹狀結(jié)構(gòu)圖像的形狀識別和分析。對樹狀結(jié)構(gòu)進行了圖像預(yù)處理和特征提取,然后將提取的特征作為BP神經(jīng)網(wǎng)絡(luò)的輸入訓(xùn)練網(wǎng)絡(luò)模型以識別不同形狀的樹狀結(jié)構(gòu)。實驗結(jié)果表明,所提方法在形狀識別的準確性和魯棒性上均取得了良好表現(xiàn),具有較高的應(yīng)用潛力和推廣價值。為樹狀結(jié)構(gòu)圖像處理領(lǐng)域提供了一種有效的分析方法,有助于進一步提升圖像識別技術(shù)在實際應(yīng)用中的應(yīng)用效果和智能化水平。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò)算法;樹狀結(jié)構(gòu);智能找形
一、前言
傳統(tǒng)的找形分析方法存在著計算復(fù)雜度高、收斂速度慢等問題,難以滿足工程實際需求。而BP神經(jīng)網(wǎng)絡(luò)具有較強的非線性擬合能力和自適應(yīng)學(xué)習(xí)能力,能夠有效地提高找形分析的效率和精度。建立了樹狀結(jié)構(gòu)的數(shù)學(xué)模型,并將其轉(zhuǎn)化為神經(jīng)網(wǎng)絡(luò)訓(xùn)練問題。然后,通過設(shè)計合適的網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練算法,實現(xiàn)了對樹狀結(jié)構(gòu)的智能找形分析。實驗結(jié)果表明,本文提出的方法在計算效率和收斂速度方面具有明顯優(yōu)勢,能夠有效地應(yīng)用于工程實際。研究不僅拓展了BP神經(jīng)網(wǎng)絡(luò)的應(yīng)用領(lǐng)域,也為樹狀結(jié)構(gòu)找形分析提供了新的思路和方法。希望本文能為相關(guān)領(lǐng)域的研究和實踐提供參考和借鑒。
二、BP神經(jīng)網(wǎng)絡(luò)算法
BP神經(jīng)網(wǎng)絡(luò)即反向傳播神經(jīng)網(wǎng)絡(luò)(Backpropagation Neural Network),是一種常見的人工神經(jīng)網(wǎng)絡(luò)模型,用于解決分類和回歸問題。以下是關(guān)于BP神經(jīng)網(wǎng)絡(luò)算法的一些重要信息:從輸入層開始,通過隱藏層逐層計算輸出,直到輸出層。每一層的神經(jīng)元將輸入信號加權(quán)求和后,通過激活函數(shù)產(chǎn)生輸出。通過比較網(wǎng)絡(luò)的輸出和實際目標值,計算輸出層和隱藏層的誤差,并根據(jù)誤差調(diào)整權(quán)重。這一過程是通過梯度下降優(yōu)化算法實現(xiàn)的,目的是最小化損失函數(shù)。如圖1所示,BP神經(jīng)網(wǎng)絡(luò)通常由輸入層、若干個隱藏層和輸出層組成。每一層都包含多個神經(jīng)元,每個神經(jīng)元與前一層的所有神經(jīng)元連接,并帶有權(quán)重。通常隱藏層使用的激活函數(shù)為sigmoid函數(shù)、ReLU(Rectified Linear Unit)函數(shù)或tanh函數(shù),輸出層的激活函數(shù)根據(jù)具體問題選擇,如sigmoid用于二分類問題,softmax用于多分類問題,線性函數(shù)用于回歸問題。輸入數(shù)據(jù)經(jīng)過權(quán)重和激活函數(shù)計算得到輸出。
對于輸入數(shù)據(jù)x和網(wǎng)絡(luò)中的第l個隱層,第i個神經(jīng)元,其輸出ai(l)可以通過以下公式計算:
ai(l)=σ(j∑wij(l)aj(l-1)+bi(l)) (1)
σ是激活函數(shù),wij(l)是從第l?1層第j個神經(jīng)元到第l層第i個神經(jīng)元的權(quán)重,bi(l)是第l層第i個神經(jīng)元的偏置。
常用的成本函數(shù)是均方誤差(Mean Squared Error,MSE),其公式為:
J=m1i=1∑m(y^(i)-y(i))2 (2)
m是樣本數(shù)量,y^(i)是網(wǎng)絡(luò)的預(yù)測輸出,y(i)是實際的標簽輸出。
BP神經(jīng)網(wǎng)絡(luò)廣泛應(yīng)用于預(yù)測、分類、控制和模式識別等領(lǐng)域,如金融預(yù)測、醫(yī)學(xué)診斷、語音識別等。
三、樹形特征及分類
樹木圖像的分割是計算機視覺和圖像處理中的一個重要步驟,它涉及將樹木圖像劃分為多個區(qū)域或段,以便于進一步分析和處理,如圖2所示。這種方法簡單快捷,但對圖像的質(zhì)量和閾值的選擇較為敏感。使用邊緣檢測算法,如Canny、Sobel、Prewitt等來識別樹木圖像中的邊緣,從而分割出樹木的輪廓。這種方法可以有效地提取樹木的主要結(jié)構(gòu),但無法處理樹木的內(nèi)部細節(jié)。區(qū)域生長是一種基于像素相似性的圖像分割方法。它從一組初始種子點開始,逐漸將相似的像素合并到相應(yīng)的區(qū)域中。對于樹木圖像,可以從樹木的種子點開始,將具有相似顏色和紋理的像素合并為樹木區(qū)域。可以首先使用閾值分割或邊緣檢測來粗略分離樹木和背景,然后使用區(qū)域生長或水平集方法來細化分割,最后利用深度學(xué)習(xí)方法進行精確的像素級分割。
四、基于BP神經(jīng)網(wǎng)絡(luò)算法的樹狀結(jié)構(gòu)智能找形系統(tǒng)設(shè)計
(一)輸入層
輸入層選擇15個節(jié)點來代表6個分形維數(shù)和9個樹形特征值。在這種情況下,假設(shè)這15個節(jié)點是用于構(gòu)建一個神經(jīng)網(wǎng)絡(luò)的輸入層,每個節(jié)點代表了不同的特征。6個分形維數(shù)可以用節(jié)點1到節(jié)點6來表示,9個樹形特征值可以用節(jié)點7到節(jié)點15來表示,構(gòu)建一個BP神經(jīng)網(wǎng)絡(luò),輸入層有15個節(jié)點,隱藏層和輸出層的節(jié)點數(shù)可以根據(jù)網(wǎng)絡(luò)的設(shè)計來確定。在訓(xùn)練過程中,需要使用適當(dāng)?shù)募せ詈瘮?shù)和成本函數(shù)。激活函數(shù)可以選擇Sigmoid函數(shù)、ReLU函數(shù)等,成本函數(shù)可以選擇均方誤差(MSE)、交叉熵等。
Nδ=M^2-∑(i=1toM/δ)
∑(j=1toM/δ)(uδ(i,j)-bδ(i,j)) (3)
M是圖像的高度或?qū)挾龋僭O(shè)為M×M的方形圖像),δ是格子的大小,uδ(i,j)和bδ(i,j)分別是格子(i,j)中像素的最大灰度和最小灰度值,分形維數(shù)的估計可以通過計算不同尺寸δ的盒子數(shù)量Nδ來獲得。通常,δ的取值范圍可以從圖像尺寸的某個比例開始,如1%到10%的圖像尺寸[1]。
分形維數(shù)的計算公式為:
D=(lim(δ→0)[(log(Nδ)/log(δ))]) (4)
在實際計算中,通常對多個δ值進行平均,以減少噪聲和隨機性的影響,從而獲得更準確的分形維數(shù)估計。
(二)隱含層
選擇隱含層只有一個節(jié)點(單元)的設(shè)計是極其不尋常的。通常情況下,隱含層的節(jié)點數(shù)應(yīng)該是根據(jù)任務(wù)的復(fù)雜性和訓(xùn)練數(shù)據(jù)的特點來選擇的。一般來說,較少的節(jié)點會限制神經(jīng)網(wǎng)絡(luò)的表達能力,使其難以捕捉復(fù)雜的模式和關(guān)系。如圖3所示,隱含層節(jié)點數(shù)過多會增加網(wǎng)絡(luò)的學(xué)習(xí)時間,尤其是在大型數(shù)據(jù)集上,會增加訓(xùn)練的時間成本。過多的節(jié)點導(dǎo)致網(wǎng)絡(luò)過擬合訓(xùn)練數(shù)據(jù),從而在未見過的數(shù)據(jù)上表現(xiàn)不佳。選擇適當(dāng)?shù)碾[含層節(jié)點數(shù)通常需要進行實驗和驗證。一般建議從較少的節(jié)點數(shù)開始,逐步增加,直到發(fā)現(xiàn)增加節(jié)點數(shù)不再顯著提高性能為止。這意味著任務(wù)相對簡單,或者是某種特殊情況下的優(yōu)化結(jié)果[2]。通常來說,選擇僅有一個節(jié)點的隱含層會限制網(wǎng)絡(luò)的能力,特別是在處理多樣化和復(fù)雜的樹形數(shù)據(jù)時。
(三)輸出層
輸出層的數(shù)量取決于樹形的種類,因此有6個節(jié)點。每個節(jié)點代表一種樹形,意味著網(wǎng)絡(luò)的輸出層有6個神經(jīng)元,用于生成樹形類型的預(yù)測。在BP算法中加入動量項,動量項實際上是一種阻尼項,它可以幫助減小學(xué)習(xí)過程中的振蕩趨勢,從而改善網(wǎng)絡(luò)的收斂性。
Δω(n)=η(n)×d-Δω(n-1)+Δη×Δω(n-1) (5)
Δω(n)是本次的權(quán)重點變化。Δω(n-1)是前次的權(quán)重點變化,d是本次誤差計算得到的權(quán)重點變化,η(n)是本次的慣性系數(shù),Δη是慣性系數(shù)每次的變化量。
五、試驗及結(jié)果分析
(一)樣本分析
樣本采集于江蘇地區(qū)的行道樹,并經(jīng)過修剪。在選擇樣本時,考慮了樹形的不同種類和背景的典型性,以確保訓(xùn)練數(shù)據(jù)的代表性和多樣性。這樣的樣本選擇方法有助于提高神經(jīng)網(wǎng)絡(luò)的泛化能力和識別準確性。在訓(xùn)練階段,選擇了36種已知樹形作為樣本,每種樹形分別取6種,以豐富訓(xùn)練數(shù)據(jù)。這種做法有助于網(wǎng)絡(luò)學(xué)習(xí)到不同樹形的特征,提高識別的準確性。
(二)迭代次數(shù)的確定
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是通過調(diào)整網(wǎng)絡(luò)權(quán)重來最小化預(yù)測輸出和實際輸出之間的誤差。這個過程涉及前向傳播(計算輸出)和反向傳播(計算誤差并更新權(quán)重) [3]。在訓(xùn)練過程中,通常會將數(shù)據(jù)集分為訓(xùn)練集和測試集。訓(xùn)練集用于訓(xùn)練網(wǎng)絡(luò),而測試集用于評估網(wǎng)絡(luò)的性能。理想情況下,訓(xùn)練集和測試集應(yīng)該能夠代表實際應(yīng)用場景中的數(shù)據(jù)分布。均方根偏差是一種衡量預(yù)測值與實際值之間差異的指標。在訓(xùn)練過程中,會監(jiān)控訓(xùn)練集和測試集的RMSE值來評估網(wǎng)絡(luò)的性能。在訓(xùn)練初期,訓(xùn)練集和測試集的RMSE都會下降,因為網(wǎng)絡(luò)在不斷學(xué)習(xí)數(shù)據(jù)特征。隨著訓(xùn)練的進行,訓(xùn)練集的RMSE會繼續(xù)下降,測試集的RMSE會先下降后保持平穩(wěn)甚至上升,訓(xùn)練集的RMSE仍在下降,可以確保網(wǎng)絡(luò)在測試集上的表現(xiàn)已經(jīng)足夠好,從而提高在未知數(shù)據(jù)上的泛化能力。
(三)試驗結(jié)果分析
1.原始圖像結(jié)果
香樟圖像樣本展示了一個人穿著色澤鮮艷的衣服,地面有草坪,背景是一個灰色的房屋,房屋背后有各種樹木。這樣的背景信息對于樹木識別任務(wù)來說是很有挑戰(zhàn)性的,因為它包含了多種不同的物體和紋理。在圖像處理中,分割是將圖像劃分為多個區(qū)域或?qū)ο蟮倪^程。在這個案例中,分割的目的是將香樟樹冠從背景中分離出來,通常涉及閾值處理、邊緣檢測或更高級的分割技術(shù),如區(qū)域生長、水平集方法或深度學(xué)習(xí)中的分割網(wǎng)絡(luò)。界面顯示了識別結(jié)果,包括樹形識別的類型、歸一化后樹形的6個分形維數(shù)和9個樹冠的形狀特征參數(shù)。這些特征參數(shù)是用來描述樹冠的幾何特征,圖4的右邊顯示了灰度直方圖。灰度直方圖提供了圖像中像素灰度值的分布信息,有助于理解圖像的亮度和對比度特性[4]。
2.識別結(jié)果
見表1,基于顏色的分割方法,這種方法通過分析圖像中的顏色信息來分割樹木。對于樣本8,雖然使用基于顏色的方法能夠得到完整的分割圖像,但由于分割誤差較大,識別算法無法準確地識別樹木的形狀,在實際應(yīng)用中,為了提高分割和識別的準確性,通常需要結(jié)合先驗知識[5]。樹木通常具有特定的形狀或紋理特征,可以在分割算法中加入這些知識,以幫助算法更準確地識別和分割樹木。在分割時,能夠利用形狀信息指導(dǎo)分割算法,以避免將草坪等水平區(qū)域誤分為樹木。
六、結(jié)語
本文基于BP神經(jīng)網(wǎng)絡(luò)算法,探索了樹狀結(jié)構(gòu)智能形狀分析的方法與應(yīng)用。通過圖像預(yù)處理、特征提取和BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練,成功實現(xiàn)了對樹狀結(jié)構(gòu)的形狀識別和分析。研究結(jié)果顯示,所提出的方法在形狀識別的準確性和魯棒性方面表現(xiàn)出色,為樹狀結(jié)構(gòu)圖像處理領(lǐng)域提供了新的思路和技術(shù)支持,為圖像識別技術(shù)的發(fā)展和應(yīng)用奠定了堅實的基礎(chǔ)。
參考文獻
[1]周軼凡,陸明,郭喆,等.基于遺傳算法與神經(jīng)網(wǎng)絡(luò)的建筑結(jié)構(gòu)找形優(yōu)化研究[C]//全國高等學(xué)校建筑學(xué)專業(yè)指導(dǎo)委員會.2020全國建筑院系建筑數(shù)字技術(shù)教學(xué)與研究學(xué)術(shù)研討會,2020.
[2]孫中波,趙立銘,劉克平,等.一種基于歸零神經(jīng)網(wǎng)絡(luò)的張拉整體結(jié)構(gòu)找形方法:202110754182[P].[2024-07-02].
[3]涂桂剛,陳晨,崔昌禹,等.基于動力松弛的樹狀結(jié)構(gòu)單元集群找形分析[J].建筑結(jié)構(gòu)學(xué)報,2022,43(11):287-293.
[4]趙中偉,于鐸,簡相洋,等.基于力密度法的樹狀結(jié)構(gòu)找形及穩(wěn)定承載力優(yōu)化算法[J].建筑結(jié)構(gòu)學(xué)報,2022,43(09):260-268.
[5]趙中偉,吳謹伽,于鐸,等.基于數(shù)值逆吊法的樹狀結(jié)構(gòu)智能設(shè)計算法[J].建筑結(jié)構(gòu)學(xué)報,2022,43(04):86-94.
作者單位:濟南職業(yè)學(xué)院
責(zé)任編輯:張津平、尚丹