戴月真,徐海峰,朱增強,王金星,王冉冉
(1.山東農業大學,山東 泰安271018;2.煙臺工程職業技術學院,山東 煙臺264000;3.泰山管委櫻桃園管理區,山東 泰安271000)
土壤是不均一和變化的時空連續體,即使在土壤質地相同的區域內,土壤特性在不同空間位置上也有明顯差異[1]。精細農業就是在認識環境中不同時間不同區域土壤肥力等因素的空間差異下,根據其空間差異性調整化肥等的使用,以達到減少投入、增加產量、提高農資利用率的目的[2]。其中土壤信息采集是重要前提,要求采集到的樣品能夠比較準確的反映果園土壤的情況,如果規模布設較大則采樣成本過高,布設較少不足以反應果園土壤的信息。所以怎樣合理部署傳感器采樣點是精準農業研究的重要內容之一。目前國內常用的采樣點部署方法主要有簡單隨機采樣、網格采樣、Cochran方法,最適分配法、地統計學方法等。盛建東等[3]以三種取樣間距進行網格取樣,研究不同取樣間距對合理取樣數量的影響;姜城等[4]等研究發現分層采樣可以有效降低采樣數量,且最適分配法可以獲得理想的采樣數量,且可根據情況調節局部的采樣點密度提高采樣精度;薛正平等[5]利用地統計學的方法對上海精準農業示范基地進行取樣數量分析;陳天恩[6]等研究了縣域范圍農田土壤養分統一采樣規劃問題。但這些方法均是確定在一定范圍內的傳感器的部署密度,對傳感器的具體部署研究較少。而采樣點的部署位置對采樣有著重要的作用。在采樣點數目相同的情況下,布局方式不同,每一樣點能表征空間變異性的范圍和效率不同[7]。王蒙[8]等研究果園土壤不同位置養分與葉片營養的關系發現在距樹干75 cm處,20~30 cm土層為果園最佳采樣區域。所以如何在整個果園中保證精度的情況下精確部署傳感器成為傳感器優化布局的關鍵。本文研究一種傳感器的位置部署方法,通過Cochran采樣與MATLAB反聚類方法確定果園內采樣點數量以及具體部署,以達到精度的要求,節約成本。
Cochran[9]對于區域隨機取樣的最佳取樣數量為:

式中λ為在置信度為α、自由度為f的t分布,f=采樣數-1,Δ為采樣精度,σ為總體標準差。
如果考慮到取樣精度的要求,通常Δ=kE(式中k為相對誤差,E為總體均值),當總體方差未知時,可以用樣本標準差差s代替總體標準差σ,當總體樣本均值未知時,可以用樣本均值U代替總體均值E,即 Δ =ku,s= σ =CvE,則(1)可改寫為:

其中相對誤差k的確定方法如下:
合理相對誤差根據土壤養分評價標準臨界值水平和實際平均濃度確定[10]。
土壤養分分級標準采用全國第二次土壤普查分類標準如表1.

表1 全國第二次土壤普查分類標準
如果果園土壤養分含量分在5%、10%、15%誤差范圍內,對平均值的估測值都在養分等級指標的同一范圍內,則應該選取誤差范圍最大的情況;如果土壤養分含量在5%、10%、15%的誤差范圍內跨越多個養分等級,說明有一部分數值因誤差存在會出現在下一個等級中,則應該選取同一個精度較高的,在誤差范圍盡可能小的情況。
聚類分析是指按照事物的某些屬性將其聚集成類,使類間相似性盡量小,類內相似性盡量大[11],它的目的是使得屬于同一組的樣本之間彼此相似。那么如果將果園無限分為n個類別即n個區域,每個區域相差很小,則每個區域可以用一個傳感器來監測,換言之如果一個區域可以用一個傳感器來監測,則這個區域可以看做是一類,即當n=1(公式2)時,一個傳感器可以監測果園的一部分區域,基于此設計以下算法:
(1)將果園分別以兩個垂直方向為x軸y軸建立直角坐標系并將采樣點進行坐標編碼(初始采樣點應盡可能遍布在整個果園,使數據更全面準確)。選擇果園養分變異性最大的養分的采集數據為基礎。
(2)初始化并讀入數據。首先以采樣點中的第1個點為中心點,分別計算其余點與其的距離,選出距離大于0的最短的點,通過Cochran公式當n=1時,計算出這兩個點的養分含量的理論變異系數,如果實際變異系數值小于理論值,將該點附屬類別,并判斷是否所有樣本點均附屬類別,若為否,則繼續尋找距離次短的點,再次比較這三個點的變異系數理論值和實際值的大小,如果實際變異系數值小于理論值,則繼續尋找距離更短的點,逐漸擴大范圍。
(3)如果實際變異系數值大于理論值,則傳感器數量加一,停止尋找,那么這個點為第一個區域的中心點,即第一個傳感器部署位置。再以最后的一個不符合點為起點,分別計算其余沒有附屬類別點與該點的距離,同步驟(2)。當所有點均有附屬區域,則循環結束。記錄需要的傳感器數量。
(4)再分別以采樣點的第2個、第3個點......第n個點為中心重復以上三步,直到每個點均作為中心點循環一遍后,選出布置傳感器最少的方案。
(5)輸出傳感器的部署位置,并在MATLAB中可視化。
MATLAB流程圖如圖1所示。

圖1 MATLAB程序流程圖
實驗點設在煙臺市萊山鎮蘋果園內,果樹東西株距為4 m,南北株距為3 m,果園的面積為1 944 m2,地勢比較平坦,園內東部坡度為3°,果園土壤類型為壤土。將取樣點設在每棵果樹根部附近,取樣點包括9行18列,其中南北方向每隔3 m取樣,每列共9個;東西方向每隔4 m取樣,每行共取樣18個樣點。整個果園共取樣162個取樣點。
對實驗果園得到的土壤樣本進行分析,結果見表2.

表2 果園土壤養分特征值
(1)均值單位為mg/kg.Average unit is mg/kg.
(2)其中區域A為西部平地,區域B為東部坡地。
從表1可以看出,果園東部坡地養分變異程度較西部平地大,從變異系數上看,由于研究區的10% 2.2.1 反聚類最優布局法 從表2可以看出,P元素的變異系數最大達到92%,則以變異系數最大的P元素的數據為基礎數據。以果園的南邊界和西邊界為x軸和y軸,橫坐標間隔值為4,縱坐標間隔值為3,則每棵樹為一個坐標交點,將采樣得到的162個點分布在坐標軸上如圖2所示(其中“*”代表緩坡上樣點,“+”代表平地上樣點)。 圖2 果園初始采樣位置坐標分布圖 由于P的均值為22.64 mg/kg,根據相對誤差確定方法,相對誤差取10%.采用公式(2),則當n=1時,Cv=(k/λα,f)2,分別以162個點為起點進行運算。 最優解是以(24,12)即第24列第12行的果樹為起始傳感器部署中心得到傳感器數量最少為27個,分布位置如圖3所示。 圖3 果園傳感器優化布局分布圖 土壤養分變異越大,為了達到所要求精度所需要的傳感器數量也會增加。秦松[12]等研究表明土壤養分與地形地貌在一定程度上有很強的相關性。果園東部坡地土壤養分變異系數較大,西部平坦地區土壤養分變異系數較小,從圖中可以看出在西部地區傳感器分布較為稀疏,而在東部傳感器部署較密集。2.2.2 Cochran采樣法 由于Cochran公式方法將土壤作為一個均質整體,而果園整體變異系數較大,那么按照地形將果園分為兩大區域A和B,則對于每一個區域土壤相對均勻,對區域A、B分別運用Cochran公式設計采樣。對于區域A可以求得在95%的置信區間和一定相對誤差要P元素需要32個取樣點,K元素次之,需要11個,由于N元素最小為4個,所以按各養分標準差加權平均得到綜合采樣數為14個。而對于區域B,在95%的置信區間下P元素需要141個,N元素次之需要22個,K元素最小為18個,則所以按各養分標準差加權平均得到綜合采樣數為43個,所以整個果園所需要的采樣數為57個。 在MATLAB R2016a環境下采用DACE-A MATLAB Kriging Toolbox V2.0,選用球狀半方差模型作為半變異函數擬合函數,以上述兩種方法所得樣本為擬合數據,使用普通克里金插值估計法進行預測,選擇3個評價指標:平均絕對誤差(MAE),均方根誤差(RMSE),一致性系數(AC)對不同的采樣布局進行精度分析評價標準。從統計學角度來說MAE、RMSE的均值越小,準確性越高;AC取值范圍為0到1,預測值與觀測值越趨于一致,AC值越接近1,反之,預測值與觀測值約不同,AC值越接近于0[13]。其中AC的計算方法如下: 式中:n是樣本數;PE為可能的誤差變化,Pi為預測值,Oi為觀測值,是觀測值的平均值。 對研究區采用MATLAB反聚類方法以及經典Cochran方法進行評價,結果如表3所示。 表3 精度評價指標結果表 從表中可以看出反聚類方法無論在RMSE還是MAE上,均較Cochran小,精度有所改善,在AC指標上,反聚類法值為0.68更接近1,即預測值與實際值更接近。可以看出,運用反聚類方法對土壤的描述精度更好。綜上所述,本文方法在一定采樣點數量下,對土壤描述精度更高。 準確確定土壤采樣傳感器部署位置,本文以Cochran方法和反聚類分析方法為基礎提出一種兼顧精確度和數量的傳感器布局方法,并以煙臺市萊山鎮蘋果園為研究區設計了傳感器部署方案,結果表明: (1)利用本方法,在保證精度的前提下,計算出了每個傳感器的位置,且數量較常規的均勻分布法要少,在本實驗條件下,蘋果園的最佳部署傳感器數量為27個。 (2)不同地形區域土壤養分變異系數相差較大時,養分之間差異也較大,單純利用Cochran公式方法的取樣數量有一定的不足,利用本文的反聚類算法對土壤養分分布,具有更高精度的描述。 (3)本文中實驗果園較小,初始將每棵果樹均進行采樣,而對于更大面積的土壤檢測,可利用有限元劃分網格的方法,則傳感器部署位置為所在網格的中心,再利用本文算法確定傳感器部署位置。

2.3 效果評價


3 結論