萬青松,羅曉姣
(1.成都文理學院,成都 610499;2.四川錦興國試書業有限公司,成都 610041)
確定農作物的種植面積和分布狀況能夠幫助人們更加準確地估算農作物的產量,通過加強管理,確保農作物的空間布局為最優布局,從宏觀管理的角度來看,對于保障糧食安全有重要意義[1,2]。針對冬小麥產量進行評估,目前研究的主要方法包括數據預測統計、氣象數據分析以及評估預報,這些方法雖然屬于經典方法,但是相對較為傳統,誤差較大,隨著信息技術的發展,新型技術被不斷應用于種植區域尺度管理分區[3,4]。
種植區域尺度指標作為一種經濟有效的參考量,能夠很好地幫助學者們分析和預測小麥產量和增長趨勢。通過過濾指標確定冬小麥的種植區域,對小麥信息數據進行預處理,篩除無用指標,能夠降低管理過程的負面影響[5,6]。目前對于指標選擇的研究越來越多,且向著綜合性的方向發展。冬小麥種植區域指標選擇可以分為有監督模式和無監督模式兩種。有監督模式的選擇方法相對成熟,而無監督模式的研究較少,主要原因在于無監督模式缺少信息指導,難以得到不同空間的搜索簇群,聚類分類法難以應用。但是無監督模式能夠選取具有代表性的特征數據集合成特征子集,在高維度數據中,無監督模式能夠選擇樣本數據特征相近的數值形成數據標簽,通過數據計算,完成指標選擇[7-12]。
本研究為一種基于無監督過濾式指標選擇的冬小麥種植區域尺度管理分區算法,結合聚類算法,分析不同區域冬小麥種植結果的特征,確定信息重要程度,根據重要程度選擇特征子集。
研究區域位于重慶市境內,該地區屬于溫帶大陸性季風氣候區,植物所處區域接收的養分和陽光都十分充足。該地區的氣候條件較好,四季分明,每年的降水量可達800 mm,氣溫在14 ℃左右波動,十分適合種植小麥、水稻和棉花等農作物。
對研究區域冬小麥的生長特征進行觀察可以發現,10 月上旬和中旬為冬小麥播種時期,10 月下旬冬小麥開始出苗;11 月上旬和中旬,冬小麥長出幼苗;11 月下旬至12 月上旬,冬小麥處于分蘗階段;12月中旬至翌年2 月上旬,冬小麥處于越冬階段;2 月中旬至3 月上旬,冬小麥處于返青階段;3 月中旬至4月上旬,冬小麥處于拔節階段;4 月中旬和下旬冬小麥處于抽穗階段;5 月冬小麥處于灌漿階段;6 月冬小麥逐漸成熟。
在確定冬小麥的生長特征后,分析光譜特征,得到遙感圖像,除了提取小麥狀態數據之外,還分析了所處的綠色植被狀態,野外樣方數據。提取發現,冬小麥正處于分蘗狀態,而位于冬小麥周邊的所有綠色植被都為枯萎狀態。
為更好地實現冬小麥種植區域尺度管理分區,設置技術路線如圖1 所示。由圖1 可知,首先利用遙感圖像提取冬小麥特征指標,根據指標特征建立樣本庫,分析尺度變化,通過數據分析完成區域管理,確定內部的樣方數據,運用計算機技術對數據進行調節,同時結合人工聚類法、識別法確定該區域種植的冬小麥面積和冬小麥在該區域的分布情況。通過GPS 調取野外數據,利用計算機對提取的數據進行多方位處理,將樣本數據轉換成翻譯數據,并進行修正,設置500 個以上的檢測點,對提取的冬小麥圖像進行修正,根據不同空間幅度范圍內得到的數據尺度變化,分析樣本狀況[13-15]。

圖1 技術路線
同時,計算區域精度、平均區域精度、區域精度標準差、均方根誤差和偏差,根據計算結果完成區域尺度管理。區域精度計算公式如下。
式中,A0為采集的冬小麥種植區域總量,被設定為基準值;i為提取圖像分辨率;S為所選定的冬小麥種植區域;Ai為提取的小麥面積總量;K(s,i)為得到的區域精度。
平均區域精度計算公式如下。
式中,(s,i)為得到的平均區域精度;n為小麥被分的區域數目。
區域精度標準差與區域精度平均值成正相關,能夠很好地反映不同區間內部區域精度的波動狀況,分析冬小麥所處精度的離散情況,計算公式如式(3)所示。
式中,s為所選定的冬小麥種植區域
均方根誤差計算公式如式(4)所示。
式中,RMSE(s,i)為得到的均方根誤差;g(s,i)為區域精度觀測值;bias(s,i)為區域精度的真值偏差。真值偏差計算如式(5)所示。
在得到上述5 項結果后,確定過濾式指標,并將指標對象讀入集合內部,根據指標對象構造一個新的簇,如果得到的數據庫數值為末尾值,則直接結束,否則進行再次讀取,確定新的數據對象;計算不同數據簇之間的距離,確定最小距離,分析數據半徑閾值,計算指標特征統計頻度,判斷是否為數據庫末尾值,如果為末尾值,則代表聚類結束。
本研究的無監督過濾式指標選擇法能夠根據不同指標的特征值確定重要程度,得到特征選取子集。由于數據的局部特性十分明顯,因此可以根據數據特征聚類,確保數據簇的相似性,分析數據之間的局部特征,計算特征指標。對特征指標進行離散化處理,尋求指標內部的連續特征值,選取聚類閾值,確定內部特征值,尋找指標變化數值,根據變化數值劃分為過濾式指標選擇子集,實現數據操作。
通過數據分析得到不同無監督過濾指標下的冬小麥平均區域精度、區域精度標準差、均方根誤差和偏差,如圖2 所示。
由圖2 可知,隨著過濾式指標降低,冬小麥平均區域精度值也逐漸降低。當無監督過濾指標最高時,冬小麥平均區域精度值最高可達90%。而當無監督過濾指標一定時,空間范圍會直接影響平均區域精度,空間范圍越大,平均區域精度值越高。

圖2 無監督過濾式指標對冬小麥管理分區精度的影響
相比平均區域精度,區域精度標準差、均方根誤差和偏差3 個指標隨著過濾式指標增高也不斷遞增;均方根誤差和偏差2 個指標隨著空間范圍增大整體呈下降趨勢。
由上述分析結果可知,冬小麥種植區域尺度管理分區精度同時受到無監督過濾式指標和空間范圍2 個因素的影響,無監督過濾式指標的影響大于空間范圍的影響。
在一定空間范圍內,若農作物種類不同,農作物生長狀況也會存在一定的差別,對冬小麥尺度管理分區精度也會造成影響。確定一定空間范圍內的樣本數據,得到不同農作物的占比情況,根據占比情況進行數據統計,從而得到各不同參數的狀態如圖3所示。
由圖3 可知,當農作物種類一定時,選擇過濾式指標數值越高,得到的平均區域精度就越高;隨著作物種類的增加,平均區域精度值也會改變,整體呈增加的態勢;當農作物種類為4~6 種時,平均區域精度值處于較穩定狀態。

圖3 農作物種類對尺度管理分區精度的影響
對統計結果進一步研究發現,當無監督過濾式指標為50時,產生的偏差值相對較大,偏差最大值接近-10。誤差的不斷積累會直接導致精度的降低,因此將無監督過濾式指標為50 設定為尺度響應敏感點。
在確定數據源后,對冬小麥的種植面積進行測量,確定特征數據種類,分析數據狀態,同時分析尺度分區精度、尺度空間范圍、分區成本和數據獲取可靠性四方面因素,得到在不同無監督過濾式指標下冬小麥平均區域精度,如圖4 所示。
由圖4 可知,冬小麥種植密度會對平均區域精度造成一定的影響。當種植密度低于45%時,平均區域精度較低;當種植密度處于45%~70%時,說明冬小麥生長狀況達到最佳,此時的平均區域精度為96%,分區精度趨于平穩;當種植密度大于70%時,冬小麥植株過密,不利于陽光、養分等吸收利用,此時平均區域精度也較低。

圖4 種植密度對冬小麥平均區域精度的結果
本研究通過聚類分析算法和空間統計算法確定了無監督過濾式指標的選擇對冬小麥種植區域尺度管理分區精度的影響。結果表明,無監督過濾式指標、種植空間范圍、農作物種類和冬小麥種植密度都會對冬小麥種植區域尺度管理分區精度造成影響。
1)隨著無監督過濾式指標的降低,內部特征數目在不斷增加,對冬小麥種植區域分區時所造成的面積誤差較大,從而導致冬小麥種植區域尺度管理分區精度降低。
2)當無監督過濾指標一定時,空間范圍會直接影響平均區域精度,空間范圍越大,平均區域精度值越高。主要因為當人為監測區域空間范圍增大時,所造成的正負誤差也在相互抵消,測量區域精度隨之升高。
3)在空間范圍一定的情況下,農作物種類會對冬小麥尺度管理分區精度造成影響。隨著作物種類的增加,平均區域精度值也會改變,整體呈增加的態勢;當農作物種類為4~6時,平均區域精度值處于較穩定狀態。
4)在空間范圍和農作物種類一定的情況下,冬小麥種植密度也會對平均區域精度造成一定的影響。當種植密度低于45%或大于70%時,冬小麥的狀態過于稀疏或過于密集,此時平均區域精度較低;當種植密度處于45%~70%時,此時的平均區域精度基本穩定在96%。
1)本研究基于無監督過濾式指標選擇研究了一種新的冬小麥種植區域尺度管理分區算法,確定不同無監督過濾式指標所造成的影響,避免由于單個因素進行尺度管理分區所造成的影響,從而提高分區精度。與傳統的分區管理方法相比,加入無監督過濾式指標后,冬小麥種植區域分區精度更高,更有利于及時了解冬小麥的生長狀況并進行人工調節生產。因此在研究過程中,可以通過測量無監督過濾式指標,從而達到更好的冬小麥種植區域尺度管理分區效果。
2)本研究僅選用了冬小麥作為研究目標,對于其他作物的研究較少,未來需要分析不同目標作物所造成的尺度管理分區影響,從而取得更加全面和細致的尺度管理分區效果,為調控農作物生長及時提供數據參考。