




摘" 要:該文基于2021年、2022年宜城市耕地實地調查數據,對宜城市耕地的26個指標采用主成分分析法去除冗余因子,并運用SOM神經網絡模型對剩余因子聚類分析,得到宜城市耕地健康狀況。研究發現,宜城市耕地整體狀況良好,耕地大多建立在平地上,配套的基礎設施較為完善,富硒土壤分布廣泛,Ⅰ級、Ⅱ級、Ⅲ級耕地要遠多于Ⅳ級耕地。研究區內耕地資源質量等級分布存在空間分布特征,小河鎮和南營街道耕地健康狀況略差于其他區域,板橋店鎮和流水鎮耕地健康狀況最好。
關鍵詞:耕地健康評價;宜城市;主成分分析法;SOM神經網絡;聚類分析
中圖分類號:TP183" " " "文獻標志碼:A" " " " " 文章編號:2096-9902(2023)17-0018-06
Abstract: Based on the field survey data of arable land in Yicheng City in 2021 and 2022, this paper uses principal component analysis to remove redundant factors from 26 indexes of arable land in Yicheng City, and uses SOM neural network model to cluster analysis of residual factors, and obtains the health status of arable land in Yicheng City." It is found that the cultivated land in Yicheng city is in good condition as a whole, the cultivated land is mostly established on the flat land, the supporting infrastructure is relatively perfect, the Se-rich soil is widely distributed, and the cultivated land of grade I, II and III is much more than that of grade IV. The quality distribution of cultivated land resources in the study area has spatial distribution characteristics, the health status of cultivated land in Xiaohe Town and Nanying street is slightly worse than that in other areas, and the health status of cultivated land in Banqiaodian town and Liushui town is the best.
Keywords: arable land health evaluation; Yicheng City; principal component analysis; SOM neural network; cluster analysis
耕地健康關乎國家發展,近年來,我國耕地的健康問題得到了密切關注,各相關部門出臺了法律法規來保障耕地的可持續利用。2016年農業部出臺的《耕地質量調查監測與評價辦法》對保障糧食安全、推動農業可持續發展、優化資源利用效率和保護生態環境具有重要的意義,GB/T 30600—2022《高標準農田建設 通則》的實施為高質量農田建設完善了科學依據和操作指南,促進了農業現代化的發展。這些政策的制定都體現了耕地健康的重要性,因此,科學而合理地對耕地健康狀況進行評價受到了越來越多的關注。
1" 耕地健康評價方法
自20世紀70年代以來,土地質量越來越受到各國的關注[1],相關土地健康評價指標的研究也取得了豐富的成果[2]。在國外,耕地健康的研究往往隨著土地健康的研究而發展[3]。國內的研究大多集中于耕地產能[4]、耕地質量[5]、土壤健康[6]等,而在耕地健康方面的研究較少,主要方法包括有模糊物元法[7]、GIS模型[8]、距離模型[9]和PSR模型[10]等,由于不同地區具體情況的差異性,耕地健康評價往往需要結合當地實際情況采用不同的方法進行研究。
本文結合宜城市的實際情況,采用主成分分析法,利用其降低冗余度效果顯著的特性,篩選出相關性低的耕地健康評價因子,對這些因子使用自組織特征(self-organizing map,SOM)映射網絡[11]進行聚類。由于SOM神經網絡無須提前了解各指標的權重,能夠有效地避免人為因素的干擾,將相互關系復雜且非線性的高維數據映射到低維空間,比較適合本研究,所以選擇SOM神經網絡進行訓練仿真,對宜城市耕地健康狀況進行評價。
2" 研究區概況
宜城市屬湖北省襄陽市下轄的縣級市,是“千年古縣”,地處東經111°57'~112°45',北緯31°26'~31°54',位于湖北省西北部、漢江中游,東鄰隨州隨縣、襄陽棗陽市,西鄰襄陽南漳縣,南接荊門鐘祥市,北抵襄陽襄州區、襄城區,版圖呈“蝴蝶狀”,東西長76 km,南北寬53 km,總面積211 500 hm2,漢江將全境自然分割為東西兩大部分,以漢江為界,分別往東部西部呈平原、丘陵、山地變勢,階梯式延伸。宜城市屬亞熱帶季風性濕潤氣候,四季分明。春秋季短,冬夏季長,有典型的大陸氣候特征,近年來年均降水量在1 000 mm左右,年均氣溫在15~16 ℃,1月最冷,7月最熱。
根據第三次全國國土調查數據,宜城市耕地面積為108 830 hm2,占全區總面積的51.46%,其中人均耕地面積為0.195 hm2,是全省平均水平(0.086 7 hm2)的2.25倍,是全國水平(0.089 hm2)的2.19倍。宜城市土壤富硒,有利于種植特色作物,區內耕地資源分布存在明顯空間分布特征,中北部漢江兩側耕地多為砂土,且水土流失嚴重、土壤肥力低、人口密集、樹木較少和人為干擾較大。中部地勢較低,多屬平原地帶,巖石類型以第四紀沖積物、松散沉積巖建造為主,土壤多為深色,結構上松下緊,肥力中等較好。東西部為丘陵區山間盆地,巖石類型以松散沉積巖和少量碎屑巖建造為主,土壤顏色較深,含水量較中部略少,結構稍致密,含少量礫質,腐殖質層較厚,土壤肥力中等較好,多發育森林固土防沙。
3" 研究方法
3.1" 數據來源
本文數據來源于2021年、2022年宜城市野外實地調查數據,化驗分析數據來自樣品室內檢測。設置樣地調查點時,對宜城市建立網格單元大小為2 km×2 km均勻抽樣格網,提取落入國土三調耕地圖斑內的交叉點或選取附近具有代表性的點作為宜城市耕地實地采樣點。耕地調查樣地內設置1 m×0.5 m×1 m的長方體樣坑,在樣坑采樣面深0.2 m處、深0.6 m處和底層分別取樣并記錄相關屬性值。其中,土質測試分析項目包括顆粒分析及地球化學分析,涉及到的測試儀器包括原子熒光光度計(型號AFS-8500)、電感耦合等離子體發射光譜儀(型號Optima 8000)、電感耦合等離子體質譜儀(型號X series Ⅱ)和高頻紅外碳硫分析儀(型號HCS-878A)。在數據分析階段,剔除有明顯錯誤的調查點后,共選取實地調查的99個樣地點數據進行宜城市耕地健康狀況評價。
3.2" 評價指標體系的建立
3.2.1" 技術路線圖
本文的技術路線圖如圖1所示。
3.2.2" 評價指標的選取
綜合考慮宜城市耕地實際狀況,以及科學性、可操作性、系統性、代表性和定性與定量相結合的原則,初步選取了Cr、Pb、Cd、As和Hg含量5個重金屬指標,Se、速效鉀、有效磷和有機質含量4個有益成分指標,地形、坡度、地貌3個地形地貌指標,耕層厚度、有效土層厚度、容重、土壤結構、侵蝕類型、侵蝕程度、pH、表層土EC和成因類型9個土壤環境指標,農田網化率、作物覆蓋程度、灌溉能力、排水能力和水源條件5個社會環境指標,共計26個指標進行主成分分析降維處理,部分定性指標的量化標準見表1。
4" 健康評價
4.1" 主成分分析
基于SPSS 26.0的軟件環境對26個指標進行主成分分析,并進行KMO和巴特利特球形度檢驗,設置特征值大于1,結果如下。
4.1.1" KMO和巴特利特球形度檢驗
KMO和巴特利特球形度檢驗常用于檢測數據是否適合做因子分析。結果見表2。
4.1.2" 主成分提取
本文選擇主成分時設置特征值大于1,具體信息見表3。
成分矩陣信息表見表4。
4.1.3" 結果分析
由表3可知,前8個主成分的特征值都滿足大于1的條件,此外累計方差貢獻率達到了72.137%,滿足主成分分析要求,因此選取前8個主成分進行主成分分析。
由表4可知,第一主成分主要有耕層厚度、土壤結構;第二主成分主要包括有效磷、Cd含量;第三、五主成分主要有速效鉀;第四主成分主要有排水能力;第六主成分主要有水源條件;第七主成分主要有pH;第八主成分主要有農田網化率。其中,第一主成分可以反映土壤的物理性質,第二、三、五、七主成分可以反映土壤的化學性質,第四、六、八主成分可以反映耕地基礎設施情況。
在建立評價指標體系時,考慮到地形、坡度、作物覆蓋程度、侵蝕程度、Pb含量和侵蝕類型6個指標的成分值在8個主成分中低于其他指標,同時排除相關性過高的一些指標,最終確定宜城市耕地健康評價指標體系,具體見表5。
4.2" 健康等級劃分
參考前人研究的等級劃分標準,并結合宜城市實際情況,將宜城市耕地健康狀況劃分為Ⅰ級、Ⅱ級、Ⅲ級和Ⅳ級4個等級,從Ⅰ級到Ⅳ級健康狀況依次遞減,具體等級評價標準見表6。
4.3" SOM神經網絡模型的建立
本文基于Matlab R2016a軟件建立SOM神經網絡模型,該模型由輸入層和輸出層組成,輸入層中輸入向量的維數即輸入層神經元的個數,本文中分等評價指標因子個數即輸入層神經元的個數,輸入層各神經元通過權向量將外界信息匯集到輸出層的各神經元。輸出層內的每個神經元與其鄰域連接,個數取決于研究者分成幾類,此連接是相互激勵的關系,各輸出層則實現側向連接,訓練完成后輸出層不同的節點代表不同的分類模式。SOM神經網絡模型的優勢在于,在無監督的條件下,可以從輸入的主成分分析后的數據中找出耕地各指標的規律,并以無教師學習的方式進行模擬訓練,能夠做到自動對輸入模式進行分類。具體流程如下。
1)數據預處理。由于耕地的調查數據受外界影響較大,所以調查數據的單位和數量級會有所差別,因此,在SOM神經網絡模型建立前,應對數據進行標準化處理。
2)初始化。將隨機數作為輸入層和映射層間權值的初始值。
3)輸入向量并計算與權值向量的歐氏距離。將輸入向量X=(x1,x2,x3,…,xm)T傳遞給輸入層,并將映射層的權值向量和輸入向量的距離用歐氏距離表示,接著計算輸入向量與映射層第j個神經元的距離。
4)定義優勝領域Nj*(t)。以j*為中心確定t時刻的權值調整域,一般初始鄰域Nj*(0)較大,訓練過程中Nj*(t)隨訓練時間逐漸收縮。
5)調整權值并計算輸出結果。修正輸出神經元j*及其“鄰接神經元”的權值并計算最終結果Ok。
6)當結果滿足預期要求時則結束,否則重新進行學習直到滿足預期要求。
5" 結果與分析
經過上述研究分析后,發現宜城市Ⅰ級耕地樣地25個,占比約為25%;Ⅱ級耕地樣地37個,占比約為38%;Ⅲ級耕地樣地29個,占比約為29%;Ⅳ級耕地樣地8個,占比約為8%(圖2)。
對結果基于Arcgis10.2進行繪圖,所得結果如圖3所示。
總體來看,得益于宜城市境內水資源豐富、配套的基礎設施較為完善、富硒土壤較多以及各鎮土壤重金屬含量大部分不超過農用地土壤污染風險篩選值,宜城市耕地整體狀況評價良好,其中Ⅰ級耕地、Ⅱ級耕地、Ⅲ級耕地占比遠多于Ⅳ級耕地。從宜城市耕地調查點健康等級圖(圖3)中可以看出,研究區內耕地資源質量等級分布存在空間分布特征,小河鎮和南營街道耕地健康狀況略差于其他區域,板橋店鎮和流水鎮耕地健康狀況最好,分析其主要原因,可能是中北部漢江北側的耕地屬于第四紀沖積物,多為砂土,水土流失嚴重,同時該地區人口密集、樹木較少、人為干擾較大,進而導致健康評價等級較低,此外,漢江中部地勢較低,多屬平原地帶,巖石類型以第四紀沖積物、松散沉積巖建造為主,土壤顏色多為深色,土壤結構上松下緊,因此這片區域的土壤肥力中等偏好。
從耕地成因角度看,研究區殘積方式形成的耕地最多,且耕地大多建立在平地上,這使得當地農民能夠較為簡單地引水灌溉。此外,經過實驗室化驗分析,發現宜城市表層土(耕作層)Se含量呈現出整體表現較高,部分地區明顯出現富Se土地特征的現象,例如板橋店芝麻地和桃園地中性黏土Se含量高達2.4 mg/kg和1.08 mg/kg,達到了富硒土地劃分指標,非常適合種植特色農作物。本文在評價宜城市耕地健康狀況時,特意將Se含量作為一項指標加入耕地評價指標體系,使得實驗結果更加符合宜城市實際情況。
6" 結論
本文結合主成分分析法與SOM神經網絡,對宜城市耕地健康狀況進行了評價分析,所得主要結論如下。
1)宜城市耕地整體狀況良好,配套的基礎設施較為完善,富硒土壤分布廣泛,發展前景巨大,后續可以針對富硒土壤開展進一步的研究。
2)主成分分析法能夠有效地去除冗余因子,為耕地健康狀況評價提供低冗余度的數據,本文利用主成分分析法有效地過濾掉了12個因子,為后續的SOM神經網絡分析提供了低相關度的數據。
3)SOM神經網絡屬于非監督學習的競爭性神經網絡,能夠依靠待分類樣本不斷迭代學習,在保持拓撲結構不變的情況下有效地進行聚類分析,并且它有著不需要先驗知識、不受人為主觀因素影響的優勢,這使得結果更加客觀真實。在本文的實驗中,SOM神經網絡成功地將調查數據分成了4類,滿足了實驗的需求。
參考文獻:
[1] DUMANSKI J, PIERI C. Land quality indicators: research plan[J]. Agriculture, Ecosystems amp; Environment: an international journal for scientific research on the relationship of agriculture and food production to the biosphere,2000,81(2):93-102.
[2] BOUMA J. Land quality indicators of sustainable land management across scales[J]. Agriculture, Ecosystems amp; Environment: an international journal for scientific research on the relationship of agriculture and food production to the biosphere,2002,88(2):129-136.
[3] Mithun S, Matthew J E. Geospatial assessment of regional scale bioenergy production potential on marginal and degraded land[J]. Resources, Conservation amp; Recycling. 2018,128:90-97.
[4] 吳心怡,金曉斌,韓博,等.2001—2017年四川省耕地產能變化與潛力特征分析[J].農業工程學報,2021,37(3):238-249.
[5] 任斌裕,張清,周曉楨.基于數據挖掘模型的耕地質量評價研究[J].江西科學,2022,40(6):1091-1095.
[6] 趙瑞,吳克寧,楊淇鈞,等.基于土壤功能與脅迫的耕地土壤健康評價方法[J].農業機械學報,2021,52(6):333-343.
[7] 楊希越,張明,劉友兆,等.基于模糊物元分析法的耕地健康評價[J].經濟研究導刊,2015(17):40-43.
[8] 譚晶今.基于GIS的西南丘陵地區耕地健康評價研究[D].重慶:重慶交通大學,2017.
[9] 張春花,李雪銘.基于距離模型的大連市耕地質量健康評價研究[J].國土與自然資源研究,2015(2):17-19.
[10] 王鵬飛,程琳琳,蔣舒,等.基于PSR的北京市耕地利用系統健康評價[J].湖北農業科學,2015,54(3):582-586.
[11] 李雪瑩,李玉寶,梁偉.基于SOM神經網絡的通遼市庫倫旗森林健康評價[J].內蒙古林業調查設計,2021,44(4):68-74.