【中圖分類號】:P208 【文獻標志碼】:A 【文章編號】:1008-3197(2025)03-76-05
【DOI編碼】:10.3969/j.issn.1008-3197.2025.03.018
Research on Land Surveying and Mapping Data Classification Integration Method Based on Fuzzy Clustering and Genetic Algorithm
GE Tong, XUYang
(Tianjin Branch,Beijing Century Qianfu International Engineering Design Co.Ltd.,Tianjin3Ooo74,China)
【Abstract】:Inorder toimprove theaccuracyand completenessoftheland surveying data,preprocessing theoriginal land surveying data,noise,redundancy,and abnormal data were removed.Subsequently,utilizing DSM paralel technology to eficiently extract feature information from land surveying data,fuzzy clustering algorithm was combined to classifyland surveying and mapping data.Finally,the integration optimization ofclassification results was achieved through genetic algorithms.The results showed that the maximum accuracy of the proposed method for land surveying and mapping data classification was 95 % ,and the maximum evaluation value for the quality ofland surveyingand mappingdata integration was O.96,confirming that theproposed method has better performance in land surveying and mapping data classfication integration.
KeyWords】: fuzzy clustering;land surveying;classification integration;genetic algorithm
一般情況下,國家多種生產建設均需落實到土地上,但是國土資源是有限的,再加之國土資源利用具有不可逆轉性,使得國土資源規劃難度大幅度增加。土地測繪技術集成了光電技術、計算機技術、空間科學、網絡通信技術和信息科學等多種手段,獲取地面已有界線和特征點的位置信息,為國土資源規劃提供重要的依據和支持。土地測繪數據體量龐大,再加之采集設備、環境等因素的影響,使得土地測繪數據中存在著大量的噪聲數據、冗余數據,為其應用帶來了較大的難度,故提出基于模糊聚類的土地測繪數據分類集成方法,通過數據集成,大規模處理土地測繪數據,為國土資源規劃提供一定的幫助。
1土地測繪數據快速集成方法
1.1數據預處理
由于測繪裝置振動、環境變化等因素的影響,原始土地測繪數據中包含大量噪聲數據、冗余數據與偏離數據,直接采用勢必會影響國土資源規劃的精準性,因此需要對土地測繪數據進行預處理。
設置原始土地測繪數據集合為 X={x1,x2,… xi,……,xn},xi 為第 i 個原始土地測繪數據; n 為原始土地測繪數據的數量。
采用中值濾波算法對原始土地測繪數據進行噪聲數據去除處理
xi′=med{xi-k,…,xi,…,xi+k}
式中: xi′ 為去噪后土地測繪數據; med{?} 為中值濾波函數; k 為中值濾波窗口。
以 xi′ 為基礎,計算土地測繪數據間的相似程度,從而制定冗余數據的判定規則,依據制定規則對其進行檢測與刪除[]。

式中: αij 為土地測繪數據 xi′ 與 xj′ 的相似程度;cov(xi′,xj′) 為土地測繪數據 xi′ 與 xj′ 的協方差數值;
與 σ(xj′) 為土地測繪數據 xi′ 與 xj′ 的標準差數值; εij 為相似程度輔助計算參數,取值范圍為[0,1],具體取值需根據土地測繪數據的實際情況設置。
以 αij 為依據,制定冗余數據的判定規則[3]

式中: α∧ 為冗余數據判定閾值,需要根據冗余數據占比、體量大小等因素共同決定。
結合式(4)對冗余數據進行檢測與刪除,將剩余土地測繪數據記為 xi′′, 計算不同土地測繪數據之間的距離,從而去除土地測繪偏離數據[4。

式中: dic 為土地測繪數據 xi′′ 與測繪區域中心數據xc′′ 之間的歐式距離。
以 dic 為依據,制定土地測繪偏離數據判定規則

式中: d?R 為測繪區域中心數據 xc′′ 與測繪區域邊界之間的距離。
土地測繪偏離數據判定原理見圖1。

注:藍色圓圈表示土地測繪范圍,紅色圓圈表示土地測繪正常數據,綠色圓圈表示土地測繪偏離數據
對綠色圓圈進行刪除處理,將剩余土地測繪數據進行重新整合,記為
Y={y1,y2,……,yi,……,ym}
式中: m 為土地測繪數據的總量。
1.2數據特征提取
DSM是指分布式共享內存,是一種并行計算技術,充許多個處理器通過共享內存進行通信和協作。采用DSM并行技術可以實現對大規模數據的快速處理與高效計算,提高數據特征提取的效率和準確性,為后續模糊聚類算法提供充分的數據支撐。以式(6)為基礎,采用DSM并行技術提取土地測繪數據特征。見表1。

根據表1,利用DSM并行技術對土地測繪數據進行快速提取[5]。見圖2。

提取結果記為 Z={Z1,Z2,Z3,Z4,Z5,Z6,Z7,Z8,Z9}(7)
1.3基于模糊聚類和遺傳算法的數據分類集成
模糊聚類是一種基于模糊理論的分類方法,能夠充分考慮不確定性和模糊性因素,對數據之間的隸屬關系進行建模,從而可以更好地處理土地測繪數據的分類問題。土地測繪數據具有復雜多樣的特征,不同類型的土地在數據上可能存在不確定性和重疊的情況,傳統的確定性算法難以很好地對這種不確定性進行處理;而模糊聚類能夠通過建立隸屬函數來描述數據歸屬于不同類別的隸屬程度,更好地適應和處理不確定性的問題,從而保證數據分類集成質量。
以式(7)為依據,設計模糊聚類器。見圖3。

在模糊聚類器運行過程中,土地測繪數據隸屬度、聚類中心的迭代更新公式為

式中: ωij?cj 分別為迭代更新后的土地測繪數據隸
屬度與聚類中心; ck 為某一個聚類中心; M 為迭代次數; ωijM-1 為前一次迭代的土地測繪數據隸屬度數值。
搭建土地測繪數據分類目標函數

式中: J 為土地測繪數據分類的目標函數; βo 為目標函數輔助計算參數,取值范圍為0\~1。
當 J* 時,表明模糊聚類器運算停止,輸出結果即為土地測繪數據分類結果;當 J?Q* 時,表明模糊聚類器運算繼續,直至符合迭代停止條件。
模糊聚類器有效地融合遺傳算法共同實現土地測繪數據的快速集成,為土地測繪數據的應用提供助力。
遺傳算法能夠模擬生物進化過程,通過種群的遺傳變異、選擇和適應度評估來搜索最優解,從而實現優化問題的求解。在土地測繪數據分類中,結合遺傳算法可以優化模糊聚類算法的參數和聚類中心,提高分類結果的穩定性和準確性,同時避免陷人局部最優解。這樣的組合可以充分利用遺傳算法的全局搜索能力和模糊聚類的數據處理能力,實現更加有效的土地測繪數據分類集成。
基于遺傳算法與模糊聚類器的土地測繪數據快速集成算法。
步驟一:利用不同初始隸屬度矩陣的模糊聚類器對土地測繪數據進行分類處理,獲取多個分類結果,將準則函數作為算法的適應度函數f8]。
步驟二:初始化種群并將初始迭代次數設置為0。
步驟三:根據事先確定的適應度函數,對種群中的所有染色體進行評估。
步驟四:選擇適應度最高的前 L 個染色體作為下一代種群,并對它們進行交叉和變異操作,以獲得新的染色體

式中: Pc,Pm 分別為染色體交叉率與變異率; δ?1 、
分別為交叉率和變異率的計算常數 ;f′ 為交叉、變異操作后染色體的適應度數值
分別為適應度的平均值、最大值。
步驟五:進行迭代終止條件檢測。若滿足迭代終正條件,則轉至步驟六;若不滿足迭代終止條件,則轉至步驟三進行評估和選擇新的種群。
步驟六:輸出適應度數值最大染色體對應的結果,即為土地測繪數據分類集成結果。
2實例分析
為驗證本文方法的有效性,選取某城市邊緣區域作為測繪對象。該區域土地面積22.17萬 hm2 ,其中耕地面積4.67萬 hm2 (水田面積3.03萬 hm2. 旱地面積1.64萬 hm2. 水澆地面積 25.67hm2. ;園地面積3.02萬hm2 (果園面積2.96萬 hm2 茶園面積 16.74hm2 其他園地面積 614.93hm2 ;林地面積10.42萬 hm2 (有林地面積 83 133.19hm2. 灌木林地面積 3 193.15hm2 其他林地面積1.79萬 hm2 );草地面積1.58萬 hm2 。采用無人機進行土地測繪,同時將實時采集的土地測繪數據傳輸回數據終端。根據獲得的土地測繪數據進行測試。
選取文獻[9]提出的基于數據中臺的裝備保障數據集成與文獻[10]提出的歷代史志自錄的數據集成與可視化作為對比方法1與對比方法2,聯合本文提出方法共同進行土地測繪數據快速集成對比,以此來驗證提出方法的應用性能。
2.1準備階段
設置噪聲數據占比、冗余數據占比與偏離數據占比存在較大差異性的10種工況,每種工況背景環境具有顯著差別,符合提出方法應用性能的測試需求。見表2。

2.2土地測繪數據分類準確率
土地測繪數據分類準確率是測試土地測繪數據集成性能的關鍵指標

式中: V 為土地測繪數據分類準確率; Te 為測試集合中的樣本總數; ζ(yi) 為土地測繪數據的預測標簽;ψ(yi) 為土地測繪數據的真實標簽。
不同工況采用本文提出方法獲得的土地測繪數據分類準確率均高于對比方法1與對比方法2,其在第7種工況的土地測繪數據分類準確率最高,為 95% 。見圖4。

2.3土地測繪數據集成質量評價
采用多種評價指標與權重系數的累乘評價土地測繪數據集成質量。標準情況下,土地測繪數據集成質量評價數值越大,土地測繪數據集成質量越好。
不同工況應用本文提出方法獲得的土地測繪數據集成質量評價數值均高于對比方法1與對比方法2,其在第6種工況的土地測繪數據集成質量評價數值最高,為 0.96 。見圖5。

3結語
本文提出的基于模糊聚類和遺傳算法的土地測繪數據分類集成方法能夠大幅提升土地測繪數據分
類準確率與土地測繪數據集成質量評價數值,能夠為國土資源規劃提供更有效的方法支撐。
參考文獻:
[1]張偉,格平,趙晶.國土空間規劃中水資源的開發利用探究—評《水資源規劃及利用(第三版)》[J].人民黃河,2022,44(8):166.
[2]桑瀟,張成業,李軍,等.煤炭開采背景下的伊金霍洛旗土地利用變化強度分析[J].國土資源遙感,2021,33(3):148-155.
[3]修曉龍.山西省礦山開發新增損毀土地年度監測與分析[J].中國礦業,2022,31(2):59-64.
[4]王笑時,束晨陽,鄧武功,等.國土空間規劃語境下魅力景觀空間構建研究[J].中國園林,2021,37(增1):100-105.
[5]李國民,章鰲,賀耀宜,等.智能礦井多元監控數據集成關鍵技術研究[J].工礦自動化,2022,48(8):127-130+146
[6]劉燕,秦軍,竇上凱,等.天然氣凈化廠生產實時數據集成方法創新[J].天然氣工業,2022,42(8):211.
[7]李永武,秦怡雯,李健,等.基于數據分解集成和高頻數據建模的匯率波動率預測[J].運籌與管理,2023,32(5):168-174.
[8]劉曉晨,王卓昊.基于大數據環境的科技管理數據集成平臺研究[J].情報學報,2021,40(9):953-961.
[9]李文俊,楊學強,杜家興.基于數據中臺的裝備保障數據集成[J].系統工程與電子技術,2020,42(6):1317-1323.
[10]李文琦,王鳳翔,孫顯斌,等.歷代史志目錄的數據集成與可視化[J].中國圖書館學報,2023,49(1):82-98.