孫佳龍,崔旭升,郭淑艷
(淮海工學院 測繪工程學院,江蘇 連云港 222001)
高精度的高程異常曲面模型與GPS定位技術相結合可以在一定程度上取代傳統繁瑣的幾何水準測量方法,可大幅度提高測繪工作效率[1-3]。而對高程異常曲面擬合時,目前常用的擬合方法主要有多項式擬合法、移動二次曲面擬合法和多面函數擬合法等[4-7]。在擬合區域較小的情況下,一般的擬合方法可以達到較高的精度,但由于這些方法未顧及似大地水準面的物理性質,擬合出的曲面只能是高程異常的趨勢面,與高程異常的實際數值存在一定差異[8]。球冠諧分析作為一種譜方法,由非整階勒讓德函數和三角函數張成的近似空間具有良好的逼近性質,可以實現與高程異常曲面的最大逼近[8-9]。而在利用球冠諧函數擬合高程異常曲面時,選擇不同的擬合點,對最后的擬合結果有較大的影響。由于其選擇方法目前尚無可靠的理論依據,為此本文提出了基于K-means聚類的球冠諧函數擬合法,即以K-means聚類方法對擬合點進行有效選取,利用選擇的擬合點建立球冠諧函數模型,依此模型解算檢核點處的高程異常值,從而對擬合精度進行評價。
球冠諧函數是球冠坐標系下滿足位理論邊界條件的譜函數,它是局部區域對應的特征函數。在球坐標系下對Laplace方程進行求解,得到球諧函數逼近模型[3]

(1)

球冠諧函數與球諧函數的區別在于用非整階勒讓德函數代替整階勒讓德函數,余緯θ的定義域由[0,π]變為[0,θ0]。為了計算方便,需要把通過地球北極的坐標軸Z軸沿子午線旋轉到通過球冠的中心,使經度λ仍然滿足周期性的邊界條件[8]。非整階勒讓德函數序列是由球冠的大小來確定的,對于半角不同的球冠,非整階勒讓德函數序列是不同的,且非整階勒讓德函數由以下邊界條件確定
(2)

當用球冠諧函數表示殘差高程異常時,由于選擇的擬合點對高程異常曲面擬合有較大影響,因此,需要對所有的高程異常值進行選取。人為選取高程異常值既耗時又費力,且容易出錯。因此,合理有效地選取高程異常值,使這些高程異常能很好地表示該區域的高程異常變化就顯得尤為必要。聚類分析是對樣本進行分類的一種多元統計方法,是從樣本中發現有用信息的一種有效手段[10-11]。聚類是基于“物以聚類”的樸素思想,將數據對象分組成為若干個類或簇,使得在同一個簇中的對象之間具有較高的相似度,而不同簇中的對象差別很大。K-means聚類算法是由MacQueen提出的,該算法是一種在科學研究中被廣泛應用的一種經典聚類算法[11]。本文以K-means算法為聚類分析的分類方法,以歐氏距離作為相似性統計量,對高程異常數據進行了聚類分析。考慮到高程異常曲面不僅與樣本點的地理位置有關,還與該點的高程異常值的大小有關,因此,本文以三維歐氏距離作為相似性統計量[10],即
(3)
式中,(xi,yi)、ξi分別為Pi點的坐標和高程異常,d為距離。由于高程異常的單位與坐標單位不同,在進行聚類分析之前需將高程異常數據進行規格化處理[10]
(4)
式中,i=1,2,3;P為規格化處理后的高程異常所對應的坐標和高程異常值。
某地區D級GPS控制網布設了17個觀測點,對其進行了GPS觀測和三等水準測量,利用GPS獲得的大地高和水準測量得到的正常高,得到17個GPS/水準點的高程異常。從17個高程異常點中選擇12點參與球冠諧函數擬合,另外5個點對擬合精度進行檢核。因此,需要對17個數據進行聚類分析,從每個聚類中選取歐氏距離最長的點作為高程異常曲面擬合點,構建球冠諧函數模型,其中球冠極點選在區域中心,而球冠半角為1°,全部觀測點均落入定義的球冠內。以另外5個點的數據作為外部檢核,外符合精度為

(5)
式中,νi為檢核點實測高程異常與擬合高程異常的差值;m為檢核點個數。檢核結果見表1。

表1 基于K-means聚類的球冠諧函數擬合的外部檢核結果 mm
從表1中可以看出,隨著分類數從2開始,球冠諧函數擬合的精度有所提高,當分類數為5時,精度最高,達到5.5 mm;隨著分類數繼續增加,精度又開始下降,當分類數為12時,精度最低,為145.8 mm。由此說明,通過對樣本數據進行有效分類,可以有效地提高球冠諧函數的擬合精度。為了綜合評價基于K-means聚類分析的球冠諧函數的擬合精度,本文還利用同樣的數據,從17個點中隨機選取12個點,以多項式曲面、移動曲面、多面函數和球冠諧函數這4種常用的曲面擬合模型作為參考模型,比較各種模型之間的擬合精度,結果見表2。

表2 擬合結果殘差比較 mm
從表2中可以看出,移動二次曲面擬合的結果中,殘差最大值為150 mm,為各種擬合函數中的最大值,其標準差和外符合精度也都最大,說明移動二次曲面擬合的精度在4種方法中最差。5種評價指標都顯示,基于K-means聚類分析的球冠諧函數擬合的精度是最優的,其外符合精度最高,達到5.5 mm。各個檢核點的高程異常殘差值如圖1所示。

圖1 5種擬合方法得到的高程異常殘差值
從圖1中可以看出,移動二次曲面在5個檢核點的高程異常殘差值波動較大,說明該函數模型未能很好地表示該區域的高程異常變化趨勢;兩種球冠諧函數得到的高程異常殘差變化幅度都很小,說明球冠諧函數能很好地逼近高程異常曲面,因此擬合精度較高。而基于K-means聚類分析的球冠諧函數在檢核點處的高程異常殘差變化比球冠諧函數更平緩、幅度更小,說明K-means聚類方法能對高程異常點進行有效分類,從而能從數量較多的已知高程異常數據中選擇有代表性的特征點,再結合球冠諧函數的逼近性質,提高了高程異常曲面的擬合精度,因此擬合精度更高。
基于K-means聚類分析的球冠諧函數擬合法,將差異較小的數據歸入同類,在同一聚類中選擇歐氏距離最長的點作為高程異常曲面擬合點,利用球冠諧函數很好的逼近性質,實現了高程異常曲面的有效逼近。實例分析結果表明,基于K-means聚類分析的球冠諧函數擬合方法比多項式曲面擬合、移動曲面擬合、多面函數和球冠諧函數的擬合精度更高,因此,利用該方法可以在一定程度上提升高程異常曲面擬合精度。
參考文獻:
[1] 李斐, 岳建利, 張利明. 應用GPS重力數據確定(似)大地水準面[J]. 地球物理學報, 2005, 48(2): 294-298.
[2] 郭東美, 許厚澤. 應用GPS水準與重力數據聯合解算大地水準面[J]. 武漢大學學報:信息科學版, 2011, 36(5): 621-624.
[3] 程蘆穎, 許厚澤, 顧及測站點上重力場信息的大地水準面高的擬合方法[J]. 武漢大學學報:信息科學版, 2008, 33(7): 701-705.
[4] 馬洪濱, 董仲宇. 多面函數GPS水準高程擬合中光滑因子求定方法[J]. 東北大學學報:自然科學版, 2008, 29(8): 1176-1178.
[5] 王殊偉, 李斐, 柯寶貴,等. 基于BP神經網絡算法的GPS水準高程轉換[J]. 武漢大學學報:信息科學版, 2009, 34(10): 1190-1194.
[6] 張勤, 趙超英. 地殼垂直形變場逼近的球冠諧分析法[J]. 測繪學報, 2004, 33(1): 39-42.
[7] 彭富清, 于錦海. 球冠諧分析中非整階Legendre函數的性質及其計算[J]. 測繪學報,2000, 29(3): 204-208.
[8] 胡伍生, 華錫生, 張志偉. 平坦地區轉換GPS高程的混合轉換方法[J]. 測繪學報, 2002, 31(2): 128-133.
[9] 馮林剛, 郅軍義, 寶因烏力吉. 應用EGM2008模型和GPS/水準數據確定局部似大地水準面[J]. 測繪通報, 2011(1): 18-20.
[10] 楊圣云, 袁德輝, 賴國明. 一種新的聚類初始化方法[J]. 計算機應用與軟件, 2007, 8(24): 51-52.
[11] 毛韶陽, 林肯立. 優化k-means初始聚類中心研究[J]. 計算機工程與應用, 2007, 43(22): 179-181.