王樂洋,李志強
(1.東華理工大學 測繪工程學院,江西 南昌 330013;2.山東建筑大學 測繪地理信息學院,山東 濟南 250101)
大地測量數據處理所涉及到的觀測模型一般為非線性模型[1-2],而非線性模型參數估計一直是測量平差所研究的重點問題之一。對于非線性模型,常用固有曲率和參數效應曲率來刻畫非線性平差模型的非線性強度,進而評估參數估計的統計推斷效果[3]。處理非線性模型的傳統方法是線性最小二乘法,利用泰勒公式將非線性模型展開并截取至一次項[4]。對于非線性強度較高的模型,如三角網、導線網,線性近似將引起較大的模型誤差[5-7]。隨著測量技術的不斷發展,對測量及平差的精度要求不斷提高,因此,傳統方法并不能滿足當今科學技術的要求,而如何減弱模型線性化帶來的模型誤差成為了提高成果質量的重要內容。關于如何削弱模型誤差影響,文獻[7]通過對非線性函數求三階偏導數,考慮了二次項及三次項的影響,提出了非線性模型參數估計的直接解法。為了有效地避免導數計算,可以通過函數差分的方法,利用快速差分迭代解算模型獲取非線性最小二乘參數估值[8]。文獻[9]研究了基于非線性最小二乘的空間三維直角坐標轉換算法。針對測距定位方程該非線性平差模型,文獻[10]給出了距離函數二階導數的表達式,并推導了非線性平差的封閉牛頓迭代公式以及退化條件。對于非線性平差精度評定問題,可以從近似非線性函數的概率密度入手,采用無需求導的Sterling插值方法研究非線性函數的統計信息[11]。
目前,解決非線性最小二乘參數估計問題的方法主要分三類[12]:第一類是線性最小二乘法,用線性模型的理論與方法近似求解,其弊端在于當模型的非線性強度較強時,會產生較大的模型誤差[6]。第二類是直接搜索算法,如模擬退火法、單純形法、遺傳算法等,其優勢在于不需要求導計算,但是該類方法無法獲得參數的解析解,且計算耗時很長[13]。第三類方法是迭代解法,如牛頓法、高斯牛頓法、改進的高斯牛頓法等[14]。牛頓法每次迭代時都需要計算目標函數的海森矩陣,當遇到非線性函數復雜時往往很難獲得[12]。改進的高斯牛頓法與高斯牛頓法具有相同的迭代速率,但由于改進的高斯牛頓法在每次迭代時都需要確定一個步長因子,因此其計算量仍大于高斯牛頓法[13]。高斯牛頓法不僅具有牛頓法的收斂速率,而且每次迭代計算工作量相對最少[12],且在實際執行該算法前,總是通過某種方法求得一個靠近參數真值的解作為迭代初值進行解算,因此可以避免迭代算法受初值較差的影響,使其迭代收斂。
考慮到使用高斯牛頓迭代法解算非線性模型得到的參數估值并不能滿足方差最小性和無偏性[15-17],考慮將Bootstrap采樣方法引入非線性參數估計問題中。Bootstrap采樣方法也稱為自助法,該方法通過對觀測數據的有放回隨機采樣,能夠充分利用觀測值的先驗信息和數據性質,降低參數估值偏差,改善參數估值的質量。文獻[18]首次提出了自助法,并給出了采樣策略和相關證明,提出通過研究由重復采樣得到的自助世界的經驗分布來逼近真實分布的思想。文獻[19]研究了確定置信區間的Bootstrap改進方法。針對結構復雜的數據,可以采用更具一般性的Bootstrap假設檢驗方法對統計量進行推斷分析[20]。文獻[21]綜述了自助法在機器學習方面的應用和進展。針對自助法在標準差估計、偏差計算、回歸分析、區間估計、置換檢驗、交叉驗證等諸多方面的研究,也獲得了豐富的成果[22-25]。自助法的研究主要集中在該方法在統計學上的性質,目前尚未發現將該方法用于非線性參數估計的論文出現。
本文從處理測角網坐標平差模型的傳統方法出發,針對該方法在處理非線性模型時引起較大模型誤差的局限性,采用高斯牛頓迭代方法求取未知點坐標;為減小迭代計算產生的偏差,引入Bootstrap采樣方法,從而進一步改善參數估值質量。針對等精度和不等精度觀測數據,本文通過兩個案例研究并與傳統方法進行對比分析,來驗證本文方法的有效性和優勢性。
以角度為觀測值、未知點坐標為參數的平差模型,稱為測角網坐標平差模型。為直觀表示,假設角度測量的示意圖如圖1所示,其中點j為頂點,∠hjk為待測角。

圖1 測角示意圖
假設測角觀測方程的向量表達式為:
L=f(X)+ε.
(1)
式中:L∈Rn×1為相互獨立的角度觀測值向量;X∈Rt×1為未知點坐標向量;f(·)表示非線性映射關系,f(X)為n個非線性函數組成的向量;ε∈Rt×1表示角度觀測誤差向量。
用未知點坐標估值和測角真誤差的估值分別代替其真值,得測角網模型的誤差方程:

(2)


(3)

(4)

矩陣表達形式為:
v=Bx-l.
(5)
式中:B為誤差方程的系數矩陣,x為未知點坐標改正數向量,l為誤差方程常數項向量。
根據最小二乘原理,加權最小二乘解為[26-27]:
x=(BTPB)-1BTPl.
(6)
式中:P是角度觀測值的權陣。
最后可得測角網模型未知點坐標估值為:
(7)
式中:X0為未知點坐標初值。

(8)

(9)
將高斯牛頓解法用于求解測角網坐標平差模型的關鍵,是每步迭代后都需要及時更新系數矩陣B及常數項向量l。因此,分析歸納誤差矩陣及常數項向量的特點和性質就顯得尤為重要。
假設式(4)的系數為:
(10)
等價于
(11)
式中:ai,bi,ci,di由式(10)求得,其數值的正負取決于坐標增量ΔX,ΔY的正負;(+ai),(-ai),(+bi),(-bi),(+ci),(-ci),(+di),(-di)的正負由坐標增量與式(6)中的正負號共同決定。
由圖1可知,對于所有觀測角度L,其誤差方程總共存在7種表達形式,見表1。

表1 誤差方程的不同形式

根據高斯牛頓迭代原理及系數矩陣及常數項向量的更新規律,測角網坐標平差的高斯牛頓迭代解法總結為算法1。
算法1:高斯牛頓迭代解法。
1)利用余切公式獲取迭代初值X0;
2)計算各基線邊的坐標增量ΔX,ΔY及邊長S;
3)由式(10)計算系數ai,bi,ci,di,并獲取Bk;
4)計算各基線邊的近似坐標方位角α0,得到lk;
Bootstrap采樣方法通過重采樣給定觀測數據獲取自助樣本來統計推斷未知參數,該方法通過對已知樣本(假設樣本容量為n)做有放回隨機循環抽樣,得到M個樣本容量仍為n的自助樣本,進而估計原始樣本的有效信息。自助法能充分利用總體包含在原始樣本中的所有信息,使得自助樣本的分布能夠不斷逼近原始樣本統計量的分布。該方法的優勢性在于它不需要對未知模型及分布做任何假設,也無需推導估計量的精確表達式,只需通過檢驗樣本內統計量的變化來估計未知參數的整個抽樣分布,即對觀測值進行重采樣并計算估計值[21]。


(12)


根據Bootstrap方法采樣策略、高斯牛頓迭代原理及系數矩陣和常數項向量的更新規律,測角網坐標平差模型的Bootstrap參數估計方法總結為算法2。
算法2:Bootstrap重采樣方法。
1)假設原始觀測值樣本N=(L1,L2,…,Ln)為觀測總體,其權陣為P=(P1,P2,…,P3);
2)產生n個隨機數(i1,i2,…,in),其中1≤iu≤n,(u=1,2,3,…,n);
3)對N中的觀測值進行采樣,獲取自助樣本Nr=(Li1,Li2,Li3,…,Lin),其中1≤r≤1 000;

5)根據自助樣本中的角度數據,利用余切公式獲取坐標迭代初值X0;
6)計算采樣到的基線邊的坐標增量ΔY,ΔX及邊長S;
7)由式(10)計算系數ai,bi,ci,di,并獲取系數矩陣Bk;
8)計算采樣到的基線邊的近似坐標方位角α0,并獲取常數項向量lk;


12)通過式(12)計算未知點坐標的自助估計值。
根據以上計算步驟,可以得到測角網坐標平差模型的Bootstrap參數估計算法迭代流程圖,如圖2所示。

圖2 測角網坐標平差模型的Bootstrap參數估計算法迭代流程圖
從上述迭代步驟可以看出,所有自助樣本中包含的樣本數據均來源于原始樣本,并未根據更多的觀測信息進行計算,所以測角網坐標平差模型的Bootstrap參數估計方法與高斯牛頓算法均是利用相同的角度觀測數據最終得到未知點坐標估值。
模擬一個加密控制網,如圖3所示。網中A,B,C,D是已知三角點,P是待定點,獨立等精度獲取12個觀測角度,已知點的坐標數據見表2。

圖3 測角網示意圖

表2 已知點數據 m


表3 自助法計算參數估值的過程
從表3可以看出,自助法采樣過程將原始觀測數據采樣成了多個自助樣本,雖然每個自助樣本的樣本容量與原始樣本相同,但并不是改變觀測值的先后排列順序。有放回隨機抽樣過程使得每個自助樣本中可能存在重復的原始數據點,而另外一些原始樣本點沒有出現。因此,每個自助樣本將隨機地異于原始樣本,導致每個自助樣本獲得的參數估值存在細微差異。

采用最小二乘法(LS)、基于最小二乘的Bootstrap方法(LSB)、算法1(GNI)及算法2(GNIB)計算該測角網中未知點坐標,各方法的參數估值、范數結果見表4。LSB法的具體表現為在獲取自助樣本后、通過LS方法來解算自助樣本獲取未知點坐標參數。

表4 參數估計結果
從表4結果可以看出,經典LS法得到的坐標估值與參數真值偏離較大。考慮到參數估值的真誤差一般由觀測誤差以及線性近似所引起的模型誤差共同影響。而針對非線性強度很強的測角網模型,在具有相同觀測誤差的角度觀測值情況下,LS法得到的參數估值最差,表明LS法在線性近似的過程中,引入了較大的模型誤差,從而嚴重影響坐標估計值的質量。相比于LS法及LSB法,基于逐步線性化的GNI法得到的參數估值更接近于參數真值,表明GNI法通過反復迭代的確能夠削弱線性近似所帶來的模型誤差的影響,使其參數估值精確度比傳統方法有較為明顯的提高。
同時,相比于傳統的LS法,LSB法能夠改善參數估值的質量;而相比于GNI法,GNIB法在估計值的精確度方面也有較明顯的提升,且均優于LS法及LSB法。表明將自助法與傳統的最小二乘法及高斯牛頓迭代法結合是可行且有效的。自助法的循環有放回隨機采樣過程獲得的自助樣本能夠充分利用角度觀測值先驗信息,而且該采樣過程不會產生額外的模型誤差,也不會改變模型態性。尤其是GNIB法,其大量的自助樣本能夠減小GNI法計算坐標估值產生的偏差,從而使得GNIB法獲得的坐標估值最接近真值。從實驗結果可以看出,算法2除具備算法1的優點外,其采樣角度觀測值獲得的大量自助樣本可以減小GNI法計算產生的偏差,進而改善參數估值的質量。
模擬一個更復雜的測角網,如圖4所示。網中A,B,C,D是已知點,P1,P2是待定點,獨立不等精度觀測了18個角度,已知點坐標值見表5。

圖4 測角網示意圖

表5 已知點數據 m


表6 角度觀測數據
針對不等精度的測角網觀測數據,自助法獲取自助樣本及參數估值的具體實施過程見表7。

表7 Bootstrap參數估計方法重采樣過程
XLFXL從表7的自助采樣過程可以看出,針對不等精度觀測數據,自助法重采樣獲取自助樣本的過程中,需要對觀測值及其權值同步采樣,保持觀測值與其權值相對應。自助法通過有放回隨機抽樣將樣本容量為18的原始角度觀測值樣本采樣成M個自助樣本,該過程并不是改變觀測值的先后排列順序,其采樣過程使得某些原始數據點重復出現,而另外一些原始樣本點沒有被采樣到。因此,利用高斯牛頓解算每個自助樣本得到的未知點坐標估值存在細微差異。
分別采用線性加權最小二乘法(WLS)、基于加權最小二乘的Bootstrap方法(WLSB)、算法1(GNI)以及算法2(GNIB)對該測角網進行參數估計,各方法的參數估值、范數結果見表8。為更好地實現實驗對照,WLSB法是WLS法與Bootstrap方法結合后的方法,具體表現為通過WLS法來解算自助樣本。

表8 參數估計結果
由表8的結果可以看出,傳統WLS法獲取的坐標估值質量最差,是由于該方法需要利用泰勒級數對測角網模型進行線性化處理,在截斷取至一次項的過程中不可避免地引入了線性化模型誤差。對于非線性強度很強的測角網模型,線性近似將產生大于觀測誤差的模型誤差,該誤差極易引起參數估值與真值偏離較大;當坐標初值計算不準確時,將嚴重影響坐標估計值的質量。而相比于WLS法和WLSB法,GNI法得到的參數估值最優,說明GNI法能夠減弱測角網函數模型線性近似所帶來的模型誤差的影響,其循環迭代過程可以不斷修正參數估值,在一定程度上能夠有效改善傳統WLS法對測角網模型線性化過程中所引起的精度損失,使其參數估值比傳統的線性近似方法更接近參數真值。
相比于傳統的WLS法,WLSB能夠提高參數估值的質量;而相比于GNI法,GNIB法在參數估值的精確度方面也具有一定的提升。結果表明自助法同樣適用于不等精度的角度觀測數據。由于自助法重采樣不需要對模型及分布做任何假設,也無需推導參數估值的精確表達式,而有放回隨機采樣過程獲得的自助樣本能夠更好地包含原始觀測值的先驗信息和數據性質。尤其是GNIB法,其大量的自助樣本能夠減小GNI法計算產生的偏差,提高參數估值的精確度。實驗驗證了自助法在重采樣不等精度觀測數據時需要對觀測值的權值同步采樣的正確性,也再次驗證了將自助法與高斯牛頓迭代法相結合、并用于測角網坐標平差模型的有效性與優勢。
本文介紹了測角網坐標平差模型和Bootstrap重采樣理論,將高斯牛頓迭代解法應用于測角網坐標平差模型,并在此基礎上結合自助法,提出了測角網坐標平差模型的Bootstrap參數估計算法,并給出了詳細的采樣步驟及計算流程圖。針對等精度與不等精度的獨立觀測數據,將本文方法用于兩個測角網案例,并與傳統的加權最小二乘法和基于加權最小二乘的Bootstrap方法求取的坐標估值進行比較。由于測角網模型的非線性強度較強,經典的加權最小二乘法在對測角網模型進行線性化處理過程中引入了較大的模型誤差,導致其坐標估值與真值偏離較大。而高斯牛頓法通過迭代削弱了因線性近似帶來的模型誤差的影響,有效改善傳統最小二乘法對測角網模型線性化所引起的參數精度損失,使其坐標估值比傳統方法獲得的結果更加準確。測角網坐標平差模型的Bootstrap參數估計算法具備了除高斯牛頓迭代法的所有優點外,由于其重采樣過程不僅不會產生額外的模型誤差,而且能夠充分利用角度觀測值性質,其大量的自助樣本能夠減小高斯牛頓迭代計算產生的偏差,進一步提高參數估值的精確度。算例驗證了將高斯牛頓迭代解法應用于測角網坐標平差模型的必要性與實用性,也驗證了將Bootstrap參數估計方法用于測角網坐標平差模型的有效性與優勢性。
在計算效率方面,自助法通過重采樣觀測值得到M個自助樣本,其解算過程盡管會增加計算耗時,但是其原理簡單、適用性強,易于理解和編碼,且重采樣次數M可調,它僅需要通過計算機重復解算自助樣本便可改善未知參數的質量,不失為一種較好的參數估計方法。本文方法同樣也適用于觀測值相互獨立的非線性模型參數估計問題,本文僅以測角網坐標平差為例。隨著自助法的首次引入測角網坐標平差模型中,將拓展自助法在參數估計中的應用,也將是非線性平差理論研究的一個重要補充。
Bootstrap采樣方法依賴于原始觀測數據的樣本容量,足夠的觀測數據對提高參數估值的自助估計十分重要。此外,對于相關觀測數據的非線性平差及提高計算效率的問題還需要進一步研究。