王冠宇
(山東理工大學,山東 淄博 255000)
粗差會對最小二乘估計造成不良影響,即觀測值中含有粗差時,采用最小二乘法求得的參數估值變得不再可靠[1]。L1范數最小估計作為一種穩健估計方案,雖然在計算效率方面弱于最小二乘,但在抗差方面有較為明顯的優勢[2]。目前對L1范數估計在測量數據處理中的應用已有大量研究,如L1范數在控制網觀測值粗差探測,以及衛星定位中的應用等[3-4]。
在進行平差處理時,對于小樣本觀測的情形,計算效率并不是考慮的主要因素,保證精度為首要目標。在一般的觀測過程,粗差出現的概率在1%~10%,且不服從正態分布[5-6]。此時若使用單純最小二乘估計進行平差解算,參數估計必然會失實;若采用L1范數最小估計,是否會取得較高精度的參數平差值有待驗證。
基于上述理論,本文詳細解釋了L1范數在平差過程中的應用原理,并采用matlab軟件模擬觀測值,通過平差實驗,從內、外符精度等方面對最小二乘估計和L1范數最小估計方案的抗差性以及殘差特性作出討論。實驗表明,最小二乘會使粗差等概率分配到正常觀測值上,即不能從殘差分布上探測到粗差;L1范數則不受影響,對粗差觀測值作出有效探測。
設有誤差方程[7]:

基于線性規劃理論,對式(1)采用單純形法求解,其估計準則[8]:

其中:n為觀測值個數;pi為獨立觀測值的權,vi為第i個觀測值的殘差;P和V為相應的權陣和殘差向量。求解L1范數估計時通常使用基于線性規劃的單純形法或選權迭代法,解得待估參數及殘差V。將參數平差式(1)作為約束條件的L1估計數學模型[9]:


將(4)代入模型式中可得到線性規劃的標準形式[10]:

式(5)為具有概括性的L1范數平差模型。基于選權迭代法求解L1范數,取ρ函數為ρ(ν)=|ν|,則估計準則[11]:

式中:νi為觀測值改正數;ρ(νi)為觀測值權函數,式(6)對求導,得


如此進行法方程解算并迭代,直到前后兩次解的差值符合限差要求為止。選權迭代法解算L1范數已有較多討論,在此不多贅述,本文使用算法和模型相對完備的單純形法對L1范數估計進行求解。
標準形式的單純形法用向量形式表示如下[12]:

約束方程組的系數矩陣的任意非奇異子方陣B,其列向量線性無關,稱為一個基矩陣,用B來表示B=(P1,…,Pm)。除基變量以外的變量Pi(i=m+1,…,n),非基矩陣用N表示N=(Pm+1,Pm+2,…,Pn)。從而可以將系數矩陣寫為分塊的形式A=(B,N),記XB=(x1,x2,…,xm)T,XN=(xm+1,xm+2,…,xn)T,這樣待求解X寫為分塊形式,即BXB+NXN=b,由此解得:

這是用非基變量表達基變量的公式。此時可以將XN看作一組自由變量,給它們任意一組值,得,這就是約束方程組的一個解。如令式(5)中所有的非基變量,則,稱解為線性規劃問題的基本可行解。
在式(10)中令xN=0,得,則式(5)相當于。將式(10)代入目標函數的表達式,即得用非基變量表達目標函數的公式:

此時若記目標函數在x(0)處的值為f(0),即,再記,則目標函數的表達式可寫為:

λj可用來判斷一個基可行解是否為最優解,對于某線性規劃問題的一個基B,若全部λN=cN-cBB-1N≥0,則對應的基解x(0)便是LP的最優解,否則重復上述過程。
假設某觀測向量為Y,參數真值向量為X,其存在以下關系:

式中ε是誤差向量。為了實驗驗證方便,我們給定真值X和設計矩陣A,則觀測值的真值向量:

給定的參數真值X=[1,2,3]T;隨機生成100×3的設計矩陣A;根據不同情況生成的100×1的誤差向量ε。生成模擬數據后,為了直觀展示最小二乘估計與L1范數估計之間的差異,使用如下方案進行解算:
(1)生成服從均值為0,標準差為1的無粗差正態分布誤差,分別用最小二乘估計和L1范數估計進行計算,重復計算過程10次,得到當誤差分布服從正態分布時的參數X;
(2)在(1)的基礎上,對每次生成的數據添加10%的較大粗差,并比較2種算法的結果差異。
為對比2種算法所得結果,使用內符精度和外符精度進行直觀展現[2]。參數的內符精度含義為所有組數據計算的參數中誤差的平均,即為第i組數據第n個參數的中誤差。參數的外符精度為所有數據計算的參數真誤差的均方根,即mn=為第i組數據第n個參數的中誤差。
根據上述實驗流程,得到結果見表1。

表1 2種方法精度對比
由表1我們可以看出,當誤差服從正態分布的時候,最小二乘估計和L1范數估計的內、外符精度存在較小差別,最小二乘估計精度稍優于L1范數估計,說明此時最小二乘估計最優。而當添加粗差時,對最小二乘估計會造成嚴重影響,L1范數則能避免粗差影響,依然保持和無粗差時相同的精度。下面,我們通過2種方案的殘差值來進一步分析。
從圖1中我們可以看出,在使用最小二乘估計平差時,會將粗差無差別等概率分配到其他觀測值中,導致無法從殘差結果進行粗差觀測值的定位。說明最小二乘估計不具有抗差性,粗差會損害最小二乘估計的平差結果,從而無法達到預期精度。

圖1 最小二乘估計殘差值
由圖2我們可以看出,L1范數估計的殘差值能精確定位粗差觀測值,真殘差會分配到粗差較大的觀測值上,說明L1范數具有較強的抗粗差能力。

圖2 L1范數估計殘差值
通過L1范數估計和最小二乘估計的實驗驗證,小樣本情況下,當觀測中不含粗差時,最小二乘估計和L1范數估計精度相差不大;當觀測值中含有粗差時,L1范數最小估計能獲得較好的平差結果,這與L1范數的解算原理有關,總是能在準則下選得最優的平差解。
雖然L1范數估計相比最小二乘有良好的抗差性,但并不能說L1范數估計強于最小二乘,其在某些情況存在不能真實反映粗差信息的問題,且其多適用于小樣本參數估計。在抗差領域,發展L1范數與最小二乘相結合的抗差估計方法,進而為抗差最小二乘提供高質量、高可靠性殘差信息,讓最小二乘變得適應性更強。