潘家寶 戴吾蛟 章浙濤 黃大偉
1)中南大學測繪與國土信息工程系,長沙 410083
2)湖南省精密工程測量與形變災害監測重點實驗室,長沙 410083
變異函數模型參數估計的信息熵加權回歸法*
潘家寶1,2)戴吾蛟1,2)章浙濤1,2)黃大偉1,2)
1)中南大學測繪與國土信息工程系,長沙 410083
2)湖南省精密工程測量與形變災害監測重點實驗室,長沙 410083
將熵權理論引入到變異函數理論模型的參數估計中,對加權多項式回歸的加權方法進行改進,以信息熵定權,并用實際變形監測數據進行實驗。實驗結果表明,該方法綜合了距離和樣本點對數對權重的影響,加權回歸確定的變異函數模型更準確,插值預報效果更優。
信息熵;變異函數;加權回歸;變形監測;交叉驗證
克里金插值在地學領域已經得到了廣泛的應用,其中變異函數模型參數的估計是克里金插值的關鍵。最初使用的方法是人工擬合法,但是該方法耗時費力,效率低,而且主觀性強,缺乏統一客觀的標準[1-2]。最小二乘法則無法反映變異函數曲線中前幾個點的重要性,但前幾個點距離較小,它們在反映變量的空間相關性方面極為重要,其可靠性比后面點的可靠性強得多。許多學者提出了一些相應的處理方法[2-4]。在鉆探領域,鉆孔一般是等間距或近似等間距的,步長較小時樣本點對數就多,權重就大,反之則樣本點對數就少,權重就小。而在變形監測領域,監測點之間的距離各不相等,樣本點的對數無法反映出變異函數曲線前面幾個點的重要性,此時以樣本點的對數為權重則不能很好地反映權重的實際情況。熵權法全面考慮幾種因素的共同影響,合理分配各因素的比例,定權更加全面和科學。本文首先對變異函數理論模型進行線性化[5],隨后以信息熵作為衡量權重的因子進行加權回歸來估計模型的參數,最終得到基于信息熵的加權回歸模型,并以實際變形監測的數據驗證了該方法的可靠性。
常用的變異函數理論模型主要有球狀模型、指數模型和高斯模型[1]。球狀模型為:

當0<h<3a時,對式中exp(-h/a)進行泰勒級數展開,隨著泰勒級數階數的增加,參數的變化將逐漸減小,參數趨于穩定。因此,只需展開到二階平方項:

同球狀模型類似,此時γ(h)可以線性化為γ(h)=b0+b1x1+b2x2。高斯模型為:

同指數模型線性化過程類似,γ(h)可以線性化為γ(h)=b0+b1x1+b2x2。冪函數模型為:

兩邊取對數則可以得到:

對于球狀模型、指數模型和高斯模型,令y=γ(h),得到多元線性回歸方程為:

參數求解公式為:

冪函數模型線性化后為一元回歸模型,其參數求解公式為:

式中W(i)為權重,距離小的樣點比距離大的樣點在反映變量空間相關性方面更為重要,權重也更大。
若系統處于多個不同的狀態,而每種狀態出現的概率為 pi(i=1,2,…,m),則其熵定義為[6]:

設有m個待評價項目,n個評價指標構成的評價矩陣 R=(rij)m×n,熵權法定權的步驟如下[7-9]:
1)根據評價矩陣計算每個待評價項目出現的概率:

2)計算第j個指標的熵:

3)計算第j個指標的熵權:

4)確定變異函數的最終權重:

以天津市GPS監測的2006~2007年12個點的沉降量為例,首先根據坐標計算出每兩個GPS點之間的距離,然后對距離進行分組[2,10]。若距離落入[kh±ε(h)](k為常數,ε(h)為容差)范圍內就分在同一組,認為這些點間的距離為kh,統計落入[kh±ε(h)]范圍內的距離數目,記為N(k)。然后分別求出距離為kh時的實驗變異函數值γ(h),繪制實驗變異函數散點圖,如圖1可以看出,變異函數大致服從冪函數分布,選擇冪函數模型進行加權回歸估計模型參數。

圖1 實驗變異函數散點圖Fig.1 Scattergram of experimental variogram
分別以距離kh和距離kh的數目N(k)為影響因子構造評價矩陣 R,令 k=1,2,…,n,ε =1/3,最終將距離分成了18組,得到的評價矩陣為:

由式(11)~(14)求得最終的權重Wi如表1。

表1 評價指標權重Tab.1 Weights of evaluating indicator
加權回歸求得的冪函數模型參數A=0.998 4,θ=2.055 6。當 θ≥2 時,令 θ=1.999 9,變異函數的冪函數模型為:

用加權回歸得到的冪函數模型進行克里金插值,用交叉驗證法檢驗各點的插值結果(表2)。交叉驗證法將觀測值中的一個點剔除,用剩余觀測點的值估算被剔除點的值,然后再把該點還原,重復以上步驟得到每個觀測點上的估計值。然后用統計學的方法將測點上的估計值和實測值兩組數據進行統計分析,評價插值方法的精度。
常用的評價指標有[11,12]平均估計誤差百分比(PAEE)、相對均方差RMSE、均方根預報誤差RMSPE以及殘差分析(殘差均值RM以及殘差標準差RSTD)等。
平均估計誤差百分比為:

式中,Z*(Xi)為位置Xi處的克里金插值,Z(Xi)為實測值,ˉZ為所有沉降值的平均值,s2為所有沉降值的方差。
由表2可以看出,信息熵加權回歸方法建立變異函數模型得到的克里金插值明顯優于最小二乘法。其中tja2點使用新方法的預報殘差值有異常,與真實值差距較大,比最小二乘的預報結果差,這可能是因為tja2點所在地區的構造運動或含水砂層逐漸恢復引起的[13],也可能是由于該地區地處丘陵地帶,相對封閉且海拔較高,與其他點的空間相關性有所降低造成的。再分別計算兩種方法交叉驗證的各項指標,由表3可看出,除殘差均值外,加權回歸的各項指標均明顯優于最小二乘方法。

表2 交叉驗證表(單位:m)Tab.2 Cross validation table(unit:m)

表3 交叉驗證指標統計(單位:m)Tab.3 Statistics of cross validation Indicators(unit:m)
對變異函數模型參數估計的加權回歸方法進行改進,提出了以信息熵為權重的加權回歸法。熵權法減少了人為主觀性對評價過程的干擾,更客觀地反映了樣本數目和距離對變異函數權重的貢獻率。在變形監測中的應用表明,使用信息熵來確定變異函數的權重是一種比較可靠的加權方法,建立的變異函數模型更準確,插值結果也比最小二乘法更優。
1 劉愛利,王培法,丁園圓.地統計學概論[M].北京:科學出版社,2012.(Liu Aili,Wang Peifa,Ding Yuanyuan.Introduction to geostatistics[M].Beijing:Science Press,2012)
2 王仁鐸,胡光道.線性地質統計學[M].北京:地質出版社,1988.(Wang Renduo,Hu Guangdao.Linear geostatistics[M].Beijing:Geological Press,1988)
3 矯希國,劉超.變差函數的參數模擬[J].物探化計算機技術,1996,18(2):157 - 161.(Jiao Xiguo,Liu Chao.Estimation of variation parameter[J].Computing Techniques for Geophysical and Geochemical Exploration,1996,16(2):157 -161)
4 李冠林,等.改進的克里金法在海面風場計算中的應用[J].氣象水文海洋儀器,2013(1):73 -76.(Li Guanlin,et al.Application of improved Kriging to calculating sea wind field[J].Meteorological,Hydrological and Marine Instruments,2013(1):73 -76)
5 李玲,等.變異函數線性化的統一參數估計方法研究[J].長江大學學報:理工卷,2010(2):127 -129.(Li Ling,et al.Study on the unity parameter estimation method of linear variogram[J].Journal of Yangtze University:Nat Sci Edit,2010(2):127-129)
6 周訪濱,朱建軍,陳永奇.基于熵的數據污染率估算[J].大地測量與地球動力學,2013(4):92-95.(Zhou Fangbin,Zhu Jianjun,Chen Yongqi.Contamination rate estimation based on entropy[J].Journal of Geodesy and Geodynamics,2013(4):92-95)
7 謝赤,鐘贊.熵權法在銀行經營績效綜合評價中的應用[J].中國軟科學,2002,9(4):60 - 63.(Xie Chi,Zhong Zan.Entropy method and its application in comprehensive evaluation of bank’s performance[J].China Soft Science,2002,9(4):60 -63)
8 王永弟,許承權.熵權理論在測量平差中的應用[J].測繪通報,2012(11):52 - 54.(Wang Yongdi,Xu Chengquan.Application of entropy theory to measurement adjustment[J].Bulletin of Surveying and Mapping,2012(11):52 -54)
9 劉玉成.熵法確定權重的地基沉降組合預測模型[J].中國科技論文在線,2010,5(11):875 -878.(Liu Yucheng.A combined prediction model for foundation subsidence using the entropy weight method[J].Sciencepaper Online,2010,5(11):875-878)
10 程勖,等.變異函數在異常空間插值中的應用[J].世界地質,2007,26(3):298 - 303.(Cheng Xu,et al.Application of variogram in interplation of abnormal space[J].Global Geology,2007,26(3):298 -303)
11 顧春雷,楊漾,朱志春.幾種建立 DEM模型插值方法精度的交叉驗證[J].測繪與空間地理信息,2011,34(5):100 -102.(Gu Chunlei,Yang Yang,Zhu Zhichun.Accuracy cross-validation of several interpolation methods of DEM[J].Geomatics & Spatial Information Technology,2011,34(5):100-102)
12 張曉明,趙剡.基于克里金插值的局部地磁圖的構建[J].電子測量技術,2009,32(4):122 -125.(Zhang Xiaoming,Zhao Yan.Local geomagnetic field mapping based on Kriging interpolation method[J].Electronic Measurement Technology,2009,32(4):122 -125)
13 易長榮,王淼,徐冬.GPS連續站監測天津市地面沉降的初步結果[J].現代測繪,2009(1):12.(Yi Changrong,Wang Miao,Xu Dong.Preliminary results of land subsidence monitored by continuous GPS stations in Tianjin[J].Modern Surveying and Mapping,2009(1):12)
PARAMETER ESTIMATION OF VARIOGRAM MODEL BY USING INFORMATION ENTROPY WEIGHTED REGRESSION
Pan Jiabao1,2),Dai Wujiao1,2),Zhang Zhetao1,2)and Huang Dawei1,2)
1)Department of Survey Engineering and Geomatics,Central South University,Changsha 410083
2)Key Laboratory of Precise Engineering Surveying & Deformation Disaster Monitoring of Hunan Province,Changsha410083
The information entropy theory was introduced into parameter estimation of variogram model,to improve weighting method of weighted polynomial regression using the entropy weight method.An experiment was taken with real deformation monitoring data,considering the influence of both distance and the number of point pairs at the same distance.The experimental results show that the variogram model determined by information entropy weighted regression is more reasonable,and interpolating prediction is more accurate.
information entropy;variogram;weighted regression;deformation monitoring;cross validation
P207
A
1671-5942(2014)03-0125-04
2013-09-24
國家自然科學基金項目(41074004);國家973計劃項目(2013CB733303)。
潘家寶,1989年生,男,碩士研究生,主要從事變形監測和時空Kalman濾波方法的研究。E-mail:story_cn@163.com;panjiabao@csu.edu.cn。