申意保(湖南省地質調查院,湖南 湘潭 411100)
?
變形監測回歸分析模型的優化改進
申意保(湖南省地質調查院,湖南湘潭411100)
關于數據處理理論和方法的研究對變形監測有著十分重要的意義。變形監測數據處理方法主要分為平差處理和擬合預測兩個部分。本文主要針對變形監測的擬合預測部分展開分析和研究。論述了常用的回歸分析方法。運用初等函數理論,定義了一種關聯度分析方法和關聯系數。以此來提高建立模型的效率和質量。也使得到的擬合預測模型精度更高。并用算例進行驗證。證明了模型改進的有效性。
變形監測;擬合預測;相關度;步長;初等函數;回歸分析
城市建設越來越快。高層建筑物和大型工程在施工和運營期間,會產生變形,如果產生變形超過了工程主體的極限和規定的限度,就會危及建筑物安全。因此,我們需要在工程建設與運營過程中,對其進行變形安全監測[1]。變形監測的準確性就顯得很重要了。增加變形監測準確性主要包括兩部分:在數據采集上,通過研制先進的觀測儀器來提高采集數據的質量。在處理數據時,包括平差方法和預報模型,不斷尋求新的理論方法和模型[2]。本文主要對數據處理的常用預報模型——“回歸分析”進行分析和改進。
回歸分析模型是一種傳統的數據分析方法,也是最成熟的方法之一。可以建立和單因子的相關關系,也可以同時建立和多因子之間的相關關系。相關關系式可以是線性的,也可以是非線性的。非線性的關系可以根據曲線匹配和多項式函數擬合,通過變量轉換為線性回歸關系。對于具有固定相關關系的而參數不確定的也可以用回歸分析進行參數求解[3]。完整的建立回歸分析應包括:
(1)因素分析;
(2)模型的建立;
(3)相關性檢驗;
(4)預測。
建立模型:分析影響因子和監測值相關關系;
建立回歸模型為:

式中:yi為監測值應變量;β0為截距;β1,…,βm為系數;xij為自變量;εi為隨機誤差項。
模型誤差方程有:

有最小二乘參數解β=(ATA)-1ATY
得到自變量與因變量的回歸方程:

模型檢驗:對模型中被解釋變量與解釋變量之間的線性關系在總體上是否顯著成立作出推斷[4]。檢驗統計量是:

線性回歸提出的是影響因子的后檢驗,就是在確立模型之后,對影響因子與觀測數據的相關度進行分析。建立模型之前選取因子的好壞直接影響著模型的準確度。建立模型時,如果已經知道了觀測值同影響因子的數學關系,模型的建立比較簡單,但是在對相應的物理關系的不了解時,很難選取合適的影響因子。從而無法構建相應的數學方程。因此如何在建模前對影響因子檢驗就很重要了[5]。
建立一種分析方法——關聯系數分析方法。根據影響因子的發展趨勢和觀測量的趨勢相似度。并將關聯程度進行量化。關聯系數分析方法是以反應變化趨勢為立足點。因此對樣本的值大小沒有很大的要求。
影響因子和觀測值的數學關系可以寫成函數表達式,而函數形式是數學里的基本初等函數:
(1)常數函數y=c(c為常數);
(2)冪函數y=x^a(a為常數);
(3)指數函數y=a^x(a>0,a≠1);
(4)對數函數y=log(a)x(a>0,a≠1,真數x>0);
(5)三角函數:正弦函數y=sinx;余弦函數y=cosx等。
由于函數中都含有未定a常數。將預先定義常數值。冪函數,α=-∞,…,0,…∞。a的間隔根據需要而定,一般間隔大小為1。指數函數和對數函數a的值為常數e。
總結有單個因子同觀測量的關系以下幾種關系:

定義影響因子與觀測值的關聯系數為R:

其中k和b是根據相鄰兩期的觀測值計算得出。

通過比較,認為R值越小,表明影響因子與測量值的相關度更大。得到影響因子同測量值最合適的數學關系式。同時也可比較不因子間的關系度。以此來在建模之前判斷那種因子對觀測值影響更大。
現有高速公路其中一處滑坡體10期精密水平測得的垂直變形數據,選擇了其中2個變形監測點,數據鏈的長度為9期,每期的間隔是14d。表1給出了這9期的觀測值(其中的數據已經進行了等間距化)。
根據累計沉降值同觀測期數的線畫圖,人為判斷建立模型。
從圖1中判斷二次曲線同觀測值比較吻合,建立的模型方程為:

式中:y為累計沉降值;x為觀測期數(時間)。

表1 滑坡體10期精密水平9期累積變形沉降量(單位:mm)

圖1
有誤差方程組:

最小二乘解為:

有回歸分析模型方程:

同點1有:
點2:

由根據模型計算擬合值,同時與觀測值比較有表2。

表2
首先在不知道觀測值和觀測期數(時間)的相關關系的前提下,可以通過模糊比較比較觀測期數經過不同初等變換后和觀測值的相關系數來選取適合相關關系。
首先將觀測期數根據初等函數,進行初等變換。
這里通過了10種初等變化函數:

構成函數形式為:

依據關聯系數:

計算有見表3。

表3
從關聯系數R的值比較可以得出,點1第5,6,7個函數關系對模型的影響為一個水平。點2中第5,6個函數關系式對模型的影響為一個水平。
下面根據對應的函數關系式建立模型:

分別計算點的擬合值以及預測值。并與實測值進行比較。見表4。

表4
優化前后各個點擬合情況對標情況見表5。

表5
通過比較各個點,可以發現通過優化后的模型比沒有優化的模型所得到的結果要更好,模型的擬合度更高,觀測值與擬合值的差值平方和有顯著減小。擬合預測的結果與實測數據更加吻合。說明了模型的優化是有效的。
本文旨在變形監測采用回歸模型進行擬合預測過程中,在模型不確定的情況下,通過關聯系數分析方法,以基本初等函數為分析單元,對回歸模型的建立進行優化。以初等函數為基本關系式建立數學關系,優化模型結構。通過算例計算,表明模型的優化是有效的。在實際應用過程中也是具有價值的。
[1]朱健.建筑物變形監測數據分析中的灰色改進模型應用研究[D].西安:長安大學,2007.
[2]黃聲享,尹 暉,蔣 征.變形監測數據處理[M].武漢:武漢大學出版社,2003.
[3]張俊中,宋 蕾,張健雄.多元回歸分析模型在變形監測中的應用[J].河南工程學院學報(自然科學報),2009.
[4]俞能福.多元線性回歸在分析學生成績相關性中的應用[J].大學數學,2007.
[5]何曉群,劉文卿.應用回歸分析(第三版)[M].北京:中國人民大學出版社,2011.
申意保(1970-),男,工程師,本科,主要從事工程測量工作。
TU196.1
A
2095-2066(2016)11-0021-02
2016-3-27