葛 文,何文峰,陳錦林,徐長虹,李祥龍
(1.寧波市測繪設計研究院,浙江 寧波 315402;2.寧波市阿拉圖數字有限公司,浙江 寧波 315402)
組合模型的預測效果往往取決于實測數據以及各單項模型的預測精度。各單項預測模型都是首先根據實測數據擬合出最佳參數,然后對未來數據作出預測。數據擬合和數據預測是組合模型兩個不同階段,擬合效果的好壞與預測效果的好壞并無絕對關系。在中長期的預測中,預測精度能保持多久是一個現階段研究的熱點,文中稱之為穩定度。如果一個模型的數據擬合精度能夠保持較長的時間,則認為該模型具有比較高的穩定度[1],能夠在中長期預測中保持很大優勢,提高預測精度。
國內外學者研究的組合模型[2]的建模準則大都為誤差平方和最小。近些年來,對于穩定度的研究越來越多,本文介紹了基于穩定度建模的基本方法,最后利用該模型對地鐵隧道沉降進行預測,結果表明該模型建模簡單、賦權合理,能有效預測沉降量,優于現有的組合預測模型。
定義1:設隧道沉降量的時間序列已知觀測值為 {xt,t=1,2,3,…,n},利用m種不同的數學模型對其進行預測,其中yt為第t期的觀測值或真值,yit=(i=1,2,3,…,m)為第i種數學模型在t時刻的預測值,則第i種數學模型在第t期的擬合誤差為:

則可定義第i種預測模型在第t期的預測精度:

式中,α和β稱為精度因子,且滿足

α和β的取值可以根據實際需要選取。在測量數據預測時,α通常取0值,β通常取1值。
定義2:

di為第i種單一模型的精度因子量距[3],預測模型對精度因子的約束程度由di的大小決定。通常,di越大,則模型對精度因子的定義約束越大;di越小,則模型對精度因子的定義約束較小。模型的預測精度并非直接由di決定,但其可以很好的調節模型的擬合以及預測過程,使兩個不同過程都能達到一個良好的預測效果。在組合模型構建過程中,對單一模型的選擇及預測精度的大小至關重要。
定義3:設第i種模型首先進行N期數據訓練,然后進行T期數據預測,可得:

式中,Ait為第i種模型在第t期的預測精度,則稱εi為第i種模型的平均訓練精度;ηi為第i種模型的平均預測精度。
定義4:

則稱Pi為第i種模型對于觀測數據序列{xt,t= 1,2,3,…,n}的穩定度。
一般認為ηi≠εi,若ηi=εi,表明該模型的平均訓練精度與平均預測精度一致,可以認為第i種模型對于觀測數據xt的穩定度趨于無窮大∞。若|ηi-εi|→∞,則Pi→0,可認為第i種預測模型對于觀測數據序列{xt,t=1,2,3,…,n}的穩定度趨于無窮小,表明該模型穩定度極差,其擬合精度無法決定預測精度的好壞,即使擬合精度高,模型的預測精度并不一定高。
設wi為第i種模型在組合模型中所占的權重,則以穩定度為建模準則的組合模型權系數確定方法可以表示為如下的形式:

在組合模型構建過程中,單一模型的穩定度是其賦權的依據。穩定度好的模型賦予較大權重,穩定度差的模型賦予較小的權重。當組合模型的平均訓練精度εi和平均預測精度ηi具有較強的一致性時,組合模型的訓練精度將能很好的延伸下去,從而使該目標函數確定的組合模型具有較強的穩定性,使其不僅能夠用于短期預測,也可以很好的確保中長期預測精度。
在前面的章節中,已經闡述了穩定度以及模型的權重概念。
則組合模型在t時刻的預測值為:

此時我們可以根據穩定度公式得到組合模型的穩定度[4]為:

定義

式中,Pmin為所有參與組合模型中穩定度最小的模型;Pmax為所有參與組合模型中穩定度最大的模型[5]。
若P組合< pmin,則此時的組合模型為劣性模型;
若pmin< p組合 若P組合> Pmax,則此時的組合模型為優性性模型[6]。 只有當組合模型的穩定度大于任何參與組建的單一模型時,才可認為該組合模型為優性模型。 為了保障地鐵列車安全運營,施工期間及運營通車后均需要對隧道結構沉降進行監測,監測頻率為一個星期一次。沉降監測點布設在隧道外側的道床上,測點在不同區段間距不同,沉降嚴重區段較密,點之間的距離平均為15m,沉降較小區段較疏,約為(20~50m)。在相對穩定的車站軌道道床上布設水準測量的工作基點。 監測外業工作按照城市軌道交通規范中的二等水準進行監測,實際觀測時將各車站的工作基點連接成閉合水準路線施測。內業處理時,對監測網進行最小二乘平差,以國家基準點為起算基準,計算閉合水準路線得到各工作基點的高程,根據相鄰兩期高程差值采用平均間隙法對工作基點的穩定性進行分析,最后將車站區間的工作基點和隧道區間的監測點組成符合水準路線計算隧道沉降測點的高程,并進行監測成果的分析。 本文選取監測點的40期觀測數據作為研究對象,其中30期為數據擬合建模的依據,根據所建立的模型對后10期數據進行預測對比。原始數據如表1 所示。 表1 隧道監測點沉降觀測值 分別采用時間序列模型和神經網絡模型以及組合模型對地鐵隧道結構運營期的沉降量進行建模預測并分析比較其結果。 時間序列模型[7]:原始觀測數據具有明顯的趨勢性。構建模型時,首先對數據進行二次差分,使其滿足平穩性條件。對差分后的數列進行自相關和偏自相關函數的計算及分析后初步判斷為ARMA(1,2)模型。利用最小二乘原理計算各階的參數估計值。序列由原始時間序列的二次差分構造出來,故模型表達式 如下: 根據上述表達式可以得到預測結果如表2所示。 表2 時間序列模型預測結果 由上述預測結果可知,時間序列模型能很好地反映沉降數據的發展規律,實際預測時具有較高的 精度。 對隧道沉降的原始數據配置網絡參數如下所示:神經網絡模型[8]的結構2×18×1 表明輸入層為2層,隱含層為18層,1個輸出層。輸入層分別為期數和沉降量,輸出層為沉降量。學習速率參數 Eita=1.5,平滑因子參數Alfa=0.7,訓練控制誤差Error=0.01 分級迭代級數stepE=14。訓練值為前30期沉降數據,后10期數據作為預測樣本。神經網絡模型處理后的預測值及誤差如表3所示。 表3 神經網絡模型預測結果 根據穩定度的定義以及建模理論,對沉降數據進行數據處理。可得時間序列及神經網絡模型的穩定度的表達式為: 兩種模型的權重為: 根據式(7),可得基于穩定度理論的組合模型數據處理結果如表4所示。 表4 組合模型預測結果 計算時間序列模型、神經網絡模型、組合模型的數據精度及穩定度如表5所示。 由上述表格中的數據繪制各模型的預測值曲線如圖1所示。 由表1~4和圖1可知,組合模型的預測值與實測值最接近,殘差曲線在零值附近波動,相對于單一預測模型,更加符合實際情況。由表5模型的中誤差可知,組合模型的擬合、預測以及全體中誤差均小于時間序列模型和神經網絡模型,表明組合模型的預測精度要高于任意單項預測模型,預測性能更加良好。 由表中的穩定度可知,組合模型的穩定度比任意單項預測模型的穩定度都大,從而根據最優組合模型的判定準則可知,該模型為優性組合。 表5 各模型數據處理結果精度比較表 圖1 模型預測曲線圖 1)組合模型相對于各單一模型,能有效的提高數據預測精度,實踐證明,組合模型是科學合理的,能充分集合各預測模型的有效信息,同時由預測結果可知組合模型在地鐵隧道沉降數據預測中得到了良好的應用,可以為類似數據預測提供借鑒。 2)基于穩定度建模準則的組合模型通常能避免實測數據中誤差值的影響,可使模型的穩定性和精度的延續性得到良好的保持,是一種科學合理的權系數確定方法。 3)本文通過對組合模型相關理論的闡述,引入了穩定度定義,并提出了基于穩定度的組合模型構建函數以及優性組合判定方法。實例證明該方法切實可行,能有效提高預測數據的精度,可廣泛應用于相關工程項目的數據處理中。3 實例分析









4 結 語