潘中建



摘要:依據黃河下游沖淤河道水沙過程的歷史數據,對黃河下游沖淤河道的水位進行信息處理,給出了構建非線性耦合隨機數據模型的分析過程。考慮到沖淤河道水位過程自身的復雜性,為使模型更有效,引入了自回歸項和隨機擾動項——維納過程,從而有效降低信息處理模型誤差。
關鍵詞:非線性;隨機數據模型;水位信息處理
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2018)04-0237-03
Application of Nonlinear Stochastic Coupling Model in Water Level Fitting
PAN Zhong-jian
(Jiangsu Vocational College of Business, Nantong 226011, China)
Abstract: Based on the Yellow River water sediment historical data of erodible-bed channel, fitted the water level, given the construction of coupled nonlinear stochastic hydrological model analysis. We considered the own complexity of the water level of erodible-bed channel, in order to make model effective we has joined in the auto regression item and Wiener process , thus reduces the fitting model error effectively.
Key words: nonlinear; stochastic model; the water level fitting
1 概述
自然界中的水體運動是一個非線性系統,是一個復雜的不確定過程。水文學和水力學主要是研究水體的運動、循環和時空變化規律,揭示水的自然屬性和社會屬性,以及人類合理利用水資源,防治水災害問題[1]。黃河下游是沖淤性河道,沖淤河道的水沙過程受到很多因素的共同作用,各因素本身及因素間的變化規律復雜。若對黃河水系統進行有效控制和支配,以及精確的預測黃河的水位,就必須用數學方法對水體進行分析,建立合理科學的水文模型[2]。依據黃河下游沖淤河道水沙過程的歷史數據,對黃河下游沖淤河道的水位進行信息處理,給出了構建非線性耦合隨機數據模型的分析過程。考慮到沖淤河道水位過程自身的復雜性,引入耦合項、自回歸項等方法,逐步有效降低了最終模型的隨機誤差,引入了;其次,黃河下游水沙質點的運動受許多隨機力的作用,水沙過程中的隨機擾動具有維納過程特性,在原模型基礎上引入刻畫水沙過程中的隨機擾動,從而有效降低了信息處理模型誤差。
2 初始模型的構建
依據水文學科相關理論,水體的下游水位相應的影響因素主要有:該水體上斷面出現的水位,含沙量,流量,和下游同時水位,含沙量,流量。為得到合理的初始模型,首先需最大限度的考慮水位變化的影響因素,給出全因素的非線性模型即:
在模型的基礎上,分析各個影響因素的相關程度,逐步的替代或剔除弱影響因素。
2.1 影響因素線性分析、非線性分析
在解決工程問題時,耦合影響因素越來越受到重視,水文過程的影響因素復雜,僅靠單純的幾個單因素難以符合實際物理背景,簡單的多元線性關系僅僅反映的是單因素的片面結果,所以要找出潛在的影響因素,就要注重耦合因素的交互影響。選取黃河花園口-夾河灘1980-1993年與、、、、、的對應值,把看作隨機影響的白噪聲過程,確定信息處理分析模型。由于影響因素較多,分析過程較長。這里僅給出一個耦合項及二階單因素變量與因變量的散點圖和信息處理模型過程。
從圖1中可以看到,下游水位的變化與上游水位的變化的平方近似有非線性拋物線的關系,在較短的期間內變動,且這一區間離坐標原點較遠,在這一區間上該拋物線曲率已非常小,可以得到簡單的信息處理模型:
,
經過對影響因素的初步分析,逐步篩選出有價值的影響因素,并在原有基礎上進行因素替代,非線性轉化為線性替代,剔除單因素和的單因素影響,組成初始的復合非線性耦合方程,其初始模型可以表示為:
其中,為待定參數,為隨機誤差。
2.2 因素的共線性分析
根據水文預報的要求,構建的模型在于信息處理的精度高,并非模型越復雜越好,因此這里主要分析模型中因素間的共線性,從而剔除模型中的重復因素,得到簡化的模型。
從復合非線性項兩兩之間的關系,可以得到與、與有較強的共線關系,所以在簡化模型過程中,可以逐步的剔除、兩項。經過線性轉化之后的與和與有著強線性關系,所以可以剔除、,同樣與具有近似的共線性關系,可以剔除含有的項。同時引入對因變量的自回歸項,得到改進模型:
從水文學和水力學的理論分析,在水位變化的過程中,其隨機變量可以看成一個隨機過程。每一個變量可以認為有其變動的隨機空間,基于此可以簡化非線性模型為:
其中,為期望函數,為相應的回歸向量或是自變量向量,可以看作隨機變量的白噪聲過程。維納過程是工程中布朗運動的數學描述,水沙過程中的隨機擾動具有維納過程特性,適合使用維納過程刻畫。為了盡可能在預測模型中做到科學合理,且能從實際物理背景中反映水文的變化,從而假定這個白噪聲過程為維納過程,設:
引入的滯后項構成的信息處理模型。即
其中為待定參數,表示為維納過程。
3 參數的率定
針對模型的參數率定,由于考慮到共線性的問題,運用嶺估計對參數進行率定。因為嶺估計是在自變量信息矩陣的主對角線元素上人為加入一個非負因子,從而使回歸系數的估計稍有偏差、而估計的穩定性卻可能明顯提高的一種估計方法,它是最小二乘法的一種補充,嶺估計可以修復病態矩陣,達到較好的效果。
3.1 值的選擇
根據文獻嶺估計的參數估計方法,適當的值選取直接影響著回歸的結果,表1是六個回歸系數在取0~0.0228的一些嶺跡,由表1可知,隨著的增加,回歸系數有的逐漸增大,有的逐漸減小,取0.02之后的數據已經基本穩定,變化比較小,所以取k=0.02。
一般認為如果的值低于10,則認為信息處理精度較高。由以上公式計算得到:, ,可見模型的信息處理效果比較高。
信息處理誤差絕對值的最大值為0.17632,誤差絕對值的平均值為0.048156。可見所構建的復合非線性隨機信息處理模型是有效的,該構建模型的方法是科學合理的。因為該模型考慮的因素比較全面,且加入了對的分析,信息處理誤差絕對值最大值符合工科學中的精度要求。
5 結論
介紹了復合非線性隨機數據模型的構建過程,其理論依據是建立在多元回歸模型、逐步回歸模型、自回歸模型、嶺估計以及維納過程的基礎上;從科學的角度出發,綜合多個模型的特點,構建合理的復合非線性隨機數據模型。從對模型的分析來看,模型是在前人研究的基礎上引入自回歸項和隨機擾動項——維納過程,逐步深化模型的適用程度,提高模型的信息處理檢驗精度。水位的信息處理模型是為了進一步用于預測水位,所以對水位預測有一定的參考價值。
參考文獻:
[1] 葛守西. 現代洪水預報技術[M]. 北京:中國水利水電出版社, 2000.
[2] 時政華. 復雜數據分類和EV模型應用研究[D]. 河海大學碩士學位論文, 2005.
[3] 芮孝芳, 陳潔云, 常星源, 等. 黃河下游水位預報模型及其應用[J]. 水科學進展, 1998, 9(3):245-250.
[4] 柳麗, 魏慶諍, 趙樹安. 回歸分析中多重共線性的診斷與處理[J]. 中國衛生統計, 1994,11(1):5-7.