蘭芝梅,朱 詠,陳學林
(1.甘肅省張掖水文站,甘肅 張掖 734000;2.甘肅省水文站,甘肅 蘭州 730000)
水文現代化建設主要是將先進的自動化監測設備應用到水文測驗中,實現基礎水文數據的自動化監測、傳輸、分析等功能。應用歷年綜合水位~流量關系曲線進行推流計算,是滿足流量自動化監測的關鍵環節。傳統的綜合關系曲線率定方法主要是采用整編規范中的t 檢驗對相鄰年份實測流量數據(2 個獨立樣本)的同分布顯著性檢驗分析,將通過t 檢驗的3 年~4 年的流量數據作為繪制綜合線的依據[1-3]。為進一步保證綜合線的科學性、合理性,本研究提出采用spss 軟件中單樣本k-s 非參數檢驗和多樣本k-w 非參數檢驗對實測流量數據進行分析研究。非參數檢驗在總體分布未知時有很大的優越性,總是比傳統的參數檢驗安全[4],通過非參數檢驗的歷史實測流量樣本數據,表明該樣本數據總體無顯著性差異,每年的水位流量關系變化較穩定。對于穩定的水位流量關系,可以對其進行數學公式的選配,以一個數學方程式來表達這種水位流量關系[5]。最小二乘法曲線擬合方法是使實測值與擬合值差的平方和最小,可較準確地擬合水位流量關系曲線[6]。
正義峽水文站位于張掖市高臺縣羅城鄉天城村,是黑河中游和下游的分界點,屬國家重要水文站、省界測驗斷面,測驗斷面無明顯沖淤變化;高崖水文站位于臨澤縣板橋鄉土橋村以上1.5 km 處,是黑河中游的省級重要站、中央報汛站,屬縣界測驗斷面,測驗河段基本順直,河床及兩岸系礫石細沙組成,屬流沙河床,沖淤變化較大[7]。
k-s 非參數檢驗是基于連續型計量資料樣本分布未知的前提下,用樣本本身的信息來檢驗樣本來自同一個總體假設的一種統計檢驗方法,其原理主要是運用某隨機變量x 的順序樣本來構造樣本分布函數,使得能以一定的概率保證x 的理論分布函數Fn(x)落在某個范圍內[8]。k-s 非參數檢驗統計量Dn表示樣本所有變量xi,在經驗分布與理論分布對應值之差的最大絕對值[9],表達式為:

根據文獻[6]提出當樣本容量n<100 時,顯著性水平=0.05,按照由Dn的精確分布制定的D(n,α)Lilliefors 修正臨界值檢驗表查驗,當樣本實際統計量Dn 表1 單樣本k-s 非參數檢驗結果 由表1 可得正義峽和高崖水文站單年實測流量樣本數據的實際統計量Dn均大于查表值D(n,α),即單樣本的總體均不服從正態分布,故傳統方法采用t 檢驗分析率定歷年綜合線理論上不嚴密。 多獨立樣本k-w 檢驗用于在樣本來自的總體分布未知情況下由多個獨立樣本數據檢驗多個總體的分布是否存在顯著差異,其原理是將多組樣本數據混合后按照升序排序,求出各變量的秩,檢驗各組秩的平均值是否存在顯著差異,如果各組秩的均值不存在顯著差異,則推斷多個總體的分布無顯著差異;如果各組秩的均值存在顯著差異,則推斷多個總體的分布存在顯著差異,至少有一個樣本不同于其他樣本[10]。k-w 秩和檢驗統計量為: 式中:N 為總樣本量;k 為樣本組數;ni為第i 組的樣本量;Ri為第i 組樣本中的秩總和。一般數組中會存在相等秩值的情況,需按照校正系數C 進行調整: 當每個獨立樣本中實測數據大于等于5 時,KWC接近自由度為k-1 的卡方分布,用卡方分布進行統計量檢驗[11]。取顯著性水平=0.05,當實際檢驗顯著性值>0.05 時,接受原假設,即多個樣本的總體分布無顯著性差異。基于以上分析方法,應用spss 軟件中k-w 檢驗對正義峽水文站和高崖水文站7 個獨立樣本進行檢驗分析,結果見表2。 表2 多獨立樣本k-w 非參數檢驗結果 由以上檢驗結果可知,正義峽水文站基本順直河道的測驗斷面相對穩定,歷年實測流量數據的總體分布無顯著性差異,即在水力要素變化不大的前提下,每年的水位流量關系具有穩定性;高崖水文站基本順直河道的測驗斷面不穩定,歷年實測流量數據的總體分布存在顯著性差異,即每年的水位流量關系會存在一定的差異,不具備率定歷年綜合關系曲線的條件。故可以采用正義峽水文站2012 年~2018 年實測流量數據,率定歷年綜合水位-流量關系曲線。 正義峽水文站2012 年~2018 年暢流期實測流量數據共239 測次,經分析舍棄在水位~流量關系上不合理的測次11 個,實際參與分析的共228 測次。其中實測最低水位2.17 m,最高水位5.70 m,水位變幅3.53 m;實測最小流量0.123 m3/s,最大流量570 m3/s。根據文獻[12]中黑河非汛期生態需水量最小達到多年平均流量的10%,在水位低于2.44 m 時需獨立率定綜合線。綜合以上分析,采用水位高于2.44 m(共202 測次)的實測流量數據擬合暢流期的常規綜合線;水位低于2.44 m(共26 測次)的實測流量數據擬合暢流期的生態流量綜合線。 曲線擬合是指采用某種方法求出某條光滑的曲線最佳擬合數據,最小二乘法的多項式擬合原理是從整體上考慮函數q(x)=anxn+an-1xn-1+an-2xn-2……+a0同實測數據點(xi,yi)的誤差平方和(SSE)最小[13],即: 從幾何意義上講就是尋求與給定點(xi,yi)的距離平方和最小的函數曲線y=q(x),具體由多元函數求解極值的方法對式(5)中多項式系數進行求解,最終得到最佳多項式擬合函數。本文衡量擬合程度的指標為均方根(RMSE)、確定系數R-square,其表達式為: 式中:SSR 為預測數據與原始數據均值之差的平方和;SST為原始數據與原始數據均值之差的平方和,確定系數越接近1,表明方程的自變量對函數的解釋能力越強。 參與綜合線擬合的數據點共202 個,設自變量為水位z,因變量為流量q,經過擬合分析可得最優擬合函數: 綜合線的RMSE=1.2978,R-square=0.9999。為滿足高水推流的要求,將擬合函數高水延伸到歷年最大實測流量值850 m3/s。擬合結果見圖1。 圖1 暢流期常規歷年綜合水位-流量關系曲線 參與綜合線擬合的數據點共26 個,由于在生態流量期對推流精度要求高,因此根據數據點的散點圖分布情況,取其中15 個率定綜合線1,剩余11 個率定綜合線2。設自變量為水位z,因變量為流量q,經過擬合分析可得綜合線1 的最優擬合函數: 綜合線2 的最優擬合函數: 綜合線1 的RMSE=0.1178,R-square=0.9877;綜合線2的RMSE=0.0772,R-square=0.9938。擬合結果見圖2。 圖2 暢流期生態流量歷年綜合水位-流量關系曲線 根據《水文資料整編規范》中定線精度要求,穩定的水位流量關系曲線應計算實測點對關系線的隨機不確定度和系統誤差,且一類精度水文站的系統誤差絕對值小于1%;隨機不確定度小于8%。經對前文得到的綜合水位-流量關系曲線誤差計算,可得表3。 表3 水位流量綜合關系線型定線精度 正義峽水文站2019 年1 月~2020 年4 月暢流期實測流量共5 測次,應用本文暢流期常規歷年綜合線進行推流,可得數據對比表4。 表4 實測流量與綜合線推流對比 由表3 可得,本文擬合的綜合線定線精度符合規范要求;由表4 可得,相對誤差均小于規范要求。 本文采用多樣本k-w 非參數檢驗對河床基本穩定的正義峽和測驗斷面處河床不穩定的高崖水文站的參與綜合線擬合的多樣本數據進行對比分析,得出正義峽水文站歷年實測流量多樣本數據的總體無顯著性差異,而高崖水文站歷年實測流量多樣本數據的總體有顯著性差異,故可以采用正義峽水文站歷年實測流量率定歷年綜合水位-流量關系曲線;按照q=f(z)函數對實測數據進行擬合分析,率定暢流期水位高于2.44 m 綜合線一條;水位低于2.44 m 的生態流量期綜合線2條,擬合指標均較好;經過相關檢驗誤差分析,均符合規范要求。 根據本文分析結果,可得出歷年綜合線在低水期并非單一線;參與率定綜合線的樣本數據來自一個總體,在水力要素不發生大的變化前提下,關系線穩定不變。該方法適用于測驗斷面處河床基本穩定的天然河道。本研究擬合的歷年綜合水位-流量關系曲線為單一函數曲線,可作為流量自動化監測的技術支撐。 不足之處:本研究只是針對暢流期進行歷年綜合關系線定線分析,沒有對非暢流期的關系線分析;測驗斷面基本穩定,而在水位較低時會出現不同的歷年綜合關系線,本文并沒有對其產生的深層原因做分析說明。
2.2 實測流量多樣本同分布分析




3 歷年綜合水位流量關系曲線擬合
3.1 擬合數據分析


3.2 暢流期常規歷年綜合關系曲線


3.3 暢流期生態流量歷年綜合關系曲線



4 誤差分析


5 結論與討論
5.1 結論
5.2 討論