夏青青,李英海,郭家力,汪利,林偉
(三峽大學水利與環境學院,湖北宜昌443002)
水庫汛限水位分期控制是在確保水庫大壩及其下游防洪安全的前提下,合理利用洪水資源、緩解汛期防洪與興利之間矛盾的有效手段。但是如何根據流域氣象、水文等信息科學、準確地對汛期進行劃分,是進行分期汛限水位控制首要解決的關鍵問題。
傳統的汛期分期方法主要有成因分析法、數理統計法、模糊集合分析法和基于分形理論的方法等[1]。然而,這些分期方法各有優缺點:成因分析法建立在對研究流域的水文、氣象的成因分析基礎之上,分期結果因有較高的可靠性而被普遍采用,但在分析暴雨天氣的成因上存在一定的主觀性,也難以將汛期細分到天;數理統計法根據水文要素的統計規律進行分期,具有原理簡單、實用性強、可操作性強等優點,但是指標閾值的選取具有較強的主觀性;模糊集合分析法考慮了汛期指標在時間上的模糊性,但存在分期指標單一、閾值的選取上具有主觀性的問題;基于分形理論的方法物理背景強,但只能考慮單因子指標且需樣本容量較大、計算繁瑣。
Fisher最優分割法是一種對有序樣本系列進行最優分段的數學統計方法,將Fisher最優分割法應用于汛期分期,為解決分期多指標選取、分期數目以及相鄰分期分界點難確定等問題提供了有效手段[2]。當運用Fisher最優分割法在進行汛期分期時,選取的各個指標的權重如何確定將直接影響分期的準確性。目前的賦權方式主要有賦均權重[3]、專家評分法[2]、模糊層次分析法(FAHP)[4]、主成分分析法(PCA)[5]等。其中賦均權重將各個指標的權重均值化,忽略了不同指標的重要程度的差異;而專家評分法、模糊層次分析法和主成分分析法需要借助主觀經驗確定指標權重,忽略了對各個指標中隱含有用信息的挖掘。針對這一問題,本文借助熵權法計算指標權重的客觀性,提出基于熵權法的改進Fisher最優分割方法,并將其應用于三峽水庫汛期分期問題。
Fisher 最優分割法屬于有序聚類方法的一種,能保證樣本序列的時序性,這與汛期的天然時序性相吻合。該方法以各個分段總離差平方和最小為依據,以各段內樣本間差異最小、各分段間差異最大為基本原則[2]。
xij′=
(1)
式中xij——第i行第j列數據;xmax,j、xmin,j——第j列的最大、最小值。
然后,根據各個指標所占比重大小加權平均后得到向量Y:
(2)
式中ωj——第j個指標的權重。
(3)
式中yt——第t個分類中的樣本值,1≤t≤k。
若用D(it,it+1-1)來表示某一類Pt的類直徑,則可記為:
(4)
定義目標函數為k類類直徑之和:
(5)
使目標函數值最小的分割即為Fisher最優分割,記為:
(6)
有序樣本{y1,y2,…,yn}的最優k分割是在其某一截斷末尾子段的最優分割B*(n,k-1)之后再添加一段形成的,因此最優k分割的遞推公式為:
B*(n,k)=
(7)
若分類k(1 先找到分割點,使B*(n,k)達到最小,即: B*(n,k)=B*(ik-1,k-1)+D(ik,n) (8) 于是得第k類為Pk={yik,yik + 1,…,yik + 1 -1};然后找分割點ik-1,使其滿足: Bk(ik-1,k-1)=B*(ik-1-1,k-2)+D(ik-1,ik-1) (9) 得到第k-1類Pk-1={yik-1,yik-1 + 1,…,yik -1}。依照同樣的方法,可求出所有分類P1,P2,…,Pk,由此得到最優k分類的分類結果。 采用Fisher最優分割法進行汛期分期時,需要對選取的各個指標進行賦權。熵權法以變量隱含的信息熵為基礎,是一種客觀的權重賦值方法[7-8]。在汛期分期中,根據指標的信息熵計算其對應的權重,盡量消除權重計算的人為干擾,使指標權重的確定更符合客觀實際。本文引入熵權法對Fisher最優分割法中指標進行賦權,其基本過程如下。 a) 根據信息熵的定義以及Fisher最優分割法在數據處理中得到的標準化矩陣X′,采用下式計算指標j的熵值Hj。 (10) b) 根據指標j熵值Hj計算其熵權ωj′。 (11) c) 將Fisher最優分割法中向量Y的計算權重由熵權ωj′確定,得到向量Y′,見公式(12),并按照后續過程對向量Y′進行分期計算,再運用Fisher最優分割法對向量Y′進行分期計算。 (12) 三峽水庫是長江上游干流的控制性水庫工程,汛期防洪是其主要功能,防洪庫容221.5億m3。根據三峽水庫正常運行期防洪調度規則,每年6月10日水庫水位降至汛限水位145 m,并從6月10日至9月30日都維持單一汛限水位運行[8]。由于未考慮汛期洪水變化規律,未進行分期汛限水位控制,導致每年三峽水庫在汛期會產生大量棄水,而在汛末可能出現無水可蓄的問題。因此,分期汛限水位是提高三峽水庫汛期水資源利用效率的有效手段。而要實現汛限水位分期控制,首先要解決的就是汛期分期問題。 表1 旬多年指標特征值 利用式(1)對指標特征值進行標準化處理,然后采用熵權法計算5個指標信息熵及其熵權結果,利用式(10)、(11)計算得其信息熵和熵權,見表2。 表2 旬多年分期指標信息熵和熵權確定 將標準化處理后的數據按式(12)賦予相應的權重,得到向量Y′。用it表示該類分割的起點,it+1-1表示該類分割的終點,由于本研究中將汛期劃分為11旬,所以it={1,2,…,10},it+1-1={2,3,…,11},D(it,it+1-1)表示Pt={yit,yit + 1,…,yit + 1 -1}的類直徑。進一步的,采用式(3)、(4)計算各種組合的類直徑D(it,it+1-1),見表3。 利用式(5)—(9)計算出最優k分割的最優值B*(n,k)(其中n=11,k=2,…,10),再計算出f(k),見表4。 利用表4中的數據繪制B*(n,k)-k曲線和斜率差值f(k)-k曲線,見圖1。 由圖1可以看出,最優值B*(n,k)在k=2和k=3時相對較大,斜率差值f(k)在k=3時取得最大值,因此綜合判斷,取k=3為最優分段數。由表3可知k=3時對應的分類為1~2、3~7、8~11,故與之相應汛期劃分結果為:6月10至30日為前汛期,7月1日至8月20日為主汛期,8月21日至9月30日為后汛期。 表3 類直徑D(it,it+1-1)計算 表4 最優k分割結果 從氣候成因[9-10]來看,長江流域具有明顯的季風氣候,上游主要支流有金沙江、岷江、沱江、嘉陵江和烏江。根據西太平洋副熱帶高壓脊線位置移動對降水影響可知:在6月中旬至下旬,暴雨主要出現在烏江流域、嘉陵江東部和三峽區間,若三者不同時遭受暴雨,則宜昌站不會出現大量級洪水;7月上旬至8月中旬,雨帶位于長江上游,且易形成川西暴雨,隨著副高脊線周期性地東退西進,暴雨逐漸東移,易造成上游各個支流產生大量級洪水,在這個時期宜昌站易出現峰高量大的洪水。8月下旬,金沙江流域降水較多,而岷江、沱江和嘉陵江降水較少,因此宜昌出現量級較大洪水的概率較小。從9月初開始,長江上游受西風帶偏北氣流影響,整個流域降水量減少。10月以后,副熱帶高壓脊線南退到北緯20°以南,長江汛期隨之結束。因此,根據成因分析確定三峽水庫汛期分期結果為6月中旬至下旬為前汛期、7月初至8月中旬為主汛期、8月下旬至9月底為后汛期。這與基于熵權法的改進Fisher最優分割法的分期結果基本一致,說明改進方法對汛期的劃分符合洪水季節變化規律。 進一步,為檢驗本文的改進方法是否合理,選取旬信息熵的相對平均離差RMAD[7]作為分期評判標準,RAMD值越小表明分期方案越合理,其計算公式見式(13)、(14)。在計算得到的汛期分期的標準上將相應的分割點向后挪1個或2個位得到新分期方案,比較各方案RAMD大小。文獻[7]給出了詳細的計算步驟,計算結果見表5。 (13) (14) 式中Si——旬信息熵;RMADk——第t類的相對平均離差。 表5 分期方案相對平均離差RMAD值 由表5得方案1的相對平均離差為0.040,較其他方案小。進一步,采用基于賦均權重和主成分分析(PCA)[5]的Fisher最優分割法對三峽水庫汛期進行劃分,5個指標的權重分別為(0.200,0.200,0.200,0.200,0.200)、(0.203,0.207,0.207,0.200,0.183),2種方法最后計算得到三峽水庫汛期分期結果均為前汛期為6月10至30日,主汛期為7月1日至9月10日,后汛期為9月11至30日,即與表5中的方案3對應。而方案3相對平均離差為0.041相比方案1略大。因此,對比3種方法可知,本文改進方法所得分期更加合理。 為解決Fisher最優分割法中各指標賦權重主觀性強的問題,更加科學準確地進行水庫汛期分期,本文提出一種基于熵權法的改進Fisher最優分割方法,并將其應用于三峽水庫進行汛期分期,在確定分3期為最優的基礎上,將三峽汛期劃分為前汛期(6月10日至30日)、主汛期(7月1日至8月20日)、后汛期(8月21日至9月30日)。通過氣候成因分析和旬信息熵的相對平均離差RMAD計算對分期結果進行評價,結果表明,通過熵權法計算Fisher最優分割法中各指標的權重能夠盡量消除權重計算的人為干擾,分期結果相比基于主成分分析和賦均權重的Fisher最優分割法更為準確。1.5 最優分段數k的確定
2 基于熵權法的Fisher最優分割法改進
3 實例計算與分析
3.1 基于改進Fisher最優分割法的三峽水庫汛期劃分
3.2 結果分析
4 結論