高勝勇,焦立國,王占全
(1.綏化市水利工程公司,黑龍江 綏化 152000;2.大慶地區防洪工程管理中心,黑龍江 大慶 163311)
水資源工程作為一項重要且復雜的工程項目,在規劃和設計時必須在眾多方案中進行比較,并且從中選出最優方案。水資源工程方案優選作為一個綜合性技術經濟評價問題是極其復雜的,其結果關系著水資源工程的投資與收益問題,也關系著水利水電資源是否可以合理的開發利用,同時,也受到當前當地社會環境因素的影響,受到工程所在地的地質環境、水文特征與地理環境等自然環境因素的影響。在這些限制性因素中,有些因素可以通過定量描述,充分考慮到并解決;有些因素則是由于對其認識不足,或由于受到現有技術手段限制,難以進行定量描述,加以解決,只能對這些因素進行定量的評價,因此,水資源工程方案在進行選擇的過程中,需要運用投影尋蹤模型進行分析,通過已建立的方案評價指標體系,從該工程的發揮的社會效益、經濟效益和環境效益出發,從眾多備選方案中選擇出最優方案。在水資源開發規劃與管理運行過程中提供科學的理論指導,對水資源工程的發展與運行具有長足和深遠意義。從當前看,我們國家對水資源工程方案優選的分析、探索和研究,還僅僅停留在如何科學合理的把n多個評價分析指標轉換為單一的綜合性評價指標,從而降低評價與選擇難度,在一維空間內進行方案優選。
在高維數據統計與分析越來越普遍,也越來越重要的今天,多元分析法是解決此類問題的最主要最直接最現實的形式和方法。但是我們以往探索的多元分析法是用數據總體服從正態分布這個假設條件為前提的,在實際問題中,許多數據是不滿足正態分布這個假定條件的,此時,就需要用穩健的或非參數但方法來解決此問題。然而,隨著維數的增加,計算量與計算難度迅速增加,并且會存在高維點稀分布所造成的“維數禍根”問題。除此之外,在低維中穩健性好的統計方法,被用于高維時,穩健性會變差。
傳統的數據分析方法大多采用證實行性數據分析方法,即“對數據結構或分布特征做某種假定——按照一定準則尋找最優模擬——對建立的模型進行證實”這一方法,但由于這種方法過于形式化、數學化,在對高維非正態、非線性數據進行分析時,很難收獲預期效果。與此相對比,投影尋蹤模型在分析和處理高維數據時的優勢顯而易見。
投影尋蹤即通過計算機應用分析技術,將高維數據通過某種特殊排列優化組合,投影到低維度(1維度~3維度)子空間上,再通過運用極小化某個投影指標,尋查找出能夠反映原來高維度數據結構或某種特征的投射影像,并在低維度幾何空間對尋查到的數據結構進行分析計算,逐步分析和研究這些高維度數據。
過程1:水資源工程方案評價指標數值的歸一化處理。方案集為{x*(ij)|i=1-n,j=1-p)}
其中x*(ij)為第i個方案第j個分析評價指標值,n、p分別為方案的數目和評價指標的數目。為消除每個評價指標的量綱、統一每個評價指標的變化幅度,對越優越大型分析評價指標可通過公式(1)進行極值歸一化處理:
x(i,j)=[x*(i,j)-xmin(j)]/
[xmax(j)-xmin(j)]
(1)
對越優越小型分析評價指標可通過公式(2)進行極值歸一化處理:
x(i,j)=[xmax(j)-x*(i,j)]/
[xma(j)-xmin(j)]
(2)
式中:xmax(j)、xmin(j)分別是方案集中第j個分析評價指標的最大值和最小值。利用公式(1)和公式(2)得出的x(i,j)統一為[0,1]區間上的越大越優型分析評價指標。
過程2:建構投影指標函數。PP模型就是把p維數據{x(ij)|j=1-p整理成以a=(a(1),a(1),…,a(p)為投影方向的一維度投影值z(i)
(3)
然后根據{z(i)|i=1-n}的一維散布圖進行方案優選。公式(3)中a為單位長度向量。
在綜合投影時要求投影值z(i)的散布特征應為:局部投影點盡可能密集,最好凝聚成若干個點團;而在整體上投影點團之間盡可能散開。為此,投影指標函數可取{266}
Q(a)=S+D2
(4)
式中,s2為投影值z(i)的標準差;D2為投影值z(i)的局部密度,即
(5)
(6)
式中:Ez為系列{z(i)|i=1-n}的平均值;R定義為求局部密度的窗口半徑,對水資源工程方案優選問題R一般可取為0.1s2;距離rij=|z(i)-z(j)|;u(t)為單位階躍函數,當t≥0時其函數值為1,當t<0時其函數值為0。R的選取既要使包含在窗口內的投影點的平均個數不能太少,避免滑動平均偏差太大,又不能使它隨著n的增大而增加太快。
過程3:優化投影指標函數。當已知方案集時,投影指標函數Q(a)只隨投影方向a的變化而變化。不同的投影方向體現折射不同的數據結構特征,如何判斷最佳投影方向很關鍵,最佳投影方向應該是最大可能暴露高維數據某類特征結構的投影方向。通過求解投影指標函數最大化問題可以估計判定最佳投影方向,即
maxQ(a)=S2D2
(7)
(8)
公式(8)是以{a(j)|j=1-p}為優化變量的復雜非線性優化問題,用常規優化方法處理難度系數比較大[266.267]。模擬生物優勝劣汰規則與群體內部染色體信息交換機制的加速遺傳算法(RAGA)是一種常用的全局優化方法,根據這種方法來求解上述問題比較有效和簡便。
過程4:進行方案優選。把由過程3計算出的最佳投影方向導入式(3)后,可以獲取每個方案的投影值z*(i)。顯而易見,z*(i)數值越大,對應的方案i越優化。對z*(i)值從大到小進行排列順序,最大的z*(i)值所對應的方案i就是最合理方案。
構建投影尋蹤模型就是把從多維度分析評價指標建構的方案集,綜合分析、整理簡化成投影指標值,依據投影數值的大小來判定水資源工程方案的優劣:投影值越大,所對應的水資源工程方案就越優,該方案就越具有可指導性和可操作性[1]。
項目地區位于鄂爾多斯臺地南部黃土高原地帶。當地地質條件復雜。山地地形,由山地、緩坡丘陵構成,西高東低,南高北低。區域內丘陵起伏,溝壑縱橫,地層巖性均為第四系全新統砂壤土,局部夾壤土。溫帶大陸性氣候,干旱少雨,風沙大,日照時間長,蒸發強烈,冬季寒冷,持續時間長,夏季炎熱,持續時間短。霜凍、沙塵暴、冰雹等自然災害頻發。基于此復雜多樣的氣候條件和地質條件,合理利用投影尋蹤模型,選擇最優灌溉工程建設方案是很重要的一環。只有選擇了最優方案,因地制宜,才能真正解決灌溉水源問題。
在選擇水源前,必須充分了解水源情況,對水源地進行詳細勘查,對水源進行綜合性評價,并在綜合性考慮后進行選擇。避免因水源問題引發矛盾,做到統一規劃,合理分配,綜合利用。取水地需要選擇在有穩定河床,靠近水源主流的彎曲河段的凹岸處,以此保證不易堆積泥沙造成河床及取水口堵塞,同時可以保證良好水質。取水構筑物的選擇也應根據取水地環境進行選擇,無論是岸邊式、分建式、虹吸管式、濕式泵房,都應該根據具體情況選擇最優方案。因此,在變量眾多的情況下,利用投影尋蹤模型進行分析,選擇最優方案是最合適、最正確的選擇。
無論是不同城市,不同地區的防洪標準方案優選,還是節水灌溉方案的選擇,亦或是取水調水方案的判定,在復雜的社會因素、環境因素、自然因素面前,在變量眾多,數據分析量大且復雜的情況下,運用投影尋蹤模型,可以有效的將復雜的問題簡單化,在諸多繁雜方案中迅速選擇最優解。
水資源系統在隨著時間變化受到眾多因素的影響,因此導致水資源系統內部錯綜復雜。由于各個影響因素之間存在復雜關系,人們在利用水資源的時候,就需要對水資源進行合理分析,建立理論體系,并對水資源加以保護。
隨著人們不斷地對水資源體系進行探索研究,并加以利用,影響水資源的因素在自然條件的前提下,有摻雜了人為因素,這也使得隨著社會與科技的進步,能夠影響水資源的因素變得更加多樣化,也變得更加復雜,這些因素之間相互影響的關系也變得更加復雜,這就對水資源研究過程所需的技術提出了更高要求。當原有的技術手段在不能滿足對水資源問題進行精準快速的分析時,就促使技術不斷發展進步。因此,投影尋蹤技術的出現,為水資源系統理論體系的研究,數據的整理與分析,水資源工程方案的優選帶來了重要改變,起到了重要作用。
在水資源領域中,關于預測、多位評價以及各種復雜的多元化問題迎刃而解。將投影尋蹤高維降維技術應用于水資源工程方案優選問題,解決諸多懸而未決的實際問題,使工程方案更加適用于實際操作中,在理論與實際應用問題上都有跨越性進展,為水資源工程方案比選優選中遇到的復雜性和技術性難題,找到了新的解決路徑與研究方法,做出了新的解答[2]。
投影尋蹤模型克服了高維點稀分布所導致的“維數禍根”這一難題,打破了傳統證實性數據分析思維桎梏,使用降維手段,有效發現數據數值的結構特征,對數據進行有效分析,更好的穩健性,也是其可以運用與各行各業的基礎。基于投影尋蹤理論的發展與延伸,其應用與社會生活的方方面面,將會為社會各行各業的發展與推進帶來巨大影響,使社會發生天翻地覆的變化。