馬英豪 成 雷 高 攀
(山東省膠東調水局, 山東 濟南 250013)
?
因子分析對青島水資源情況的預測
馬英豪成雷高攀
(山東省膠東調水局, 山東 濟南250013)
本文利用成分因子分析等統計學方法,通過對青島歷年水資源數據的整合和分析對比得出風險因子,從而建立數學模型對水資源緊缺情況進行預測,為水資源綜合利用提供科學依據。
青島; 成分因子; 水資源; 風險預測
水資源緊缺是世界所有國家都面臨的迫切問題,而我國缺水問題尤為嚴重,特別是長江以北地區,呈現逐年遞增趨勢,嚴重影響了當地的居民生活和經濟發展。青島作為北方缺水型大城市,對于分析地區水資源緊缺情況具有較大的代表性和可研究性。通過查看2013年青島公布的水資源情況統計資料,發現與青島水資源緊缺問題有關的直接因素有年降雨量、膠東調水年送水量、人口數量遞增量、大沽河水情、工農業生產需求量等。本文對產生水資源緊缺的風險因子進行分類分析并進行評價判定,通過建立數學模型對青島水資源緊缺的風險情況進行綜合性的辨析,并得出調控主要風險因子的方法。然后,運用此方法對青島2013年和2014年兩年的水資源情況進行詳細的分析判斷并判斷出水資源是否緊缺,同時通過青島2013年和2014年兩年的水資源實際情況對判斷方法和結論進行檢驗。
影響水資源緊缺風險評價判定的因素非常多,且每個因素對評價判定的影響程度不同。因此,運用主成分分析法和因子分析法等方法,找到影響因素對水資源緊缺風險的權重程度,從而得到青島水資源緊缺風險的主要風險因子。
主成分分析法是將多個變量通過線性變換選出較少個數重要變量的一種多元統計方法。這種方法可以利用變量之間的相關關系進行重疊從而相對原變量提出盡可能少的新變量,同時使這些新變量相互之間不關聯影響,且確保這些新變量在反映課題的信息方面盡可能保持原有的信息。
因子分析是指研究從變量群中提取共性因子的統計技術。主要目的是用來描述隱藏在一組測量到的變量中的一些更基本的,但又無法直接測量到的隱性變量。因子分析的結果可以通過主成分分析的結果進一步計算得出。
我們可以用F1表示由缺水量的第一個線性組合所形成的主成分指標,即F1=a11X1+a21X2+…+ap1Xp,每一個主成分所提取的信息量可用其方差來度量,其方差Var(F1)越大,表示F1包含的信息越多。F1作為第一主成分,在所有的線性組合中選取的F1應該是X1、X2、…、XP的所有線性組合中方差最大的。但是它不能夠涵蓋原來p個指標的信息,于是選取第二個主成分F2,但F2與F1要保持獨立、不相關,即協方差Cov(F1,F2)=0。依此類推構造出的F1、F2、…、Fm為原變量指標X1、X2、…、XP的第1、第2、…、第m個主成分。
根據以上分析得知:

X1、X2、…、XP在線性組合中的方差最大,即Fm是與F1、F2、…、Fm-1都不相關的X1、X2、…、XP的所有線性組合中方差最大者。F1、F2、…、Fm(m≤p)為構造的新變量指標。
求解:a. 計算協方差矩陣。 ∑=(sij)p×p,其中
b.不僅要得到∑的特征值λi而且要知道正交化單位特征向量ai。λ1≥λ2≥…≥λm>0是方差數值,而ai就是成分分析中的主成分的Fi的原變量系數,則它們之間的關系如下:

根據貢獻率的數值,可以判斷出來變量情況。比如貢獻率超過85%時,說明此數值合理反映了原來變量的信息,對應的m就是抽取的前m個主成分。具體計算過程,采用MATLAB主成分分析進行主成分判定選取。
d.計算相關程度。相關程度反映了主成分Fi與缺水量之間的相互關聯程度。相關程度的含義不同于權重,但是它同樣能夠反映各主成分與缺水量之間的相關關系。運用SPSS軟件中因子分析并得出結果。
主成分分析結果:應用MATLAB對所需數據進行分析,得到每個因子對于實際水資源缺乏量的影響大小,進行主成分的判定選取。通過MATLAB處理得出:總用水量、實際的水資源數量、自然水資源降水數量、污水處理凈化能力、污水處理轉換率的影響程度值為:7.74,20.21,9.91,5.56,4.39。
2.1風險指標
根據常用的水資源風險評判指標,選取了風險率、脆弱性、可恢復性、重現期、風險度五項指標。下面對這五項指標分別進行闡述。
a.風險率。一般而言,每個城市對于水資源情況都會有記錄,通過長期觀測會發現一個比率:整個水資源系統的缺水時長與整個水資源使用時長之間的比,計算公式如下:
(1)
b.脆弱性。是指水資源在使用過程平均短缺情況的重要數據。例如,將缺水年每個月的缺水量疊加為∑VEi,干旱月份的整體用水量用∑VDi表示,故此,整個水資源系統的脆弱性就可以表示為:
(2)
c.重現期。相鄰兩次出現缺水情況F之間的時間間隔,稱為平均重現期。我們用d(μ,n)表示第n次間隔時間的歷時,可以得出平均重現期為:
(3)
d.可恢復性。指城市從水資源緊缺狀態回復到滿足需求狀態的可能性。
(4)
其中,0<β<1, β越大表明該系統越能更快地從缺水狀態轉變為不缺水狀態。
e.風險度。用σ表示標準差,σ值如果變大,就證明該水資源系統的風險越大,反之則相反。
(5)
特別需要注意的是:風險度與前面提到的風險率有所區別,風險度可以比1大,而風險率一定不能大于1。
2.2風險評價
根據上述5項評價指標,建立數學概率模型,對水資源緊缺風險進行綜合評價。所謂風險評價,是指在風險識別和風險分析的基礎上,把損失概率損失程度以及其他因素綜合考慮,分析該風險產生的影響,尋求風險對策并對該對策的影響進行分析,為風險決策創造條件。
假設給定2個有限論域U={v1,v2,v3,…,vn},V={v1,v2,v3,…,vn}。其中U代表由綜合評判因素所組成的集合, V代表由評語所組成的集合。分配權重A是U上的模糊子集,評判結果B是V上的模糊子集,并且可表示為A={λ1,λ2,λ3,…,λm},0≤λi≤1;權重分配A滿足∑λi=1(i=1,2,…,m);權重分配A的系數確定通過層次分析法(AHP)得到。關系矩陣R可表示為:
Ri={ri1,ri2,ri3,…,rin}即為對第i個因素ui的單因素評判結果。
將水資源緊缺風險劃分為五個等級,見表1。

表1 各評價因素分級指標
此模型用以下矩陣表示
水資源緊缺風險評價各因素影響程度采用(AHP)式的分析方法,同時通過A=(λ1,λ2,λ3,λ4,λ5)得到以下向量:

在具體計算實現的過程中,仍然運用MATLAB進行運算,得到各項風險判定指標,之后根據采用層次分析法確定各因素權重,對水資源緊缺風險等級進行判定評價并得出結論,風險等級的判定結果,見表2。

表2 青島1982—2012年缺水概率分布參數 單位:106m3
在實際操作過程中,可以一邊計算水資源能否做到進出平衡,一邊用風險數據指標對青島水資源情況進行數據量化分析,見表3。

表3 青島水資源緊缺風險性能指標描述
采用AHP法對青島各評價指標的權重計算結果為A=(λ1,λ2,λ3,λ4,λ5)=(0.40,0.20,0.10,0.10,0.20),利用上述的風險評價的指標對青島水資源緊缺風險情況進行綜合評價判斷,成果見表4。

表4 青島水資源緊缺風險綜合評分值
根據常識及AHP法分析得到權重分配:

再根據上邊的關系矩陣的公式得到如下關系矩陣:
通過模型得出的評價值可知青島的水資源緊缺等級介于較高風險和高風險之間;根據得出的風險因子采取有效措施進行調節,可以避免出現用水緊張情況,否則就可能造成當地生活和生產的用水緊張。
由于需要對2013年以及2014年青島水資源緊缺風險進行預測,建立缺水量預測的BP神經網絡模型進行缺水量的預測。其中, Y為固定年份用水總量(萬t),ZY為作為標準化處理后的變量值;令W固定年份實際需求用水量(萬t),ZW為作為標準化處理后的變量值(見圖1和表5~表6)。

圖1 具有單隱層的三層BP神經網絡拓撲結構

年 份200720082009201020112012缺水量Y/萬t17.4013.2011.309.8011.000.90標準化ZY/萬t-0.0288-0.1913-0.2647-0.32281.0000-0.6670

表6 基于時間序列的青島年需水量
求解:
a.訓練樣本確定。對將1983年和2012年數據進行建模,將2013年和2014年的數據帶入模型進行測試。利用主成分分析,比較ZY和ZXi的相關系數矩陣,得出各因子對ZY的作用大小為:ZX1>ZX2>ZX3>ZX4>ZX5>ZX6>ZX7>ZX8,利用下列因子建模ZX1、ZX2、ZX3、ZX4、ZX5。
b.模型參數。訓練函數、學習函數、性能函數、隱層傳遞函數、輸出層傳遞函數分別為TRAINLM、LEARNDM、MSE、TANSIG、PURELIN。根據輸入層、輸出層、慣量因子、迭代,學習系數和目標誤差,列出數據分別為:5.0,1.0,0.5,1000,0.05,0.001。
c.隱含層神經元數目的確定。該層神經元數目采用試算法確定。
d.網絡仿真。通過ATLAB的newff函數建立一個前向型BP神經網絡。訓練經迭代8次后誤差達到允許范圍。將測試樣本向量輸入作預測,并將結果做反歸一化處理,得到2013年和2014年的缺水量分別為12.34萬t和15.6萬t,總用水量分別為30.96萬t和32.21萬t。以此為依據,可預測到各項指標,青島2013年缺水風險預測結果見表7。

表7 2013年各項風險系數數據
由表7數據并結合關系矩陣Rv內各元素的求解公式得到:
仿照前述的模糊數學綜合評判方法B=A°Rv,而A=[0.40,0.20,0.10,0.10,0.20],可得B=(0.20,0.20,0.20,20.40,0.40)。
由此可知2013年青島缺水等級為高風險缺水,需采取有效調控措施,以減輕水資源高風險的現狀,青島2014年缺水風險預測結果見表8。

表8 2014年各項風險系數數據
由表8數據并結合關系矩陣Rv內各元素的求解公式得到
運用模糊數學綜合評判方法B=A°Rv,而A=[0.40,0.20,0.10,0.10,0.20],可得B=(0.20,0.20,0.20,20.40,0.40)。由此可知2014年青島缺水等級為高風險缺水,需采取有效調控措施,以減輕水資源高風險的現狀。
由于2013年和2014年已經過去,筆者用有關部門現已公布的數據對以上預測進行對比,發現以上結論均與事實相符,使本文所建立和求解的模型得到了很好的驗證。證明利用因子分析方法預測水資源情況是可行,在合理利用SPSS統計學分析工具和MATLAB神經網絡工具以后,增加了預測的準確性,也一定程度上避免了人工繁雜的計算過程,不失為一種很好的水資源風險預測方法。
Forecast of water resources condition in Qingdao by factor analysis
MA Yinghao, CHENG Lei, GAO Pan
(ShandongJiaodongWaterDiversionBureau,Jinan250013,China)
In the paper, component factor analysis and other statistical methods are adopted for obtaining risk factors through the integration, analysis and comparison of water resources data of Qingdao in previous years. Mathematical model is established for forecasting water resources shortage condition. Scientific basis is provided for comprehensive utilization of water resources.
Qingdao; component factor; water resources; risk prediction
10.16616/j.cnki.10-1326/TV.2016.03.018
TV211.1
A
2096- 0131(2016)03- 0063- 05