趙克勤
(諸暨市聯(lián)系數學研究所,浙江 諸暨 311800)
凡事預則立,不預則廢。但事物的預測通常受多種不確定性干擾。鑒于作者于1989 年提出的集對分析(set pair analysis theory,SPA)理論對系統(tǒng)不確定性采取“客觀承認,系統(tǒng)描述,定量刻畫、具體分析”的處置方針,把系統(tǒng)的確定性關系與不確定關系作為一個不確定性子系統(tǒng)做數學處理[1-3],吸引了不同領域的眾多科技工作者把SPA應用于系統(tǒng)預測研究,通過對已有預測模型的集對分析,不同程度地提高了預測精度,取得滿意或較為滿意的預測效果。在中國知網上,采用“高級檢索”“主題:集對分析”,“篇關摘:預測”,檢索到250 多篇文獻。本文綜述其中一部分有代表性的文獻,指出基于集對分析的系統(tǒng)智能預測原理是通過系統(tǒng)已有數據做合理的結構化聚類和合適的聯(lián)系數表達與不確定性分析進行預測建模,每次預測前,讓預測模型通過回顧性學習使預測值與系統(tǒng)歷史數據最大程度擬合,從而改善模型的預測功能,保證和提高預測精度。
例1天氣系統(tǒng)同時具有確定性和隨機不確定性。基于概率的多元回歸模型REEP 是世界各國進行天氣預報的基本模式。由文獻[4] 可知,王國強在1998 年就把集對分析用于天氣降水預報研究,通過對進入預報模型的預報因子及其數值按集對分析理論進行預處理,提高了天氣降水預報的準確率,在對93 次個例的降水預報作回顧性檢驗時,81 次預報結論不變,有12 次修改了預報結論,其中11 次修改成功,1 次修改失敗,成功率0.917,見表1,其中Y表示降水,1 指降水發(fā)生,0 指沒有降水發(fā)生。

表1 集對分析對REEP 的修改效果Table1 Set pair analysis of the effect of modifying REEP
預處理的基本步驟是:首先,在眾多的氣象要素中確定預報降水事件W 的n個“最佳因子”集合(做中長期降水預報涉及的因素多達10 多個,短期和近期降水預報涉及的因素較少,如文獻[4]中取n=5),但這n個“最佳因子”在每一次降水預報中對指示W 所起的“作用”有強(處于高概率區(qū))有弱(處于低概率區(qū))見圖1 和圖2,是一個動態(tài)變化著的組合;因此第2 步,計算這n個因子的變異系數,變異系數最大的因子被認為是指示降水事件W 的弱勢因子(變異系數的計算公式為cv=,原理見文獻[4-6]),該弱勢因子會干擾其他強勢因子指示降水事件W 的出現,因此第3步,把弱勢因子的數值按集對分析中的“i比例取值原理”(見文獻[4])分解給強勢因子,加強預報模型做出降水事件W 出現的概率,i比例取值公式如下:


圖1 事件W 出現的高(c)中(b)低(a)概率Fig.1 High (c)medium (b)low (a)probability of occurrence of event W

圖2 單峰曲線時的高(c)中(b)低(a)概率Fig.2 Probability of high (c)medium (b)low (a)at unimodal curve
從而把μ=a+bi+c j轉換成:

以上3個基本步驟中的關鍵是對不確定性的合理處置。如第一步,要在眾多的氣象要素中確定預報降水事件W 的n個“最佳因子”集合,既需要統(tǒng)計數據,也需要有預報經驗;既需要有大范圍的歷史和即時氣象信息,也需要給定降水區(qū)域附近小范圍的歷史和即時氣象信息;即樣本大小要合理;等等;第2 步中把最大變異系數對應的因子確定為弱勢因子(文獻[4-5]),但次大變異系數對應的因子也可以視情況確定為次弱勢因子,也就是按變異系數的由小到大把“最佳因子”分成“強勢”“中間勢”“弱勢”三類;第3 步中對“弱勢”因子數值的“比例分解”,其中的“比例”可以利用式(1)也可以有理由地“加權”;而要把上述諸多不確定性轉化為確定性(式(2)),每次預報降水事件W 前作回顧性預報是不可或缺的重要一環(huán)。多年的預報實踐證明了上述基于集對分析理論的天氣降水預報多元回歸模型,精度較高。例如,文獻[5]中報告了2002 年紹興市全年共出現13個大-暴雨,報對了10個,漏報的3個都是雨量相對較小的降水,雨量較大的降水一個未漏。
例2馮利華(2000,2014)先后把王國強等在文獻[4-6]中應用SPA 提高天氣預報準確率的思路和方法用于浙江省臺風降雨量回顧性預報,證實了通過反復調整預報模型中各預報因子同(強勢因子) 異(強弱之間) 反(弱勢因子) 相關區(qū)的分界值和不確定性分析,可以使臺風降水計算等級和實際等級的歷史擬合率達到最大,結果比較理想[7-8]。
例3王繁強(2006)沿用王國強等在文獻[4-6]中的思路,把集對分析用于沙塵暴預報[9],在以往對沙塵暴研究成果的基礎上,以強風、熱力和沙源三大影響因子為著眼點,結合2001—2003 年的沙塵暴天氣個例,對沙塵暴天氣進行了分類,分別選取預報因子,建立基于SPA 的沙塵暴預報模型,于2004 年春季進行了短期(24 h) 預報試用,結果表明,這一方法具有較好的預報效果。
例4王紅芳等[10]在2006 年研究了基于集對分析的年徑流預測法。通過長江寸灘站年徑流集對預測實例分析并與模糊優(yōu)選預測結果對比,表明基于集對分析的預測法計算簡單、關系結構清晰、預測精度較高。
例5金菊良等[11]于2009 年提出基于集對分析的水資源相似預測模型SPA-SF,并用于新疆伊犁河流域雅馬渡站年平均流量預測,結果說明:用SPA-SF 預測水資源的豐枯變化,物理概念清晰,計算直觀,預測精度較高。
例6劉銀迪等[12]提出一種基于序位的集對分析降雨量預測模型(ordinal-set pair analysis OSPA),并用于遼河流域1956-2006 年水文雨量站年降雨量預測,預測精度全部滿足《水文情報預報規(guī)范》對年降雨量預報的精度要求。
例7Zhang 等[13]在采用集對分析方法同時引入協(xié)整理論,提出基于誤差修正模型的徑流預測模型并用于西北黑河徑流序列預測,模型能夠較好地模擬和預測河川徑流。
例8盧家海[14]采用人工智能BP 模型、小波BP 模型及GA-BP 模型對徑流進行預測,然后將徑流的實測值系列A 和上述3 種模型的預測值Bi 建立集對H(A,Bi),利用集對分析的同、異、反特性進行聯(lián)系度計算,據此確定徑流預測模型的相對隸屬度,并對隸屬度進行歸一化處理,得到上述3 種模型的權重,再依據此權重建立相應的徑流組合預測模型。應用1950—1975 年小浪底水庫的資料,對徑流組合預測模型進行模擬,結果顯示其預測精度明顯高于單個模型的預測精度。
例9袁喆等[15]分別采用熵權法和集對分析法構建基于熵權法的集合模型(EW-CM)和基于集對分析法的集合模型(SPA-CM),分別應用于灤河流域徑流過程的模擬和預測,對比結果表明:SPA-CM 模型徑流預測效果在一定程度上優(yōu)于單一模型,綜合分析表明SPA-CM 模型最優(yōu)。
例10李深奇等[16](2016)提出了率定量化標準系數的SPA 年徑流預測模型,首先對量化標準系數進行率定,再用SPA 模型對徑流進行預測。將該模型應用于長江宜昌站,并與經驗標準預測結果進行對比。結果表明,率定量化標準后的預測結果能更好、更準確地反映原序列的變化,精度更高。
例11劉祖發(fā)等[17]將小波消噪(wavelet denoise,WD)與秩次集對分析(rank set pair analysis,RSPA)方法耦合,建立基于小波消噪的秩次集對分析水文預測模型(WD-RSPA),并應用于馬口站年總徑流量以及深圳市年總降雨量預測。結果表明:當集合維數T=4 時,coif3-RSPA 模型預測馬口站徑流量的預測誤差|e|=11.97%;T=6 時,db5-RSPA模型預測深圳市降雨量的預測誤差|e|=17.73%。相較于傳統(tǒng)AR(1) 模型和單一的RSPA 模型,WD-RSPA 模型更接近真實值,是一種切實可行的水文時間序列預測方法。
例12侯澤宇等[18]將有序樣品聚類、集對分析和馬爾可夫鏈3 種方法相結合,對傳統(tǒng)的加權馬爾可夫鏈預測方法進行了多方面改進,建立了基于有序樣品聚類的集對權馬爾可夫鏈年降水量預測模型,并將其應用于吉林省白城地區(qū)白城站2008—2010 年年降水量的預測。將預測結果與實測值對比發(fā)現:三結合法有效提高了預測精度。實測值均位于預測區(qū)間內。結果令人滿意。
例13萬陽[19]依據都江堰雨量站1961—2002年的年降雨量資料,基于集對分析方法構建了2 種(秩次加權集對預報模型和量化加權集對預報模型)年降雨量預報模型,然后利用預報模型對2003—2006 年的年降水量進行預測,并將預測結果對比。結果顯示,2 種年降雨量預報模型預報結果均滿足水文預報精度要求。相比較而言,秩次加權集對分析方法預測結果更加接近實際值,推薦采用秩次加權集對分析方法預測年降雨量。
例14莫崇勛等[20]根據中國西南典型巖溶區(qū)澄碧河流域內平塘站1963—2007 年的水文氣象資料,利用集對分析方法(SPA)的相似預測模型,分析和預測該流域水資源情況。結果表明,1993—2007 年徑流預測的NSE 為0.687,RSR為0.559,整體達到“良”等級,平均誤差11.4%,預測精度符合要求;集對分析方法在巖溶區(qū)流域中長期水資源預測中有很好的適用性。
例15何思為等[21]利用甘肅省白銀市景泰縣2 處地下水位測站的長序列觀測資料,研究了秩次集對方法預測地下水位動態(tài)變化的優(yōu)勢。
例16徐源蔚等[22]把集對分析與相似預測結合,從同、異、反三方面定量刻畫地下水位的當前樣本與歷史樣本之間的相似性,建立了基于集對分析的地下水位相似預測模型。實例表明:基于集對分析的地下水位相似預測模型的平均相對誤差小于3%。
例17Zhang 等[23]把秩次集對分析與小波分析結合,對北京水庫日極端氣溫和天津水庫月極端氣溫進行精確模擬和預報,獲得較為滿意的結果。
例18史紅波[24]將丹東地區(qū)作為研究對象,結合地下水位的相關數據信息,在集對分析基礎上選擇相似預測模型構建地下水樣本,進而對地下水位進行預測。實例檢驗結果顯示,丹東地區(qū)運用集對分析對地下水位相似預測模型的評價相對誤差小于4%。
例19Su 博士等[25]采用集對分析(spa)-馬爾可夫鏈模型對地下水水質評價和預測,以西安市為例,以1996—2015 年的地下水水質監(jiān)測數據為例,驗證了spa-markov 模型的可行性。
例20張云云等[26]從2000—2014 年的《中國統(tǒng)計年鑒》中收集年居民生活用水量時間序列數據,利用聚類和集對分析,計算居民生活用水量與影響因子人口總數的聯(lián)系度,預測人口總數在未來的增長率,預測未來居民生活用水量及其增長速度,其預測誤差均在2%以內,表明集對分析聚類預測模型對于生活用水量預測具有較高精度。
例21郭彥等[27]提出基于集對分析的多元回歸、神經網絡和灰色系統(tǒng)預測模型(SPA-CF)預測區(qū)域需水量,結果表明,SPA-CF 是一種直觀、簡便、通用的組合預測新模型,具有推廣應用價值。
例22和蕊等[28]用集對分析聚類預測法建立了城市生活需水量聚類預測模型,利用我國北京市實際數據進行驗證,證實模型計算簡單且精度較高。
例23汪明武等[29]提出基于聯(lián)系隸屬度的城市需水量預測模型,實例應用表明模型有效。
例24周戎星等[30]把基于集對分析的相似預測模型應用于山東省2010—2014 年的用水量預測。預測結果與實測值相對誤差較小。
例25王培等[31]用集對分析相似預測法對克拉瑪依市三坪地區(qū)需水量預測,發(fā)現集對分析相似預測法計算簡單,精度優(yōu)于傳統(tǒng)ARIMA 模型。
例26郭旭寧等[32]提出了確定供水水庫群聯(lián)合調度規(guī)則的集對分析新方法。首先把離散微分動態(tài)規(guī)劃(DDDP)和擬定供水調度圖確定的相同時段同一蓄水狀態(tài)下的水庫供水決策構成一組集對,通過遺傳算法優(yōu)化調度圖中各調度線的位置,使兩種供水決策聯(lián)系度最大,從而得到最優(yōu)調度圖。根據該原理,以水庫群虛擬聚合水庫為研究對象,采用多維DDDP 與遺傳算法確定聚合水庫最優(yōu)調度圖,并以此作為水庫群的供水規(guī)則。在多維DDDP 確定的供水決策樣本系列中,選取與當前時段蓄水、來水情況最相似(聯(lián)系度最大)的若干樣本作為參照樣本,將參照樣本下水庫放水量的加權平均值作為該水庫當前時段的放水量。以觀音閣、葠窩水庫群為例,驗證了采用集對分析方法確定供水水庫群聯(lián)合調度規(guī)則的有效性和合理性。
例27張明等[33]從同、異、反三個方面度量漏損預測樣本與歷史樣本的相似性,建立了基于集對分析的漏損預測(SPA-LF)模型。應用結果表明,SPA-LF 對預測過程不確定性的描述較為詳細,供水管網漏點數及漏損頻率預測結果均顯示出SPA-LF 模型的有效性,減小了預測過程的不確定性,與灰色系統(tǒng)模型、指數平滑模型及神經網絡模型預測結果相比,SPA-LF 模型取得了滿意的預測精度。且計算簡單,使用方便,可為供水管網的維護及管道更新提供決策支持。
例28郭鈺鋒等[34]把集對分析原理引入風速的區(qū)間預測,利用風向、溫度、氣壓、濕度等影響因素的訓練數據,并考慮風速點預測的結果誤差分布及風速變化率的影響,確定未來某時間段內風速的預測值所屬的分類集合,以該分類集合的上下限作為風速預測區(qū)間的上下限,從而實現了風速的區(qū)間預測。以某風電場的數據進行訓練和預測,驗證了基于SPAT 的風速區(qū)間預測方法的有效性。
例29風電功率時間序列的隨機性和波動性使得風電功率多步預測難以達到理想的預測準確度,楊茂等[35]提出一種基于經驗模態(tài)分解(EMD)集對分析的風電功率實時預測模型。1)將風電功率時間序列經EMD 分解,處理成有限個相對平穩(wěn)的分量;2)利用極值點劃分法,按波動程度相近的原則將分量重構為高頻、中頻和低頻3個分量,再對3個分量各自的特點建立預測模型;3)把3個分量的預測結果疊加作為原始風電功率的預測值,并用滾動的方式實現多步預測。采用3個不同裝機容量的風電場的實測風電功率數據進行仿真,結果表明該方法提高了多步預測的準確度,顯示出了良好的預測性能,算法結構見圖3。

圖3 滾動式多步預測算法結構Fig.3 Structure diagram of rolling multistep prediction algorithm
注意:本例中采用滾動方式實現多步預測的做法,本質上與例1 在每次預報前對預測模型用因子組合進行調整的做法異曲同工,能有效地提高多步預測的準確度,例30 也同此。
例30楊茂等[36]在傳統(tǒng)ARIMA 算法的基礎上,引入集對分析理論對風電功率進行超短期區(qū)間滾動預測。首先采用改進的K-means 算法,建立風電功率與風速、風向之間的集對關系;在點預測結果的基礎上,估計區(qū)間上下限,經過誤差調整,最后得到區(qū)間預測結果。算例表明,所提出的基于集對分析聚類算法的超短期風電功率區(qū)間預測能夠得到更精確的預測區(qū)間。
例31白靜芬等[37]針對電能量值傳遞過程中精度需求,提出基于標準電能表組的量值傳遞方法,在此基礎上提出基于集對分析預測的電能量值校準方法,利用集對分析預測算法獲得的預測值對標準電能表組的測量值進行修正,從而獲得更為準確的電能量值。采用3個標準電能表1年的測量數據進行驗證。結果表明:基于集對分析預測的電能量值校準方法能夠有效提高電能測量精度。
例32彭明鴻等[38]提出一種中長期電力負荷預測的集對分析聚類算法。該方法采用集對分析中的同異反模式進行模式識別,并根據聚類分析的基本思想進行分類預測。最后采用福建省年用電量數據進行了實例驗證,結果表明該預測方法有效。
例33趙高飛[39]以某市為例,收集整理了2004—2014 年用電量及其影響因素的數據,應用集對分析方法對用電量進行預測,并與實際值比對。結果表明該方法應用于用電量預測計算簡單,思路清晰,精度較高。
例34楊茂等[40]把秩次集對分析應用到風電功率時間序列實時預測。
例35葉鄭庚[41]用聯(lián)系數預測電動汽車的充電負荷,為電網安全運行與優(yōu)化調度提供參考。
例36肖白等[42]提出一種新的空間負荷預測方法。首先,在電力地理信息系統(tǒng)中,根據待預測區(qū)域內各10 kV 饋線供電范圍生成Ⅰ類元胞,將Ⅰ類元胞的歷史負荷數據分別按不同的集合容量生成多個歷史數據集合和1個目標數據集合;其次,對各歷史數據集合進行秩次變換得到相應的秩次集合,并分別將其與目標數據秩次集合構成集對;然后,尋找與目標數據集合相似的歷史數據集合,選取相對誤差最小的集合容量對應的預測值作為各Ⅰ類元胞負荷預測值;最后,以等大小網格生成Ⅱ類元胞,根據Ⅰ類元胞負荷預測值結合用地信息求出各Ⅱ類元胞的負荷預測值,從而得到網格化后的空間負荷預測結果。工程實例驗證了所提方法的實用性和有效性。
例37羅明武等[43]提出一種基于集對分析的太陽輻照度區(qū)間預測方法。經過數據預處理后,分別建立相似日輻照度與主因素集對和相似日主因素與待預測日主集對,計算相似日主因素與待預測日主因素的同異反距離模型并進行計算,實例表明所提方法有效。
例38陳紅江等[44]基于SPAT 選取影響巖爆的主要因素最大切向應力 σθ、單軸抗壓強度 σc、單軸抗拉強度 σt、彈性能量指數Wst 和巖石的脆性指數Is,并把σθ/σc、σc/σt、Wet 和Is 作為巖爆預測的主控因子,建立了巖爆預測的集對分析模型,對各個工程巖爆烈度級別進行預測。結合國內外一些典型深埋長大隧道工程實例進行分析計算,通過實際預測分析對比表明,集對分析模型簡便易行,評價結果準確,在隧道巖爆烈度級別的評判中具有廣泛的實用價值。
例39汪明武等[45]應用SPAT 建立了基于接近度概念的模糊差異度系數的改進計算模型,實例及同其他方法的對比應用表明:該模型預測巖爆有效可行,結果較好。
例40汪明武等[46]建立了巖爆烈度的聯(lián)系數-證據預測模型,該模型基于聯(lián)系數定量表達評價指標,通過聯(lián)系云構建評價矩陣,用D-S 證據理論得到基本概率賦值,基于距離函數組合權重與融合均值證據預測樣本的巖爆等級。實例表明模型有效可行。
例41Wang 等[47]把集對分析與云模型結合給出了一種不同等級巖爆的預測模型。
例42趙浩楊等[48]基于組合賦權SPA,建立巖爆傾向性預測模型。首先從巖性、應力、圍巖3個方面確立預測指標,其次利用組合數有序加權平均算子賦權法(combination weighting averaging,C-OWA)、關聯(lián)準則重要性賦權法(criteria importance though intercrieria correlation,CRITIC)、博弈論分別計算出主觀權重、客觀權重、組合權重;最后用集對分析理論中的四元聯(lián)系度預測出巖爆等級。將該模型應用于西藏甲瑪銅多金屬礦等工程的巖爆傾向性預測中,得出該礦的綜合聯(lián)系度為u1=?0.302 9,為弱巖爆,與實際相符。
例43劉曉等[49]把集對分析理論(SPAT)與模糊馬爾可夫(fuzzy-Markov)理論結合,對滑坡SPA 模型中的不確定系數進行二次預測,結果表明:復合模型能夠進一步提高整體預測精度,在巖土監(jiān)測分析領域中具有良好的實用價值。
例44桂蕾等[50]把集對分析法引用到滑坡空間預測,以MAPGIS 為操作平臺,在對巴東縣新城區(qū)滑坡災害發(fā)育的地質背景、分布規(guī)律和發(fā)育特征進行統(tǒng)計分析的基礎上,根據統(tǒng)計結果確定預測危險性等級評價標準,然后根據各預測單元的屬性信息判別各預測單元指標等級,最后利用集對分析理論對各預測單元進行危險性等級預測。將所得空間預測圖與已知滑坡分布圖進行比較,結果可靠、方法可行,得出聯(lián)系度和集對勢理論結合能夠提高預測精度的結論。
例45彭麗娟等[51]把基于集對分析理論的預報模型用于湖北恩施地區(qū)的滑坡災害易發(fā)性預測,并對預測結果進行分析,高易發(fā)區(qū)占總面積的15.89%,中易發(fā)區(qū)占12.96%,低易發(fā)區(qū)和不易區(qū)分別占45.15%和26%。滑坡易發(fā)因素組合主要是地層巖性(志留系和三疊系巴東組) 和坡度(10°~30°),與該區(qū)的實際情況較符合。
例46段先前等[52],選擇巖性、巖溶發(fā)育程度、地形地貌、地質構造、土層厚度、土層巖性、地下水位距基巖面距離、地下水位變幅、地下水徑流強度、地表水入滲、人工抽水強度和其他人類工程活動12個指標為巖溶塌陷主要影響因素,并將塌陷危險性劃分為5個等級,用定量或定性的方法對指標進行賦值,構建其分級標準。運用集對分析方法,將影響因素實測值分別與5個危險性等級評價標準組成集對,計算其聯(lián)系度,最后根據聯(lián)系數的排序結果,判定巖溶塌陷危險性等級。利用該方法對貴州定扒地區(qū)巖溶塌陷危險性進行預測,結果表明,該模型評價結果與實際情況相符。
例47任玉鵬等[53]以白龍江流域21 條典型泥石流溝為研究對象,將用集對分析法得出的評價結果作為泥石流當前活動性狀態(tài),與定量方法?地貌信息熵理論得出的評價結果進行比對,定性、定量相結合動態(tài)預測未來泥石流的活動趨勢。
例48鄭丕諤等[54]于2001 年基于集對分析方法和近20 年來的居民消費數據,建立了我國城鎮(zhèn)居民的消費增量預測模型。通過和常規(guī)回歸方法相比較,闡明了集對分析方法在研究居民消費增量的等級變化問題方面的優(yōu)點。
例49高潔等[55]于2002 年提出一種基于集對分析的聚類預測法。該方法融合了集對分析中的同異反模式識別的“擇近原則”和聚類分析的基本思想進行分類預測。將該方法應用于我國郵電業(yè)務總量預測的研究,與其他預測方法比較,結果表明該預測方法有效。
例50魏超[56]以集對分析理論為基礎,根據空間集合歐式距離理論,構建區(qū)域承載力集對預測模型(SPA-RCC)。將八市1996—2013 年區(qū)域承載力研究數據分為實驗數據和檢驗數據,實驗數據用于預測模型構建,檢驗數據用于模型的精確度分析。結果表明,基于集對分析的區(qū)域承載力預測模型的誤差率處于?8.63%~?7.19%,精確度高于非線性預測模型,可用來預測區(qū)域承載力的變化。
例51Wei 等[57]利用集對分析模型對跨國公司的成長趨勢進行預測,建立了跨國公司的動態(tài)預測模型。該模型在長江8個沿海城市的案例中進行了測試,模型的平均誤差率僅為0.38%,最低誤差率為0.01%。
例52孫晉眾等[58]建立基于馬爾可夫鏈的集對分析的動態(tài)模型,并將其應用于人力資源動態(tài)績效的評價與預測,取得很好的效果。孫晉眾等[59]2009 年還提出一種基于模糊集值統(tǒng)計的集對預測方法。
例53常志朋等[60]基于高階Markov 鏈理論、變權方法和集對分析方法,構建重大決策社會風險預測模型。首先將重大決策前后的社會風險指標狀態(tài)集組成集對;再利用指標變權計算不同時刻的集對聯(lián)系度和狀態(tài)轉移概率矩陣,以克服傳統(tǒng)常權無法反映指標值次序重要性的問題;最后,利用更接近客觀實際的高階Markov 鏈預測集對聯(lián)系度,進行社會風險態(tài)勢分析,以某市PX 項目決策為例進行方法驗證和比較,結果表明所構建模型與傳統(tǒng)模型相比,可以更有效、更準確地對重大決策社會風險進行預測 。
例54亢永等[61]提出集狀態(tài)評價和預測分析于一體的城市埋地燃氣系統(tǒng)動態(tài)危險性評價預測方法。該方法利用SPA 的多元聯(lián)系數對系統(tǒng)的危險等級進行劃分,運用馬爾可夫鏈的遍歷性,并將結果與集對勢相結合,預測城市埋地燃氣管道系統(tǒng)最終的危險水平。
例55城市空氣質量與一定范圍內污染源的分布和排放有關,與大氣運動對空氣中污染物的稀釋、擴散、清除和聚集的強度有關。前者可用當地環(huán)境監(jiān)測站的實測空氣質量記錄來反映,并認為污染源在短期內有相對穩(wěn)定性,而空氣污染預報主要從天氣過程與污染物的關系出發(fā)進行研究。諸曉明等[62]把集對分析用于城市空氣污染預報研究,預報結果較為滿意。他們認為:“在城市空氣污染預報模型中,精心挑選的因子具有較好的預報性能,但是因子的優(yōu)良性能并非始終不變,而有時個別因子的不良表現往往可能導致預報的失敗。 根據集對分析(SPA)把不確定性和確定性作為一個動態(tài)的同異反系統(tǒng)處理的思想,動態(tài)地分析和處理每次預報中因子作用的變化,即每次預報前,先對因子進行態(tài)勢判別和同異反分析,讓可能干擾預報的弱勢因子的作用受到有效抑制,讓有助于預報的強勢因子的作用得到充分發(fā)揮,從而實現因子作用大小在各次預報中的動態(tài)變化,因而能得到較為滿意的效果。”具體操作步驟與本文1.1 節(jié)的例1 中所述相同。這個例子也再一次說明了在傳統(tǒng)的多元回歸預報模型中增加基于集對分析的預報因子不確定性的動態(tài)處理有助于提高預報準確率。
例56徐源蔚等[63]建立了基于集對分析的降水酸度及水質相似預測模型(SFM-SPA),并運用該模型進行了降水酸度及水質預測的實例驗證。結果表明,在限定條件下,利用模型進行環(huán)境預測可行,且直觀和計算簡便。
例57自然生態(tài)環(huán)境是城市社會經濟健康發(fā)展的重要物質基礎,生態(tài)足跡作為生態(tài)環(huán)境承載狀態(tài)測度的指標,受到社會、經濟、人口等多種因素影響,具有時空動態(tài)性和不確定性等特征。李湘梅等[64]在對1988—2004 年武漢市生態(tài)足跡及其社會經濟影響因子時間序列分析的基礎上,構建集對分析動態(tài)模型:1)建立分類模式系統(tǒng)與參照系統(tǒng)的集對及其聯(lián)系度;2)利用歷史數據樣本檢驗聯(lián)系度;3)計算模擬系統(tǒng)的預測值;調試滿意后,對武漢市2005—2020 年總生態(tài)足跡發(fā)展趨勢進行了預測;結果表明,2005—2020 年總生態(tài)足跡將由1 810.925 萬hm2增長到2 873.857 萬hm2,呈現出低于GDP 和生態(tài)效率增長速率的趨勢,生態(tài)環(huán)境將進一步惡化,據此就武漢市生態(tài)系統(tǒng)的發(fā)展提出對策與建議。
例58周敬宣等[65]以武漢市為研究對象,將城市總生態(tài)足跡與其相關影響因子聯(lián)系起來考慮,融合集對分析中的同異反模式識別的“擇近原則”和聚類分析思想構造集對分析動態(tài)模型,利用模型對武漢市2005—2020 年總生態(tài)足跡發(fā)展趨勢進行了預測,誤差均小于0.3%。
例59吳開亞等[66]建立了用集對分析聚類預測方法進行區(qū)域生態(tài)足跡動態(tài)預測的(SPACP)具體實施方案。應用結果表明,這套建模方案的物理概念清晰,計算簡便,精度較高,通用性較強,在不同區(qū)域生態(tài)足跡動態(tài)預測中有應用價值。
例60劉玲莉等[67]以集對分析中的同異反模式識別的“擇近原則”和聚類分析理論為基礎,利用相關性分析得出與民航運輸事故征候量變化高度相關的因素,并利用事故征候量與其影響因素的歷史數據,建立了民航運輸事故征候集對分析聚類預測模型,通過對我國2011 年民航運輸事故征候量的預測,結果表明民航運輸事故征候的集對分析聚類預測模型的精度要高于其他預測模型(表2),并且所需樣本少、運算簡便,具有較高的實用價值。

表2 5 種預測方法的預測結果比較Table2 Comparison of prediction results of five forecasting methods
例61高揚等[68]利用QAR 數據作為支撐,結合集對分析和馬爾可夫理論建立飛行安全態(tài)勢評估模型。該模型以QAR 超限事件為評估指標,采用集對分析中的聯(lián)系度來描述安全風險等級;運用馬爾可夫理論確定安全狀態(tài)的轉移概率矩陣,以預測飛行安全動態(tài)變化趨勢。以某公司A320機隊6個月發(fā)生頻率最高的7 類超限事件對模型進行驗證。結果表明:該公司2 月、6 月和預測月份的安全狀態(tài)為一般風險,其他月份為低風險;總體安全狀態(tài)也為一般風險,并有增加趨勢。
例62張一瑫等[69]把集對分析(SPA)理論和馬爾可夫鏈(MC)結合,預測航空維修安全動態(tài)變化趨勢。以某航空兵機務大隊為例作了驗證。
例63朱昌鋒等[70]提出了一種基于集對聚類預測和神經網絡模型組合的鐵路集裝箱運量預測方法,該方法將集對聚類預測模型的預測值作為輸入,相應的實際集裝箱貨運量作為輸出,建立了神經網絡模型結構,并提出了相應的算法,最后以實例分析了該模型的可行性和科學性。
例64Li 等[71]提出了一種基于改進集對分析的組合預測模型。該模型首先構造集對來表示預測值與實測值之間的關系。然后基于貝葉斯決策理論對集對關系辨識的風險進行表示,并利用自適應搜索算法得到集對關系的最優(yōu)判據。然后分析預測模型與實測數據之間的關系,最后進行了單一預測模型的組合。通過案例分析和與其他方法的比較,驗證了模型的可靠性和有效性。
例65蔣紅妍等[72]在2008 年基于對路面性能的分析,把集對聚類預測用于路面性能預測,實例驗證了這種新方法的可操作性和良好效果。
例66尹君等[73]從尾礦庫安全管理的決策需求出發(fā),通過對尾礦庫危險源進行分析,建立了尾礦庫安全評價預測指標體系,詳細探討了差異度和集對勢在尾礦庫安全評價和預測中的應用。
例67念其鋒等[74]構建了煤與瓦斯突出區(qū)域的聯(lián)系熵預測方法。通過應用實例預測,計算結果與實際情況相吻合,對煤礦實現煤與瓦斯突出區(qū)域預測具有一定指導意義 。
例68侯公羽等[75]對煤礦長斜井盾構機(tunnel boring machine,TBM)施工的風險因素進行了識別,根據改進的集對勢理論給出風險趨勢的預測方法。利用該模型對臺格廟礦區(qū)煤礦長斜井(1#、2#實驗井)TBM 施工風險進行了評估與趨勢預測。
例69譚翀等[76]把集對分析用于武漢地區(qū)某露天采石場的安全狀況評價和預測,結果表明,該方法計算簡單,評價結果較可靠。
例70謝力等[77]把集對分析用于艦船裝備維修費單項預測。
例71金英偉等[78]把集對分析用于技術創(chuàng)新產品購買意愿的分析及預測。
例72Lin Bu 等[79]提出了一種基于集對分析(SPA)和隧道地震預測(TSP)相結合的圍巖分類預測方法。
例73袁宏俊等[80]利用區(qū)間數和二元聯(lián)系數的相互轉化關系,把區(qū)間數組合預測問題轉換成二元聯(lián)系數組合預測問題。在聯(lián)系數貼近度的最優(yōu)準則下,建立基于聯(lián)系數貼近度的區(qū)間型組合預測模型,并對某省社會保障水平適度區(qū)間值進行預測,結果顯示所建立的模型能有效提高預測的精度。
例74上海中醫(yī)藥大學李斌教授團隊蒯仂等[81]把集對分析與馬爾可夫鏈結合,用于中醫(yī)藥治療糖尿病致皮膚潰瘍有效性預測。
例75作者與趙森烽還探討了趙森烽-克勤概率在系統(tǒng)預測中的應用[82-83]。
1)由本文提到的75個應用實例看出,基于集對分析的系統(tǒng)智能預測已應用于“天”“地”“生”“人”“社”“經”不同領域的不同場景。預測結果總體上較為滿意,究其原因,是上述文獻的作者在有關系統(tǒng)預測問題的研究中靈活地應用集對分析的思想(把對事物的確定性聯(lián)系(關系,信息)與不確定性聯(lián)系(關系,信息)作為一個對立統(tǒng)一體研究的思想)、理論(基于集對分析的不確定性系統(tǒng)理論和同異反系統(tǒng)理論[84-85])、方法(把人們對事物的確定性聯(lián)系(關系,信息)與不確定性的聯(lián)系(關系,信息)的辯證認識轉換成一個具體的系統(tǒng)數學模型?集對及其聯(lián)系數,充分利用聯(lián)系數的確定-不確定結構可以在不確定性分析基礎上動態(tài)優(yōu)化的功能進行系統(tǒng)的結構化動態(tài)預測建模,由此去發(fā)展和完善多元回歸模型、相似預測模型、馬爾可夫理論、經驗模態(tài)分解等傳統(tǒng)的預測模型和預測理論,從而使得基于集對分析的系統(tǒng)智能預測不僅適用性強,而且有較好的預測精度。
2)在75個應用實例中,最為突出的工作是例1 中王國強的工作。據王國強介紹,他是1995年聽過本文作者關于集對分析的一次學術報告后開始把集對分析試用于天氣降水預報多元回歸算法研究,取得確實成果并經反復驗證后在中國氣象局1998 年5 月長沙召開的重特大災害性天氣預報會商會上報告集對分析在優(yōu)化傳統(tǒng)多元回歸預測算法中的作用,受到國家氣象局等到會專家高度評價;這里簡稱其為“王方法”。從人工智能的角度看,“王方法”具有智能預測的特點:①在眾多影響天氣降水的氣象因子中尋求“最優(yōu)因子集合”;②每次預報前對“最優(yōu)因子集合”中的每個因子做“相對確定的強勢(指示事件W 出現)”“相對不確定的弱勢(干擾強勢因子指示事件W 出現)”的動態(tài)分析,實現“最優(yōu)因子”的“最佳組合”,從而客觀地刻畫出影響天氣降水氣象因子的同異反關系結構;③對同異反關系結構的歷史數據經統(tǒng)計處理后作同異反聯(lián)系數表達和不確定性分析;④把經前3 步處理后的數據進入預報模型做回顧性預報,以檢驗前3 步工作的預報精度,精度不滿意時需要調整前述的最優(yōu)氣象因子選擇與強勢弱勢因子的判定,調整同異反的劃界標準和不確定系數的分解比例,最終使模型的回顧性預報值與歷史數據最大程度擬合,從而保證模型的當前預報精度。
3)從信息能的角度看,“王方法”的實質是把天氣系統(tǒng)看作是含有能量的系統(tǒng),因為天氣系統(tǒng)是一個有自組織自演化的非線性動力學系統(tǒng),其中的能量來自多個方面,但氣象工作者只是接收到天氣系統(tǒng)所提供的信息,并要借助一定的數學模型處理這些信息去推導天氣系統(tǒng)的未來行為,這個推導的過程就是把天氣系統(tǒng)所具有的信息能轉換成智能的過程;借助模型,保持天氣系統(tǒng)中的信息能與人腦智能在能量意義上同構,是提高預測模型智能化,保證預報精度的基本要求。
4)本文把包括“王方法”在內的集對分析系統(tǒng)預測統(tǒng)稱為一種智能預測,因為:①集對分析與一些成熟的統(tǒng)計預測模型具有良好的親和性、耦合性和互補性,如例1、2、3、21、48、54,通過集對分析預處理進入多元回歸預測模型的數據提高預報精度;如例12、19、43、51、52、58、59、73,則主要是把集對分析與馬爾可夫鏈結合進行預測;②集對分析與相似預測結合,如例5、14、16、18、22、24、27,與聚類法結合有例20、22、30、32、49、57、60、62、68;與BP 神經網絡結合的如例8;③集對的概念與聯(lián)系數及其伴隨函數具有豐富的系統(tǒng)結構信息,目前已經知道聯(lián)系數是一個大家族,如多元聯(lián)系數(二元聯(lián)系數、三元聯(lián)系數、四元聯(lián)系數、五元聯(lián)系數···無窮多元聯(lián)系數),多維聯(lián)系數(二維聯(lián)系數、三維聯(lián)系數、四維聯(lián)系數、五維聯(lián)系數···無窮多維聯(lián)系數),多重聯(lián)系數(二重聯(lián)系數、三重聯(lián)系數、四重聯(lián)系數、五重聯(lián)系數···無窮多重聯(lián)系數),多次聯(lián)系數(二次聯(lián)系數、三次聯(lián)系數、四次聯(lián)系數、五次聯(lián)系數···無窮多次聯(lián)系數,以及多元多維多重多次聯(lián)系數,還有聯(lián)系數的各種伴隨函數,如偏聯(lián)系數、鄰聯(lián)系數、復聯(lián)系數、勢函數、態(tài)勢函數,等,這些聯(lián)系數及其伴隨函數可以根據不同的系統(tǒng)預測問題和不同的預測場景單一選用或組合選用,或直接用于預測建模,或用于已有預測模型的改進和優(yōu)化,或利用聯(lián)系數的某些系統(tǒng)結構信息開展系統(tǒng)預測,這方面有例4、6、13、15、23、26、28、31、33、34、35、36、38、38、39、40、44、45、46、47、50、53、56、61、63、64、65、66、68、69、70、71、72 等30 多個實例。需要指出的是,這些實例中用到的聯(lián)系數及其算法可以借助一定的算法相互轉換,如三元聯(lián)系數μ=0.5+0.3i+0.2j,既可以“壓縮”成二元聯(lián)系數 μ′=0.5+0.5i,也可以擴展成四元聯(lián)系數μ′′=0.5+0.2i1+0.1i2+0.2 或五元聯(lián)系數μ′′′=0.5+0.15i1+0.1i2+0.05i3+0.2j,或者把0.2j也分成兩部分得六元聯(lián)系數μ′′′′=0.5+0.15i1+0.1i2+0.05i3+0.15j1+0.05j2等,從而靈活地獲得被預測對象更多的系統(tǒng)結構信息和不確定性信息。
5)不同領域不同場景應用集對分析進行系統(tǒng)預測的具體思路可以不同,但基本步驟可以歸納成:①構造集對并分析集對中兩個集合的全部關系,包括確定的關系和不確定的關系,根據關系的結構選用合適的聯(lián)系數作為集對的特征函數;②建立基于聯(lián)系數的預測模型,包括利用聯(lián)系數改進和完善已有的預測模型; ③利用模型的計算和圍繞模型的不確定性分析做出預測或預報,包括回顧性預測和當前場景下的實時預測,其中圍繞模型的不確定性分析是關鍵,這里說的不確定性包括了一般情況下的隨機性、模糊性、突發(fā)性、不確知性,也包括了反常性和極端性以及模型本身的不完備性和適用性等。概言之,就是“以確定的數學建模計算應對被測系統(tǒng)的確定性規(guī)律,以圍繞預測模型的不確定分析應對被測系統(tǒng)的不確定性,從而實現對不確定性系統(tǒng)的智能預測”,這里的歸納也是本文的主要創(chuàng)新點。
6)預測是決策的基礎,但限于本文主題,對此不展開說明,有意者可參見文獻[86-87];預測也是控制的基礎,待另文綜述,敬請讀者諒解。
事物是確定性與不確定性的統(tǒng)一體,系統(tǒng)是事物的存在方式。系統(tǒng)的未來與系統(tǒng)的過去和現在既有確定的對應規(guī)律,也有不確定性關系;智能預測應當在充分計及系統(tǒng)不確定性的基礎上做出與實際情況相吻合的預測;對此,基于集對分析的“以確定的數學建模計算應對系統(tǒng)確定的對應規(guī)律,以圍繞預測模型的不確定分析應對系統(tǒng)的不確定關系”這種具有辯證思維特征的新穎預測思路為我們提供了一條有效的智能預測途徑;但是,客觀世界中的各種系統(tǒng)預測問題紛繁復雜,基于集對分析的智能預測仍有許多問題要深入系統(tǒng)研究。期待更多專家學者創(chuàng)造性地應用集對分析于各種系統(tǒng)的智能預測研究。