□文/曹健寧
公共工程是政府為了公共利益直接或間接投資形成的基礎性建設項目和社會公益建設項目,主要包括:交通、郵電、水利水電煤氣等公共基礎設施和科教、醫療衛生、體育場館、文化娛樂等社會性基礎設施。因此,公共工程存在投資大、建設周期長、不確定性因素多因而風險高、宏觀效益和社會效益突出等特點。
改革開放以來,我國各方面的建設都取得了舉世矚目的成就。三峽大壩水利工程、青藏鐵路、北京奧運場館、載人宇宙航天項目等項目的實施為我國物質文明和精神文明建設的提高起到了巨大的推動作用,但要鞏固和實現可持續發展戰略,國家和企業有責任也有必要繼續加大對公共基礎設施建設的關注和投入。與此同時,我們還應看到,諸類大型公共工程的建設大多仍然處于初期運營階段,其是否能夠達到預期的效果仍是個未知數。另外,工程中存在諸如超預算、超工期、設計過于標新立異與周圍環境不相協調、項目沒有經過充分的可行性論證便草草上馬等諸多問題,使得項目頻繁變更,溝通和索賠方面的成本費用增加,導致效率極其低下,最終影響到項目建設的成果。分析其原因,突出表現為對公共工程項目決策的短視行為,也就是政府官員的短期任職制與公共項目的長期運作不合拍。此外,政府公共項目決策標準單一、決策程序不完善、決策缺乏約束等都是不容忽視的原因。但歸根結底還是決策者對項目前期決策階段沒有清醒充分的認識。在我國,工程決策很大程度上取決于決策者的知識水平、背景、經驗以及性格,人的非理性因素決定了決策的感性行為,調查研究趨于形式化,并沒有或很少考慮參與、透明、民主的原則。因此,需要新的方式來提高公共工程決策的科學性和效率。
現有的工程管理系統能夠對數據進行收集、儲存、傳輸和簡單分析,并為項目決策人員提供實時動態、進展報告,最終為其決策和反饋服務。但該類系統缺乏對工程數據進行深入分析和綜合利用的能力,前瞻性較差,決策很大程度上還是依賴管理決策者的經驗和直覺。隨著工程項目日益龐大、復雜,管理難度的加大,使得現有的管理手段和工具已無法滿足現代工程決策的需要。因此,研究和開發新方法來解決公共工程決策問題是工程實踐的當務之急。本文在已有研究的基礎上,通過數據挖掘(DM)和基于案例推理(CBR)的結合,探討該平臺在公共工程決策機制中的應用。(圖1)
(一)DM概念及階段劃分。數據挖掘是一種在大型數據庫中尋找你感興趣的或有價值的信息的過程,根據Berry and Linoff的說法:分析報告給你后見之明,統計分析給你先機,數據挖掘給你洞察力。可見,數據挖掘的影響力和價值。它是一門結合了數據庫、人工智能、數理統計、信息檢索、知識獲取、模式識別、數據可視化等的科學,該技術已經在許多領域得到發展和應用,如商業、銀行、保險、網站開發和生物信息等領域。

圖1 DM與CBR結合機制框架
Berry and Linoff將一個通用的數據挖掘過程定義成了不同的階段。在利用數據挖掘技術之前,工程管理決策人員需要明確工程項目的目標和要求,在此基礎上,廣泛的搜集相關數據和信息。下面就數據挖掘在銀行和商業中的應用做簡要描述:首先,對潛在目標客戶進行分類,也就是說將辦理相同儲蓄或者貸款的客戶分為一組,分析其消費習慣和偏好,通過應運數據處理轉換和人工智能等技術有助于識別主要核心客戶組,對其制定相應特色服務;同時對潛在的可能流失的客戶進行跟蹤分析行為特點,避免流失過多。然后,對客戶感興趣的負債和收入等數據指標進行統計,對貸款償還可能存在風險的各因素進行識別,以確定并維護客戶信用等級和規避風險。最后,通過大量客戶的交易信息找出已有數據庫中隱藏的關系網,并對新加入客戶的收入水平、消費習慣、居住區域、文化程度以及購物類別等指標挖掘分析,進而不斷的豐富數據庫資源。這樣銀行作為客戶和商品廠商的紐帶,在掌握消費者需求的基礎上,可以更好地為客戶服務。
(二)DM主要分析方法。數據挖掘的主要分析方法包括:關聯分析、聚類分析、分類、預測、時序模型、偏差模型。下面就各種分析方法及其在公共工程中的應用做簡要敘述:
1、關聯分析:找出數據庫中隱藏的關系網。它分為簡單關系、因果關系和時序關系。一般情況下,工程項目成功的標準是按時完工、節約成本、客戶滿意等。與傳統工程項目不同的是,公共工程項目有社會效益大、生命周期長、后期影響較大等的特點,其評判標準不一。實際中,存在超預算、超工期并且在當時備受爭議的項目,建成后不僅取得了成功有的還成為國家和時代的標志。這就需要分析背后成功的原因,是必然造成的還是偶然造成的,對其進行詳細記錄和說明。最終完善公共工程項目成功的標準以及這些標準對工程項目的影響程度。當新項目遇到類似爭議時,通過關聯分析比較研究后,可以提高決策的科學性。
2、聚類關系:對記錄分組,把相似的記錄歸在一個劇集里。它和分類的區別是聚類不依賴預先定義好的類,不需要訓練集。這里用Davies-Bouldin index來評判集群分離質量:},其中△(Xk)表示聚類 Xk內部網的距離,(Xi,Xj)定義為聚類Xi和Xj的距離,c為U的組成部分的聚類數量。一般來說,值越小對應的聚類效果越好。
3、分類:找出一個類別的概念描述,代表這類數據的整體信息,一般用規則或決策樹模式表示。在公共工程中,我們可以將其影響因素分為:目標層、準則層和方案層。目標層是尋求影響公共決策的主要因素,準則層影響因素的各個指標,比如決策的科學性、決策的可操作性、決策的效率和決策的穩定性等,方案層為影響公共工程決策的具體因素,包括:社會效益、經濟效益、技術條件、人員素質和管理水平、國家和區域政治經濟狀況和籌資能力等。另外,我們還可以將項目實施期間國家的經濟狀況分為:過度膨脹、穩定增長、略微下滑和嚴重緊縮,以應對不同時期項目該采取的措施。
4、預測:利用歷史數據找出變化規律,建立模型,并由此模型對未來數據的種類和特征進行預測。眾所周知,對于大型公共工程來說,項目的投資方為國家或各級政府,而他們的資金和管理水平是有限的,這就需要結合社會其他各方的資源。現在常見的融資方式有:BOT、TOT、PPP、PFI和ABS等。具體選擇哪種形式的融資方式或組織形式需要對比類似成功項目,結合新工程項目的特點,選擇出具有可行性和可操作性強的模式。
5、時序模型:通過時間序列搜索出重復發生概率較高的模式。對于公共工程項目而言,其建設周期長,并且部分項目展現的是我國的時代特征和精神風貌,我們需要更多地關注經濟發展周期和房地產市場運行周期,避免毫無目的地扎堆重復建設。例如,奧運會的舉辦是個復雜的系統工程,但如果能夠對其經濟周期各階段(申辦、籌辦、舉辦和后期運營)所要完成的任務進行研究,才能達到事半功倍的效果。另外,對公路、橋梁和大型體育設施中出現的維修、改建、擴建情況進行追蹤記錄,這樣有助于合理安排資源和減少資源的浪費。
6、偏差模型:發現或排除數據庫中數據存在的異常情況。一方面如果數據庫中存在大量異常情況的案例,那必將影響到整個樣本的可信度;另一方面特殊情況下工程項目也必然會導致異常數據結果。例如,在公共工程項目中,涉及投資額巨大,如果投資方不能按時發放進度款,將會影響工期的進度計劃;再如,如果項目所在區域發生各種不可預測的地質條件或氣候的變化(地震、干旱),也必將影響項目的整體運行。因此,要對這部分數據進行分析處理,如實反映項目情況的應保留,否則排除。
(三)D M數據分析工具。當應用數據挖掘的分析方法來解決工程項目中的實際問題時,各種分析方式是建立在相應的數據分析工具的基礎之上的。數據挖掘技術中包含了一些用于分析歷史數據的分析工具,主要有決策樹工具、貝葉斯分類工具、神經網絡工具以及基于案例推理工具。盡管所有這些工具能夠用于分類或者預測,但每個工具只有在某種特定的條件環境下才能正確地執行。例如,決策樹和貝葉斯工具不能用于支持預測,而神經網絡和案例推理工具能同時支持分類和預測功能;決策樹和神經網絡工具只需要在第一次使用時建立模型,而貝葉斯和案例推理工具在遇到一個新的案例時重新建立模型。
在公共工程項目中,這些工具可以幫助參與人員分析數據并使得決策更有效率,同時更重要的是,它對于潛在的問題更具有洞察力。它能夠提供如下問題的解決方法:①項目應該選擇一種什么樣的結構形式?②項目適合的組織形式和融資方式?③投資額多大,工期多長?④項目中可能遇到的風險有哪些?可以采取的應對措施包括哪些?
基于案例的推理是為決策者提供充分利用經驗、具體問題的情況和公共工程案例的專門知識,案例可以是具體的經歷或者相似案例的集合。根據Aamodt and Plaza,CBR方法的中心任務是明確當前情況,尋找與新項目類似的已完成工程項目,利用該項目來尋求對新問題的解決辦法、評估建議的解決辦法以及通過對新項目經驗的總結來更新系統。大體上一個CBR周期可分為以下四個階段:檢索與目標項目最匹配的案例;重新利用信息和知識用于新項目;修改建議的解決辦法;保留案例用于解決今后問題。而檢索又包括:條件分析、初步匹配和最終確定三個階段。
(一)案例檢索階段。主要任務是應用檢索工具通過比較新工程項目與歷史記錄的案例進行相似度的比較,如果它們之間的相似度值大于預定于的閾值,那么歷史案例將被選擇作為參照。因此,計算相似度就成為本階段的關鍵步驟。應用這樣一個工具,每個輸入的參數都會被賦予相應的權重,權重的大小由專家根據參數間的兩兩比較分析得出,相似度可以用下面的表達式計算:

其中,N和O分別代表新舊工程項目,n表示輸入值的數量,Ni和Oi為它們各自區間的值,wi則是所對應權重,f是N和O所對應的域i的函數。
對于逐項描述性參數,當相比較的案例參數具有相同的值時,相似度函數輸出1,否則返回0。對于清單型參數,返回值由下面的表達式計算:

其中,f(Ni,Oi)表示相似度,Ni∩Oi指在Ni和Oi域中由子值所構成的一個新的清單型數值,而Count(X)是X域子值的數量。
(二)案例使用階段。用以往的解決方法來處理新工程項目的問題,通過分析歷史案例的情況,借鑒其經驗教訓來指導本階段的決策。
(三)案例修訂階段。調整匹配案例的解決方案來尋求問題的新解決途徑。并對新的工程項目決策的質量做出評估,并及時反饋。解決方案得出的是一個清單型參數,它是由一個或者多個子值構成。可以通過下面的公式來計算出匹配案例中解決方案的值:

v 表示一個子值,Score(v)則是 v的得分,k是匹配案例的數量,O(I)是匹配項目之一,而g(v,O(I))是一個判斷函數,當 v包含了 O(I)的一個解決方案的時候返回值1,否則返回值0。
(四)案例保留階段。當新的工程項目被驗證通過之后,它將被加入數據庫中。通過這個過程可以豐富數據庫資源并進一步改進系統。
我國公共工程決策一直以來都存在諸多問題,這也迫使有關人員不斷探索一套解決其問題的有效方法。數據挖掘是能夠從歷史數據中獲取有用信息并輔助決策者進行決策的強大工具。同時,通過DM-CBR的結合可以幫助參與決策人員簡化數據的利用和分析過程,以提高公共工程決策的效率。本文闡述了DM與CBR結合的理論框架,也就它們如何提高公共工程決策進行了說明。盡管本文把焦點集中于DM在公共工程決策中的運用,但更為重要的是它為其他建筑領域的研究提供了新的研究方向,如風險分析、可行性研究、人力資源研究以及價值工程等領域。
[1]程龍.公共工程項目建設管理問題及對策.安徽建筑,2000.3.
[2]郭建鋒,張建平,胡振中,沈岐平.基于數據挖掘的智能工程決策平臺.哈爾濱工業大學學報,2006.9.