李萬慶,安娟
(河北工程大學(xué)經(jīng)管學(xué)院,河北邯鄲056038)
建筑施工項(xiàng)目是安全風(fēng)險(xiǎn)最密集、安全事故發(fā)生率最多的領(lǐng)域之一,加強(qiáng)施工項(xiàng)目的安全管理與預(yù)警有著現(xiàn)實(shí)的政治、經(jīng)濟(jì)和社會(huì)意義[1-3]。目前國內(nèi)外關(guān)于建筑施工項(xiàng)目安全預(yù)警的方法主要有趨勢外推法、動(dòng)態(tài)層次分析法、模糊綜合分析法、故障樹分析法、神經(jīng)網(wǎng)絡(luò)等方法。然而趨勢外推模型雖然簡單易懂,但在建筑工程上的使用范圍卻很小;DAHP模型中專家評(píng)估的風(fēng)險(xiǎn)要素帶有很大的主觀性;模糊分析法的運(yùn)算精度依然有待商榷;神經(jīng)網(wǎng)絡(luò)雖具有很好的非線性逼近能力,但常常出現(xiàn)過度訓(xùn)練或訓(xùn)練不足;故障樹分析法則對(duì)事故類型復(fù)雜的系統(tǒng)處理效果欠佳。
粗集(rough set,RS)是一種處理模糊和不確定知識(shí)的數(shù)據(jù)分析理論,能在保持知識(shí)庫分類能力不變的條件下,刪除其中的不相關(guān)或不重要的知識(shí),提取滿足條件的最小屬性集[4]。支持向量機(jī)(Support Vector Machine,SVM)是近年來在結(jié)構(gòu)風(fēng)險(xiǎn)最小化基礎(chǔ)之上發(fā)展起來的統(tǒng)計(jì)學(xué)習(xí)理論,它可以按任意精度逼近非線性函數(shù),具有全局極小點(diǎn)和收斂速度快的優(yōu)點(diǎn)。結(jié)合RS的屬性約簡和SVM的回歸機(jī)理,提出了基于RS-SVM的建筑施工項(xiàng)目安全風(fēng)險(xiǎn)預(yù)警模型,并與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)證對(duì)比分析。
在RS理論中,“知識(shí)”被認(rèn)為是一種將現(xiàn)實(shí)或抽象的對(duì)象進(jìn)行分類的能力。一個(gè)知識(shí)表達(dá)系統(tǒng)(決策信息表達(dá)系統(tǒng),知識(shí)表達(dá)系統(tǒng))由有限個(gè)研究對(duì)象組成,這些對(duì)象的知識(shí)通過指定對(duì)象的屬性和屬性值來描述,其表達(dá)式為

式中 S—知識(shí)表達(dá)系統(tǒng);U—論域;A—屬性集;α—屬性;Vα—屬性α的值域;F—信息函數(shù),指定論域U中每一對(duì)象的屬性值。
運(yùn)用RS理論處理決策表時(shí),要求決策表中的值用離散化數(shù)據(jù)表達(dá),由于本文數(shù)據(jù)較集中故采用C-均值聚類算法。對(duì)于定量指標(biāo)中連續(xù)數(shù)據(jù)的離散分類,離散后的區(qū)間數(shù)值由小到大分別用數(shù)字0、1、2、3對(duì)應(yīng)表示;對(duì)于定性指標(biāo),分別用 0、1、2表示差、中、優(yōu);決策屬性值以是否完成安全目標(biāo)分為0,1,0表示未完成安全目標(biāo),1表示完成安全目標(biāo)。將項(xiàng)目的風(fēng)險(xiǎn)等級(jí)劃分為5級(jí),分別用[0,0.3] ,(0.3,0.5] ,(0.5,0.7] ,(0.7,0.9] 及(0.9,1] 表示低風(fēng)險(xiǎn)、較低風(fēng)險(xiǎn)、一般風(fēng)險(xiǎn)、較高風(fēng)險(xiǎn)及高風(fēng)險(xiǎn)。
SVM是針對(duì)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則提出的,改變了傳統(tǒng)的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,具有很好的泛化能力[5]。SVM在處理非線性問題時(shí),首先將非線性問題轉(zhuǎn)化為高維空間中的線性問題,然后用一個(gè)核函數(shù)來代替高維空間中的內(nèi)積運(yùn)算,從而巧妙地解決了復(fù)雜計(jì)算問題,并且有效地克服了維數(shù)災(zāi)難及局部極小問題。
給定訓(xùn)練數(shù)據(jù)

采用一個(gè)非線性映射將樣本從原空間映射到維數(shù)為K(K可能是無窮大)的高維特征空間中,然后在高維特征空間中進(jìn)行線性回歸。設(shè)回歸函數(shù)為

通過拉格朗日變換得到其優(yōu)化問題的對(duì)偶形式


式中NNsv—支持向量的個(gè)數(shù)。
通過訓(xùn)練和學(xué)習(xí)得到回歸預(yù)測函數(shù)為

用RS對(duì)施工項(xiàng)目安全因素進(jìn)行預(yù)處理,減少SVM數(shù)據(jù)維數(shù)和降低系統(tǒng)結(jié)構(gòu)的復(fù)雜性,即把粗集作為前置系統(tǒng),再根據(jù)RS方法預(yù)處理后的信息結(jié)構(gòu),構(gòu)成SVM信息處理系統(tǒng),從而可構(gòu)造出具有更好的抑制噪聲干擾和良好泛化能力的預(yù)測模型。具體的流程如圖1所示。
在人—機(jī)—環(huán)境系統(tǒng)理論、人機(jī)工程學(xué)事故致因理論的基礎(chǔ)上,分析了可能影響施工項(xiàng)目安全的因素。并在遵循指標(biāo)體系構(gòu)建的科學(xué)性、系統(tǒng)性、動(dòng)態(tài)性、客觀性和可操作性原則的基礎(chǔ)上,結(jié)合專家經(jīng)驗(yàn),構(gòu)建了建筑施工項(xiàng)目安全預(yù)警指標(biāo)體系(圖2)。


(1)參考類似工程的項(xiàng)目數(shù)據(jù)建立訓(xùn)練樣本集。
(2)采用C-均值聚類算法,對(duì)樣本數(shù)據(jù)進(jìn)行離散,然后用RS對(duì)樣本集進(jìn)行約簡,去除不完全數(shù)據(jù),提取最優(yōu)屬性集。
(3)利用交叉驗(yàn)證法法選擇核函數(shù)參數(shù) σ和懲罰參數(shù)C,根據(jù)式(1)、式(2)并通過MATLAB編程求解模型的參數(shù)(w,b)。
(4)建立最優(yōu)預(yù)測模型。
采用相對(duì)誤差函數(shù)(Error)和均方根誤差函數(shù)(MSE)來檢驗(yàn)?zāi)P偷念A(yù)測精度,相對(duì)誤差是評(píng)價(jià)預(yù)測模型對(duì)每一個(gè)樣本的測試效果,而均方根誤差是預(yù)測模型整體效果的誤差檢驗(yàn)函數(shù)。


式中 x(n,true)—第 n個(gè)測試樣本的實(shí)際值;x(n,pred)—第n個(gè)測試樣本的預(yù)測值。
將預(yù)測模型計(jì)算求得的預(yù)測值y′和實(shí)際值y相比較,得到︱y-y′︱。根據(jù)概率統(tǒng)計(jì)理論,︱yy′︱落入[0,2S] 的概率為95.5%,落入[0,3S] 的概率為99.7%,其中S為模型標(biāo)準(zhǔn)差[6]。據(jù)此,可按以下幾種情況對(duì)施工項(xiàng)目安全性態(tài)進(jìn)行預(yù)警:
(1)正常:︱y-y′︱≤2S。
(2)基本正常:2S<︱y-y′︱≤3S,且測值無趨勢性變化。
(3)異常:2S<︱y-y′︱≤3S,但測值有趨勢性變化。
(4)險(xiǎn)情:︱y-y′︱>3S,應(yīng)分析其成因。
借鑒文獻(xiàn)[7] 的數(shù)據(jù)進(jìn)行預(yù)測研究,數(shù)據(jù)如表1所示。
采用C-均值聚類算法對(duì)表1中的數(shù)據(jù)進(jìn)行離散化(其中政治的穩(wěn)定情況不具有分類能力已被刪除),利用RS將離散化后的數(shù)據(jù)在MATLAB 7.0中進(jìn)行約簡,得到最優(yōu)屬性集12個(gè)指標(biāo),約簡冗余因素5個(gè)(表2)。將RS約簡后的最優(yōu)屬性集作為SVM的訓(xùn)練和測試數(shù)據(jù),輸入條件屬性和決策屬性的歷史數(shù)據(jù),取前8組作為訓(xùn)練樣本來進(jìn)行機(jī)器學(xué)習(xí),從而得到預(yù)測模型,余下的4組作為檢驗(yàn)樣本考察模型的預(yù)測和泛化能力。
SVM采用滿足Mercer條件的核函數(shù)來代替映射函數(shù),將輸入變量 x映射到高維特征空間。常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)和神經(jīng)網(wǎng)絡(luò)核函數(shù),就函數(shù)擬合而言,徑向基函數(shù)(radial basis function,RBF)能使SVM以任意精度逼近非線性函數(shù)曲線,其函數(shù)擬合性優(yōu)于多項(xiàng)式核函數(shù)。因此,采用RBF核函數(shù),參數(shù)包括調(diào)整懲罰參數(shù)C,核寬度σ,和不敏感系數(shù) ε。對(duì)參數(shù)的選取采用交叉驗(yàn)證法,以最小均方根誤差(MSEmin)為參數(shù)選擇標(biāo)準(zhǔn)。交叉驗(yàn)證如下:

表1 建筑施工項(xiàng)目安全因素及歷史數(shù)據(jù)Tab.1 Historical date and safety risk factors of construction project

表2 建筑施工項(xiàng)目安全預(yù)警決策表Tab.2 Safety early-warning decision table of construction project
(1)固定 ε=0.01,C=90,令 σ在[0.01:0.05:10] 期間上變動(dòng),計(jì)算SVM預(yù)測的均方根誤差,如圖3所示。由圖可見,在區(qū)間[0.01,1] 之間時(shí),模型訓(xùn)練的均方根誤差顯著降低,在區(qū)間[1,10] 之間則增長緩慢。當(dāng) σ=0.85時(shí),MSE=0.013 7為最小值。

(2)固定參數(shù)C=90,σ=0.8,調(diào)整不敏感損失函數(shù)值 ε,如圖4所示。當(dāng) ε=0.003時(shí),模型測試的均方根誤差MSE=0.013 7為最小值。

(3)固定參數(shù)σ=0.85以及參數(shù) ε=0.000 3,使模型的懲罰參數(shù)C在區(qū)間(0,10 000] 以步長50進(jìn)行變動(dòng)以測試模型的訓(xùn)練精度。程序的運(yùn)行結(jié)果顯示,實(shí)例中懲罰參數(shù)C的變化對(duì)模型的預(yù)測精度沒有顯著影響。
這樣,當(dāng)取參數(shù) C=90,σ=0.8,ε=0.000 3時(shí),預(yù)測模型的均方根誤差最小MSE=0.011 5,此時(shí)的SVM模型便為最優(yōu)模型。
根據(jù)選取的核函數(shù)和最優(yōu)參數(shù),在MATLAB 7.0語言支持下,利用式(1)計(jì)算出偏置項(xiàng)系數(shù)b=0.538 62;支持向量的個(gè)數(shù)=4,分別為第3、8、11、12個(gè)項(xiàng)目樣本;對(duì)應(yīng)的拉格朗日乘子為m3=0.372,m8=0.015,m11=0.385,m12=0.044。
將所求參數(shù)代入式(2),得到RS-SVM模型

式中 x—待測建筑施工項(xiàng)目的安全指標(biāo)值向量;xi—支持向量,i=3,8,11,12。
為檢驗(yàn)RS-SVM算法的優(yōu)越性,將其與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比分析。在BP神經(jīng)網(wǎng)絡(luò)模型中,采用3層結(jié)構(gòu),輸入向量和輸出向量同RS-SVM,將前8項(xiàng)作為訓(xùn)練樣本,后4項(xiàng)作為預(yù)測樣本,隱層選20個(gè)神經(jīng)元。利用神經(jīng)網(wǎng)絡(luò)系統(tǒng)對(duì)學(xué)習(xí)數(shù)據(jù)反復(fù)訓(xùn)練,得到當(dāng)均方根誤差為0.070 7時(shí),實(shí)驗(yàn)結(jié)果最優(yōu)。兩種模型的實(shí)際值和預(yù)測值的對(duì)比曲線見表3,擬合預(yù)測效果見圖5。

表3 兩種模型的預(yù)測值與實(shí)際值比較Tab.3 Compare by predicted result and fact of the two models
由表3可以看出,對(duì)于同一個(gè)工程項(xiàng)目樣本,RS-SVM的相對(duì)誤差明顯都低于BP神經(jīng)網(wǎng)絡(luò),這說明RS-SVM的預(yù)測精度要明顯優(yōu)于比BP神經(jīng)網(wǎng)絡(luò)的預(yù)測精度,而且RS-SVM模型測試樣本的相對(duì)誤差控制在3%以內(nèi)。
從圖5兩種模型的預(yù)測結(jié)果擬合情況可知,基于SVM建立的安全預(yù)警模型的預(yù)測擬合效果要優(yōu)于BP神經(jīng)網(wǎng)絡(luò),這主要是BP神經(jīng)網(wǎng)絡(luò)在處理有限樣本數(shù)據(jù)的局限性所致。BP神經(jīng)網(wǎng)絡(luò)是一種基于無限樣本的漸近理論,只有樣本數(shù)量趨于無窮多時(shí)理論上才收斂于全局最優(yōu)值,也難免陷入局部極值。而SVM是建立在結(jié)構(gòu)風(fēng)險(xiǎn)最小化的原則之上的,能夠根據(jù)有限樣本信息,在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折衷,得到的一定是全局最優(yōu)解,而且這些計(jì)算單元具有有限可控的學(xué)習(xí)能力。

1)簡化了建筑施工項(xiàng)目安全風(fēng)險(xiǎn)預(yù)警模型的信息表達(dá)空間,減小了SVM構(gòu)成系統(tǒng)的復(fù)雜性,提高了容錯(cuò)及抗干擾能力。
2)BP神經(jīng)網(wǎng)絡(luò)的均方根誤差為0.070 7,RSSVM預(yù)測模型的最小均方根誤差為0.011 5,可見在小樣本條件下,RS-SVM預(yù)警模型的預(yù)測精度、泛化能力明顯優(yōu)越于BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法。
[1] 孫華山,安全生產(chǎn)風(fēng)險(xiǎn)管理[M] .北京:化學(xué)工業(yè)出版社,2006.
[2] 程杰.建筑安裝工程施工安全風(fēng)險(xiǎn)評(píng)價(jià)與管理[J] .現(xiàn)代管理科學(xué),2002(9):42-43.
[3] 張仕廉,董勇,樊承仁.建筑安全管理[M] .北京:中國建筑工業(yè)出版社,2005.
[4] 李萬慶,李繼萍,孟文清,等.基于粗糙集的載體樁質(zhì)量核心影響因素分析[J] ,河北工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,27(1):88-91.
[5] 李萬慶,李海濤,孟文清.工程項(xiàng)目工期風(fēng)險(xiǎn)的支持向量機(jī)預(yù)測模型[J] .河北工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,24(4):1-4.
[6] 蘇懷智,溫志萍,吳中如.基于SVM理論的大壩安全預(yù)警模型研究[J] .應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報(bào),2009,17(1):41-47.
[7] MENG W,LI W,LI J,et al.Risk prediction modelfor construction projects basedon rough sets and artificial neural networks[C] //FITME.2nd International Conference on Future Information Technology and Management Engineering.US:IEEE Computer Society,2009.