魯守東,林 仁
?
基于小樣本貝葉斯網絡結構學習的質量績效評價模型研究
魯守東1,林 仁2
(1. 安徽信息工程學院,安徽 蕪湖 241000;2. 湖南城市學院,湖南 益陽 413000)
采用一種多元回歸加PC算法的改良BN結構學習方法,有效地克服了小樣本訓練數據下的結構學習可靠性問題﹒從鐵路建筑施工現場收集到研究數據后進行探索性因子分析,并萃取出11個質量績效動因要素;以多元回歸分析方法找出5個直接影響因子,并以此為先驗知識構建BN初始網絡結構,再應用PC算法進行結構學習,一套理想的質量績效測度模型被最終獲得﹒以3個企業的實際樣本數據為依據,進行貝葉斯網絡推理和檢驗,檢驗結果表明模型具有較好的適切性和科學性﹒
建筑施工系統;質量績效評價;小樣本BN結構學習;多元回歸分析
質量和績效分別是兩個具有豐富內涵的概念,由這2個抽象的概念組合而成的新概念——質量績效,則具有更加豐富的理論內涵﹒事實上,到目前為止還沒有人對質量績效概念作出嚴格的定義,但有關質量績效評價方面的研究文獻卻從質量管理實踐中源源不斷地產生﹒
Jim(2003)以波音公司的20條最佳實踐結合MBNQA的19個2級要素構建實踐——績效關系矩陣,以質量功能展開的方法構建質量屋,并給出實現各種績效戰略的手段[1]﹒于本海等(2011)以軟件企業為例,應用模糊神經網絡方法,定義了若干級輸入指標和輸出指標并構建出6個層次的FNN項目績效評價模型[2]﹒Florence(2004)應用神經網絡方法構建了一套包含11個輸出指標和65個輸入指標的3層ANN模型,以新加坡的33個建筑項目為樣本,對項目績效模型進行了有效性驗證[3]﹒還有文獻以ISO9004標準和質量競爭力指數為依據的績效評價模型等﹒
總結國內外相關研究文獻,主要有以下一些特點及不足的地方:(1)評價指標體系不完備或過于寬泛;(2)評價方法定性的居多,定量評價方法較少;(3)定量評價方法出現過如QFD、BP、ANN、FNN和DEA等不少好方法[1-3],但還不曾發現用BN方法進行質量績效定量評價的文獻﹒
BN方法作為數據挖掘和人工智能領域的一種新型工具,在系統變量的因果關系挖掘及網絡結構建立方面具有很好的應用前景﹒本文的目標就是嘗試以貝葉斯網絡為工具,以鐵路建筑施工系統的質量績效為評價對象,構建一套適合推理診斷和可預測決策的績效評價模型﹒
BN(Bayesian Network)最早是由Judea Pearl提出的[4]﹒貝葉斯網絡理論認為BN由2部分構成:其一是有向無環圖DAG(Directed Acyclic Graph),又稱作貝葉斯網絡結構,通常是由若干節點和一些連接邊所組成的;其二是條件概率表CPT(Conditional Probability Table),它是變量之間聯系規律的表達﹒
貝葉斯網絡學習包括參數學習和結構學習﹒結構學習的目標是獲得DAG結構圖,參數學習通常是在結構學習的基礎之上,通過特定的方法獲得CPT參數的過程﹒
為了保證BN結構學習的準確性和可靠性,一般需要海量的訓練樣本數據﹒而基于條件獨立性測試(簡稱CIS)的PC算法相對來說比較適合于系統變量不多、網絡結構稀疏和小樣本訓練數據的學習條件[5]﹒
文獻[6]曾經將SEM結構方程模型方法和BN方法相結合,先用SEM方法構建模型網絡結構,再應用BN推理方法進行診斷研究,從而避開了小樣本數據下的BN結構學習難題[6]﹒文獻[4]認為BN結構學習的樣本量較少時,可人為增加一些客觀的先驗信息和擴大樣本數據量具有同樣的效果﹒正是在這2篇文獻的啟發之下,本文將多元回歸方法和PC算法相結合,直接面對小樣本數據下的BN結構學習問題﹒
國內的文獻在確定質量績效影響因素時,幾乎都是按照國外的“質量管理實踐QMP——質量績效QP”的實證研究范式來進行的[6,7],至于國外的量表是否適合中國的文化情境以及不同行業的特點,學者們并沒有深入研究﹒本文則是采用理論分析加文獻分析,結合鐵路建筑行業的特點,以探索性因子分析方法來確定鐵路建筑施工系統質量績效的動因要素或影響因素﹒
質量績效評價雖然也涉及到結果質量,但主要是以組織系統及其過程為評價對象﹒根據建筑施工系統的特點,資源類要素一般包括4M1E(人、機、料、法、環)及信息資源6個方面內容;而流程類要素則包括業主溝通、地勘設計、施組計劃、工藝設計、采購供應、施工過程和質量檢驗7個過程;管理活動要素通常包括質量領導、質量計劃、質量保證和質量改進4個方面﹒這3類不同性質的要素跟質量績效以及最終工程質量之間的具體關系,定性的推斷只能是一種假設,必須要拿到實踐中檢驗,甚至是多次檢驗,才能得到相對可靠的結論﹒
本文結合QMP-QP實證研究文獻中的量表題項內容,同時參考了建筑施工管理領域相關的研究文獻[3,7-9],從流程、資源和管理3個視角出發,設計出一套調查問卷如表1所示﹒
文獻[8]曾經對鐵路建設的質量風險因素進行過識別,發現共有34項常見的質量風險因素,本文對此進行一一驗證,發現有31項能從本文的問卷中找到準確的對應﹒而通過與其它類似的量表[2,3,7]對照后發現:本文以流程、資源和管理3個視角設計的問卷題項具有一定的代表性,能夠發現施工系統中影響質量績效的主要因素﹒
為了進一步保證問卷質量,本文第一作者還通過電話、電子郵件及個別訪談的方式接受了鐵路建設施工現場的專家建議,通過對題項的增加、刪減和合并等多輪互動與修改,最后得到1份包括53個題項的質量績效調查問卷如表1所示﹒

表1 質量績效及其影響因素指標測度
注:由于篇幅限制,凡是標有“**”的地方均表示省略的部分
最終的調查問卷在南廣鐵路、云桂鐵路和京滬鐵路的建設施工單位中發放,它們分別是中國鐵建、中國建筑和中國中鐵股份有限公司﹒調查對象主要是各標段的項目經理、項目監理和項目質量安全負責人,總共收集到有效問卷945份﹒
本文利用收集到的數據,對建筑施工系統中質量績效影響要素進行一次探索性因子分析,從53個指標項目中共萃取出包括:信息管理、過程控制、質量領導、質量檢驗、人力資源、改進創新、施組工藝、地勘設計、資質標準、資源保證和材料供應11個因子﹒11個主成分累計解釋總方差變異數為67.108%,各維度因子所涵蓋的測度題項及其信度和效度檢驗結果如表2所示﹒
Cronbach′s α信度檢驗結果顯示:除因子9和因子11的信度系數略低于0.7(標準)外,其它維度的因子基本達到或超過標準值﹒

表2 探索性因子分析及信度效度檢驗
效度檢驗結果顯示:因子6的WBS52及TD44、因子7的TD14和因子9的WBS13題項的CITC指標遠低于0.5(標準)而予以刪除,確保各維度指標的收斂效度達到標準﹒刪除4個題項后,最終的49個題項的11個因子維度及其測度題項數均未改變,且第1主元方差提取指標均大于0.5(標準),符合單維度標準﹒另外除了因子1和因子3的AVE平方根指標略低于最大相關系數指標外,其它維度因子均顯示出具有較好的區分效度﹒在內容效度方面,因子1(信息管理)、2(過程控制)、3(質量領導)、5(人力資源)、6(改進創新)和11(材料供應)是國內外文獻中常見的績效影響因子;其余5個因子可以理解為行業特有的影響因素,其內容效度均解釋良好﹒最終的探索性因子分析結果顯示:施工系統中影響質量績效的11個因子具有一定的代表性和穩定性﹒
接下來本文采用多元線性回歸方法來驗證11個績效動因要素和質量績效變量之間的直接因果效應是否真實存在﹒
首先采用SPSS15.0將11個解釋變量用強行進入法納入回歸模型,擬合結果如表3所示﹒

表3 具有11個解釋變量的強行進入法回歸分析
預測變量:(常量),1,2,3,4,5,6,7,8,9,10,11;因變量:質量績效
回歸結果表明:達到統計顯著性水平,說明各變量回歸系數整體來說顯著不為零;調整后R方達到0.467,表明11個解釋變量對被解釋變量質量績效的變異具有一定的解釋力;D-W在1.5和2.5之間,表明自變量之間不存在自相關可能性﹒
考慮到變量11、10、9、6、3和1的回歸系數的T檢驗不具有顯著性,運用逐步后退法再次進行回歸分析,最后得到表4的回歸結果﹒

表4 應用逐步后退法的回歸分析
預測變量:(常量),8,4,5,7,2;因變量:質量績效
最終的回歸分析結果顯示地勘設計(8)、施組工藝(7)、人力資源(5)、質量檢驗(4)及過程控制(2)這5個變量與質量績效之間的回歸系數顯著不為零,表明它們之間具有直接因果效應,同時5個變量之間的VIF膨脹系數都小于10,表明它們之間不存在共線性,是影響質量績效的相對獨立的因子,它們共同解釋因變量(質量績效)約45.5%的變異﹒
在BN應用領域,有大量文獻直接通過定性分析構建網絡拓撲,多數是以簡單的“魚骨圖”來建立模型結構,這對于其后的BN推理和診斷會帶來較大誤差[8,10]﹒真正意義上的BN網絡結構是需要通過數據學習才能獲得的,筆者從中國知網中僅搜索到1篇醫學方面類似的研究案例[11]﹒
本文通過2.3節的多元回歸分析獲得了一些實證結論,為構建初始的BN網絡拓撲結構提供了客觀的先驗信息,接下來再利用PC算法進行結構學習,試圖解決小樣本前提下的BN結構學習效果問題﹒
PC算法的核心思想和算法步驟如下:
步驟1:將節點集中節點進行兩兩連接,得到完全無向圖;
步驟4:所有的結構找到后,為確定剩余的無向邊方向,PC算法反復運用下面2條規則﹒
GeNIe是一款建立圖決策模型的應用軟件,由美國匹茲堡大學決策系統實驗室開發﹒本文選擇GeNIe2.0作為結構學習平臺,在BN結構學習之前,先構建如下的初始BN網絡拓撲結構:
(1)地勘設計8為質量績效的父節點;
(2)施組工藝7為質量績效的父節點;
(3)人力資源5為質量績效的父節點;
(4)過程控制變量2為質量績效變量父節點;
(5)質量檢驗4為質量績效的父節點﹒
在GeNIe軟件平臺上進行樣本數據學習,學習方法選PC算法,顯著性水平選擇0.05,最大父節點數選擇11,得到11個QP動因要素和質量績效間的貝葉斯網絡結構模型如圖1所示﹒

圖1 質量績效BN網絡結構
從圖1的模型內容來看,影響質量績效的直接動因要素是人力資源、質量檢驗、過程控制、地勘設計和施組工藝,而質量領導、質量信息、資源保證、改進創新、材料供應和資質標準6個變量是通過前5個變量的中介間接作用于最終的質量績效﹒整個模型沒有出現違背常理或明顯邏輯悖論問題,初步預示模型學習效果良好﹒但是,BN結構學習效果的最終驗證還是要看模型在實際應用中的解釋力﹒
獲得了結構模型之后,還需要進一步進行CPT參數學習,獲得節點之間的條件概率關系表,才算是獲得一個完整的BN網絡﹒BN參數學習方法主要有極大似然估計、貝葉斯估計、EM算法和MCMC算法等[4]﹒
以BN方法建立的質量績效評價模型的特點是:它不僅能充分體現出動因要素績效指標和結果績效指標之間的內在因果聯系,以DAG來反映這種因果關聯的方向,以CPT反映因果關聯強度;并且還可以推理和診斷,對于管理決策具有很強的現實意義﹒BN推理可以實現從左到右的因果推理、從右到左的診斷推理、相互關聯性推理和敏感性分析等﹒
為了檢驗圖1中的質量績效路徑結構模型的適切性,本文從945個樣本中挑選出1個樣本項目A(屬于優秀項目公司)的數據進行檢驗﹒應用熵權法[12]計算11個動因要素的分值,再按照分值為3.7~5.0定義為優等、分值為2.4~3.7定義為中等和分值為1.0~2.4定義為劣等的標準進行等級劃分,得到每個動因要素的得分等級,結果如表5(第2行)所示﹒
應用GeNIe2.0軟件的推理工具進行推理,推理結果:項目A質量績效為劣等級的概率為0.07;中等級概率為0.07;優等級概率為0.85,具體結果如表5所示(注:表5的最后1列為GeNIe2.0的BN推理得到的結果,前11列為調查統計的結果,下同)﹒
為了驗證本次研究獲得的績效模型是否具有可推廣性,重新挑選了2家公司(簡稱項目公司B和項目公司C)進行驗證研究,它們的質量績效水平有著顯著差異,每家分別發放并回收問卷35份,問卷主要由公司的中高層管理人員及技術人員填寫,僅有少量優秀員工代表參與,最終獲得1組評價統計數據見表5﹒
對項目公司B所收集到的數據再次進行CPT參數學習,將11個QP動因要素變量的概率值分別帶入模型,應用GeNIe2.0軟件,選擇貝葉斯估計方法,運行軟件得到QP節點的后驗概率值﹒其中質量績效為劣等級的概率為0.11;中等級概率為0.24;優等級概率為0.65﹒這就說明了當前的施工水平下,項目公司B的工程結構質量達到優等級的概率為0.65,且達到優等水平的概率最大,推理結果符合選擇樣本時的初始預期﹒

表5 3個測試項目的調查及推理
進行類似推理可獲得項目C的QP后驗概率結果分別為0.61、0.20和0.19﹒后驗概率的數值表明項目公司C的工程結構質量達到優等級的概率僅為0.19,而符合劣等級水平的概率值最大(0.61)﹒這和現實情況也是完全相符的,也說明了本次研究所建立的模型是科學合理的﹒
(1)本文采用1種多元回歸加PC算法的改良BN結構學習方法有效地克服了小樣本訓練數據條件下結構學習的準確性與可靠性問題;
(2)在參考同行文獻基礎上,根據鐵路建筑施工行業的特點,從資源、流程和管理3個視角探索質量績效的影響因素,應用探索性因子分析方法得到影響質量績效的11個因子,并在此基礎上應用改良BN結構學習方法獲得了一套比較理想的質量績效評價與測度模型;
(3)本次研究不足之處在于以探索性因子分析方法萃取出11個績效動因要素只能解釋質量績效變量46.7%的變異,表明本文的質量績效影響因素調查問卷中的53個指標測度項還有待進一步擴充﹒如何發展出更加完善的質量績效量表和質量績效評價模型,是今后同類研究中需要重點關注的內容﹒
[1]WALDEN J. Performance excellence: A QFD approach[J]. International Journal of Quality & Reliability Management, 2003, 20(1): 123-133.
[2]于本海, 張金隆, 吳恒亮, 等. 基于FNN的軟件項目績效評價模型研究[J]. 管理學報, 2011, 8(10): 1517-1523.
[3]Ling F Y Y, Liu M. Using neural network to predict performance of design-build projects in Singapore[J]. Building & Environment, 2004, 39(10): 1263-1274.
[4]SPIRTES P, GLYMOUR C, SCHEINES R. Causation, prediction, and search[M]. Seconded, Cambridge: The MIT Press, 2000.
[5]SPIRTES P, GLYMOUR C, SCHEINES R. Causality from prob- ability[M]. London: Piman Evolving Knowledge in Natural Science and Artificial Intelligence, 1990.
[6]宋永濤, 蘇秦. 基于貝葉斯網絡的質量管理實踐對績效的影響評價[J]. 系統工程理論與實踐, 2011, 31(8): 1440-1446.
[7]李軍鋒, 曾德智, 龍勇. 我國制造業背景下質量管理活動的量表開發研究[J]. 數理統計與管理, 2011, 30(1): 1-11.
[8]周國華, 彭波. 基于貝葉斯網絡的建設項目質量管理風險因素分析——以京滬高速鐵路建設項目為例[J]. 中國軟科學, 2009(9): 99-106.
[9]CHAN A P C, CHAN A P L. Key performance indicators for measuring construction success[J]. Benchmarking: An International Journal, 2004, 11(2): 203-221.
[10]陸靜, 唐小我. 基于貝葉斯網絡的操作風險預警機制研究[J].管理工程學報, 2008, 22(4): 56-61.
[11]朱文鋒, 晏峻峰, 黃碧群. 貝葉斯網絡在中醫證素辨證體系中的應用研究[J]. 中西醫結合學報, 2006, 4(6): 567-571.
[12]邱菀華. 管理決策與應用熵學[M]. 北京: 機械工業出版社, 2002.
(責任編校:龔倫峰)
Research on Quality Performance Evaluation Model Based on Small Sample Bayesian Network Structure Learning
LU Shoudong1, LIN Ren2
(1. Anhui Information Engineering Technology Institute, Wuhu, Anhui 241000, China; 2. Hunan City University, Yiyang, Hunan 413000, China)
The reliability of structure learning in small sample training data is the bottleneck of the application of Bayesian Network method. This paper uses a new improved method based on multiple regression and PC algorithm to overcome this shortcoming. The collecting data from the railway construction site, an Exploration Factors Analysis is conducted to extract 11 quality performance factors. The multiple regression analysis is used to find out 5 factors that directly affect the quality performance, and the initial network topology of the Bayesian Network is constructed. the PC algorithm is used to construct the final Bayesian Network structure, an ideal quality performance evaluation & measure model is obtained. Through the sample data of 3 typical enterprises, The Bayesian Network inference and model test were conducted, the result shows that the model is scientific and good applicableness.
building construction system; quality performance evaluation; small sample BN structure learning; multiple regression analysis
F273.2
A
10.3969/j.issn.1672-7304.2017.06.0013
1672–7304(2017)06–0061–06
2017-09-19
魯守東(1971- ),男,安徽蕪湖人,講師,博士,主要從事項目質量管理研究﹒E-mail: donaldlsd@163.com