武 婧,楊存麗
(中國核電工程有限公司,北京 100840)
閥門在核電用設備中不屬于重要設備,但卻是核電站安全運行不可或缺的關鍵附件。在實際閥門采購合同執行過程中,閥門采購管理往往依靠管理決策人員個人經驗,難以適應目前核電建設項目精細化管理的要求。因此,建立一個合適的核電閥門采購管理的模型,對閥門設備采購合同進行合理、系統、科學的管理,對整個核電項目建設都有著十分積極的作用。
設備采購管理正好符合“大數據”應用的兩個特點:有大量的數據存儲、缺少定量的評估模型。本文以核電閥門合同執行的過程作為研究對象,建立一套合適的計算規則,對后續合同的執行起到提高效率、規避風險的作用。
在核電閥門合同執行過中,越來越多的管理手段不斷引進,最終的目的是找到一個最有效的、最符合設備采購管理的工具。通過分析合同執行的工作量與合同的關鍵因素之間的關系,找出影響合同執行工作量的關鍵因素,如表1所示。
表1 影響合同執行工作量的關鍵因素
根據不同建模角度劃分,建模的方式可以分為基于理論的方法和基于數據的方法。
基于理論的方法是以建模對象的已知理論為基礎,運用該方法時,建模對象的因果關系需要由公式來表達。在基于理論的建模中,建模者必須知道關于系統的先驗信息,比如模型結構,模型變量等等。
基于數據的方法則正好相反,該方法是從數據中得到分析結果。因此,建立合同執行的關鍵因素與合同執行任務量之間的預測模型,必須基于數據的建模方法。
目前基于數據的主流建模方法就是數據挖掘。數據挖掘是從大量的數據中發現知識,總結知識。而數據挖掘的方法按照使用者參與程度可以分為他組織數據挖掘和自組織數據挖掘。自組織數據挖掘的模型生成以及數據約簡、預處理和模型檢驗都是在自適應地生成的。自組織數據挖掘是依靠系統內部的相互作用來實現“知識發現”,對使用者基本沒有要求。
采用數據挖掘的方法進行研究時,應該選用自組織的數據挖掘方法,將合同執行關鍵因素作為輸入變量,將合同執行的工作量構成作為輸出變量,讓系統進行自發的數據選擇和處理,建模和學習,找出模型結果[1-2]。
3.3.1 分組數據處理算法
設系統的m個輸入變量為x1,…,xm,輸出為y,最終模型如式(1),稱為系統的“完全實現”。
一般情況,任意的非線性的函數f可展開成x的Volterra級數,如式(2):
將式(2)變成離散型多項式,成為多變量非線性多項式,如式(3):
式中:xi為x(t-iπ)是x(t)的i步滯后;ai為各項實系數,i=0,1,…,N。這就是把x(t)和自身的慢變化過程看成是一個多變量輸入組,簡稱K-G多項式。
如果多項式階次增加到10,那么參數的總數將達10萬多個。為了估計這10萬個參數,需要解高階方程組,數值計算難度很大。
為了解決計算問題,考慮由任意兩個輸入變量構成函數。如式(4):
在第一層用輸入、輸出數據擬合得到部分實現,用上一層的輸入,生成下一層的部分實現。見式(5):
每一層保留一部分好的部分實現,舍去一部分壞的部分實現,直到找出近似程度滿意的部分實現為止,最后就以這個最優的部分實現作為完全實現。
3.3.2 運用GMDH方法建立模型
本文選取閥門設備合同執行的關鍵因素,同時獲取合同的實際執行中的單項工作任務量。假設每一個合同執行項目經理完成這些工作的效率是一致的,單項工作任務量主要由具體完成的工作數量來體現。以文件管理工作量(G1)為例:
輸入的合同執行關鍵因素X1,X2,X3,X4,X5,X6,X7,X8,X9,輸出為文件管理工作量為X10-G1。得出模型的結果如下:
輸入值中的主要相關因子2個,分別是:X5-K5—項目堆型—(71%);X8-K8—設計固化程度—(29%)。
說明文件管理工作量主要是與項目堆型及設計固化程度相關。模型的擬合效果圖如圖1所示。
本文將一種自組織的數據挖掘方法(GMDH)用于合同執行工作量的分析。通過分析,證明使用GMDH方法來研究分析合同關系信息與合同執行工作量之間的關系是客觀、有效的。通過建立合同關鍵因素與單項工作量之間的定量關系模型,對后續項目合同執行中人力資源的分配及重要工作的風險管理都有重要的指導意義。