





摘要:大科學工程項目一般是由多個子項目集成的復雜系統工程,其各子項的研制周期、研制目標和研制難度千差萬別,因此對各子項的管理人員提出了極高的管理要求。隨著計算機技術的發展,以神經網絡算法為代表的機器學習方法為復雜系統的管理帶來了新機遇。利用某大科學工程項目已完成的1000項項目數據,訓練得到三個多輸入單輸出的神經網絡模型,可根據項目執行團隊和任務情況,以較高精度預測項目完成質量、完成時間和管理成本,供決策者及時對項目執行情況進行調整。該方法有望為大科學工程項目的子項目管理提供一條新路徑。
關鍵詞:神經網絡;大科學工程;項目管理;進度管理
0引言
大科學工程項目區別于一般項目,其特點體現為“大”:項目規模大、經費體量大、參與項目的單位數量大、建成后的影響大[1-3]。這樣的項目關系國計民生、國家長遠利益,一旦立項,將涉及大量人力、物力和財力的投入,項目成功與否將對綜合國力的展示產生巨大影響。而一項大科學工程項目的成功,離不開科學有效的項目管理,如我國天眼FAST項目[4]、C919“大飛機”項目[5]及聚變工程實驗堆CFETR項目[6]等,其背后均有一個強大的項目管理團隊作為支撐。
大科學工程項目可分解為多個子項目,每個子項之間有串行和并行的工作模式。一個團隊的任務進度和完成情況將直接對與其銜接的上下游團隊的任務產生影響[7]。在有限的管理資源條件下,如何針對不同項目合理分配管理資源,采取不同的管理策略,以達到最優的管理效果和項目產出,是項目管理實踐中需要著重考慮的問題[8]。這不僅需要對時間管理、整合管理等項目管理知識體系有深入理解,而且需要采取合適有效的方法手段對項目進度進行控制。常用的項目進度管理方法有甘特圖、網絡圖、掙值法等,均已在項目管理過程中得到廣泛應用[9]。任振等[10]利用基于關鍵路徑法(Critical Path Method,CPM)的改進型掙值法研究了某大科學工程中的科研項目進度管理,該方法能抓住影響進度的主要矛盾,得到正確的結果;李雅琴等[11]討論了聚變堆主機系統建設過程中項目進度管理優化措施;王雪等[12]討論了項目推進軟件在項目進度管理中的應用優勢;陸斌[13]利用蒙特卡洛方法研究了關鍵鏈技術在某項目中的實際應用。以上研究關注重點多是單個項目某一階段的項目管理,缺少對新立項目執行結果的預測,因而無法為決策者在立項之初的資源分配提供支撐。
大數據技術的發展,為項目管理提供了一種全新的方法手段。胡榮春等[14]基于大數據分析模型探索了學科項目管理的預測方法,并取得良好的效果;陳留林[15]提供了大數據環境下科技項目管理的一些建議;顧志恒等[16]利用BP神經網絡法討論了項目安全管理。基于以上研究,本文將大數據分析方法應用于大科學工程項目進度管理,利用前期積累的大量項目數據訓練神經網絡,對項目進度、完成時間、完成質量等進行預測,有望為大科學工程項目管理提供一種新手段。
1項目數據采集
為了利用神經網絡算法對項目進度進行預測,首先需要收集已有項目完成情況數據,作為神經網絡模型的訓練集,然后利用訓練得到的神經網絡模型對正在進行或還未執行的項目執行結果進行預測。基于此,收集了某大科學工程項目下1000項子項任務執行情況數據,并根據因果關系將數據分為輸入數據和輸出數據兩大類。
1.1輸入數據
根據數據特點,可將輸入數據分為三大類:任務執行團隊數據、任務數據及獎勵數據。任務執行團隊數據主要包括團隊成員的平均學歷、平均工齡、平均職稱三個參數;任務數據包括任務難度、任務緊迫性和任務性質三個參數;獎勵數據指項目結題后給予團隊成員的獎勵系數。為了建立訓練集,需要對以上參數進行合理賦值。團隊成員的平均學歷賦值規則為:最高學歷為博士得3分,最高學歷為碩士得2分,最高學歷為學士得1分,其余得0分,團隊成員的平均學歷值為所有團隊成員學歷得分的算術平均值。平均工齡取所有團隊成員工齡的算術平均值。平均職稱的賦值規則為:高級職稱得3分,中級職稱得2分,初級職稱得1分,其余得0分,平均職稱取所有團隊成員職稱得分的算術平均值。任務難度賦值規則為:由7名專家對任務難度進行評分(打分區間為[0,1]),任務難度取其算術平均值。任務緊迫性賦值為任務完成時間(單位:周)。任務性質賦值規則為:橫向任務值為1,縱向任務值為2。獎勵賦值為0.05、0.1、0.15、0.2,執行單位文件規定。
1.2輸出數據
輸出數據包括三大類:任務完成時間、任務完成質量和管理成本。任務完成時間指相對于規定完成時間的提前或滯后量,按天計算;任務完成質量由專家評分獲得,評分區間為[0,1],專家打分時應綜合考慮任務執行團隊交付的產品質量、技術先進性和創新性,以及可能帶來的經濟效益等因素;管理成本指管理人員在本項目中投入的總工時。通過神經網絡算法,建立輸入數據與輸出數據之間的聯系,可以有效地對正在執行的項目產出進行預測,從而及時調整管理策略。如根據預測,某項目的任務完成時間存在較大的延期概率,且任務完成質量不會太高,此時投入太多管理成本是不合適的,需要及時對項目輸入(任務執行團隊、任務、獎勵等)進行調整,以獲得更好的項目產出。
1.3數據分析
在求解神經網絡前,先分析某幾個重要的輸入參數與輸出參數之間的大致關系,有助于更好地改進神經網絡,得到更有效的預測結果。每個輸入參數xi對輸出結果的影響大小不同。根據以往經驗,學歷平均值、任務難度系數、任務緊迫性等參數對任務執行結果的影響具有一定的預期:學歷越高,任務完成質量、完成時間的期望值就越高;任務難度系數越大,任務完成質量、完成時間的期望值就越低。
平均學歷為1、2和3三種情況時任務完成時間和任務完成質量統計直方圖如圖1所示,并給出了高斯擬合結果。從圖1a~c可以發現,平均學歷為1、2和3時,分布函數分別為N(4,3.2),N(0.8,3.9)和N(-0.5,5.28),三種情況的任務完成時間均基本滿足正態分布。平均學歷越高,相應的任務完成時間平均值越小,任務完成越快;但σ值越大,說明任務完成時間的分布范圍越寬。利用該統計結果,可以根據團隊的平均學歷,簡單預測出任務完成時間的范圍。例如,當一個任務執行團隊的平均學歷為1時,其任務完成時間有約63%的概率處于[2.4d,5.6d]的范圍。而圖1d~f展示了平均學歷與任務完成質量的關系,可以發現,任務平均完成質量隨團隊平均學歷的增加而增加。
任務難度系數與任務完成時間和完成質量的統計關系如圖2所示。圖2a和圖2b分別給出了任務難度系數與任務完成時間和任務完成質量的統計關系。從圖2a可以清晰地看到,隨著任務難度系數的增加,任務完成時間呈現增加趨勢,并且大概率會出現完成時間推遲的情況。當任務難度系數接近1時,幾乎所有的任務均出現了不同程度的延期。在大科學工程項目中,較多子項目任務具有研究、攻關性質,這類項目一般難度較大,在立項之初難以準確預估其完成時間,因而經常會造成任務延期,這也與圖2a反映的統計結果相符。圖2b則反映隨著任務難度系數的增加,任務完成質量呈現略微下降的趨勢,這也與大科學工程項目具有研究、攻關的性質密切相關,因而也符合預期的統計結果。
根據以上簡單的數據分析,可以從輸入數據簡單地判斷輸出結果(如任務完成時間和完成質量)的大致范圍和走向。但從圖1和圖2也可看出,輸出結果具有較大的分布范圍,且并不僅僅受單一變量的影響,所以無法從統計結果準確地預測輸出結果的具體值。采用神經網絡算法可以求解這類問題。
2神經網絡預測分析
2.1模型的建立
輸入參數X為上節中獲取的7個參數:X=[x1,x2,x3,x4,x5,x6,x7]=[團隊平均學歷,團隊平均工齡,團隊平均職稱,任務難度,任務緊迫性,任務性質,獎勵]。考慮到三個輸出數據Y(Y=[y1,y2,y3]=[任務完成時間,任務完成質量,管理成本])之間的關系相對獨立,故采用多輸入單輸出的神經網絡模型逐一對三個輸出數據進行擬合,以加快收斂速度并提高擬合準確度,即建立三個神經網絡:X→yi(i=1,2,3)。使用MATLAB自帶的神經網絡擬合工具箱對該問題進行求解,神經網絡求解模型如圖3所示,為兩層前向反饋模型。隱藏層數為10,采用Levenberg-Marquardt后向傳播算法對網絡進行訓練。選擇1000項子項目數據中的70%作為訓練集,15%作為驗證集,剩余15%作為測試集,訓練的評價標準為盡量小的均方差和盡量大的回歸系數。
2.2模型訓練結果
利用前文所述的數據集訓練得到三個神經網絡模型。X→y1(任務完成時間)神經網絡訓練結果如圖4所示,X→y1(任務完成時間)神經網絡訓練誤差直方圖如圖5所示。其余兩個神經網絡模型與此類似。圖4依次展示了訓練集、驗證集、測試集和全部數據的回歸系數。從圖4可以看出,4個數據集的回歸系數均在0.8左右,說明輸入數據與輸出數據之間存在較強的關聯性,該值越接近于1,兩者的關聯性越強。圖5給出了訓練誤差直方圖,呈現出正態分布特征,有近50%的誤差集中在±1d以內,均方差在4.5d左右。從訓練結果來看,無論是回歸系數還是誤差,均接近其理論值,說明訓練得到的模型具有較高的精度。
2.3預測結果
在訓練得到神經網絡模型后,便可利用輸入數據對項目執行結果進行預測。典型的輸入參數圖示如圖6所示,展示了一組典型的輸入數據(數據已按統計得到的各參數的最大值進行了歸一化處理),將之帶入訓練得到的神經網絡模型,得到輸出結果為Y=[y1,y2,y3]=[任務完成時間,任務完成質量,管理成本]=[-3.3d,0.93,1.3w],即對于該項目而言,預計提前3.3d完成,完成質量比較好,投入的管理成本約為1.3w。在對該項目進行管理時,可采取較松的管理策略,將相應的管理資源投入到預期較差的項目。
3結語
本文介紹了一種利用神經網絡算法對大科學工程項目子項目執行結果進行預測的方法。收集以往執行的1000項子項目的執行、完成情況,對其進行量化、分類,形成了神經網絡訓練數據集。利用訓練得到的神經網絡模型,對正在立項的子項目執行結果進行預測,相關預測結果可作為項目立項、調整的依據。對于正在執行的項目,也可根據預測結果,及時調整策略,以期獲得更好的輸出結果。本次實踐證明,大數據分析引入大科學工程項目管理,可以實現項目管理水平的提升。
參考文獻
[1]沈敏圣,任振,王成程,等.掙值管理方法在大科學工程進度管理中的應用[J].項目管理技術,2016,14(4):86-91.[2]王成程,何偉,鄭萬國,等.XX項目建設外協合作聯盟的建立與管理實踐[J].項目管理技術,2016,14(7):98-101.
[3]何偉,王煒,申晨,等.XX項目外協實施管理特點研究[J].科技成果管理與研究,2016(8):29-32.
[4]黃夢林,朱明.FAST望遠鏡觀測項目管理系統框架設計[J].貴州大學學報,2014,31(1):88-91.
[5]孟銳征,賈佳.C919大型客機國內市場銷售策略初探 [J]. 民用飛機設計與研究,2012,3(31):44-46.
[6]SONG Y T,LI J G,WAN Y X,et al.Engineering design of the CFETR machine[J].Fusion Engineering and Design,2022,183(1):11324.
[7]任振,張文健,王成程,等.基于復合式管理模式的大科學工程項目實施管理體系研究[J].項目管理技術,2019,17(4):84-89.
[8]Project Management Institute.項目管理知識體系指南(PMBOK指南)[M].6版.北京:電子工業出版社,2018.
[9]張野.鐵路建設項目進度管理研究[J].管理創新,2022,17(6):74-76.
[10]任振,沈敏圣,王成程,等.改進掙值法在大型科研項目進度—成本管理的應用[J].科技管理研究,2016,36(20):211-214.
[11]李雅琴,王曉潔,劉甫坤,等.CRAFT項目進度管理改進及優化措施 [J].項目管理技術,2021,19(10):89-92.
[12]王雪,李玉光.項目推進軟件在項目進度管理中的應用 [J].天津科技,2021,48(8):4-6.
[13]陸斌.基于蒙特卡羅模擬的項目進度管理方法對比 [J].項目管理技術,2021,19(11):124-128.
[14]胡榮春,劉知貴,胡茂,等.基于大數據分析模型的學科項目管理探索[J].教育評論,2019(5):55-59.
[15]陳留林.闡述大數據環境下科技項目的管理[J],科技創新導報,2020(20):169-173.
[16]顧志恒,馮樂.基于主成分分析和BP神經網絡的工程項目安全管理評價研究[J].項目管理技術,2017,15(4):36-39.PMT
收稿日期:2023-07-07
作者簡介:
黃華(通信作者)(1991—),男,博士,工程師,研究方向:大科學工程管理。
晏青(1993—),女,工程師,研究方向:大科學工程管理。
黃存婷(1988—),女,高級工程師,研究方向:大科學工程管理。
申晨(1989—),男,高級工程師,研究方向:大科學工程管理。