馮兵,杜曉春,鄭國雄,蔣佳,唐剛
(中國石油西南油氣田分公司輸氣管理處,四川 成都 610213)
我國已成為世界上最大的能源生產國和消費國。管道,特別是長輸管道,是能源運輸最主要、最經濟安全的方式。截至2020年底,我國油氣長輸管線總里程達到16.5萬千米,已實現西氣東輸、川氣出川、北氣南下。隨著能源生產與儲運量的增加,預計到2025年我國長輸管道總里程將超24萬千米。長輸管道項目線路呈現工期長、工程內容復雜、變化大等特點,這給項目造價管理造成極大不確定性[1]。造價管理決定長輸管道項目總體成本,對促進石油與天然氣行業的發展、提升社會經濟效益有直接影響。在油氣行業造價管理過程中,預算、概算與結算“三超”現象普遍存在[2]。長輸管道附屬的地面工程項目是項目總體造價構成的主要部分之一,其造價管理直接影響項目總體成本控制。目前,長輸管道造價管理模式總體相對落后[3],內外部影響工程造價管理的因素繁雜,缺乏建設單位、咨詢單位及施工單位三方協同的造價管理整體控制[4],致使工程造價得不到有效控制,結算金額超合同簽訂價格現象普遍存在[5]。長輸管道項目管理輕視成本控制、項目范圍定義不清晰、合同條款歧義、工程主體間協作問題等均易造成施工成本無法控制現象頻發[6]。針對油氣長輸管道項目造價的復雜性,有學者提出對工程的造價從投資決策階段到竣工結算階段進行全過程的管理[7]。然而,長輸管道地面工程建設項目的造價管理在項目全生命周期管理過程中受各因素影響,如成本管理認識不足、項目頻繁產生變更、材料價格失調、施工方法不當、合同管理失敗、外部環境變化等[8]。大數據、人工智能等高新技術被逐步運用于工程項目管理,如自然語言處理(natural language processing)方法被用于提取合同條件中的合同風險條款[9],人工神經網絡法(人工智能方法之一)被用于預測施工變形[10],BIM (building information modeling)技術被用于開發協作系統可視化平臺[11]等。大數據背景下,高新技術也被逐步運用于油氣行業,如GIS運用于管道路徑選擇有效降低15%~30%的項目成本[12-13],云計算、大數據等運用于物聯網長輸管道構架、實現數據采集自動化、生產過程實時監測、管理模式優化等,降低維護運營成本及工程造價[14]等。基于大數據的機器學習方法可運用于處理大量數據、識別工程造價管理中的關鍵影響因素。為了有效提高長輸管道地面工程項目造價管理實踐,本文在扎實的理論分析研究基礎上,運用大數據分析方法構建機器學習決策樹模型,識別影響長輸管道地面工程建設項目造價管理的關鍵因素,填補相關領域研究空白,為長輸管道地面建設工程項目的造價管理提供政策建議與決策參考。
圍繞長輸管道地面工程建設項目造價管理失敗、造價超支等問題,本研究開展了大量的文獻研究。通過關鍵詞在知網(中文)、web of science(英文)搜索相關文獻、進行系統的理論分析,初步提取影響長輸管道地面建設工程項目造價管理的關鍵因素,包括范圍界定、頻繁變更、材料管理、施工方法、合同條款、合同執行、變更管理、政策法規、市場變化、自然條件等,以構建長影響輸管道地面工程項目造價管理因素的概念模型。
為了實證研究識別在設計決策階段、施工階段影響長輸管道地面建設工程造價管理的關鍵因素,本研究開展了問卷調查研究。本研究采用經驗證的成熟量表設計調查問卷,向長輸管道地面工程項目造價管理相關人員收集定量分析數據。問卷調研法是工程項目造價管理常用數據收集方法之一[15]。調查問卷主要包含兩部分問題:(1)答題者個人信息相關問題;(2)影響長輸管道地面建設工程造價管理的關鍵因素,包括主體相關因素、施工環境的變化、合同管理、材料管理、市場因素、自然環境因素等因素。問卷使用五分級Likert量表,答題者以1分(非常不重要)到5分(非常重要)的任意分值表明其對長輸管道地面建設工程造價管理的關鍵影響因素重要程度的評判。本次問卷的受訪者均滿足三點要求:(1)從事長輸管道地面工程相關工作,取得專業資格;(2)具有至少半年的長輸管道相關行業工作經驗;(3)就職于長輸管道行業相關的主要組織機構,包括建設單位、咨詢單位、施工單位等。依托中國石油西南油氣田公司長輸管道項目,本次問卷調研共收回有效問卷100余份,其中男性答題者占比近八成;答題者年齡大多集中于30~39歲(近60%),教育程度多為本科(近75%),符合我國長輸管道行業的實際情況;答題者工作年限普遍較長(6~15年工作經驗的占比近65%),對長輸管道地面工程造價管理等相關工作較熟悉,觀點能反映工程實際。總體上,問卷樣本滿足抽樣調查的要求,具有普遍現實意義。
機器學習是常見的大數據處理方法,被廣泛運用于語音識別、光學文字識別、手寫識別、計算機視覺、醫學圖像分析、文件分類、生物特征識別、自然語言處理、搜索引擎等。機器學習方法也被應用于工程項目的造價管理,包括構建工程造價預測的模型[16]和造價控制[17]。決策樹是一種常用于大數據處理的機器學習方法[18]。通過從一系列有特征和標簽的數據中總結決策規律、用樹狀結構呈現規律解決問題。該方法包含訓練集和測試集,可對數據進行分類及回歸分析,已被證明是一項可靠的大數據預測方法。本文運用scikit-learn對問卷收集的有效數據進行決策樹分析,開發環境是Jupyter lab,庫包括Numpy、Pandas、Matplotlib等,最終運用可視化工具Graphviz制作結果決策樹模型。
決策樹方法需將每個輸出數據標記類別。本文問卷采用李克特5級量表,選項從5到1分別表示“非常同意”、“非常不同意”等五種回答。在建立決策樹模型時,以造價管理的平均值作為分界點,大于平均值標記為“1”類,表示造價管理成功;其他為“0”類,表示造價管理失敗。 “不純度”是衡量決策樹擬合度的指標,可通過其確定決策樹的最佳節點和最佳的分枝方法。不純度越低,擬合度越好。基尼系數(Gini)和信息熵(Entropy)常用來表示不純度,其計算公式如下:

為了識別長輸管道地面工程項目造價管理的關鍵影響因素,本文根據研究假說建立了“影響因素–造價管理”的決策樹模型。在決策樹模型中,以“范圍界定、頻繁變更、材料管理、施工方法、合同條款、合同執行、變更管理、政策法規、市場變化、自然條件”為輸入量,以“造價管理”為輸出量。決策樹模型結果顯示,材料管理是對長輸管道地面工程項目造價管理的預測能力最高的因素,其他預測因素依次為自然條件、頻繁變更、范圍界定等。在決策樹模型中,每個數據按照因素特征值自上而下判斷決策樹結構分枝。首先,在決策樹最高層級按材料管理特征值進行判斷,當滿足特征值≤3.5時,進入左邊的非葉結點,再根據頻繁變更的特征值,當≤4.5時,進入左邊葉節點,得到結果“0”,即“造價管理成功”,結束判斷。節點中的samples屬性顯示應用于該節點的訓練樣本數量,value屬性表明此節點“0”“1”樣本數量(例如,根結點材料管理中,samples為74個,其中23個屬于0類(class 0),51個屬于1類(class 1)。entropy值表示節點的不純度,entropy值越高該節點數據不確定性越高,entropy=0時,則該節點所有訓練樣本均為同一類別。
工程造價管理是長輸管道地面工程管理的重要工作。圍繞工程造價超支現象頻發,本課題旨在運用大數據分析方法識別影響該類項目工程造價管理的關鍵因素。在大量文獻研究的基礎上,本文提出了影響長輸管道地面工程造價管理的關鍵因素及研究假說,通過問卷調研法采集了超過一百個實證數據、運用機器學習決策樹方法構建決策樹模型。研究發現,材料管理是影響長輸管道地面工程造價管理的最主要因素,其他重要因素還包括自然條件、頻繁變更、范圍界定等。材料費用占工程項目直接費的較大比例,而材料供應、材料價格容易受到市場波動影響。材料的現場管理保證材料的質量及使用量,不當的材料進場檢查、施工浪費等造成材料消耗量增加,最終造成長輸管道地面工程項目成本超支。項目范圍的界定不清晰被發現是影響長輸管道地面工程造價管理的主要因素之一。作為長輸管道的重要附屬工程,地面建設工程的范圍受到管道主體工程的影響,導致原定的造價管理失效。此外,在工程實際中,由于業主原因、設計原因、地質條件不符等引起的設計變更,惡劣氣候現象等自然原因導致的停工、產生的窩工費用及財產損失等,亦是影響長輸管道地面工程建設項目造價管理的主要原因。為了更好地管理長輸管道地面工程項目、有效實施造價管理,建議與材料供應商建立長期戰略合作關系,以保障材料供應充足以及減少價格波動;建議建立良好的材料進場驗收、現場儲備、領取使用制度。為避免不必要的變更,項目建設方應在前期階段開展充分的調研、做足可行性研究,避免由于地質勘探原因、決策失誤等被迫發起變更,致使項目成本超支、造價管理失效。同時,建議建設方采用EPC、設計施工等新型承發包模式,充分發揮施工方在設計階段的作用,避免由于設計原因等造成的項目變更。最后,項目建設方、施工方應在制定項目預算時預留風險保證金,就可能發生的惡劣天氣條件做好預防措施。通過購買保險、風險轉移等方式有效規避自然條件相關風險、降低其造成的損失。本文的研究發現將為科學開展長輸管道地面工程造價管理提供理論支持,對提升造價管理實踐產生積極作用。