國網青海省電力公司經濟技術研究院 田海豐 楊蒲寒婷 趙生延 國網青海省電力公司 趙健勃
配電網工程相對主網工程規模小且費用構成復雜,同時較主網工程缺乏相應的專業造價人員,使得其工程造價控制工作存在一定的難度。合理分析工程投資水平,有效控制工程造價是電網企業實現精準投資管控要求的重要手段。
造價合理區間是在歷史工程數據的基礎上得出的,用來判斷某類工程造價水平是否合理的定量化控制方法,可用于初步設計階段的設計評審環節。相比于傳統的國家電網造價控制線和通用造價,合理區間考慮了地區差異,對不同地域因素及建設條件、差異化技術方案下造價具有良好的兼容性,能有效控制造價水平。
由此,如何精準確定造價合理區間受到學者廣泛關注:姚剛[1]通過研究不同電壓等級下的單位造價概率分布,定量計算其近似概率密度函數,進而得到輸變電工程的造價區間;杜英[2]通過對比不同統計分析方法,將正態分布與四分位數間距法相結合,構造了造價區間的分析框架,通過實例確定工程造價控制區間;李澤陽[3]從造價大數據角度將正態模型、參數估計、擬合檢驗、區間估計等經典統計學理論相結合,構建了造價信息測算模型,并通過實例測算了某一置信水平下的造價區間。
以上學者通過構造不同數學模型以實現對造價區間的預測,但未詳細劃分樣本種類、實際操作較為復雜,實踐中有一定的局限性。本文參照國家電網典型造價劃分樣本類型,對相關樣本集分別設立造價區間,通過一定的統計分析方法給出區間上限和下限,并與國家電網公司發布的造價控制線對比,驗證區間合理性。造價合理區間可用以指導造價水平控制工作的順利實施,且基于可靠數據,該方法可實現對不同技術方案下的配電網工程造價合理水平的分析,具有較強實用性。
本文選取2019~2020年青海省8個地市的配電網工程造價結算數據作為樣本進行分析。其中配電工程247項、架空線路工程400項、電纜工程45項。參照《國家電網公司10kV 及以下配電網工程典型造價》工程劃分思路對數據進行分類,為避免樣本涵蓋面不足,影響分析的真實性與合理性,對于僅存在1年數據且樣本數量少于5項的工程類別,不列入本文的研究范圍。綜上,配電工程分為4種技術方案,架空線路工程分為6類技術方案,電纜線路工程分為6類技術方案。
本文結合專家經驗及相關文獻,定義至少有80%的樣本數據落入的區間為該技術方案下的配電網工程造價合理區間,即在考慮地區、技術指標差異的情況下,表示為該地區待建配電網工程的合理造價水平。
樣本數據分類:參考《國家電網公司10kV 及以下配電網工程典型造價》工程劃分思路,將近兩年配電工程樣本數據按照“變壓器容量”一項指標進行分類,架空線路工程按照電壓等級、導線類型、導線截面積三項指標進行分類,電纜線路工程按照電壓等級、電纜材質、導線芯數×截面積三項指標進行分類;計算該類型樣本數據的中位數、第一四分位數和第三四分位數,分別計算出該組數據的最大值和最小值,進而測算樣本數據的樣本均值和方差[4];利用箱線圖法剔除樣本中的異常值。剔除異常值后樣本數據更為科學、合理,本項工作為下一步進行區間計算提供了基礎數據[5]。
利用改進Chebyshev 不等式,確定將有80%的樣本數據將會處于合理區間中,即Φi={xij|μikiσi≤xij≤μi+kiσi},式中:Φi 為配電網工程第i 類技術方案下的合理區間;xij為第i 類技術方案下的第j 個數據;μi為第i 類技術方案下的樣本均值;ki為經迭代后第i 類技術方案下的區間系數;σi為第i 類技術方案下的樣本標準差。
箱線圖是利用數據中的五個統計量:最小值、第四分位數、中位數、第三四分位數與最大值來計算一組數據分散情況的數學算法。箱線圖判斷異常值的標準是以四分位數和四分位距為基礎,四分位數具有一定抗干擾性,多達25%的數據可變得任意遠而不會在很大程度上干擾四分位數,這樣使異常數據識別結果更加客觀。其公式為:

式中:QLi為配電網工程第i 類技術方案下的數據第一四分位點;QUi為第i 類技術方案下的數據第三四分位點;QIQRi為第i 類技術方案下的四分位數間距,為QLi與QUi兩數之差;QBLi與QBUi為配電網第i 類技術方案下數據檢測下界與檢測上界。當第i 類技術方案下的數據小于檢測下界QBLi或大于檢測上界QBUi時,認為該值屬于異常值。
Chebyshev 理論由19世紀俄國數學家切比雪夫提出。根據該理論,計算一個樣本數據集的平均值及方差,可得到在一定比例條件下該樣本數據集的區間分布。由于切比雪夫對于樣本數據集的普遍適用性,依據該理論研究會得到一個非常保守、粗糙的上下界。因此,本文在引入Chebyshev 理論的基礎上,采用成功失敗法優化參數,提升造價波動性大特點下的造價合理性及控制能力。對于處于任意一種分布形態的樣本數據,由Chebyshev 不等式可知,將有至少以概率P 數據處于k 個標準差范圍內,即任意一個數據集中,位于其平均數k 個標準差范圍內的比例總是至少為1-1/k2:Pi{xij|μiki0σi≤xij≤μi+ki0σi}=1-1/ki02。
式中:ki0為第i 類技術方案下的區間初值;Pi為配電網工程第i 類技術方案中的數據落入初始區間Ωi={xij|μi-ki0σi≤xij≤μi+ki0σi}的概率。當1-1/ki02=80%時,可得區間初值ki0=2.24。如計算得到的區間包括了80%以上樣本數據,則可通過調整區間初值ki0,使得造價區間趨于80%左右的樣本數據,即本文所提出的造價合理區間。
本文使用成功失敗法為參數尋優的方法,對區間初值k 進行一維無約束條件的迭代尋優。成功失敗法以區間初值ki0為迭代對象,以某一技術方案下落入合理區間的樣本數量占總樣本的比例與80%的差值作為尋優函數,即認為當該函數值無限接近0時,合理區間內包含的樣本數量愈趨近80%,此時的區間即為造價合理區間。尋優迭代從區間初值ki0=2.24開始反復搜索,直至找到目標函數的一維無約束條件尋優函數極小值minFi(k1),迭代尋優結束,并得到區間參數ki。尋優目標函數為:minFi(k1)=|num(μi-ki0σi≤xij≤μi+ki0σi)/num(zi)-80%|。式中:ki為配電網工程第i 類技術方案下的區間參數;minFi(k1)為帶入ki后第i 類技術方案的尋優函數極小值;num(μi-ki0σi≤xij≤μi+ki0σi)為第i 類技術方案下落入區間μi-ki0σi≤xij≤μi+ki0σi的樣本數量;num(zi)為第i 類技術方案下的樣本總數。
綜上,本文利用MATLAB 仿真軟件采用成功失敗法對參數k 值進行迭代尋優。設初始步長h0=-0.10,精度ε=0.005,初值ki0=2.24,當搜尋結果為成功且步長|hi|<ε 時迭代終止,得出最優解ki。
為驗證所提方法可行性,本文選取配電工程400kVA 變壓器容量作為造價合理區間的樣本進行分析,樣本數據共計46項,其最大值為652.66元/kVA、最小值為140.71元/kVA,平均值為322.24元/kVA。
異常數據的剔除。計算400kVA 變壓器容量配電工程中樣本數據的第一四分位數QL1為268.37元/kVA,第三四分位數QU1為332.72元/kVA、四分位數間距QIQR1為64.35元/kVA。由式(2)計算箱線圖檢測上界QBU1為429.24元/kVA,箱線圖檢測下屆QBL1為171.84元/kVA。根據箱線圖理論剔除異常數據6項,剩余樣本數量為40項,樣本數據區間為[202.16,409.98]。此時400kVA 變壓器容量配電工程技術方案下的樣本均值μ1=293.69,樣本標準差σ1=49.61。
區間系數k 尋優。利用成功失敗法計算k1值,400kVA 變壓器容量配電工程當迭代計算到68次時步長|h|<ε,計算終止,得到k1=1.35,此時一維無約束條件尋優函數minF1(k1)=0.00%;測算造價合理區間。將參數k 代入式(1)中,得到400kVA變壓器容量配電工程的造價合理區間下界μ1-k1σ1為226.76元/kVA,合理區間上界μ1+k1σ1為360.61元/kVA,則400kVA 變壓器容量配電工程的造價合理區間為[226.76,360.61]。
區間合理性驗證。為檢驗造價區間的合理性,本文參考《國家電網公司配電網工程通用造價10kV配電分冊》,與其典型方案單位容量靜態投資進行對比(圖1):經過與《國家電網公司配電網工程通用造價10kV 配電分冊》中的400kVA 變壓器容量配電工程典型方案單位造價對比,其所有典型方案的單位造價均在造價合理區間內,該項結果驗證了造價區間的合理性,同時也說明了本文研究方法的可行性。

圖1 400kVA 變壓器容量配電工程與國網典型方案對比情況
各類技術方案造價合理區間。將該方法應用于其他各類技術方案下的配電網工程中,得到各技術方案下配電網工程造價合理區間,并與相應典型造價進行對比。結果表明,相應典型造價均能落入利用此方法所計算的造價合理區間內(表1)。

表1 其他技術方案下配電網工程造價合理區間
綜上所述,采用箱線圖法剔除異常值的思想,可以作為實際工程數據分析的常用方法,對于消除異常數據所帶來的噪聲干擾有著一定的優勢;當樣本數據足夠大時,該合理區間計算方法可得到較為有代表性的造價區間值,為各地區控制配電網工程造價提供可靠度較高的分析依據,具有較大的實際意義。