李建青 張云云 康健


摘 要:更換變壓器工程是生產技改工程的重要組成部分,分析工程造價合理性,往往需要參考已施過的工程造價數據,在對過去樣本進行數據整理過程中,為獲得合理投資區間,需要對異常數值進行篩選剔除。本文通過3δ原則和箱線圖法對更換變壓器工程單位造價進行數據整理,獲得合理造價區間,為項目立項、投資計劃制定提供參考。
關鍵詞:更換變壓器工程;數據整理;3δ原則;箱線圖法
中圖分類號:TM73 文獻標識碼:A 文章編號:1671-2064(2018)23-0155-03
1 樣本情況
本次整理2014-2017年變壓器更換工程數據共21項,整理前各電壓等級單位造價樣本區間分別為35kV:43.15元/kVA-104.66元/kVA,110kV:52.10元/kVA-66.06元/kVA,220kV:37.26元/kVA,具體如表1所示。
由于110kV電壓等級和220kV電壓等級樣本均不大于5,本次不做區間整理,本次僅對35kV更換變壓器工程做整理分析。
電壓等級為35kV的樣本描述統計如表2所示。
數據散點圖如圖1所示。
2 整理方法
對所有技改造價數據進行的數據分析主要分為三個部分:(1)樣本的描述統計;(2)異常值剔除、異常數據分析;(3)總體的區間估計。
2.1 樣本的描述統計
統計樣本的均值、中位數、方差、標準差、極小值、極大值、范圍、四分位距、偏度、峰度、散點圖等。
軟件實現:使用spss軟件進行描述性統計分析。
2.2 異常值剔除
篩除異常值的常用方法有3δ原則和箱線圖法。
3δ原則;首先,運用樣本數據來繪制頻率分布直方圖。
其次,根據頻率分布直方圖顯示結果來擬合出概率密度曲線,并得出相應的概率密度函數。當數據服從正態分布時,根據正態分布的定義可知,μ為樣本數據的均值,δ為樣本數據的偏差。而距離均值3δ之外的概率為P(|×-μ|>3δ)<=0.003,這屬于極小概率事件,在默認情況下我們可以認定,距離超過均值3δ之外的樣本是不存在的。因此當樣本數據距離平均值大于3δ時,則認為該樣本數據為異常值。當數據不服從正態分布時,可以通過遠離平均距離多少倍的標準差來判定,多少倍的取值需要根據經驗和實際情況來決定,具體如圖2所示。
本報告數據整理采取箱線圖法。箱線圖由五部分構成,分別是最小值、中位數、最大數和兩個四分位數Q1和Q2。而篩除異常值則是去除樣本中小于Q1-1.5IQR或大于Q2+1.5IQR的數值。
第一步,計算出樣本的第一個四分位數Q1,等于該樣本中所有數值由小到大排列后第25%的數字。
第二步,計算出樣本的中位數F,等于該樣本中所有數值由小到大排列后第50%的數字。
第三步,計算出樣本的Q2,等于該樣本中所有數值由小到大排列后第75%的數字。
第四步,計算出樣本的四分位距IQR。
IQR=Q2-Q1
最后,計算出Q1-1.5IQR和Q2+1.5IQR的值,并剔除兩者區間外的異常值。
軟件實現:使用spss、python和matlab進行繪圖與計算,箱線圖兩個胡須的末端并非準確的1.5倍箱子長度,而是不超過該長度的最遠的值,所以使用python/matlab計算異常值范圍,因為造價數據為正值,對于下限為負值的改為該區間的最小值,異常值的最終確定以spss輸出的箱線圖結果為準。
異常值選出后,還需要根據具體工程對異常值進行分析,分析異常發生的原因,以減少后續技改造價數據填報的異常率。
2.3 總體的區間估計
區間估計是從點估計值和抽樣標準誤出發,按給定的概率值建立包含待估計參數的區間.其中這個給定的概率值稱為置信度或置信水平,這個建立起來的包含待估計函數的區間稱為置信區間,指總體參數值落在樣本統計值某一區內的概率。
因為很多數據的樣本量不大,總體分布未知,所以使用walsh平均順序統計量構造對稱中心的置信區間,這一方法不依賴于總體分布,能較精確的估計置信區間。
設x1,x2,…,xn (1)
為原始數據,是連續對稱的獨立同分布隨機樣本,θ為分布的對稱中心。首先計算walsh平均值:
W(·)=1≤i≤j≤n (2)
對walsh平均值升冪排列,記為W(1),W(2)W(N),N=n(n+1)。
如果給定置信度1-α,估計θ所在區間(),由下式確定
=W(N-K+1) (3)
其中:
K≈ (4)
這里Zα/2為正態隨機變量的α/2臨界值,若Φ(·)為標準正態分布函數,則1-Φ(Zα/2)=。
在施行計算時,按下列步驟進行:
1)由α查正態分布表得到Zα/2;
2)由公式(4)計算出K及N-K+1;
3)把(1)由小到大排列,依次從小到大求出(2)的第K個值W(K),再從大到小求出(2)的從后向前的第K個值,即第N-K+1個值W(N-K+1);
4)由(3)式得到()。
軟件實現:使用R軟件進行區間估計結果的計算。對于一些電壓樣本量較少,R無法計算出95%或99%的置信區間的等級與方案沒有給出區間估計的結果。
3 整理過程
3.1 異常值剔除
繪制35kV變壓器工程單位造價箱線圖并計算正常值范圍15.93元/kVA-101.8元/kVA,存在異常值1個,如圖3所示。
3.2 總體的區間估計
軟件計算結果為7.14元/kVA-72.37元/kVA(99%)。
3.3 異常數據分析
異常數據為國網安徽肥西縣供電有限責任公司2014年35kV嚴店變主變改造工程,該工程更換2臺35kV變壓器,設備費114.51萬元,而項目管理費卻高達85.3萬元,導致單位造價達到104.66元/kVA,與平均值63.22元/kVA偏離最多,應為其他費用拆分不當所致。在本次數據整理中予以剔除。
4 樣本整理結果
本次整理2014-2017年35kV更換變壓器單位造價數據共16項,整理后刪除異常數據1項,保留樣本數據15項,整理后35kV更換變壓器工程單位造價樣本區間為:43.15元/kVA -98.56元/kVA,如表3所示。
整理后35kV的樣本描述統計結果如表4所示。
35kV的總體區間估計如圖4所示。
剔除異常值后的樣本總體真值落在7.14元/kVA-72.37元/kVA的概率為99%。