湯胤琳+王韌+吉小明
摘 要:在編制預算補充定額的過程中,由于眾多因素的影響往往會導致基礎數據出現偏差甚至錯誤,以至于影響了定額成果的準確性。在編制定額時建立一個準確的異常數據判別體系是十分必要的,可以及時剔除異常樣本,定額成果能夠更加真實的反映實際施工生產的工作效率。
關鍵詞:預算定額;格拉布準則;異常數據
1異常數據產生原因及界定
在定額的編制過程中,樣本的準確性將決定最終定額成果的質量,保證基礎數據的準確是定額編制中很重要的一項內容。在測定原始數據時數據間會存在一定的差異,即使是同一個人、相同的機械、同樣的工作環境所測得的數據也不會完全相同。定額編制對樣本的差異范圍是有規定的,當樣本差異在一個合理范圍內時可以當做合理數據進行采用,但是當數據的差異超過某一范圍并且會影響最終結果的準確性時就會被界定為異常數據,本文以港珠澳大橋珠海連接線拱北隧道定額測定為背景,通過運用格拉布準則,對預算補充定額編制時所測定的數據進行檢測,以確定其中的異常數據。
1.1原始數據產生異常的原因
由于樣本測定人員的習慣,測定樣本時的環境以及所測對象的細微變化等原因都會給定額編制過程中所測樣本帶來誤差。另外,一些錯讀、錯記等人為原因造成的差異也會使樣本出現誤差。
經過分析可以發現,一般原始數據差異的來源并不是測定人員的差異,更多的是由于測定條件的不同以及測定對象本身的變化所引起的。歸納來說,定額測定選定工地的現場環境條件差異及觀測對象不同帶來數據差異情況非常多,具體包括:工序緊前工序的影響、某工序緊后工序時間節點硬性要求、施工設備的配置、設備的額定生產能力、現場機械利用率、機械操作人員駕齡、工作面分布情況、是否經常中斷、設計上的質量要求、機械的折舊程度、現場人員配置合理程度、機械的租賃及租金結算形式、現場地質土質情況、當地水文特征、機械操作人員年齡及身體狀況、操作人員技能熟練程度、本工序自身人機并動的影響、當地氣候特征情況、所面對工作對象地質情況、設計變更影響、前后工作關聯密切程度等。
1.2異常數據的界定
對于數據測定來說,一般可以根據數據誤差影響的性質將誤差分為3類,分別是隨機誤差、系統誤差、粗差。
隨機誤差即在相同的測定環境中對同一測定工序進行重復的測定時,各組數據之間存在的差別。系統誤差是指在分析過程中由于某些固定的因素引起的同一類誤差,它具有重復性、單向性、可測性。如果在相同的條件下,重復測定過程也會重復出現的誤差,該誤差使測定結果系統偏高或系統偏低,其誤差數值的大小也具有一定規律。粗差的含義是由測量人員的錯誤所帶來的誤差,這類誤差可以說是一種錯誤,是可以避免的。通常粗差產生的原因有測量錯誤、讀數錯誤、記錄錯誤等。這類誤差的值通常會與合理數據有較大的差異,是比較容易發現的異常數據。
2數據處理方法
數據測定人員在現場進行數據采集時,常常會受到各種方面因素的干擾,例如:測定人員的專業技能水平、施工人員的熟練程度、施工環境變化等,這些因素在不同程度上對測定成果產生影響,造成原始數據存在偏差或異常。因此,在現場測定得到的原始數據是不能直接用作定額編制的,必須經過合理的數據分析、處理和優化,才能作為定額編制的樣本數據。
2.1傳統的定額原始數據處理方法
在進行異常數據剔除時,不能憑主觀意愿和感覺來進行判斷,否則僅憑主觀判斷去剔除數據就失去了數據處理的意義。目前,我國定額編制是經常用的方法主要有以下幾個步驟:
(1)在測定數據列表中,去掉人為因素造成的具有偏差極大的數據,如:工作人員違紀、施工組織不當等。
(2)根據極限偏差原理檢驗剩余數據中是否含有異常數據,基本原理為:通過計算測定數據中的最大極限值和最小極限值來判定數列中是否存在可疑值。誤差極限算式如下:
式中:——最大極限值。
——最小極限值。
——最大測定值。
——最小測定值。
——調整系數。
——算術平均值。
公式中調整系數的取值可參考表2.1進行。
(3)計算可疑數據是否在最大極限值和最小極限值之間,若在區間內,應保留;不在區間內的數據,作為異常數據剔除。
誤差極限調整法是定額研究工作中使用最多的,也是最成熟的一種測定數據處理方法,但這種方法也具有一定的局限性,例如:調整系數的取值方法是否合理可靠、誤差的極限范圍是否合理等。
2.2基于統計原理的數據處理方法
根據拱北隧道定額測定的特點,定額測定小組采用基于統計學原理的判別準則,以達到剔除測定數列中異常值的目的,主要采用格拉布斯準則進行判別。主要思路為定額原始數據測定值服從一定的概率分布,構造統計量g,并分析g的分布函數,根據給定的顯著性水平α,計算出相應的臨界值G,有公式如下:
P(g>G)=α(2-3)
公式中,α為顯著性水平,其值可取0.01或0.05,在定額的原始數據處理中通常采用0.05。若上式成立,則該原始數據為異常數據,應當剔除;上式不成立,則為合理數據,應保留。
(1)t檢驗準則
假設測定數列χ1,χ2,χ3,χi……χn是服從正態分布N(μ,σ2)的一個隨機抽取的樣本數據。
構造統計量:
是服從自由度為(n-1)的t分布。
對測定數據進行分析,剔除異常值,可將上式簡化,以方便對原始數據的判別。
為服從自由度為(n-2)的分布。式中,和分別為剩余數列的算數平均值和樣本標準差。
給定顯著性水平α,臨界值是由顯著性水平和自由度共同確定的常數,查表可知,如測定值滿足:endprint
即
則可判定測定值為異常數據,應當剔除。
(2)格拉布斯準則
設χi,χ1≤χ2≤χ3≤χ4≤……≤χn為定額原始數據現場測定值。
構造統計量:
式中,為測定數列的算數平均值,為測定數列的標準差。
格拉布斯判別式:
即
式中,臨界值G(α,n)是由測定次數n和顯著性水平α共同確定的常數,可查表2.2確定。若上式成立,則該測定數據為異常值;上式不成立,該測定數據為合理數據,應保留。
3工程案例
本文以拱北隧道某一工序中人工工時消耗為例,闡述格拉布斯檢驗準則剔除數列中異常值的原理與步驟。
根據現場實際統計,該工作內容的工時消耗為7.280,5.327,5.579,9.120,5.480,6.143,5.468,5.923,5.977,6.093,5.212,6.959,6.909,6.035,5.069,5.930,6.862,7.370,6.893,6.190小時,共20個樣本。
采用格拉布斯準則對原始數據進行異常值剔除。測定數列按從小到大的順序進行排列:5.069,5.212,5.327,5.468,5.480,5.579,5.923,5.930,5.977,6.035,6.093,6.143,6.190,6.862,6.893,6.909,6.959,7.280,7.370,9.120,共20個樣本,將數列中殘余誤差最大的測定數據作為可疑的異常數據進行檢驗。計算測定數據數列的算數平均值及標準差:
將作為可以異常值,計算統計量:
當n=20,顯著性水平α取0.05時,查表3.7可得臨界值。
將計算得出的統計量與臨界值進行比較,可得:
故可判定最大測定數據9.120為異常數據,應剔除;對剩余的數據繼續進行檢驗,既可得知數列中不存在異常值,格拉布斯檢驗結束。
對檢驗后的數列進行平均分析,得到每完成該工作內容所消耗時間為6.142小時/7=0.877工日。
4結語
確保原始數據的準確性一直是定額編制過程中十分重要的一項內容。利用統計學原理,運用格拉布準則可以簡單、方便的找出異常數據,方法簡單且結果可靠,可使得到的定額消耗量更加接近真實。同時格拉布判別準則容易編寫成程序,為大量處理數據提供了必要條件。
參考文獻:
[1]王華,喬鵬.公路定額測定異常數據剔除方法研究[J].中外科技,2013,33(6).
[2]張巖.運用格拉布斯準則原理確定公路定額測定中不合理數據[J].科研探索與知識創新,2009,(2).
[3]廣東工業大學.拱北隧道頂管幕和凍結工法工程定額研究中期報告[R].廣州:廣東工業大學,2016.
[4]陳鎮北.暗挖隧道頂管管幕工藝工程定額研究[D].廣州:廣東工業大學,2015.
作者簡介:
湯胤琳(1990—),女,湖南湘潭,碩士研究生。
王韌(1993—),男,內蒙古烏海,碩士研究生,隧道與地下工程。
吉小明(1965—),男,江蘇興化,副教授,博士研究生,隧道與地下工程。endprint