曲志君(大慶石油管理局有限公司技術監督中心)
為了掌握設備用能水平,油氣田企業持續開展節能監測工作。但由于設備數量多,分布廣,很難做到每年全部覆蓋測試,只能通過監測其中一部分設備從而對總體的有關指標做出估計和評價[1]。因此,如何科學有效的確定監測樣本量就顯得尤為重要。基于抽樣理論,介紹一種適合油氣田節能監測抽樣的樣本量確定方法,確保樣本數量合理足夠。
抽樣方法有多種,這里介紹兩種符合節能監測特點的抽樣方法,即簡單隨機抽樣和分層抽樣。
抽樣理論中,總體是在進行統計分析時,研究對象的全部。這里指某一類設備的總量,用符號N表示。個體是組成總體的每個研究對象,即每臺耗能設備。樣本是取自總體的一個或多個個體,樣本量是樣本中所包含的設備數量,用符號n 表示。
簡單隨機抽樣是按照規定的樣本量n 從總體N中抽取樣本時,使每個可能的樣本被抽中的概率相等的一種抽樣方式,是一種最基本的隨機抽樣方法。
當總體單元數比較大,特別是總體的各個總成部分單元之間差異比較大的時候,采用簡單隨機抽樣方式獲得的樣本對總體的代表性不理想,此時宜采用分層抽樣。分層抽樣將總體分隔成互不重疊的子總體,然后在子總體中按照給定的樣本量獨立地進行隨機抽樣[2]。
抽樣前,首先需要明確總體目標量(即抽樣行為所評估的具體指標),才能更有針對性的確定樣本量。通過節能監測,我們期待得到的總體指標有很多[3]。例如,抽油機井平均電動機有功功率,加熱爐的平均排煙溫度等。無疑,最能體現設備耗能水平的指標就是效率,如機采井的系統效率,輸油泵的泵機組效率,加熱爐的熱效率等。所以,把設備運行效率作為監測抽樣的總體目標量。
根據應用統計理論,以某類耗能設備總量為總體,應用簡單隨機抽樣的抽樣方式,節能監測的樣本容量計算公式[4]如下:

式中:n——樣本量,臺;
N——整個油田某一類能耗設備總量,臺;
Δxˉ——抽樣誤差,%;
σ——總體標準差。
油氣田企業普遍地域廣大,由于地質條件不同,下屬各二級單位設備運行參數不盡相同,致使各單位整體效率差異較大。所以,宜采用分層抽樣的方法。即將整個油氣田當作總體,下屬各二級單位(采油廠)為互不重疊的子總體,然后在子總體中按照給定的樣本量獨立地進行隨機抽樣[5]。例如,某油田有10 個采油廠,可以將油田某類設備N 按采油廠劃分為10 層,即N=N1+N2+…+N10,然后在每層抽樣構成樣本,使n=n1+n2+…+n10。
為使分層樣本的代表性更好,在對層樣本量進行分配時,一般采用比例抽樣[6]。例如某油田有10個采油廠,各廠某類設備總體數量分別為N1、N2、 N10,則各廠抽取的樣本量依次為三級單位的樣本量確定方法同二級單位相同,同樣采用分層比例抽樣。
按照上述方法,計算抽油機、加熱爐、輸油泵機組節能監測樣本量。結果見表1、表2、表3(標準差為某油田歷史監測數據統計值)。

表1 抽油機監測抽樣比例統計 %

表2 加熱爐監測抽樣比例統計 %

表3 輸油泵監測抽樣比例統計 %
通過上述可以看出,對于規模較小的總體,為要有較高的精確性,需要比較大的抽樣比率;對于較大規模的總體,要達到同樣的精確度,需要較小的抽樣比率就可以了。在確定樣本容量時,需要考慮以下因素的影響:
1)待估總體參數的離散程度大小。在相同條件下,離散程度越大,則需抽出的樣本容量就越多。一般用總體標準差表示離散程度的大小。
2)置信度的大小。置信度越高,需抽出的樣本容量就越多。反之,則越少。
3)允許的抽樣誤差大小。如果能夠允許較大的抽樣誤差,則可以減少抽樣的數目,降低精度;如果要求的抽樣誤差較小,則必須增加樣本抽樣數目。
適當的樣本量是能夠滿足節能監測對誤差要求的應抽取的最少樣本單位。如果樣本量較大,就會減少抽樣誤差,提高估計總體參數的精度,但是監測工作量及投入的人力物力就會相應增加;反之,樣本量較小,抽樣誤差就會增大。為油氣田節能監測樣本量的確定提供一個思路,為總體監測結果更加準確可靠提供了理論依據。