[摘 要] stata是一款強大的統(tǒng)計軟件,本文利用stata10進行審計抽樣。首先利用stata10確定屬性抽樣和變量抽樣的樣本規(guī)模,其次利用stata10創(chuàng)建隨機數(shù)表和進行等距抽樣。
[關(guān)鍵詞] 統(tǒng)計軟件stata
現(xiàn)代統(tǒng)計軟件如Eviews、spss、sas、stata等具有強大的功能,不僅能夠進行回歸等數(shù)據(jù)分析,也可以在審計抽樣中大顯身手。在審計抽樣過程中,樣本規(guī)模的確定和如何抽樣是兩個重要的問題,本文應(yīng)用stata10來解決上述兩個方面的問題。
一、運用stata確定抽取樣本的規(guī)模
根據(jù)審計測試的目的,可以把審計抽樣分為屬性抽樣和變量抽樣。由于屬性抽樣和變量抽樣的計算方法不同,具體運用stata確定樣本規(guī)模時也不同。
1.運用stata確定屬性抽樣的樣本規(guī)模
對于屬性抽樣樣本規(guī)模的確定,可以利用統(tǒng)計模型建立屬性抽樣樣本規(guī)模公式,即,其中n為樣本規(guī)模,t為可靠程度正態(tài)標(biāo)準(zhǔn)差(統(tǒng)計中用Z1-α表示),p為預(yù)計總體偏差率,E為精確度。假設(shè)t=1.96、p=0.36、E=0.04,在stata10中,我們可以輸入以下命令來確定樣本規(guī)模(>號后面為命令,在stata10中不用輸入“>”符號,下同):
>input t(輸入變量t)
>1.96(輸入t的值)
>end (輸入t值結(jié)束)
>input p (輸入變量p)
>0.36 (輸入p的值)
>input E (輸入變量E)
>0.04 (輸入E的值)
>gen n=t^2*p*(1-p)/(E^2) (產(chǎn)生變量n)
>list(查看結(jié)果)
輸出結(jié)果如圖1所示:
Input為輸入變量的命令,當(dāng)?shù)谝粋€變量輸入結(jié)束時用end命令,產(chǎn)生新的變量用gen命令,而產(chǎn)生的新變量和原有變量的關(guān)系即為新變量的計算表達(dá)式,list命令則是查看結(jié)果的命令,利用此命令即可在stata10的結(jié)果區(qū)看到最終結(jié)果。圖1即為輸出的最終結(jié)果,其中變量t、p、E是根據(jù)假設(shè)輸入的,而n則是stata10根據(jù)輸入的變量計算得出。
2.運用stata確定變量抽樣的樣本規(guī)模
對于變量抽樣樣本規(guī)模,我們將變量抽樣樣本規(guī)模公式定義為:,其中,n為初始樣本規(guī)模,SD為預(yù)先估計的標(biāo)準(zhǔn)差,ZA為可接受得誤受風(fēng)險的置信系數(shù),ZR為可接受的誤拒風(fēng)險的置信系數(shù),N為總體容量,TM為總體可容忍錯報,E為估計的總體錯報點估計值。假設(shè)SD=20、ZA=1.28、ZR=1.15、N=4000、TM=21000、E=1500,可以采用以下命令得到樣本規(guī)模n:
>input SD
>20
>end
>input ZA
>1.28
>input ZR
>1.15
>input N
>4000
>input TM
>21000
>input E
>1500
>gen n=(SD*(ZA+ZR)*N/(TM-E))^2
>list
輸出結(jié)果如圖2所示:
在圖2中,SD、ZA、ZR、N、TM和E均為輸入的變量,而n是我們需要計算的抽樣規(guī)模。在這個例子中,我們計算的抽樣規(guī)模為99.38556,約為100個樣本。
二、運用stata進行抽樣
進行審計抽樣時,在確定樣本規(guī)模的基礎(chǔ)上,經(jīng)常采用隨機選樣或者等距選樣的方法抽取樣本。利用stata可方便地創(chuàng)建隨機數(shù)表,也可以等距選擇樣本。
1.創(chuàng)建隨機數(shù)表
隨機選樣是指對審計對象總體和次級總體的所有項目,按隨機規(guī)則選取樣本。通常的做法是根據(jù)隨機數(shù)表按照一定規(guī)則進行選樣,因此,隨機數(shù)表尤為重要。在實際工作中,可以利用現(xiàn)有的隨機數(shù)表,也可以運用stata進行創(chuàng)建。假設(shè)準(zhǔn)備創(chuàng)建5×5的隨機數(shù)表,可以使用以下命令:
>set obs 5
>gen x1=uniform()
>gen x2=uniform()
>gen x3=uniform()
>gen x4=uniform()
>gen x5=uniform()
>list
輸出結(jié)果如圖3所示:
set obs命令是指產(chǎn)生的變量的列數(shù),本例中set obs 5則表明產(chǎn)生的隨機數(shù)為5列,uniform()命令表示產(chǎn)生的變量是隨機變量。從圖3中可以看出,stata創(chuàng)建了一個5×5的七位數(shù)的隨機數(shù)表。這個隨機數(shù)表的數(shù)量可以有變化,也可以創(chuàng)建6×6或者20×6的隨機數(shù)表。假如創(chuàng)建20×6的隨機數(shù)表,在命令中輸入set obs 20,并利用命令gen x6=uniform(),這樣就可以創(chuàng)建一個20×6的一個隨機數(shù)表。
2.進行等距抽樣
等距選樣是指按照相同的間隔從審計對象總體中等距離地選取樣本的一種選樣方法。采用等距選樣法,首先要計算選樣間距,確定選樣起點,然后再根據(jù)間距順序地選取樣本。假設(shè)審計人員需要抽查下表中的材料,以3為間距等距選擇樣本。
在輸入數(shù)據(jù)時,可把數(shù)據(jù)用Excel表編輯,保存成CSV格式,在stata中選擇File →Import →ASCII data created by a spreadsheet ,在彈出的對話框中Browse,找到保存的CSV文件導(dǎo)入即可。具體進行等距選樣的命令如下:
>keep if mod(xh,3)==0
>list
輸出的結(jié)果如圖4所示:
由于等距抽樣是以序號作為變量去除以間距,所以序號一列尤為重要,在命令中括號內(nèi)的變量名稱必須是序號的變量。從圖4中可以看到審計人員應(yīng)選擇材料三、材料六和材料九進行審計。
參考文獻:
王群勇:STATA在統(tǒng)計與計量分析中的應(yīng)用[M].天津:南開大學(xué)出版社,2007