吳曉樂,盛長霞,王永國*,季學楓
(1.安徽大學數學科學學院,安徽合肥 230601;2.安徽省畜牧技術推廣總站,安徽合肥 230001)
在試驗設計中樣本容量的優化和重復數的確定早在20世紀初期就有不少國內外的學者做過相關研究,如Cochran、Cox 和 Tukey 等[1]。1991 年 Berndston[2]運用 1938 年 Tang[3]推導的公式提出了一種簡單、快捷而可靠的確定動物試驗重復數的方法。2004年D.K.Aaron和V.W.Hays[4]總結了前人試驗的經驗,并從統計功效角度考慮種豬營養試驗中樣本量的確定。然而,基于豬用自動測定設備系統,在節省人力、測量更加準確背景下樣本的優化研究工作尚未起步。豬用選種選料自動測定設備,可以自動識別佩戴電子標簽的動物個體,系統會自動記錄其電子耳牌、體重、采食量、進出欄時間、體溫和環境溫度等測定數據并自動傳輸到電腦中,從而計算出種豬生長速度、采食量和料肉比等生長指標,以便科學分析環境和飼料等因素對生豬生長的影響,研究制定合理的飼養管理方案[5]。筆者引進自動測定設備后將每頭豬作為1個重復采集觀測數據,對與傳統上一欄舍豬作為1個觀測值是否具有可比性以及有效樣本容量如何確定等進行探討。
1.1 試驗方法[6-8]同時在傳統試驗方法和采用安徽省菩提果牧業科技有限公司生產的9SC-05型豬飼料轉化率自動測定設備下用同一日糧進行飼喂并測定。在傳統試驗方法下,選取健康、生長狀況良好的育肥豬90頭,每頭豬都打上耳號并稱重,按照隨機分配原則分成6欄,試驗結束對每欄豬進行稱重并記錄,測定數據如表1所示。使用自測設備進行試驗,選用與傳統方式飼養下品種相同的、健康、生長狀況良好的育肥豬6頭作為試驗豬,按照測定設備要求施以電子耳標,以單個豬圈單料槽自由采食,試驗結束根據系統記錄的測定數據,計算相關生長指標,具體見表2。

表1 人工試驗豬群采食量與體重情況

表2 機器試驗豬群采食量與體重統計情況
1.2 試驗周期 連續觀察并記錄豬群采食量,試驗自2012年5月11日到2012年6月12日,共32 d。
1.`飼養管理 按照豬場常規程序對試驗豬舍進行清掃消毒,對試驗豬只進行防疫;根據豬場目前的飼養方式,對試驗豬實行自由采食、自由飲水;每天隨時觀察試驗豬只的精神狀況、采食和排泄情況,如有異常立即通知獸醫進行檢查治療。在整個試驗過程中,保證試驗豬群適宜的環境溫度和濕度[9]。
2.1 必要樣本容量的確定[10]設X1,X2,…,Xn為獨立同分布隨機變量,且Xi服從均值為μ、方差為σ2的正態分布。確定必要的樣本容量,即用樣本平均數ˉX對總體平均數μ作出無偏估計,希望在一定的置信度1-α下,估計誤差不超過一定范圍d,也就是滿足以下條件:
2.2 Bootstrap方法 Bootstrap方法的基本思想為:不必對未知分布做任何假設,利用已知的小樣本通過計算機對其進行重抽樣,通過重抽樣得到Bootstrap樣本,根據Bootstrap樣本來計算統計量和估計總體的分布特征。它是一種非參數統計方法,將小樣本問題轉換成大樣本來進行統計推斷。
2.2.1 Bootstrap方法的原理。假設已經得到1組樣本觀測值 X1,X2,…,Xn獨立同分布于某一未知分布 F,θ= θ(F)為總體分布的一個待估參數,Fn為觀測樣本X1,X2,…,Xn的經驗分布函數是樣本對θ的估計,則估計誤差:R對樣本進行1次重抽樣,得到1個Bootstrap樣本,則相應的統計量為式中為Bootstrap樣本的經驗分布函數,Rn為Tn的Bootstrap統計量。當采用計算機進行大量重復抽樣后,可以得到N個Bootstrap統計量可用的頻率曲線作為Bootstrap分布的逼近,從而得到統計量Rn的分布,用Rn的分布去近似總體分布Tn,就可以得到待估參數θ=θ(F)的分布及特征。
2.2.2 Bootstrap-t法。當總體F服從正態分布,方差 σ2未知時,用樣本方差S2代替總體方差σ2,構造統計量來求得總體均值μ的置信度1-α的置信區間為如果總體分布未知,以樣本均值作為總體均值的μ估計,構造與t類似的統計量為式中是 Bootstrap樣本的均值,S*是Bootstrap樣本的樣本標準差,取分別作為的估計,則 μ 的置信度 1-α 的置信區間為
2.3 模型分析 若要了解某一品種的種豬的生長性能或行為特征,通過隨機抽樣選取N頭試驗豬,在群飼條件下將N頭試驗豬平均劃分到K個欄舍中,每組的觀測值數據是來自同一個總體的一個樣本,數據結構如表3所示。
其中,Xij(i=1,2,…,k;j=1,2,…,ni)表示第 i個組中的第j個觀察值,ni是第i組中的觀測個數表示第i組中的觀察值之和是第 i組的平均數,X··=為全部數據的總和為總平均,其中N=Σni為全部觀測值的個數。可將觀測值表示為影響觀測值大小的各個因素的效應的線性組合,而影響觀測值大小的因素可分為2種:①組間固有的偏差,這在群飼時是不可避免的;②其他隨機因素(通常未知),常稱為隨機誤差,它對每個個體的影響是不同的,可用下式表示:Xij=μ+ei+eij。式中,μ為來自同一總體的總體平均數;ei為第i組的組間偏差,Σei=0,E(ei)=0,D(ei)=;eij為隨機誤差,它是隨機變量,因此可對它作如下假設:①每個eij都服從相同的正態分布N(0,σ2),其中σ2為誤差方差。②不同eij間是相互獨立的。
組內的ni個離均差平方和為:
k個組的離均差平方和之和為:
上式可簡寫為:SST=SSW+SSB。式中,SSW為組內平方和,反映組內的變異性,是個體間的隨機誤差造成的;SSB為組間平方和,反映組間的變異性,是組間的固有差異造成的。
上述3個平方和可簡寫為:
全部數據的總自由度可剖分為組內自由度和組間自由度,即 dfT=dfW+dfB。式中,dfT=N - 1,dfB=k - 1,dfw=基于以上公式,可以得出組內均方MSW和組間均方MSB的表達式為它們的期望為:對于每個分組的均值而言:其離均差平方和為,其期望的均方為取每組的均值=1,2,…,k)作為實際的觀測數據,與相同個數的個體數據Xi(i=1,2,……,k)進行比較。由表4可知,當近似等于σ2時,相同個數的個體數據Xi可以代替均值2,…,k)作為實際的觀測數據,即在自測設備下選取k個試驗動物可以代替傳統方式下k欄舍試驗動物;當明顯小于σ2時,需要增加設備下的樣本容量,以達到傳統方式下試驗精度的要求,至于增加多少樣本容量則需要通過自助法(Bootstrap)對小樣本進行統計推斷,得到母本的均值和置信區間,進而得到估計精度,根據公式計算出設備下的樣本容量。
表4 與 Xi分析

表4 與 Xi分析
指標 平方和SS 自由度df 均方MS 期望均方EMSˉXi Σk i=1(ˉXi-ˉX)2k-11 k -1Σk i=1(ˉXi-ˉX)2 1 df B Σe2i Xi Σk i=1(Xi-ˉX)2k-11 k -1Σk i=1(Xi-ˉX)2 σ2
考慮到飼料轉化率與料重比的關系及其畜牧業中的作用,基于料重比對表1~2中數據進行進一步統計分析。

表5 人工試驗與機器試驗豬料重比分析
由表5可知,機器試驗方法下豬料重比的標準差和變異系數明顯高于人工試驗,說明組間偏差較個體差異程度可忽略不計,因此有必要增加設備下的樣本容量,以達到傳統方式下試驗精度的要求??紤]到人工試驗采集的料重比觀測值屬于小樣本,因此運用Bootstrap法對樣本進行重抽樣,總體均值μ的置信水平為1-α的Bootstrap置信區間求解步驟為:①獨立抽取N個容量為n的Bootstrap樣本,對于第 i個 Bootstrap 樣本,計算作為的估計。②將從小到大排序,得到③取分別作為的估計,從而得到的置信區間為
可通過Matlab編程來實現,程序如下:
function A=f1(X,N)
for i=1:N,
S=unidrnd(6,6,1);M=sort(X(S));A(i)=mean(M);end
取置信水平為0.95,α =0.05,N=10 000,則,于是在命令窗口中輸入:X=[3.5,3.27,3.27,3.1,3.55,3.63];A=f1(X,10000);A=sort(A);B=[A(250),A(9750)]
運行后可求得總體均值μ的置信水平為1-α的Bootstrap 置信區間為(3.241 7,3.533 3)。
設定總體服從正態分布,以樣本方差S2作為總體方差的估計σ2,總體均值μ的置信度1-α的置信區間為〔通過運行結果可知最后,解得
上述結果表明,每頭試驗豬作為1個重復,試驗設備下需要13頭試驗豬方可達到傳統試驗下的估計精度要求。
使用自測設備采集數據可以得到每頭試驗豬詳細的生長情況指標和環境指標,與傳統的群飼喂試驗相比需要抽取的樣本量可以得到優化,試驗效率得到提高。該試驗表明根據標準差、變異系數等指標,如果在傳統試驗下選取90頭試驗豬分成6欄飼養,將每一欄的平均觀測值作為1個重復所得的試驗結果,在機器試驗下只需選取13頭試驗豬就可以達到與之相同的估計精度要求。因此,用自測設備來代替人工飼養可以減少樣本容量,在取樣上減少人力和物力的投入,同時試驗周期短,節約設備資源的占用率,大大簡化后期數據的分析和處理工作。
由于客觀條件限制,該研究案例中抽取的樣本偏少,統計結果是否具有普適性還需要進一步研究。
[1]LECLERG E L.試驗設計在植物育種中的重要性[M]//作物雜種優勢與數量遺傳.重慶:科學技術文獻出版社重慶分社,1979:110-128.
[2]BERNDSTON W E.A simple,rapid and reliable method for selecting or assessing the number of replicates for animal experiments[J].J Anim Sci,1991,69:67-76.
[3]TANG P C.The power function of the analysis of variance tests with tables and illustrations of their use[J].Stat Res,1938(2):126 .
[4]AARON D K,HAYS V W.How many pigs?Statistical power considerations in swine nutrition experiments[J].J Aaim Sci,2004,82:245 -254.
[5]李鋼浦,陳欽輝.現代化設備在豬場的應用[C].中國畜牧業協會,第十屆中國豬業發展大會.2012:59-63.
[6]姚淑霞,張銅會.隨機抽樣必要樣本容量的確定方法及其應用[J].干旱區研究,2012,29(3):547 -552.
[7]夏倫志,齊云霞.家禽代謝試驗方法研究進展:(二)試驗處理重復數、內源養分與糞便收集及單一原料養分代謝率的測定[J].動物營養學報,2012,24(2):198 -203.
[8]ELIZABETH MAGOWAN.Does feeder type really matter?[J].Pig Progress,2005,21(7):18-19.
[9]于世征,顧憲紅,郝月.生產性能測定站對生長豬生產性能和行為的影響[J].中國畜牧獸醫,2013,40(10):106 -110.
[10]張勤.生物統計學[M].北京:中國農業大學出版社,2008.