池明遠


【摘要】學習統(tǒng)計知識時,常遇到判斷不同產(chǎn)品穩(wěn)定性的應用題,計算平均數(shù)、標準差與標準差系數(shù)本身并不困難,但對于統(tǒng)計目的與意義的理解一旦出現(xiàn)偏差,就容易因機械套用公式而導致錯誤。對一道常見統(tǒng)計應用題的解法提出了質疑,并經(jīng)過實際調研給出了不同的解答,希望與廣大師生及統(tǒng)計愛好者探討,以加強認知,提高辨析能力。
【關鍵詞】統(tǒng)計 標準差系數(shù) 習題 質疑
在統(tǒng)計應用題中,常會遇到通過計算標準差系數(shù)判斷不同產(chǎn)品(品種)穩(wěn)定性及推廣價值的題目。標準差系數(shù)是衡量離散程度的一個標志變異指標,它反映了變量值的離中趨勢,說明總體各單位標志值之間的差異大小或變異程度。標準差系數(shù)等于標準差與平均數(shù)的比值,在平均數(shù)差異不大時,標準差系數(shù)小的離散程度更低。此類題目實踐性強,具有很好的檢驗學習效果和訓練思維能力的作用。
一、一道常見習題及答案
某農(nóng)科站將甲、乙兩種水稻品種分別在五塊試驗田上試種,產(chǎn)量資料如下。假定生產(chǎn)條件相同。要求分別計算兩種品種的單位面積產(chǎn)量,計算兩種產(chǎn)品畝產(chǎn)量的標準差和離散系數(shù),并分析哪一個品種具有較大的穩(wěn)定性和推廣價值。
該題及類似題目常見于數(shù)學及統(tǒng)計學課程的教材、習題集及試題中,一些學校的精品課程網(wǎng)站、復習資料中也將其作為典型試題。本文以“考試資料網(wǎng)”收錄的《統(tǒng)計學綜合練習題庫》中的解答為例進行探討。解法如下:
(1)甲品種統(tǒng)計指標計算
(3)結論
乙品種平均產(chǎn)量略高于甲品種,且V乙﹤V甲說明乙品種具有產(chǎn)量優(yōu)勢且較為穩(wěn)定,更值得推廣。
該解法被大部分教材及輔導資料作為標準答案。
二、該解法存在的問題
1.單位面積產(chǎn)量的計算不合理
本題用總產(chǎn)量除以總試驗田面積求單位面積產(chǎn)量,看似沒有問題,一般在求解平均產(chǎn)量時都這樣計算。該指標綜合反映了生產(chǎn)結果(包括土地肥沃程度,作物的優(yōu)越性,勞動生產(chǎn)率等)的一般水平,更多的是用于事后的驗證。但若在選種和對比試種階段,用這種算法計算平均產(chǎn)量,則恰恰混淆了種子的適應性。本題中,五塊試驗田的面積差異達到30~40%,占地面積較大試驗田的單產(chǎn)就會影響總體的單位面積產(chǎn)量。若較大面積的田塊相對貧瘠,則平均單產(chǎn)就會被拉低,反之則偏高。因此,籠統(tǒng)用總產(chǎn)量除以總面積,求單位面積產(chǎn)量并不合理。如果每塊試驗田的面積相等,則能夠規(guī)避上述問題。如果無法找到面積相等的試驗田,用每塊試驗田單位產(chǎn)量的算術平均數(shù)作為單位面積產(chǎn)量,更能反映種子的穩(wěn)定性和適應性。
2.試種面積影響加權平均單位面積產(chǎn)量的推演
可見,面積擴大10%后,單位面積產(chǎn)量提高了1.8%,標準差增加了8.6%。顯然,僅少量增加試種面積,由于權數(shù)發(fā)生了變化,加權平均單位產(chǎn)量隨即變化。如果將甲產(chǎn)品的試驗面積增加到6畝與乙產(chǎn)品相同,那么甲品種的平均產(chǎn)量還將進一步變化。可見,不同試驗田塊的面積大小成為了影響統(tǒng)計指標的重要因素,原本需要檢驗的種子性狀原因被干擾和模糊。
基于以上分析,筆者懷疑該解法未能真實反映平均產(chǎn)出率,尤其是在兩個品種產(chǎn)量的標準差較為接近時,該算法求得的離散系數(shù)受平均值影響較大,而平均值受到了試種面積的干擾。帶著這個疑惑,暑假期間,筆者請教了安徽省農(nóng)科院的小麥專家劉澤博士,了解了農(nóng)作物試種方面的科學知識。
三、對農(nóng)業(yè)生產(chǎn)實際的調查與理解
1.新作物試種的設計及統(tǒng)計
劉澤博士介紹,農(nóng)業(yè)科研統(tǒng)計要建立在科學的實驗設計基礎上,兩種作物的好與壞,是否值得推廣,要比較產(chǎn)量、穩(wěn)定性、抗病蟲害、抗倒伏、營養(yǎng)成分、口感等多種因素。如果兩個品種的其他性質相仿,主要考察在不同土地上的產(chǎn)量穩(wěn)定性,并據(jù)以確定推廣價值。遇到此類問題,首先,甲乙兩組選擇的試驗田要環(huán)境類似,生產(chǎn)條件盡可能相同,以方便作對比實驗;其次,農(nóng)業(yè)試驗要求有重復,一般至少3次以上,目的是為了避免單次試驗可能帶來的誤差;再次,同期試種,試驗田的選擇要有代表性,選取的5塊試驗田應涵蓋目標種植區(qū)域的主要土壤類型。試驗完成后對產(chǎn)量進行統(tǒng)計分析,在產(chǎn)量差異顯著的情況下,優(yōu)先選用高產(chǎn)品種。在產(chǎn)量差異不顯著時,應考慮廣適性,需比較兩品種的標準差與離散系數(shù)。如果某品種的變異指標值較小,則說明其穩(wěn)產(chǎn)性和生態(tài)適應性更優(yōu)。只有設計科學的對比實驗,其統(tǒng)計數(shù)據(jù)才有意義。
2.單位面積產(chǎn)量的計算與權數(shù)的確定
劉澤博士進一步介紹,事實上,每個田塊單位產(chǎn)量之間的差異,一方面是由田塊的環(huán)境因素造成的(所以對比組要求類似),另一方面是由種子性狀的穩(wěn)定性決定的(這正是試種檢驗的目的)。穩(wěn)定性與可靠性強的品種適應性好,能保持較為均衡的產(chǎn)出率,在不同地塊上的產(chǎn)量差異小,統(tǒng)計結果顯示為標準差較小、離散系數(shù)較低。反之則相反。實際中,科研人員會在每個試驗點分別計算平均單產(chǎn),然后算出該品種所有試驗點的算術平均數(shù),這個平均數(shù)即是各試驗點單位產(chǎn)量的集中趨勢,在此基礎上計算標準差與離散系數(shù)(也就是統(tǒng)計上的離中趨勢)。此時,不再考慮面積,不能用總產(chǎn)量除以總面積,因為假設最大產(chǎn)量的點面積特別大,其對點與點間的真實產(chǎn)量表達會形成巨大干擾。筆者查閱了相關農(nóng)產(chǎn)品試種的學術論文,發(fā)現(xiàn)在統(tǒng)計平均產(chǎn)量時,的確是將各試種點平均產(chǎn)量算術平均得來,如在《9個玉米新品種引種試種評價》一文中,科研人員即是將南寧、柳州、河池、貴港、桂林五個試種點的平均單產(chǎn)算術平均后,得到該品種的平均產(chǎn)量。
一般來說,面積大小類似的試驗田可以直接比較單位產(chǎn)量,但在面積懸殊時要考慮邊際效應。例如100畝與10個10畝的產(chǎn)量結果可能會存在10%左右的差異。本例中,假如將甲品種在100畝連片試驗田試種,而乙品種在10個10畝的試驗田試種,則必須考慮產(chǎn)量的邊際效應。小面積試種時,一般不考慮邊際影響。
四、一種符合生產(chǎn)實際的解法
根據(jù)上述調研,筆者進一步確信,本例中小塊試驗田的種植面積與單位產(chǎn)量無關,不應將其作為權數(shù)(fi)。本題每個田塊的單位產(chǎn)量(收獲率)各不相同,每個變量僅出現(xiàn)1次,可簡化為求算術平均數(shù)問題(也可理解為每個變量的權數(shù)為1)。由此,給出本題的不同解法:
(1)甲品種統(tǒng)計指標計算
(3)結論
乙品種平均產(chǎn)量略高于甲品種,且V乙﹤V甲說明乙品種具有產(chǎn)量優(yōu)勢且較為穩(wěn)定,更值得推廣。
可見,盡管結論同樣(乙品種更值得推廣),但算法和意義與常見答案都有較大差別。該算法規(guī)避了試種面積變化帶來的干擾,符合統(tǒng)計的可比性原則,也符合生產(chǎn)實際中的統(tǒng)計運用方法。
參考文獻:
[1]賈俊平.統(tǒng)計學[M].北京:中國人民大學出版社,2017.57
[2]考試資料網(wǎng)[EB/OL].
[3]龐皓,楊作廩.統(tǒng)計學[M].成都:西南財經(jīng)大學出版社,2003.66.
[4]由建勛.統(tǒng)計基礎[M].北京:高等教育出版社,2018.137
[5]覃永嬡,時成俏,覃德斌,黃安霞,王兵偉.9個玉米新品種引種試種評價[J].廣西農(nóng)業(yè)科學,2008,(9)