對一道常見統(tǒng)計應用題解法的質疑

2020-12-23 09:42:11池明遠

中國校外教育(中旬) 2020年10期

池明遠

【摘要】學習統(tǒng)計知識時，常遇到判斷不同產(chǎn)品穩(wěn)定性的應用題，計算平均數(shù)、標準差與標準差系數(shù)本身并不困難，但對于統(tǒng)計目的與意義的理解一旦出現(xiàn)偏差，就容易因機械套用公式而導致錯誤。對一道常見統(tǒng)計應用題的解法提出了質疑，并經(jīng)過實際調研給出了不同的解答，希望與廣大師生及統(tǒng)計愛好者探討，以加強認知，提高辨析能力。

【關鍵詞】統(tǒng)計標準差系數(shù) 習題質疑

在統(tǒng)計應用題中，常會遇到通過計算標準差系數(shù)判斷不同產(chǎn)品（品種）穩(wěn)定性及推廣價值的題目。標準差系數(shù)是衡量離散程度的一個標志變異指標，它反映了變量值的離中趨勢，說明總體各單位標志值之間的差異大小或變異程度。標準差系數(shù)等于標準差與平均數(shù)的比值，在平均數(shù)差異不大時，標準差系數(shù)小的離散程度更低。此類題目實踐性強，具有很好的檢驗學習效果和訓練思維能力的作用。

一、一道常見習題及答案

某農(nóng)科站將甲、乙兩種水稻品種分別在五塊試驗田上試種，產(chǎn)量資料如下。假定生產(chǎn)條件相同。要求分別計算兩種品種的單位面積產(chǎn)量，計算兩種產(chǎn)品畝產(chǎn)量的標準差和離散系數(shù)，并分析哪一個品種具有較大的穩(wěn)定性和推廣價值。

該題及類似題目常見于數(shù)學及統(tǒng)計學課程的教材、習題集及試題中，一些學校的精品課程網(wǎng)站、復習資料中也將其作為典型試題。本文以“考試資料網(wǎng)”收錄的《統(tǒng)計學綜合練習題庫》中的解答為例進行探討。解法如下：

（1）甲品種統(tǒng)計指標計算

（3）結論

乙品種平均產(chǎn)量略高于甲品種，且V乙﹤V甲說明乙品種具有產(chǎn)量優(yōu)勢且較為穩(wěn)定，更值得推廣。

該解法被大部分教材及輔導資料作為標準答案。

二、該解法存在的問題

1.單位面積產(chǎn)量的計算不合理

本題用總產(chǎn)量除以總試驗田面積求單位面積產(chǎn)量，看似沒有問題，一般在求解平均產(chǎn)量時都這樣計算。該指標綜合反映了生產(chǎn)結果（包括土地肥沃程度，作物的優(yōu)越性，勞動生產(chǎn)率等）的一般水平，更多的是用于事后的驗證。但若在選種和對比試種階段，用這種算法計算平均產(chǎn)量，則恰恰混淆了種子的適應性。本題中，五塊試驗田的面積差異達到30～40%，占地面積較大試驗田的單產(chǎn)就會影響總體的單位面積產(chǎn)量。若較大面積的田塊相對貧瘠，則平均單產(chǎn)就會被拉低，反之則偏高。因此，籠統(tǒng)用總產(chǎn)量除以總面積，求單位面積產(chǎn)量并不合理。如果每塊試驗田的面積相等，則能夠規(guī)避上述問題。如果無法找到面積相等的試驗田，用每塊試驗田單位產(chǎn)量的算術平均數(shù)作為單位面積產(chǎn)量，更能反映種子的穩(wěn)定性和適應性。

2.試種面積影響加權平均單位面積產(chǎn)量的推演

可見，面積擴大10%后，單位面積產(chǎn)量提高了1.8%，標準差增加了8.6%。顯然，僅少量增加試種面積，由于權數(shù)發(fā)生了變化，加權平均單位產(chǎn)量隨即變化。如果將甲產(chǎn)品的試驗面積增加到6畝與乙產(chǎn)品相同，那么甲品種的平均產(chǎn)量還將進一步變化。可見，不同試驗田塊的面積大小成為了影響統(tǒng)計指標的重要因素，原本需要檢驗的種子性狀原因被干擾和模糊。

基于以上分析，筆者懷疑該解法未能真實反映平均產(chǎn)出率，尤其是在兩個品種產(chǎn)量的標準差較為接近時，該算法求得的離散系數(shù)受平均值影響較大，而平均值受到了試種面積的干擾。帶著這個疑惑，暑假期間，筆者請教了安徽省農(nóng)科院的小麥專家劉澤博士，了解了農(nóng)作物試種方面的科學知識。

三、對農(nóng)業(yè)生產(chǎn)實際的調查與理解

1.新作物試種的設計及統(tǒng)計

劉澤博士介紹，農(nóng)業(yè)科研統(tǒng)計要建立在科學的實驗設計基礎上，兩種作物的好與壞，是否值得推廣，要比較產(chǎn)量、穩(wěn)定性、抗病蟲害、抗倒伏、營養(yǎng)成分、口感等多種因素。如果兩個品種的其他性質相仿，主要考察在不同土地上的產(chǎn)量穩(wěn)定性，并據(jù)以確定推廣價值。遇到此類問題，首先，甲乙兩組選擇的試驗田要環(huán)境類似，生產(chǎn)條件盡可能相同，以方便作對比實驗;其次，農(nóng)業(yè)試驗要求有重復，一般至少3次以上，目的是為了避免單次試驗可能帶來的誤差;再次，同期試種，試驗田的選擇要有代表性，選取的5塊試驗田應涵蓋目標種植區(qū)域的主要土壤類型。試驗完成后對產(chǎn)量進行統(tǒng)計分析，在產(chǎn)量差異顯著的情況下，優(yōu)先選用高產(chǎn)品種。在產(chǎn)量差異不顯著時，應考慮廣適性，需比較兩品種的標準差與離散系數(shù)。如果某品種的變異指標值較小，則說明其穩(wěn)產(chǎn)性和生態(tài)適應性更優(yōu)。只有設計科學的對比實驗，其統(tǒng)計數(shù)據(jù)才有意義。

2.單位面積產(chǎn)量的計算與權數(shù)的確定

劉澤博士進一步介紹，事實上，每個田塊單位產(chǎn)量之間的差異，一方面是由田塊的環(huán)境因素造成的（所以對比組要求類似），另一方面是由種子性狀的穩(wěn)定性決定的（這正是試種檢驗的目的）。穩(wěn)定性與可靠性強的品種適應性好，能保持較為均衡的產(chǎn)出率，在不同地塊上的產(chǎn)量差異小，統(tǒng)計結果顯示為標準差較小、離散系數(shù)較低。反之則相反。實際中，科研人員會在每個試驗點分別計算平均單產(chǎn)，然后算出該品種所有試驗點的算術平均數(shù)，這個平均數(shù)即是各試驗點單位產(chǎn)量的集中趨勢，在此基礎上計算標準差與離散系數(shù)（也就是統(tǒng)計上的離中趨勢）。此時，不再考慮面積，不能用總產(chǎn)量除以總面積，因為假設最大產(chǎn)量的點面積特別大，其對點與點間的真實產(chǎn)量表達會形成巨大干擾。筆者查閱了相關農(nóng)產(chǎn)品試種的學術論文，發(fā)現(xiàn)在統(tǒng)計平均產(chǎn)量時，的確是將各試種點平均產(chǎn)量算術平均得來，如在《9個玉米新品種引種試種評價》一文中，科研人員即是將南寧、柳州、河池、貴港、桂林五個試種點的平均單產(chǎn)算術平均后，得到該品種的平均產(chǎn)量。

一般來說，面積大小類似的試驗田可以直接比較單位產(chǎn)量，但在面積懸殊時要考慮邊際效應。例如100畝與10個10畝的產(chǎn)量結果可能會存在10%左右的差異。本例中，假如將甲品種在100畝連片試驗田試種，而乙品種在10個10畝的試驗田試種，則必須考慮產(chǎn)量的邊際效應。小面積試種時，一般不考慮邊際影響。

四、一種符合生產(chǎn)實際的解法

根據(jù)上述調研，筆者進一步確信，本例中小塊試驗田的種植面積與單位產(chǎn)量無關，不應將其作為權數(shù)（fi）。本題每個田塊的單位產(chǎn)量（收獲率）各不相同，每個變量僅出現(xiàn)1次，可簡化為求算術平均數(shù)問題（也可理解為每個變量的權數(shù)為1）。由此，給出本題的不同解法：

（1）甲品種統(tǒng)計指標計算

（3）結論

乙品種平均產(chǎn)量略高于甲品種，且V乙﹤V甲說明乙品種具有產(chǎn)量優(yōu)勢且較為穩(wěn)定，更值得推廣。

可見，盡管結論同樣（乙品種更值得推廣），但算法和意義與常見答案都有較大差別。該算法規(guī)避了試種面積變化帶來的干擾，符合統(tǒng)計的可比性原則，也符合生產(chǎn)實際中的統(tǒng)計運用方法。

參考文獻：

[1]賈俊平.統(tǒng)計學[M].北京：中國人民大學出版社，2017.57

[2]考試資料網(wǎng)[EB/OL].

[3]龐皓，楊作廩.統(tǒng)計學[M].成都：西南財經(jīng)大學出版社，2003.66.

[4]由建勛.統(tǒng)計基礎[M].北京：高等教育出版社，2018.137

[5]覃永嬡，時成俏，覃德斌，黃安霞，王兵偉.9個玉米新品種引種試種評價[J].廣西農(nóng)業(yè)科學，2008，（9）

中國校外教育(中旬)2020年10期

中國校外教育(中旬)的其它文章: 普通高中信息技術課程改革與實踐研究; 高中語文教學中進行傳統(tǒng)文化滲透之探究; 讀書、看電視大比拼; 核心素養(yǎng)下小學道德與法治教學研究; 略論小學生法治素養(yǎng)的培養(yǎng)策略; 提高高中化學教學有效性的探討