宋贄 陶桂洪 惠淑榮 張闞 李麗鋒 于淼

摘要:以應用統計課程為依托,基于網絡教學平臺,以稻米中總砷含量的統計監控為研究背景,設計用于稻米總砷質量監測的非參數控制圖。介紹質量控制圖的設計理論、思路和應用方法,提高學生利用統計方法分析解決問題的能力。
關鍵詞:應用統計;實驗教學;質量控制圖;總砷含量
中圖分類號:G424.1????文獻標識碼:A????文章編號:1674-1161(2019)06-0086-03
應用統計學是一門重要的專業基礎課程,然而,由于實驗室建設、實踐基地建設和師資力量不足,課程存在“重理論、輕實踐,重方法、輕應用”的問題,教學偏離實際。以應用統計課程為依托,在學生掌握統計學基本原理、方法的基礎上,以設計稻米中總砷含量的質量控制圖為例,從案例背景、目標、內容和實施方案,介紹質量控制圖的設計理論和應用方法,培養學生解決實際問題的能力。
1 稻米中總砷含量監測研究進展
在質量控制和管理中,統計質量控制起核心作用。我國人民的主食以稻米為主,砷長期在人體內積累,易造成砷中毒,導致皮膚、腎等機體的癌變。及時進行稻米中總砷含量的系統監測和風險預警,是保障居民生活質量的重大舉措。
傳統上,研究分析人員假定已知過程分布的函數形式,并基于已知過程分布構造監控過程參數的控制圖,即參數控制圖。隨著大數據信息化時代的到來,大多數的數據流常因流程復雜而難以確定確切的分布,因此許多研究者主張使用非參數的質量控制圖。非參數控制圖大多基于不同時間點采集的過程數據的秩信息,或者基于數據分類。Qiu比較全面地分析了傳統控制圖的穩健性,以及非參數控制圖的優點和局限性。
對于正態總體,正態理論基礎上的檢驗許多都是一致最優勢檢驗(Uniformly?Most?Powerful?Test,UMPT),但很多情況下UMPT不一定存在。此時,可用局部最優勢檢驗(Locally?Most?Powerful?Test,LMPT)。例如,最常用的非參數Wilcoxon秩和檢驗法就是對于logistic分布的LMPT。但是,由于過程分布是未知的,較優的方法是給出不同檢驗,針對不同類型的分布具有較高的勢,然后使用受控樣本數據得到關于過程分布信息,如尾重、偏度等。選擇合適的非參數檢驗過程稱為“自適應”,是指根據受控數據樣本判斷過程分布類型,然后選擇適合的檢驗進行推斷。目前,已有很多學者對自適應檢驗進行研究,但用于稻米中總砷含量監測的自適應非參數控制圖尚未見報道。
2 稻米總砷含量監測控制圖的設計
2.1 設計目標
針對稻米中總砷含量分布的變化,設計能夠根據可控樣本信息(過程分布的尾重、偏度等)自適應選擇非參數檢驗統計量的質量控制圖,解決其沒有有效的利用樣本信息的缺點,提高非參數控制圖的效率,為稻米中總砷含量的有效監測及風險評價提供全新的理論方法。
2.2 設計思路
基于可控樣本,根據尾重和偏度兩方面指標,對稻米中總砷含量的分布進行分類,一般可分成4大類:對稱短尾、對稱中尾、對稱長尾、偏態分布。如何找到各個類別之間的分界點,是研究的關鍵點。可以先根據已有文獻初步確定各個類別的閾值,再結合專業理論和大量統計模擬,通過控制圖的性能表現,設計出對不同類型的過程分布性能有較好自適應的非參數控制圖。
選擇合適的非參數統計量至關重要。不合適的檢驗會降低自適應控制圖的性能。對不同類型的總體分布設計自適應控制圖,使其性能更好。具體來說,使用什么選擇統計量,選擇哪些具有不同檢測優勢的檢驗統計量,有沒有定性方法可循,都是需要詳盡研究的內容。經過前期研究發現,對于不同類型的過程分布,基于該分類里代表性分布的局部或者漸近局部最優勢檢驗,能夠取得比較好的檢測性能。例如,logistic檢驗統計量對于中尾對稱分布的位置參數和尺度參數檢驗具有較高的勢。
2.3 實施方案
1)?考慮未知過程分布情況,利用已有樣本(至少50個可控樣本),通過公式估計過程分布的分位數,得到尾重和偏度兩個重要指標。由尾重和偏度對過程分布進行分類,如對稱短尾、偏態長尾等,選擇適合的非參數檢驗統計量。
2)?選擇合適的非參數檢驗統計量是本案例的關鍵問題。針對不同類型的過程分布,選擇相應的漸近局部最優勢檢驗,對該類型分布具有較高的勢,從而提高非參數控制圖的檢測效率。例如:對對稱分布來說,如果短尾,選擇Gastwirth檢驗;如果中尾,選擇正態計分檢驗或者Logistic計分檢驗;如果長尾,選擇Bu?ning和Thadewald提出的LP3檢驗。對于非對稱分布來說,可以選擇Hogg-Fisher-Randles計分檢驗或者Savage計分檢驗。
3)?非參數檢驗統計量是基于檢驗的漸近性質,如漸近勢函數。但是在實際應用時,都是有限樣本甚至中小樣本,稻米中總砷含量監控的大樣本是不現實的。基于中小樣本的結論和漸近理論可能會有一定差異,需要通過大量統計模擬輔助研究,得到有限樣本的修正方法,及時調整設計方案,以便更適合實際應用。
4)?利用R、Fortran和Matlab軟件,基于統計模擬和計算技術,比對控制圖和已有非參數控制圖的總體分布和不同類型漂移下的性能,以選擇不同監控任務時的最優控制圖。實驗方案的技術路線如圖1所示。
3 結論
應用統計課程的實驗教學內容應選擇具有一定現實背景的學習材料,設計能夠理論聯系實際的實驗教學案例,從而提高學生的學習興趣和分析解決實際問題的能力。提出個基于質量控制圖監控稻米中總砷含量的實驗研究案例,從案例背景、目標、內容和實施方案4個方面進行詳細論述,使學生在學習統計方法的同時,實現對統計知識的應用,提高學生的學習興趣,初步培養學生獨立科研的能力。
收稿日期:2019-09-26
基金項目:沈陽農業大學教育教學研究項目(2018-84,2018-31,2018-236,2018-98,2018-143);中華農業科教基金教材建設研究立項項目(NKJ201801008);遼寧省普通高等教育本科教學改革研究項目立項優質教學資源建設與共享項目(2018—77);沈陽農業大學綜合改革一般項目(2018-yjs-11)
作者簡介:宋 贄(1982—)女,講師,從事應用統計教學研究。
通信作者:陶桂洪(1980—),男,講師,從事高級數學教學研究。
參考文獻
[1]?王麗.農田土壤重金屬污染現狀及防治對策[J].新農業,2019(3):21-21.
[2]?王夢令,梅汝煥,厲旭云,等.在線課程和現場實驗相結合提高學生的綜合能力[J].實驗室研究與探索,2017,36(5):174-177.
[3]?熊強.統計學專業實驗課程設置的改革與探索[J].教育教學論壇,2018(21):210-211.
[4]?SONG,?Z.,?MUKHERJEE,?A.,?LIU,?Y.,al.?Optimizing?joint?location-scale?monitoring?-?an?adaptive?distribution-free?approach?with?minimal?loss?of?information[J],?European?Journal?of?Operational?Research,?2019(274):1019-1036.
[5]宋贄,何川,張久軍.一種可用于檢測過程尺度參數的非參數控制圖[J].數理統計與管理,2019,38(4):652-660.
[6]?QIU,?P.?Some?perspectives?on?nonparametric?statistical?process?control[J].Journal?of?Quality?Technology,?2018,50(1):49-65.
The?Application?of?Quality?Control?Chart?in?the?Teaching
of?Applied?Statistics?Course
——Take?the?Monitoring?of?Total?Arsenic?Content?in?Rice?as?an?Example
SONG?Zhi,?TAO?Guihong*,?HU?Surong,?ZHANG?Kan,?LI?Lifeng,?YU?Miao
(College?of?Science??Shenyang?Agricultural?University,?Shenyang?110866,?China)
Abstract:?Based?on?the?course?of?applied?statistics?and?based?on?the?network?teaching?platform,?the?statistical?monitoring?of?total?arsenic?content?in?rice?taken?as?the?research?background,?a?non-parametric?control?chart?for?total?arsenic?quality?monitoring?in?rice?was?designed.?This?paper?introduces?the?design?theory,?idea?and?application?method?of?quality?control?chart,?and?improves?students'?ability?to?analyze?and?solve?problems?with?statistical?methods.
Key?words:?applied?statistics;?experiment?teaching;?quality?control?chart;?total?arsenic?content