☉華中師范大學數學與統計學學院 唐佳麗
☉華中師范大學數學與統計學學院徐章韜
正交試驗中的極差分析與方差分析
☉華中師范大學數學與統計學學院 唐佳麗
☉華中師范大學數學與統計學學院徐章韜
在社會生產和實際工作中,我們常常會遇到多因素的問題,需要找出主要因素.為了節約時間、成本,提高效率,我們通常會抓影響試驗的主要因素進行研究[1].正交試驗設計就是要求在較短的時間里,用較少的試驗次數分清影響試驗的主次因素.在“各個因素均衡分布”的指導思想下,運用標準化的正交表來安排試驗,能減少試驗次數,縮短試驗時間,并可用極差分析和方差分析對試驗數據進行整理和合理的分析,快速找到優化方案,取得較好的試驗效果,具有很強的實用性.
對中學的概率統計課程而言,我們可以在更大一點的范圍內深度挖掘教材內涵[2].在人教版高中數學選修教材中,詳細介紹了試驗設計和如何實施正交試驗設計,然而在數據的分析處理上只用了極差分析法,事實上還可以運用方差分析法處理數據.在教學實踐中,我們可以將方差分析的思想滲透給學生,從深度和廣度上拓寬學生的視野和思維,從而讓學生明白,數學的分支雖然千差萬別,但不同的數學知識之間是相關聯的.本文正是做這方面的補充,為“正交試驗設計”的教學添磚加瓦.
1.正交試驗中的相關術語
為了便于閱讀,首先需要明白正交試驗設計中的一些常見名詞.指標是指在試驗中需要考查的效果的特性值.例如,后面提到的彈簧的彈性,也就是因變量.因素也稱因子,是試驗中考查對試驗指標可能有影響的原因或要素,也就是自變量,一般用大寫字母A、B、C來表示.水平是指試驗中選定的因素所處的狀態和條件稱為水平或位級[3].全試驗指各因素各水平全部的搭配都做試驗[1].在多因素的情況下,最好能抓住主要因素,化多因素試驗為少因素試驗,以達到用較少的試驗次數取得較好效果的目的.
正交試驗之所以在一定程度上能用部分試驗去代表全試驗,主要是因為它有以下兩個特點:其一,用于試驗安排的正交表具有正交性,這就保證了不同因素的不同水平參與試驗的次數相等,不同因素的不同水平搭配出現的次數也相等,即各種因素的各種水平的搭配是均衡的;其二,正交試驗設計具有整齊可比性,也稱綜合可比性.因其具有正交性,所以任意兩種因素之間進行的是全試驗,在不考慮各因素交互作用的前提下,任一因素的各水平的試驗條件近似相同,各因素間具有可比性.
2.正交試驗實施步驟
以教材中“如何實施正交試驗設計”這一章節的例1(某五金廠在彈簧生產中,有時發生產品斷裂現象,為提高彈簧的彈性指標,要做回火工藝試驗)為例,介紹正交試驗設計的實施步驟,并在此基礎上對教材進行深一步剖析,引進方差分析,溝通極差分析與方差分析.
步驟1:制定因素水平表.
在制作因素水平表安排試驗之前,首先,我們應當考慮試驗指標與試驗目的,在此例中,試驗指標即彈簧的彈性,而目的就是提高彈簧的彈性,在實際需要中,彈性越大越好.其次,根據試驗的目的、理論及平時生產的經驗綜合分析,選擇需要考查的因素:回火溫度(A);保溫時間(B);工件質量(C),并確定好各因素的各個水平.其中,A:A1=440℃,A2=460℃,A3=500℃;B:B1=3min,B2= 4min,B3=5min;C:C1=7.5kg,C2=9.0kg,C3=10.5kg.最后,根據因素和水平制作因素水平表,見表1.

表1 因素水平表
步驟2:設計試驗方案.
根據已經制作完成的因素水平表,考慮試驗條件和實際的可操作性,選擇一張適合的三水平正交表:L9(34),因這張表最多可以考查4個因素對試驗結果的影響,而此次試驗我們只考查3個因素對試驗的影響,所以我們可任意選擇表中的3列進行表頭設計并制作試驗方案表安排試驗,見表2.

表2 回火試驗方案表
步驟3:試驗并列出試驗結果分析計算表.
列出方案表之后,就可以根據方案表進行試驗.試驗過程中,我們應特別注意:試驗的次序盡可能隨機化以減少因素間相互影響造成較大的誤差;除了我們需要考查的因素,其他的試驗條件在整個實驗過程中盡量保持相同,增大結論的可靠性;準確記錄好每一次試驗的數據.
試驗結束后,對試驗數據進行簡單的分析計算,列出實驗結果分析表,詳見表3.

表3 實驗結果分析計算表

注:表中的T表示所有試驗次數的數據之和,Ti表示各因素的第i水平所做試驗的數據之和,Ti是Ti的平均數,即各因素的第i水平所做試驗的數據的平均數,R表示各因素Ti的最大值和最小值之差,即Ti的極差.
1.數據的直觀分析——極差分析
由于正交試驗具有正交性和綜合可比性,以A因素為例,雖然在試驗中與B、C因素的搭配不同,但A因素的同一水平下的B、C因素處于相同的地位,其不同水平的效應也可以近似抵消.如此,我們就可以把TAi(A因素的i水平數據的平均數)的數據變化大體看成是由A因素的不同水平引起的,則RA就能近似看成A因素的水平變化能引起整個試驗產生變化的程度,RA的值越大,說明A因素對整個試驗的影響越大,此因素對于試驗越重要[1].反之,就說明A因素對整個試驗的影響越小,屬次要因素.B、C因素的比較與A因素同理,這就是極差分析法的原理.
用極差分析進行分析,我們可以較為直觀地比較出來此次試驗的主次因素,并通過簡單的對比找出最優水平的搭配.此例中,RA>RC>RB,所以A是影響試驗的主要因素,B為次要因素.另外,我們可以根據TAi的數據大小選擇使彈性指標最大的A因素的水平:A1,用相同的方法選出B1、C2,得到的搭配A1B1C2為最優水平的搭配,即回火溫度為400℃,保溫時間為3min,工件質量為9.0kg為最佳搭配.
當然,在簡單的數據之間進行比較,使用圖示會更清晰明了,將極差的數據利用極差的效果對比圖表示出來,可以更直觀地得到結論,如圖1.

圖1各因素極差對比圖
從圖中可以看出,對試驗影響最大的因素為A,在各因素確定的各個水平上,使得y軸上數值(試驗數據:彈性指標)最大的水平分別為:A1、B1、C2,故最優搭配為A1B1C2.
極差分析原理簡便,通俗易懂,在分析數據中起到了一定的作用,但這種分析方法的局限性很強:雖然我們可以將所有考查的因素進行主次的排序,得到了主要因素,但這種因素對試驗的影響是否顯著,在何種水平上顯著,我們仍然一無所知.而且,引起試驗數據變化的來源也十分模糊,我們并不知道數據的波動究竟是由于因素的改變(可以解釋的誤差),還是由于試驗的隨機誤差(未被解釋的誤差),在多大的程度上依賴于這兩種誤差?因此,這種分析從數學意義上就顯得過于粗糙,引進方差分析正是為了解決這一問題.
2.數據的方差分析
教材中并沒有對方差分析進行介紹,但在“試驗為什么要設計”這一章節中提到:“英國學者R.A.Fisher提出了方差分析方法,創立了‘試驗設計’”[1].既然教材中有所提及,并說明了方差分析在試驗設計中的地位,教師就有必要挖掘教材的內涵進行拓展,架起溝通極差分析和方差分析之橋,完善學生的數學認知結構,使教學內容既能符合教學需要,又能促進學生的發展.
方差分析是分類變量與定距變量之間的相關性分析[2],通過分析各因素引起的數據波動較誤差引起的數據波動的差異程度,來推斷相應因素不同水平總體均值差異的顯著性.所以我們有必要對試驗數據進一步計算其相應的離差平方和與誤差平方和,見表4,其中,ST為總離差平方和,SE為誤差平方和.

表4 方差分析計算表
表中相應的數據計算公式和計算過程如下(r是各因素的水平數,ni表示各因素i水平參與試驗的次數):

當正交表中出現空白列,則誤差平方和就等于總平方和減去各因素平方和;而當正交表的列數充分使用時,即每列都使用,誤差平方和就選擇各因素平方和中最小的一個.
由以上的計算結果我們可以列出一個方差分析表,見表5.

表5 方差分析表
注:均方和等于平方和除以相應的自由度,F比等于因素均方和除以誤差均方和.
顯然,F的比值越大,其相應的因素對試驗的影響程度越高,故能根據F比的大小排列出因素的主次程度.但僅僅有因素主次的排列是不夠的,極差分析也正好止步于此,而方差分析能進行進一步的分析.在方差分析中,看各因素對試驗的影響是否顯著,在何種顯著性水平上顯著只需比較相應的F比值與各顯著性水平的臨界值的大小.若因素F比超過了某一顯著性水平的臨界值,則此因素在此顯著性水平上顯著,反之,我們就認為此因素在此水平上無顯著特征.這樣,我們就能深入地分析各因素對試驗的影響程度.
從上面的分析表中可以看出FA=67.6>F(2,2)0.10=9.0,FA=67.6>F(2,2)0.05=19.0,A因素對試驗的影響無論是在0.1的顯著性水平上,還是在0.05的顯著性水平上都表現為顯著,所以我們有理由相信A因素是顯著性因素.而C因素不僅在0.05的水平上不顯著,在0.10的水平上也不顯著,所以C因素在試驗中對試驗的影響很小.B較C更是對試驗的影響不顯著,因此在選擇最優搭配的時候,我們可以從環保、節約時間、降低成本,方便操作等角度綜合考慮,如B2因素節約材料,操作簡單,故在試驗中選擇B2水平是較合理的,這時得到的最優水平的搭配A1B2C2較用極差分析法得到的最優搭配A1B1C2更符合實際的需要,也更具有現實意義.當然,如果在操作或技術層面的區別十分微小,就選擇使彈性指標值最大的因素水平,此時最優搭配亦為A1B1C2.
通過分析確定的最優搭配A1B1C2并不在之前所做的9次試驗當中,而9次回火試驗中,試驗結果最好的是第2次試驗,彈性指標為391,因而我們要對選擇的最優搭配進行試驗驗證.通過試驗,其試驗結果指標為400,高于第2次試驗的試驗指標值391,則認為A1B1C2是滿意的,也證實了A1B1C2是最優的水平搭配.
通過對“正交試驗設計”的闡述,我們可以看出,極差分析法思想樸素,原理單純,能根據各因素的極差大小排列出因素的主次順序,學生學習起來困難并不大.然而這種比較方法的精度并不高,教師若能在此基礎上進一步引導學生思考誤差的來源,自然而然地將方差分析的思想和方法融入課堂,彌補極差分析之不足.這也要求在平時的實際的教學中,教師要縱觀數學和課堂的全局,有意識地挖掘教材,使教學內容豐富多彩,使學生的數學認知結構日益精進.另外,教科書的編寫者花了大量心血編寫了通俗易懂、致力于提高學生核心素養的選修教材,若不加強教學研究,任之束于高閣,絕非課程改革的本意,故我們以溝通極差分析與方差分析為主題,撰寫了小文.
1.課程教材研究所.普通高中課程標準試驗教科書(B版)數學選修4-7[M].北京:人民教育出版社,2007.
2.徐章韜,趙宏.作為數學教育研究數據處理的方差[J].中學數學(上),2016(2).
3.徐仲安,王天保,李常英.正交試驗設計法簡介[J].科技情報開發與經濟,2002(7).F