于慧春,殷 勇,李 欣,袁云霞,吳 昊
(河南科技大學食品與生物工程學院,河南洛陽 471023)
在科學研究中,針對某個具體的指標,其影響因素往往有多個,考查多個因素及其交互作用對指標的影響,屬于多因素試驗。在多因素試驗中,找出各因素的最優水平組合,最直接且易于理解的做法就是對所有因素水平的組合都進行試驗,根據試驗指標值來確定各因素的最優水平組合[1-2]。這樣做的最大問題就是當因素數較多時,試驗次數以因素數為指數增長,隨著因素數的正交增多,試驗次數迅速增長,導致試驗災難,讓人難以接受,甚至難以完成。因此,只能減少試驗次數,從全部的試驗中選擇部分試驗來實施。那么關鍵的問題就是如何選擇部分試驗,使其既能大大減少試驗次數,又能代表全面試驗的結果。從全部試驗中“科學”地選擇“部分試驗”的過程,即“試驗設計”。常用的多因素試驗設計方法有正交設計法、參數設計法、回歸設計法、均勻設計法、混料設計法。
正交試驗設計在科學試驗中應用非常廣泛。因此,結合自己對正交試驗設計方法的理解,對正交試驗設計的特點和“正交性”的理解作一簡單的介紹。
正交試驗設計(Orthogonal Experimental Design)是一種主要的分式析因設計方法,是尋求因素水平的較優組合的一種簡單、高效、快速的試驗設計方法[3]。在正交試驗設計中,各因素的水平根據先驗知識進行確定,如此全部因素水平的組合,即在因素空間所有試驗點的分布是確定的,正交試驗設計即從所有試驗點中根據“正交性”選擇部分有代表性試驗點來實施試驗,選出的這部分試驗點,構成一張表,即“正交表”。
正交試驗設計方法就是利用已經造好了的“正交表”中各試驗點的因素水平搭配方案來安排試驗并進行數據分析即可。因此,相對來說是最簡單、最易于理解和掌握的一種試驗設計方法。
正交表具有均衡搭配、綜合可比的特點,這一特點決定其正交性,具有重要的意義。
(1)均衡搭配。任一因素的任一水平與其他因素的每一水平搭配的次數均相等。
(2)綜合可比。任一因素的各水平出現的次數相等[3-4]。
關于正交表的特點比較容易理解,以一個最簡單的三因素二水平的L4(23)正交表為例來說明。
L4(23)正交表見表1。

表1 L4(23)正交表
由表1可知,各個因素的水平均出現2次,各個因素的水平與任一因素的水平均搭配1次。因此,所選的試驗點是均衡搭配、綜合可比的。
也可以用圖來表示,以三因素三水平的試驗設計為例。
三因素三水平正交試驗設計試驗點的分布見圖1。

圖1 三因素三水平正交試驗設計試驗點的分布
由圖1可知,對應于因素A有A1,A2,A3共3個平面,同樣對應于因素B和C也各有3個平面B1,B2,B3和 C1,C2,C3,一個面代表一個因素水平,9個因素水平,所以共9個平面。圖中所有交點即全面試驗的所有試驗點,被選出構成正交表的試驗點用⊙表示。選取試驗點時,要求每個因素的每個水平都要同等看待。
由圖1可知,①這9個平面中,每個面上的試驗點一樣多,即對各因素水平的選擇次數一樣多,每一個因素每一個水平出現次數均等。這體現了對各因素水平的同等看待,即綜合可比的特點。②每個平面上都有3行、3列,每行、每列上的點一樣多,每個平面的每行每列都有一個點,而且只有一個點,因而每個平面上都恰好有3個點。這體現了所選試驗點分布的均勻性,即均衡搭配的特點。總共選用9個試驗點代表全面試驗,試驗次數大大降低。
正交表的正交性相對來說,比較難以理解,首先解釋根據正交性來選試驗點的意義,然后再來證明正交表的正交性。
正交的意義:線性代數中,“正交”是“垂直”這一概念的推廣,“正交”意味著2個向量相互獨立,不相關,即兩個向量的內積為0,如定義2個向量的夾角,則“正交”可直觀理解為兩向量“垂直”。從“正交”的基本概念可知,向量“正交”的實際意義是:向量各自包含的信息沒有重疊,不相交。由此,可以這樣來理解,整個因素空間的全部信息,分布在所有試驗點,每個試驗點都包含一部分信息,且各個試驗點所包含的信息存在交叉和重疊。因此,正交試驗設計方法的實質就是找出那些信息不重疊、不相關的試驗點,這些有代表性的試驗點即代表了因素空間的全部信息,又避免了信息重疊,這樣就能用部分的試驗次數來代表試驗的全部信息。所以,“正交表”中的試驗點就是從因素空間全部試驗點組合所選出的有代表性的試驗點,由他們所組成的試驗表,具有正交性,因此稱為“正交表”。
正交表的正交性如何體現:強調正交表的正交性的意義,那么如何體現出其正交性?弄明白這一點,對真正理解正交試驗設計方法的實質有重要的幫助作用。
正交表中每一個因素都可看作是一個向量,其各水平可以看作向量的元素(正交表中的列)[5]。正交表中各個字母,僅僅代表因素的不同水平,沒有實際的數學意義,所以可以用其他任何字符來代替,為了較直接地證明其正交性,用不同的數字或字母來替換。如2水平的正交表,可以用a和-a來分別代表其2個水平,三水平的正交表可以用a,-a和0來分別代表其3個水平,以此類推,四水平時,分別用a,-a,b,-b來分別代表其4個水平,五水平分別用a,-a,b,-b和0來分別代表其5個水平等進行這樣的替換后,正交表中任意兩列的乘積的和為0,即正交表中每一列當作一個向量,任意兩列的內積為0,以一個3水平正交表L9(34)為例(見表2),表中的3個水平分別用a,-a和0來表示。
替代后的三水平正交表見表2。

表2 替代后的三水平正交表
由表2可知,對各水平的表示方法進行替代,替代后任意兩列內積為0,換其他任何水平的正交表,均是如此。之所以有這樣的結果,正是因為在選試驗點時,所依據的均衡搭配、綜合可比的思想。依據這一思想在因素空間來選擇試驗點,保證了正交表的“正交性”,這是實現用較少的試驗來代替全面試驗的理論基礎。
依據正交性從全面試驗中選出有代表性的試驗點構成正交表,具有均衡搭配、綜合可比的特點;反之,正交表的均衡搭配、綜合可比的特點,也保證了正交表的正交性。正交表的正交性保證了所選出各個試驗點信息的不重疊,是實現用較少的試驗代替全面試驗的理論基礎。