蔣華偉 周同星
(河南工業大學信息科學與工程學院,鄭州 450001)
品質狀態的正確評估是小麥儲藏和檢測中的一個重要環節,也是糧食工作者和研究者最關心的問題,準確地判斷出小麥的品質狀態有助于糧食管理人員及時調整儲藏條件、快速處理已變質的小麥,從而降低損失、提高儲糧的安全系數。近些年來,國內學者在包括小麥在內的糧食儲藏基礎特性等方面做了大量的前期研究與探索,并取得了較大進步。如宋建民等[1]對小麥蛋白質品質和與蛋白質相關的因素如沉降值、筋力進行了研究;以及在常溫、低溫兩組糧倉內,通過多年的實驗證明脂肪酸值隨著儲藏時間按一定規律逐年升高,從而認為脂肪酸值是小麥儲藏品質控制的指標之一[2-3]。張鐘等[4]對小麥發芽前后的內部成分,如總淀粉、灰分及粗脂肪、容重和部分礦物質維生素等做了實驗研究,經過數據分析得出發芽時間、水分、還原糖等不同因素對小麥品質的影響。
這些研究工作在一定程度上給出小麥在不同儲藏時期內品質指標的變化,為小麥品質的評估奠定了基礎,但是這些研究沒有考慮小麥的各種生理生化指標在判斷小麥品質的綜合作用,僅分析單一的生理或生化指標,不能準確表達出小麥品質的真實狀態。由于小麥的不同生理生化指標具有復雜的數量關系,且具有一定的模糊性,很難精確描述和計算,所以需要對各指標進行模糊處理[5-10],再進一步融合分析獲得小麥品質的實際狀況。盡管模糊數學分析方法在小麥品質處理方面涉及不多,但它已在建筑、機械等行業有著廣泛的應用,如孫松[11]在軸承性能狀況的評價中,采用了模糊評價模型等相關模糊數學方法,對軸承進行狀態的定量化評價;黃必清[12]等也成功用模糊綜合算法評價得出多級因素中海上直驅風電組運行的狀態。這些研究工作雖然給出了對多指標因素的融合評價,但基本上都是采用專家征詢法和經驗法來確定各因素所占的權重系數,分析結果主觀性比較大。
為了能準確表達小麥的品質狀況,避免由單一因素判定和多因素集融合過程中所帶來的誤差[13-14],本研究嘗試采用一種新的評估方法,即基于小麥的多個生理生化指標數據,通過對各指標因素集標準差的分析計算,得出權重系數,再引入劣化度[15-18]和隸屬度函數,構建較為合理的小麥綜合評價模型,求得多指標融合后的小麥品質狀況,為小麥安全儲藏和評價提供一定的技術支撐。
在理論上,小麥品質評價因素的選擇需要考慮到反映小麥生理生化特性的全部指標,但是在具體的計算中,所能計算的指標有限,所以應選取代表性強、測量方便、被研究與實驗所認可的因素。本文基于以前對儲藏小麥品質評價的研究基礎,選取在小麥儲藏和評價中起重要作用的因素如下:
脂肪酸:是小麥品質變化的重要生化指標,脂肪酸含量對小麥食用品質和種用品質都有很大影響;在小麥儲藏期間,由于水解作用使脂肪酸值升高,種子生活力顯著下降,一般它在物理性狀還沒有顯示之前就已經引起品質的變化,意味著糧食劣變的開始。
降落數值:它是反映了小麥籽粒中a-淀粉酶活性大小的因素,它通過a-淀粉酶活性來顯示小麥的生化活性。
沉降值:是小麥生理品質的重要指標之一,它與小麥的高分子質量谷蛋白亞基(HMW-GS)和谷蛋白大聚體(GMP)有著顯著的相關性,與小麥面包品質有著直接聯系,反映小麥中粗蛋白含量多少和質量差異。
還原糖:是反映小麥生化活性的重要因素,還原糖含量因淀粉水解上升,隨呼吸消耗而下降。在儲藏過程中,還原糖含量上升后再下降即意味著糧食劣變的開始。
發芽率:是小麥的生理指標,隨著時間延長,種子喪失生活力,發芽率逐漸下降,一般發芽率高的小麥食用品質好,而食用品質好的發芽率不一定高,所以把發芽率當成一種參考指標。
本研究把脂肪酸值、降落數值、沉降值、還原糖和發芽率作為小麥品質評價模型的因素。
評價指標的權重反映了各因素對評價對象的重要程度,對各指標分配合理的權重是本文多指標模糊計算的關鍵。目前,在小麥品質評價的體系中關于指標因素的重要性還沒有明確的界定,即在權重中占據比例的大小還沒有統一的規定。本文從小麥的數據分布方面來構建合理的權重系數。
在獲取實驗數據前,由于不知道小麥品質的具體情況,小麥品質可能是優良,數據比較集中,標準差較小;也可能一部分品質已經發生了劣變,數據比較分散,標準差較大;而小麥指標與品質變化間隱含著某種規律,通過標準差來體現,需要由標準差來確定各指標權重系數。
因此,本研究擬根據數據內部的關系來確定各因素的權重系數,方法是分析計算因素集里的標準差的大小,若標準差較小,說明該因素的數據比較密集,它間接顯示對應指標可準確反映小麥品質狀況,就應賦予較大的權重系數;若標準差較大,則因素的數據分散,說明在指標本身或在測量過程中存在較大誤差,應賦予較小的權重系數。
由于5個因素是反映儲藏小麥品質變化的不同指標,物理含義有別,數量值差別較大,雖然每個因素數據的標準差可以獨立地反映對應指標的分散程度,但是并不能作為權重系數的指標作為計算,本文設計出一種算法來解決這個問題,具體步驟如下:
1)計算各參數的基本數據,包括各評價因素的平均值 ai,標準差 bi,縮放后的標準差 ci(i=1,2,3,4,5,分別代表降脂肪酸值、降落數值等評價因素)。
2)經計算選脂肪酸值的標準差b1=c1作為標準化的基準,將其他四個因素的標準差縮放到與脂肪酸值同一數量級。
3)求其他各因素縮放標準差ci,將ai與a1的比值作為放縮的依據,再對各標準差bi進行放縮計算,具體計算公式如下。

4)由于標準差越大的值,數據內部相關度越低,該因素數據的信服力也較低,所以把1/ci作為權重系數,組成權重系數矩陣A。

由于評價指標參數的物理意義和單位都不相同,例如文中儲糧品質的五個指標的單位、量級和物理意義明顯不同,為了能夠對這些指標因素進行綜合對比分析,應將初始數據值進行歸一化處理。考慮各指標所代表的特定物理意義,需要選擇某一指標作為統一衡量的標準,將不同量級的儲糧數據輸出到0~1之間的數值,而劣化度函數在統一度量方面有著優勢,文獻[6]和文獻[7]通過相關計算分析體現了這一作用,本文將引入并改進劣化度函數(越小越優型、中間優型和越大越優型三種劣化度函數)作為處理五個儲糧指標的算法。由于本模型評價的是一批小麥的總體品質狀況,單個小麥的數據并不能反映總體的品質特征,取該批小麥每種因素集的平均值x作為劣化度函數參數x的值,根據這五個指標參數的不同特點,分別采用下面相應的劣化度函數。
小麥脂肪酸值和降落數值會隨著時間的推移使小麥品質劣變程度變大,所以這兩個指標參數采用越小越優型的劣化度函數。計算中涉及最大值xmax和最小值xmin的估計。其劣化度函數為:

小麥的還原糖含量在儲藏過程中變化趨勢是先增加后減少,但最終含量與最初的相比,變化幅度不大,所以這個指標參數采用中間優型的劣化度函數。需要估計該變量的最佳范圍[xa,xb],其中xa和xb是由歷年小麥數據統計獲得。其劣化度函數為:

發芽率表達小麥種子的生活性,沉降值代表的是小麥蛋白含量,這兩個值越大越好,所以這兩個指標采用越大越優型函數。其劣化度函數為:

根據不同因素集的類型,由小麥的具體數據分別求出劣化度函數需要的極值和最佳范圍,再將各因素的五個平均值x分別帶入上函數,得到劣化值d=[d1,d2,d3,d4,d5]。
根據儲藏小麥品質評價的實際需要,本文在應用模糊評價方法處理時,將小麥品質狀態分為“優”“良”“中”“差”四個評價等級,建立如下評語集:

經過劣化度處理后的指標取值處于[0,1]之間,還要選取能夠涵蓋這些劣化度取值的隸屬度函數。常見的隸屬度分布函數有矩形、梯形、高斯、正態和嶺型分布??紤]到優、良、中、差四中隸屬度要互有交叉重疊的模糊區域,且希望數值在模糊區域能向兩邊靠攏得快一點,以便有較大的區分度,滿足這些條件的只有高斯分布和嶺型分布;由于高斯分布參數要求嚴格不易獲得且計算復雜,所以采用嶺型函數(升嶺型、中間嶺形和降嶺形)來計算各指標對不同評價等級的隸屬度。由嶺形函數的特性,數值較小的數據用降嶺形分布處理,數值較大的數據用升嶺型數據,中間分段的數值采用中間嶺形分布。
根據本文前面對儲糧品質的描述、劣化度的計算和嶺形函數的分布特點,對評價為優的數據應采用降嶺形分布,評價為良和中的采用中間型嶺分布,差評價的隸屬度采用升嶺型分布??紤]到隸屬函數要有一定的交叉性,并且交叉重疊率要保持在一定的范圍內,本文令交叉重疊率為0.2,如在降嶺形分布函數中,其處理的是0~0.3之間的數據。對于劣化度小于0.1的數據,令函數值為1,表示其對于優的隸屬度為100%;對于劣化度大于0.3的數據,令其函數值為0,表示其對于優的隸屬度為0;而0.1~0.3之間的數據,屬于優和良之間的模糊區間,其屬于優的隸屬度由公式(6)計算,屬于良的隸屬度由公式(7)計算。所以優、良、中、差四種評價對應的嶺形函數中互有交叉重疊,表達各數據在不同評價中的隸屬度。嶺型函數公式如下,圖1為其分布圖。
1)降嶺形分布函數如下:

2)中間嶺形分布函數如下,它分為良和中兩個部分組成:

3)升嶺形分布函數如下:


圖1 各隸屬度對應的嶺型函數
其中d是之前通過劣化度函數求出的各指標劣化度值;i=1,2,3,4,5 代表的是第 i個因素指標在某一種嶺形分布下所屬的隸屬度;j=1,2,3,4表示的是某個因素指標在第j個嶺型分布下所具有的隸屬度。綜合起來分析,rij即是第i個指標在第j個嶺形分布函數下所對應的隸屬度。
將d帶入rij(d)的函數中,每個劣化度d值均在4種嶺形計算一次,5個劣化度值分別計算可以得到一個5×4的矩陣,獲得如下的隸屬度矩陣R。
由于矩陣R是由所有因素的劣化度和隸屬度分析組成的,可以看作是對各因素的評價矩陣,由于各因素重要程度不同,所以需要對各因素加權。
由權重系數A與評價矩陣R合成對所有因素的綜合模糊評估矩陣,即通過B=AR,得到小麥品質在{優,良,中,差}狀態空間中的隸屬評價值(即最終的評估結果)。

選用河南省農科院培育的中筋麥(周麥22),高筋麥(鄭麥9023),收獲于2016年。
氫氧化鉀;無水乙醇;乙酸鈉;溴酚藍;重鉻酸鉀;硫代硫酸鈉;鄰苯二甲酸氫鉀等(試劑等級皆為CP,化學純)。
PQX型多段可編程扔氣候箱;錘式旋風磨恒溫水浴鍋;1010-3星鼓風恒溫干燥箱;HY-2調速多用振蕩器;SPX-150生化培養箱等。
將小麥清理干凈后,每500 g裝入紗布至于人工氣候培養箱進行模擬儲藏。根據測試中對水分的要求,在整個測試期間,使整個小麥濕度保持在12.5%左右,所對應的相對濕度范圍為65% ~75%,為了模擬室溫下小麥的儲藏效果,用空調、加熱器等方法,把小麥環境溫度控制在25℃左右,并與室溫儲藏進行對照。
小麥脂肪酸值根據GB/T 15684—2015測定。
小麥降落數值根據GB/T 10361—2008測定。
小麥沉降值根據GB/T 21119—2007測定。
小麥還原糖根據GB 5009.7—2016測定。
小麥發芽率根據GB/T5520—2011測定。
將這兩種小麥各分成5份,對不同指標分別測試,得到如表1和表2所示的數據。

表1 周麥22生理生化指標
本研究在生理生化指標測試前,已經對這批小麥的容重、水分,色澤、氣味等指標進行了初步的測量,實驗結果表明其品質為優良。表1和表2的指標測試值在一定的波動,但數據基本都落在合理的區間內;另外還利用實驗測試獲得各指標數據,通過文獻[19]計算評價、以及用現有標準測定方法[1,4,20]進行分析,發現對測試數據的評價結果也基本吻合。特別是本文所測量數值大都分布在文獻[19]的取值范圍附近;當然也有部分降落數值變化幅度較大和少量發芽率偏低,但對各指標數據進行綜合對比分析后,本次測試的兩種小麥品質也基本可評估為優。

表2 鄭麥9023生理生化指標
本研究主要選取表1中的5種指標參數進行處理(對表2中鄭麥數據也采用類似計算過程),分別標記為 u1,u2,u3,u4,u5,由它們構成小麥評估因素集U={u1,u2,u3,u4,u5}={脂肪酸值,降落數值,沉降值,還原糖,發芽率}。
由公式(1)可以計算出縮放后的標準差ci和對測試數據處理獲得的相關結果,顯示于表3中(下表各指標單位同表1,2)。

表3 指標因素參數
由表3得到間接反映權重系數的矩陣C。

再根據公式(3)求得權重系數A。

通過對表1的數據分析,經計算后得到劣化度函數所需要的極值和最佳范圍值,如表4所示。

表4 指標劣化度參數
將表1中的各指標參數的平均值x={22.6,415.7,54.5,0.284,87.75}分別按照函數類型代入劣度函數公式(3)(4)(5)可得出對應的劣化值d(x):

接著再將D代入隸屬度函數(6)(7)(8)(9),可以計算獲得如下隸屬度矩陣:

最后通過對權重系數A和隸屬度矩陣R的合成,可以得到評價矩陣:

同理對表2中的數據進行計算處理后也獲得如下的權重系數、隸屬度矩陣和評價矩陣:

主要對周麥22計算結果進行分析(表2中鄭麥數據的計算結果分析類同)。
在由標準差求權重系數時,發現還原糖與發芽率的標準差最小,一方面是因為在相近品質小麥中它們的測試數據比較靠攏,反映儲糧品質比較可靠;另一方面,可能是在數據的讀取和測量上比較精準。相比較而言,還原糖更能有效的表達儲糧品質。沉降值、脂肪酸值和降落數值的標準差比較大,沉降值和降落值受實驗環境影響較大,它們的測量存在著較大誤差;尤其是脂肪酸值的測試數據具有極大的不穩定情況,且它的分布與小麥品質狀況不一定具有良好對應關系,相同的脂肪酸值可能會對應不同狀況的小麥。所以脂肪酸在權重系數中占的比例最小,還原糖所占比例最大。
分析劣化度計算結果可以發現,由于它對數據的歸一化是根據數據的極值和最佳范圍值來決定的,這樣就有可能造成兩種誤差:
其一,在測量數據時,可能因操作方法的不當而獲得了一個或幾個極值數據,盡管這些數據對統計平均值造成的影響很小,但是在對數據進行歸一化時,由于公式的特性,就會造成數據整體的劣化度值偏大或偏小,這樣對該因素的整體評價就會帶來很大的影響。如本文中降落數值的最小數值330與第二小數值375的差別很大,但它的最大值和第二大值之間的差距則沒有這么明顯,最小值的偏差使得在用公式(3)計算后的降落數值劣化度趨小。
其二,在各個數據分布都較為集中時,如本文數據中的發芽率,其所有數據都極為相近,這樣在進行計算時,極大值和極小值會導致整體結果偏向于均值,原本能反映品質極好的數據,通過劣化度計算后,得到的結果可能并不真實顯示品質狀況。
綜合分析各指標的權重系數和劣化度時可以發現,其數值的大小在一定程度上呈現此消彼長相互限制的關系,具體如圖2所示。

圖2 劣化度和權重系數的關系
權重系數是由反應數據離散程度的標準差計算而出的,而劣化度受數據中的極值影響很大。在具體計算中,離散度偏大的數據會導致劣化度變大,同時其權重系數卻會變小,通過后來的加權計算,會消除這一誤差使得數據較為準確,即通過權重系數和劣化度的結合應用,在一定程度上,抵消了由于數據的離散而造成的誤差。如脂肪酸值和降落數值經計算后其標準差比較大,從而導致權重系數很低,然而它們的劣化度相對比較高,最終計算得到的數值趨于平庸,使得綜合評價結果仍比較合理。
本文提出了用數據的標準差來間接表示因素集的重要程度和用隸屬度表示指標的優良程度的方法。通過對文中數據的計算分析后發現如圖3所示的結果(規律):還原糖標準差很小,其對應優的隸屬度極高;發芽率標準差較小,其對應為優和良的隸屬度;脂肪酸值等對應的標準差很大,其對應的只是良和中的隸屬度。由此可以得出:在已知小麥品質較好的情況下,因素集的標準差越小,其對應優或良的隸屬度值越大,從而說明本文采用的由標準差計算權重系數的方法是較為合理的。

圖3 因素標準差和隸屬度的關系
圖4 表達了本文中小麥品質評價矩陣計算過程,即用數據標準差計算出的權重系數和數據劣化度計算出的隸屬度分別加權計算后得到最終的評價矩陣。
公式(13)中矩陣R的每行對應圖4中不同指標的隸屬度柱形圖,它表示各因素在優、良、中、差的隸屬程度。如矩陣R中第一行表示脂肪酸值在良和中的隸屬度分別為0.45、0.55,對應優和差的隸屬度為0,所以在圖4中脂肪酸對應良和中兩個柱狀圖。同理降落數值、沉降值、發芽率對應相應的兩個柱狀圖;由于還原糖只有優的隸屬度,所以在圖4中,還原糖僅對應評價為優的柱狀圖,其他三個柱狀圖為0。
圖4中的折線圖對應公式(11)中的權重系數矩陣A,它評價的是文中五個因素在品質狀態空間中的重要程度。
把每個因素權重系數和其對應的評價隸屬度相乘,并將這5個計算結果相加后就是評價結果;經過四次同樣運算,分別得到品質狀態對于優、良、中、差的隸屬度,具體見圖4中左上的餅圖。
根據文中對評價矩陣B的計算分析可知:b1=0.47是矩陣中數據最大的一個,由最大隸屬度原則可知小麥品質狀況屬于“優”可能性最大,對應狀態空間中的品質“優”,在圖4的餅圖中可以清楚的看到“優”所占的比例最大,這與“4.5測量結果”獲得的周麥品質接近“優”相符合。

圖4 小麥品質評價矩陣合成
表2的鄭麥9023數據經過模型計算,b1=0.49,優所占的比例最大,可以判定其品質也為優,這也與之前“4.5測量結果”中鄭麥品質基本一致。
針對儲藏小麥檢測和評估的需要,本研究通過對周麥22和鄭麥9023多生理生化指標進行了分析研究,建立了模糊融合評價模型,通過應用數據間標準差的計算降低了由劣化度所導致的誤差,最終由模糊評價獲得了儲藏小麥的品質狀況,在狀態空間中對應品質都為“優”,它顯示了計算分析模型接近真實情況,結果比較可信,在一定程度上可以為糧倉的檢測和評估提供幫助。
本研究采用五個代表性的指標,僅對它們進行了模糊融合計算分析,在分析儲糧品質狀況上還存在著一些誤差;在生物學上,這五個指標間存在著復雜的聯系,還需要對這些因素進行深入的調研,找出其生物學下的內在聯系和相關系數,由此判斷其權重系數才有更加科學的依據,這也是下一步將要研究的方向和重點。