劉湘云
(東南大學 機械工程學院,江蘇 南京 211189)
如今,市場上的橙汁品牌越來越多,每種品牌橙汁的營養成分基本相同,如能量、碳水化合物、蛋白質等,但含量各異,價格也大相徑庭。本文應用主成分分析法針對橙汁的各種營養成分含量相關性進行研究,對市面上常見品牌橙汁的營養成分指標進行歸納總結。主成分分析法作為分析和歸納數據類型的一種主流方法已被應用于多個領域,都取得了很好的效果。將不同品牌的橙汁營養成分指標進行主成份分析,可以在初步檢測中選取主成分中易于檢測的指標來代表整個主成分的含量,進而可以通過3個主成分含量來代表樣本整體的成分含量情況,同時也利于消費者合理地選擇橙汁的品牌,在不丟失營養的同時選擇更加經濟的商品。
本文所有的數據都收集自不同品牌橙汁外包裝,廠方自己標明的指標無法完全代表其產品中成分的含量,但是就研究而言有一定價值。對于一些未標明的成分,為了使得分析更為精確,用此類指標的平均數值進行代替,同時也能使得其對整個分析造成的影響最小。橙汁營養成分指標原始數據見表1。表中只列出了常規的特征性指標,而一些較少的指標,對于分析研究沒有很大影響,便沒有在表中列出,且當廠方標明的特征性指標處于某一范圍時,為了數據分析的準確,取其范圍中的平均值。
主成分分析法(Principal Component Analysis,PCA)也稱主分量分析或矩陣數據分析,通過變量變換的方法把相關的變量變為若干不相關的綜合指標變量。若某研究對象有兩項指標ζ1和ζ2,從總體ζ(ζ1,ζ2)中抽取了N個樣品,它們散布在橢圓平面內(圖1),指標ζ1與ζ2有相關性。η1和η2分別是橢圓的長軸和短軸,η1⊥η2,故η1與η2互不相關。其中η1是點ζ(ζ1,ζ2)在長軸上的投影坐標,η2是該點在短軸上的投影坐標。從圖1可以看出點的N個觀測值的波動大部分可以歸結為η1軸上投影點的波動,而η2軸上投影點的波動較小。若η1作為一個綜合指標,則η1可較好地反映出N個觀測值的變化情況,η2的作用次要。綜合指標η1稱為主成分,找出主成分的工作稱為主成分分析。

表1 橙汁特征性指標原始數據
可見,主成分分析即選擇恰當的投影方向,將高維空間的點投影到低維空間上,且使低維空間上的投影盡可能多地保存原空間的信息,就是要使低維空間上投影的方差盡可能地大。

圖1 主成分分析法示意
由于原始數據矩陣龐大,如對全部指標進行分析,將會導致主次要成因相混淆;若僅選其中部分指標,又可能會影響分析結果的代表性和完整性。此外,為了克服不同變量數值差異過大而造成的主成分分析誤差,按照主成分分析法要求,應對原始數據矩陣進行標準化,進而得到進行主成分分析的變量的相關系數矩陣,見表2。

表2 變量相關性
主成分分析的計算結果中,新變量所代表的方差(即對應的特征值)貢獻率和由原變量變換為新變量的線性變換系數(即對應的特征向量)就成為進行綜合分析的重點.在主成分分析中一般要求少數新變量的累積方差貢獻率應大于70%。表3、表4和表5分別給出了原始數據的公因子方差、各個主成分的解釋的總方差和主成分的計算結果,圖2則是各個主成分的特征值。
表4表明,前3個主成分積累方差貢獻率達到81%,根據主成分分析法的一般原理,可取前3個具有明顯代表性的主成分,原有的6個變量可用3個主成分表示,如表5所示。
根據橙汁特征性指標的實際狀況和主成分分析的要求,本文取前3個主成分來反映原來的6個變量,其方差的累計貢獻率已達到81.45%,3個主成分的貢獻率分別為39%、22%和20%,3個主成分在81.45%的程度上反應了某一樣本的營養成分情況與離子條件。可以認為,這3個主成分基本上能夠反映出原變量的變化所代表的橙汁營養標準。

表3 原始數據公因子方差
在第一主成分中,能量和碳水化合物兩個指數所占權系數較大,并且兩個指標變化方向一致,呈正相關,說明引起這兩個指標變化的原因相似,而處理的方式也相關。實際上,攝入碳水化合物是快速補充能量的最佳途徑,它是能量的直接來源,所以能量和碳水化合物的含量可以用第二主成分來表示,將其命名為糖能量成分。

表4 各成分解釋的總方差

表5 成分矩陣

圖2 主成分特征值(碎石圖)
在第二主成分中,蛋白質和脂肪兩個指數所占權系數較大,并且兩個指標變化方向一致,呈正相關,說明二者的來源相似,處理相近。蛋白質和脂肪所具有的能量極高,蛋白質是橙汁中脂肪的唯一來源,因而蛋白質、脂肪的含量直接決定了能量的高低,所以蛋白質和脂肪指標的含量可以用第一主成分來表示,將其命名為蛋白脂肪成分。
在第三主成分中,Na和維生素C兩個指數所占權系數較大,并且兩個指數變化方向一致,呈正相關,說明二者來源相似,處理相近。Na是人體所必須的元素,缺乏相應的鹽會導致人體不適,而維生素C也是人體必須的有機物質,必須經常從飲食中攝取,故pH值與偏硅酸含量可以用第三主成分表示,將其命名為維生素Na成分。
主成分分析法結果表明,飲用水的成分可以分為三類:第一能量成分、第二能量成分和維生素Na成分.每種成分中所包含的變量都是正相關的,故在橙汁初步檢測時,可以僅抽取主成分中的一個變量進行檢測,以代表整個主成分的含量,所得出的結論與完全檢測所有指標得出的結論相近程度達81.45%,可以大大減少初步檢測的成本和工作量。主成分分析法是進行產品質量檢測的一種很好的工具,其分析結果對橙汁生產廠家具有指導作用,同時對消費者經濟的消費也具有導向作用。數據和品牌證明,并不是純的橙汁所含的營養成分就高,也不是含營養成分高價格也高。消費者可以根據自身對營養成分的需求,合理選擇自己想要的橙汁品牌,當然,最好的營養攝入其實是直接食用新鮮橙子,無添加易吸收。
[1]汪應洛.系統工程[M].北京:機械工業出版社,2009.54~60.
[2]方開泰.實用多元統計分析[M].上海:華東師范大出版社,1989.
[3]王學仁,王松桂.實用多元統計分析[M].上海:上海科技出版社,1990.