摘 要:本文在對安徽人均工農產品組成成分進行調查統計的基礎上,運用主成份分析的方法,對所選工農產品進行分類分析。分析結果表明:人均工農產品主成分主要由糧食、棉花、油料等組成;糧食、茶葉和豬牛羊肉為同一類指標、棉花和糖料為同一類.
關鍵詞:人均工農產品;主成份分析;營養成分
中圖分類號:F224 文獻標識碼:A 文章編號:1674-7712 (2013) 24-0000-01
一、數據來源
本文數據來自百度文庫,安徽農業產品的原始成分表見文后附錄,農業產品成分種類多,本文僅選取7種成分進行分析。
二、主成份分析法(Principal Component Analysis,PCA)
主成份分析法也稱主分量分析或矩陣數據分析,通過變量變換的方法把相關的變量變為若干不相關的綜合指標變量。
若某研究對象有兩項指標ζ1和ζ2,從總體ζ(ζ1,ζ2)中抽取了N個樣品,它們散布在橢圓平面內(見圖1),指標ζ1與ζ2有相關性.η1和η2分別是橢圓的長軸和短軸,η1⊥η2,故η1與η2互不相關.其中η1是點ζ(ζ1,ζ2)在長軸上的投影坐標,η2是該點在短軸上的投影坐標.從圖1可以看出點的N個觀測值的波動大部分可以歸結為η1軸上投影點的波動,而η2軸上投影點的波動較小。若η1作為一個綜臺指標,則η1可較好地反映出N個觀測值的變化情況,η2的作用次要.綜合指標η1稱為主成份,找出主成份的工作稱為主成份分析[7]。
可見,主成份分析即選擇恰當的投影方向,將高維空間的點投影到低維空間上,且使低維空間上的投影盡可能多地保存原空間的信息,就是要使低維空間上投影的方差盡可能地大。
三、主成份分析法的應用
(一)原始數據的處理和標準化
由于原始數據龐大,如對全部指標進行分析,將而導致主次要成因相混淆;若僅選其中部分指標,又可能會影響分析結果的代表性和完整性.此外,為了克服不同變量數值差異過大而造成的主成份分析誤差,按照主成份分析法要求,應對原始數據矩陣進行標準化,進而得到進行主成份分析的變量的相關系數矩陣,見表1。
(二)樣本主成分分析計算結果
主成份分析的計算結果中,新變量所代表的方差(即對應的特征值)貢獻率和由原變量變換為新變量的線性變換系數(即對應的特征向量)就成為我們進行綜合分析的重點.在主成份分析中一般要求少數新變量的累積方差貢獻率應大于70%。表2、表3和表4分別給出了原始數據的公因子方差、主成份的計算結果和各個主成份的解釋的總方差.
表4表明,前2個主成份積累方差貢獻率達到94.579%,根據主成份分析法的一般原理,可取前2個具有明顯代表性的主成份.原有的6個變量可用2個主成份表示,如表4所示.
(三)結果分析
由主成份分析的計算結果可以看出,原變量的方差在新變量中的集中度很高,根據主成份分析的要求,本文取前2個主成份來反映原來的6個變量,其方差的累計貢獻率已達到94.579%,二個主成份的貢獻率分別為70.764%,23.815%;
二個主成份在94.579%的程度上反應了這些樣本成分含量條件。可以認為,這二個主成份基本上能夠反映出這些工農產品的組成成分。
在第一主成分之中,糧食、茶葉和豬牛羊肉三個指數所占權系數較大,因為兩個指標變化方向一致,呈正相關。
在第二主成分分之中,棉花和糖料兩個指數所占權系數較大,并且兩個指標變化方向相同,呈正相關。
四、結束語
主成份分析法結果表明,樣本的成份可以分為二類:糧食、茶葉和豬牛羊肉成分;棉花和糖料成分。便于從事農業生產者選擇性的進行生產社會所需要的農業產品,對農業生產者和糧食統計部門都有很大的幫助。
參考文獻:
[1]汪應洛.系統工程[M].北京:工業出版社,2009:54-60.
[作者簡介]趙俊哲(1994.02-),男,湖南邵陽人,東南大學大三學生,研究方向:系統工程。