摘 要:人均純收入是反映區域經濟發展水平的重要指標。我國土地資源和人口資源分布不均勻以及農村二三產業發展的差異性,導致農村居民家庭人均純收入的不均衡。Fisher判別法和Bayes判別法具有很強的樣本分類能力。為全面和系統地研究農村居民家庭人均純收入的情況,文章利用SPSS軟件通過Fisher判別法建立判別函數,對待判樣本進行分類,再運用Bayes判別法對樣本進行驗證。待判組的正確分組率為100%。原始樣本分類的正確率為96.43%,證明了聯合判別方法的有效性。
關鍵詞:判別分析 Fisher判別分析 Bayes判別分析 人均純收入
中圖分類號:O212.4 文獻標識碼:A
文章編號:1004-4914(2013)07-061-03
我國是農業大國,農村人口總量巨大,國民經濟要實現大的發展,就必須讓農村居民收入有顯著性的增長。就目前情況看,我國地域廣博,但土地資源和人口分布密度各個區域并不相同,而且在農村不同地域二三產業發展程度不同,共同導致農村居民家庭人均純收入的顯著差異性。而農村地區家庭人均純收入作為影響區域經濟發展水平的重要指標,對其進行研究,對地區經濟政策的制定和調整有重要的指導意義。
一、費歇判別法
(一)費歇判別法的基本思想
Fisher判別法是利用投影技術,將各組P維數據投影到某個方向,使得數據的投影組與組之間盡可能分開。
(二)費歇判別法的基本原理
從兩個總體中抽取具有P個指標的樣品觀測數據,根據方差分析的思想造一個判別函數y=c1x1+c2x2+…+cpxp,其中系數c1,c2,…,cp確定的原則是使兩組間的區別最大,而使每個組內部的離差最小。有了判別式后,對于一個新的樣品,將它的p個指標值代入判別函數中求y值,然后與判別臨界值(或稱分界點)進行比較,就可以判別它應屬于哪一個總體。
假設有兩個總體G1、G2,從第一個總體中抽取n1個樣品,從第二個總體中抽取n2個樣品,假設新建立的判別函數為y=c1x1+c2x2+…+cpxp,現將屬于不同總體的樣品觀測值代入判別函數中,得:yi(1)=c1xi1(1)+c2xi2(1)+…+cpxip(1),i=1,…n1,yi(2)=c1xi1(2)+c2xi2(2)+…+cpxip(2),i=1,…n2。
對上邊兩式分別左右相加,再除以相應的樣品個數,則有:
二、貝葉斯判別法
(一)貝葉斯判別法的基本思想
假定對研究的對象以有一定的認識,常用先驗概率分布來描述這種認識,然后我們取得一個樣本用樣本來修正已有的認識,得到后驗概率分布,各種統計推斷都是通過后驗概率分布來進行。將Bayes思想運用到判別分析中的判別方法就是Bayes判別法。
(二)貝葉斯判別法的基本原理
設有兩個總體,它們的先驗概率分別為q1、q2,各總體的密度函數為f1(x)、f2(x),在觀測到一個樣本x的情況下,可用貝葉斯公式計算它來自第k個總體的后驗概率為:
三、數據選取
(一)數據來源
數據來自《中國國家統計局網站——分地區農村居民家庭基本情況——人均純收入——2011年》。數據的含義如下:
x1:工資性收入,x2:家庭經營純收入,x3:財產性收入,x4:轉移性收入。數據表見下頁。
(二)數據分類
對于表中的數據,按照家庭人均純收入總額=7000作為劃分標準,把遼寧、天津、北京、山東、上海、浙江、福建、廣東、吉林、黑龍江、河北歸為第一組;把內蒙古、山西、河南、湖北、湖南、廣西、重慶、江西、海南、甘肅、寧夏、四川、云南、貴州、青海、新疆、西藏歸為第二組;把江蘇、安徽、陜西歸為待判樣品。
(三)數據處理
選擇使用SPSS19.0,該軟件擁有大量成熟的統計分析方法、完善的數據定義操作管理、開放的數據接口以及靈活的統計表格和統計圖形。
打開SPSS19.0選擇Type in data選項,然后按要求將原始數據輸入得到。
現在SPSS軟件中執行下列操作:
1.選擇“analyze”→“classify”→“discriminate”.
2.將左邊“組別”選入“grouping variable”分組變量中,其他的解釋變量“x1”至“x4”放入因變量中。
3.選擇【define range】,范圍為1到2,最小值輸入1,最大值輸入2,然后單擊【continue】返回。
4.選擇【Independents】,單擊【Enter independents together】,然后單擊【continue】返回。
5.單擊【statistics】,選擇“function coefficients”內所有選項,然后單擊【continue】返回。
6.單擊【classify…】,選擇“all groups equal”、“casewise results”、“within-group”,單擊【continue】返回。
7.單擊【save…】,選擇項下三欄,單擊【continue】返回,單擊【OK】確定。
(四)結果分析
總共有31個樣本,其中有28個樣本參加判別分析,3個樣本為待判樣本。
dis1_2是樣本屬于第一組的后驗概率,dis2_2是樣本屬于第二組的后驗概率。
原始數據及處理結果:
判別分析方法的判別小結,v1是原分組,dis_1是實際分組,dis1_1是判別得分,dis1_2是樣本屬于第一組的后驗概率,dis2_2是樣本屬于第二組的后驗概率。對照v1和dis_1可以看出,誤判的有一個樣品:第3號(河北),它由第2類誤判為第1類。原分組的正確分組率為96.43%,錯誤率為3.57%,待判組的正確分組率為100%。
(五)結束語
判別分析是統計科學的一個重要分支,隨著社會的進步,判別分析已被廣泛應用到社會的各個領域。本文利用判別分析對影響地區經濟增長的農村居民家庭基本情況——人均純收入,進行了比較透徹的分析。得出了以下觀點:
第一,在有多個變量影響的分類過程中,簡單的以某個方法作為分類標準,很可能會出現誤判。而用聯合方法對該分類問題進行判別就能在很大程度上避免誤判。
第二,當一個問題中所要研究的變量太多、太雜,從而使解決問題所需的計算量極大時,用多種判別方法對問題進行處理會有助于問題的解決。
第三,人均純收入對經濟發展有著重要的影響,各地方政府應根據實際情況,制定有利于本地區經濟發展的合理政策,使人民收入得到提升。
【基金項目:黑龍江科技大學教研項目,項目編號:JY13-166】
參考文獻:
1.何曉群.多元統計分析(第二版)[M].北京:中國人民大學出版社,2008
2.于秀林,任雪松.多元統計分析[M].北京:中國統計出版社,1999
3.孫文爽,陳蘭祥.多元統計分析[M].北京:高等教育出版社,1994
4.孫堯庭,方開泰.多元統計分析引論[M].北京:科學出版社,1999
5.張文彤,董偉.SPSS軟件分析高級教程[M].北京:高等教育出版社,2004
(作者單位:黑龍江科技大學理學院 黑龍江哈爾濱 150022)
(責編:賈偉)