張永超,張建村
(中國航天空氣動力技術研究院,北京 100074)
Fisher判別分析方法的基本思想是投影,即將高維數據點投影到低維空間上,這樣,數據點就變得比較密集,從而可以克服由于維數較高而引起的“維數禍根”,根據類間距離最大、類內距離最小的原則確定判別函數,再依據建立的判別函數判定待判樣品的類別。
設有m個總體G1,G2…Gm相應的均值向量和協方差矩陣分別為 μ(1),μ(2),…,μ(m);ν(1),ν(2),…,ν(m)從總體 Gi中抽取容量為ni樣本為

則得到

為X(i)a在軸上的投影,其中:a=1,2,…,ni;i=1,2,…,m向量u=(u1,u2…,up)T表示P維空間中的1個方向,Y=uTX,為u與X的內積,即X在u軸上的投影,記


其中:Si就是Gi中ni個本樣 的樣本離差陳,組間差為


令,為了使φ達到最大值,且使解維一,通常附加條件使uTWu=1,于是問題就轉化為在條件uTWu=1下求使uTBu達到最大值u。為此,用拉格朗日乘數法,令

對(7)式進行求偏導,并使其為0,即

經進一步整理得到:

表明應是的最大特真值,u就是最大特征值所對應的特征向量,從而可求出判別函數。
參照許強、Guan、邵云飛和、陳偉和張永超等人關于高技術相關產業的指標體系設計,并同時遵循指標設計的數據可獲取和可操作性原則,本文確定如表1的高技術產業技術創新能力評價指標。本研究在綜合考慮數據的非保密性、時效性及權威性,根據指標體系中的所要獲取數據均來源于《中國統計年鑒》(2012年)《中國科技統計年鑒》2012年)《中國高技術產業統計年鑒》(2012年),并選取了全國30個省級區域在2011年的數據。此外,為統計上的方便,對各省進行區進行編號,如北京為1、遼寧為7等。
根據表1中指標和數據,本文運用SPSS19.0軟件對我國高技術產業各省的創新水平進行判別分析。從而輸出如下表所示。
上述表2反映了判別函數的特征值、解釋方差的比例和典型相關系數。第一判別函數解釋了62.6的方差,第二判別函數解釋了37.4方差,兩個判別函數解釋了全部方差。表3是對兩個判別函數的顯著性檢驗,由Wilks的Lambda檢驗,認為兩個函數在0.05水平上顯著
上表4是標標準化的典型判別式函數系數,從而得到標準化的判別式函數如下:
Y1=-1.204X1+1.069X2+2.459X3+4.868X4+.788X5-5.751X6
Y2=-5.067X1+10.579X2+-.066X3-3.281X4+1.132X5-2.117X6

表1 指標及統計數據

表2 特征值

表 3 Wilks’Lambda

表4 標準化的典型判別式函數系數
此外還得到最終的Fisher的線性判別式函數,如上表所示,于是根據分類函數系數可求出相慶的分類函數:

表5 分類函數系數
F1=-14.211+5.379E-5X2-5.119E-5X3-.004X4+12.765X5+7.322E-7X6
F2=-17.403-.001X1+7.339E-5X2+4.004E-5X3+40.3015-2.373E-6X6
F3=-2.973+2.136E-5X2+1.219E-5X3+13.733X5-8.015E-7X6
從而我們得到最終的分類結果如下表6所示

表6 判別結果

圖1 聚類圖
從上表可以看出,通過判別函數的預測,31個樣本的分類是正確的,其中第1組6個樣本的觀測全部判對,第二組的和第三的樣本全部預測正確,可以看出本文所構造的判別函數很好地預測了我國高技術產業創新能力分類情況。此外,從分類結果圖1可以直觀地看到三組分類可以很清晰地分開。同時根據各省的區域代碼所對應的省區發現,第一組基上為我國經濟發展水平較高的東部地區,第二組為中部次發達地區,第三組為西部發展中地區,這也我國經濟整體的區域發展水平是相符的。
通過對我國31個省區的高技術產業創新能力進行判別分析,得到的各省在高技術產業創新能力發展水評分類情況與本地區的經濟發展水平是比較相符合的,說明判別分析方法可以作為我國產業創新能力判斷的一種手段。研究結果對于政府部門及相關企業制定各自發展戰略具有一定的指導意義。
[1]陳 偉,楊早立,周 文,朗益夫.基于突變級數的知識密集型制造業技術創新能力動態綜合評價——變化速度特征的視角[J].運籌與管理,2015(1):191-201.
[2]陳 偉,楊早立,張永超.網絡結構與企業核心能力關系實證研究:基于知識共享與知識整合中介效應視角[J].管理評論,2014(6):74-82.
[3]何曉群.多元統計分析[M].北京:中國人民大學出版社,2012.
[4]許 強.知識密集型產業評價和發展研究[D].上海:復旦大學,2007:45-47.
[5]Guan,J.C.,Chen,K..Measuring the innovation production process:a cross-region empirical study of China’s high-tech innovations [J].Technovation,2010(30):348-358.
[6]邵云飛,唐小我.中國區域技術創新能力的主成份實證研究[J].管理工程學報,2005(3):71-76.
[7]陳 偉,張永超,馬一博,田世海.高技術虛擬企業合作伙伴選擇組合評價研究[J].科技與經濟,2011(3):1-5.
[8]張永超.知識密集型制造業知識產權管理系統研究[D].哈爾濱:哈爾濱工程大學,2013.