薛建明 胡興凱
【摘要】實對稱矩陣實一類特殊的方陣,是線性代數或是高等代數課程教學過程中的重點和難點之一,本文梳理了實對稱矩陣的性質,給出了實對稱矩陣在主成分分析法中的應用,最后給出了例子來展示主成分分析法的運用,豐富了實對稱矩陣的教學內容。
【關鍵詞】實對稱矩陣? 主成分分析? 綜合評價
【基金項目】2019年云南省教育廳科學研究基金項目“矩陣奇異值與酉不變范數不等式的研究”(項目編號:2019J0350)。
【中圖分類號】O178;O177.1? 【文獻標識碼】A 【文章編號】2095-3089(2021)40-0158-02
一、實對稱矩陣的定義及其性質
在學習綜合評價和機器學習等課程的學習過程中,難免會與矩陣打交道,而實對稱矩陣更是其中常用的一類特殊矩陣。雖然實對稱矩陣的定義比較簡單:若實矩陣A滿足AT=A,則我們稱其為實對稱矩陣,但實對稱矩陣具有非常好的性質[1-3]:
(1)實對稱矩陣A的特征值都是實數,特征向量都是實向量。
(2)實對稱矩陣A的不同特征值對應的特征向量是正交的。
(3)實對稱矩陣A可相似對角化且其特征值為相似對角化矩陣對角線的元素。
(4)設λ是A的重特征值,則其幾何重數等于代數重數。
(5)實對稱矩陣A一定可正交相似對角化。
(6)設A的特征值為λn≤…≤λ2≤λ1,則對于任意的x∈Rn,都有:
λnxTx≤xTAx≤λ1xTx
二、實對稱矩陣的應用
主成分分析是一種降維方法,其思路是利用數學方法找出幾個新的變量來替代原來線性相關的變量,同時盡可能地代表原來變量的信息[4]。主成分分析的處理方法是將原來的變量做線性組合,作為新的綜合變量,首先將選取的第一個線性組合即第一個綜合變量記為F1,自然的我們希望它盡可能多的反映原來變量的信息,這里“信息”用方差來測量,即希望Var(F1)越大,表示F1包含的信息越多。如果第一主成分不足以代表原來n個變量的信息,再考慮選取第二主成分F2,為了有效的反映原來信息,F1已有的信息就不需要再出現在F2中,用數學語言表達就是要求Cov(F1,F2)=0,依此類推可以構造出第三、四……第p個主成分。
對于一個樣本資料,觀測n個變量x1,x2,…,xn,m個樣品的數據資料陣為:
X==(x1,x2,…xn)
其中:x=,j=1,2…n
主成分分析就是將n個觀測變量綜合成為n個新的變量(綜合變量),即
F1=a11x1+a12x2+…+a1nxn
F2=a21x1+a22x2+…+a2nxn
…
Fn=an1x1+an2x2+…+annxn
簡寫為:
Fj=αj1x1+αj2x2+…+αjnxn,j=1,2,…,n
要求成分之間滿足以下條件:
①Fi,Fj互不相關(i≠j,i,j=1,2,…,n)
②F1的方差大于F2的方差大于F3的方差,依次類推
③ak12+ak22+…+akn2=1,k=1,2,…n.
利用矩陣乘法可記為:F=AX
其中
F=AXF=,A==,X=
主成分F=AX的協差陣為:
Var(F)=Var(AX)=(AX)·(AX)T=AXXTAT=Λ=
設原始數據的協方差陣為V=R=XXT,若能夠滿足條件③,最好要求A為正交矩陣,即:
AAT=I
將原始數據的協方差代入主成分的協差陣公式得
Var(F)=AXXTAT=ARAT=Λ
展開上式得:
=
注意到V=R=XXT是一個實對稱矩陣,由上面的等式,我們想到矩陣A可能是實對稱矩陣的正交相似變換矩陣,對角矩陣Λ是其特征值所按降序排列之后生成的矩陣。
于是,根據實對稱矩陣的性質可知,主成分分析中的主成分協方差應該是對角矩陣,其對角線上的元素恰好是原始數據相關矩陣的特征值,而主成分系數矩陣A的元素則是原始數據相關矩陣特征值相應的特征向量。于是,解釋變量(x1,x2,…,xn)經過變換后得到新的綜合變量:
F1=a11x1+a12x2+…+a1pxp
F2=a21x1+a22x2+…+a2pxp
…
Fp=ap1x1+ap2x2+…+appxp
新的隨機變量Fi間是彼此正交的,且方差依次遞減。
接下來,我們來看看主成分分析在綜合評價方面的應用,表1 是某市人民醫院1995至1997年的醫療質量數據,采用主成分分析法對某市人民醫院1995至1997年的醫療質量進行綜合評價。
利用主成分分析法可得第一主成分:
F1=0.1656x1+0.9710x2+…+0.0543x4
第一主成分的貢獻比為98.25%,各年度第一主成分的得分分別為3.0186,5.3068,-8.325,由此可知1996年的醫療質量最好。
參考文獻:
[1]北京大學數學系前代數小組.王萼芳,石生明,修訂,高等代數(第五版)[M].北京:高等教育出版社,2019:153-154
[2]安軍,蔣婭.高等代數 [M].北京:北京大學出版社,2016:348-350
[3]丘維聲.高等代數(下冊) [M].北京:北京大學出版社,2016:198-199
[4]楊虎,劉瓊蓀,鐘波.數理統計 [M].北京:高等教育出版社,2004:199-206
作者簡介:
薛建明(1982年-),女,山東高唐人,碩士,副教授,研究方向:矩陣理論。
胡興凱(1982年-),男,山東泰安人,博士,講師,研究方向:算子不等式。