帕提古麗·木沙
摘要:數學、統計學及物理學等多學科領域中均是隨機矩陣理論的活躍研究領域,并且發展迅猛。現如今,隨機矩陣理論及其應用范圍十分廣泛,其在多元統計分析中應用的研究也得到了越來越多的專家學者的關注。本文就隨機矩陣理論的研究背景、目的意義及發展趨勢進行了粗淺分析,以探究隨機矩陣理論在高維多元統計分析的檢驗問題中的應用問題,為發掘隨機矩陣理論更多的應用研究價值提供新思路。
關鍵詞:隨機矩陣理論;多元統計分析;檢驗問題
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2016)32-0200-02
一、隨機矩陣理論的研究背景
隨機矩陣理論在發展的早期研究階段主要用于科研探索研究,在數學和物理等學科得到廣泛應用。隨著隨機矩陣理論的進一步深入研究,隨機矩陣理論被應用到股市的價格波動預示,乃至后來對于金融資產收益、醫學生理信號、磁場電子運動等方面的研究探索。隨著隨機矩陣理論被廣泛應用于解決一些科學研究或工程實踐等問題,國內外對于隨機矩陣理論的研究均有了突破性進展。國內外均有對于隨機矩陣理論與頻譜感知進行科學連接的研究。
二、隨機矩陣理論研究的目的意義及發展趨勢
隨機矩陣意味著所有的元素都是隨機變量。隨機矩陣理論主要是研究在滿足某些條件時隨機矩陣的特征根的性質。其中統計中的樣本協方差矩陣是隨機矩陣理論中的一類重要研究對象,并且由于目前現實生活中高維數據的大量出現,利用隨機矩陣理論去進行高位數據的分析越來越流行。隨機矩陣理論自從被提出來后,受到了無數的不同領域的學者的關注。首先是數學家,原因是本身對于矩陣各種性質的研究就是數學家們關心的重點,而更重要的是隨機矩陣理論與數學上備受關注的黎曼猜想有著大量的數值證據關聯。目前已經有大量的研究數據表明,黎曼ζ函數的非平凡零點的分布可以用任何一個典型隨機厄爾米特矩陣特征根分布來描述,但是遺憾的是還沒有嚴格的數學證明,所以目前包括像菲爾茲獎獲得者Terence Tao等很多世界著名數學家都在從事隨機矩陣理論的研究。另外,包括統計學家、物理學家、經濟學家和通訊學家在內的學者們也同樣對隨機矩陣理論有很高的關注度,因為隨著計算機技術的飛速發展和廣泛應用,人們得以搜集儲存大維巨量數據(比如多體物理學、現代經濟學以及通訊中的信號處理中的大維數據),然而建立在經典的極限理論(假設維數固定,而樣本容量趨于無窮)下的多元統計方法被應用于大維數據時,它們或者根本不可以應用,或者即使可以應用,其效率也會非常低。所以統計學家利用大維隨機矩陣的譜分析理論(這時我們假設維數趨于無窮),對那些傳統的統計分析方法進行了必要的修正,使之適用于大維統計分析。隨機矩陣理論及其統計應用中有著諸多經典結果被世界所認可,這也是隨機矩陣理論可以進行高維檢驗的理論基礎。
三、隨機矩陣的經驗譜分布函數
四、多元統計分析
多元統計分析是指對于元素為隨機變量的向量和元素為隨機變量的矩陣進行的分析。其中隨機變量X的分布函數表現為:F(a)=P(X<=a)
隨機向量X=(X1,X2,…,Xn)的分布函數為:F(X1,X2,…,Xn)=P(X1<=x1,X2<=x2,…,Xn<=xn)
多元統計分析的數字特征包括數字期望、協方差矩陣和相關矩陣。其中隨機矩陣X的數學期望表現為:E(aX)=aE(X)
E(AXB+C)=AE(X)B+C
E(X1+X2+…+Xn)=E(X1)+E(X2)+…+E(X1)
(其中a,A,B,C均為常數;X1,X2,…,Xn為n個同階的矩陣)
多元統計分析是統計學的延伸,是運用數理統計學的方法對多變量、多個指標進行研究分析的理論和方法。多元統計分析涉及對變量或指標根據其相似性進行分類,以求達到類別中對象的同質性做大化或是類別間異質性最大化的聚類分析;對于自變量與因變量沒有嚴格確定的函數關系時,用來反映依據一種因變量與多種自變量之間線性或是非線性數學模型數量關系的多元回歸分析;根據總體變量或是指標來衡量樣本變量或是指標的判別分析;通過將具有一定相關性的多個指標重新組合成一組新的相互沒有關系的綜合指標來探究多個變量或指標間相關性的主成分分析,此外還有典型相關分析、多元方差分析等。
五、隨機矩陣在多元統計分析中的運用
1.檢驗多個高維均值。對于高維均值變量的統計分析,是多元統計分析中的重要組成部分。然而,隨機矩對于高維數據的均值變量的檢驗問題,可以對單總體均值進行檢驗,可以對多總體均值進行檢驗,還可以對多總體均值進行檢驗。隨機矩陣對于單總體均值的檢驗即將總體均值定位一個常數,H0:μ=μ0;隨機矩陣對于雙總體均值的檢驗是讓兩個樣本的總體均值保持一致,H0:μ1=…μ2;隨機矩陣對于多個總體均值的檢驗是讓N個總體均值保持一致,H0:μ1=…μn。然而無論是單總體均值的檢驗、雙總體均值的檢驗還是多總體均值的檢驗,都是在高維數據的維度小于樣本量的前提下,因為當維數很高時,隨機矩陣的原理預示著樣本的協方差存在一些問題,表現為不穩定的狀態。大維隨機矩陣針對這一問題給出對應的解決辦法。
2.檢驗多個高維協方差矩陣。協方差可以簡單的定義為:Cov(X,Y)=E[X-E(X)][Y-E(Y)]
如果Cov(X,Y)=0時,X與Y是不相關關系。對于這時的高維協方差矩陣而言,兩個獨立的隨機變量是必然不相關的關系,而兩個不相關的隨機變量則未必是獨立的。而當X=Y時,Cov(X,Y)=Var(X),X和Y的協方差矩陣與Y和X的協方差矩陣互為轉置關系,Cov(X,Y)=[Cov(Y,X)]
如果Cov(X,Y)=0,那么X與Y是不相關的。對于這時的高維協方差矩陣而言,同樣兩個獨立的隨機向量是必然不相關的關系,而兩個不相關的隨機向量則未必是獨立的。
3.檢驗線性回歸模型中的回歸系數。回歸分析是用來分析書籍間的內在規律的統計分析,它是基于數據、變量或是向量之間的依存關系而確立的。回歸分析不同于描述兩變量間相關關系的線性關系,因為線性關系只用來筆試自變量X與因變量Y的關系,而自變量X與因變量Y只有滿足線性關系時才能進行回歸分析,因為回歸分析是一種擬合分析方法,即使自變量X與因變量Y不存在線性關系也可以對其進行回歸分析。對于多元線性回歸模型中回歸變量的維度明顯高于樣本量的高維數據的回歸性質進行分析稱為大回歸分析。多元線性回歸模型表現為:Fi為獨立分布的序列,源于均值等于0的協方差矩陣——高斯噪聲分布,B為回歸系數矩陣,zi為回歸變量。
Xi=Bzi+Fi,i=1,2,…,n
綜上,我們得出的結論是檢驗高維協方差等于給定的非隨機矩陣,隨機矩陣可以檢驗兩個協方差矩陣相等,隨機矩陣可以檢驗線性回歸模型中的回歸系數,隨機矩陣可以檢驗同協方差矩陣的多個總體均值相等。
六、結語
本文的主要研究是基于隨機矩陣理論對于高維多元統計分析的檢驗問題中的應用進行了探究,包括隨機矩陣理論用于檢驗多個高維均值,隨機矩陣理論用于檢驗多個高維協方差矩陣,隨機矩陣理論用于檢驗線性回歸模型中的回歸系數等多個問題進行探究。通過所得結果我們可以發現隨機矩陣理論對于高維統計分析具有非常強的應用前景。
參考文獻:
[1]胡江.大維隨機矩陣經驗譜分布函數的收斂[D].長春:東北師范大學,2012.
[2]解俊山.隨機矩陣譜統計量的若干概率極限定理[D].杭州:浙江大學,2012.