蒲倩
【摘要】函數性數據分析(FDA)是一種新型數據分析方法,該種分析方法是建立在函數角度基礎上,強調將函數數據作為整體進行分析,函數性數據有效豐富了數據分析領域,為解決數據問題提供了強有力的支撐,該種技術屬于探索性技術,對函數通特征描述與特征提取到起到了理想的成效,數性數據分析有著很大的優越性,能夠通過微分曲線與導數曲線來處理信息,本文主要討論函數性數據分析中的主成分分析.
【關鍵詞】函數性數據分析;主成分分析;討論
在人們的日常生活中,常常需要處理各種各樣的數據,其中很多數據是有函數特征的,如氣象數據、證券交易數據等等,函數性數據分析(FDA)是一種新型數據分析方法,該種分析方法是建立在函數角度基礎上,強調將函數數據作為整體進行分析.
與傳統數據分析方法相比而言,函數性數據分析有著很大的優越性,能夠通過微分曲線與導數曲線來處理信息,截至目前為止,各界的專家學者已經針對函數性數據進行了深入的分析,下面就針對函數性數據分析的主成分進行相應的介紹.
一、傳統主成分分析
主成分分析在1901年開始在正交回歸分析中得到了應用,在1933年,主成分分析法得到了一定的發展,該種分析方式能夠將高維空間問題變成低維空間問題,這樣即可將問題直觀化、簡單化,雖然該種分析法會損失部分數據,但是卻抓住了主要問題,對問題的分析十分有益.在技術水平的發展之下,主分析法十分的重要,從幾何角度進行分析,該種分析方式能夠將原始變量組合成新坐標,新指標伸縮情況主要由樣本協方差矩陣進行表示,新變量之間并無密切的關系,可以看出,使用主成分分析法能夠很好地避免多重共線問題的發生.
從本質上而言,主成分分析是線性映射法,該種方法是不適宜應用在非線性問題處理中的,在這一背景下,一些學者提出主曲線方法、核主成分分析法、主曲面方法、多層感知器方法等多種主成分分析法,該種這些數據分析法的應用還存在一些弊端,因此,就需要使用新型主成分分析法,函數性數據分析法正是在這一基礎上產生.
二、函數性數據主成分分析
1.函數性數據的特征
顧名思義,函數性數據就是一種采用函數來表現的數據,具有函數性的特征,在分析數據時,若觀測點過于密集,那么數據則會表現出函數性特征,采用該種分析法時,需要將數據作為獨立項進行分析,不能將其看作數據點序列.該種分析方式最早由一位加拿大學者提出,在提出伊始,強調采用現代緊密數據系統來獲取數據,在獲取數據時,需要將其作為動態概念,并不能將其作為靜態概念,如果采用傳統分析法就難以提升分析的準確性,因此,就需要進一步來擴展分析方法.近年來,很多學者開始對函數性數據進行了深入的分析,但是,這一技術依然處在初級發展階段,還需要進行深入的研究.
關于函數性數據x函數形式,需要將數據假定為是一種連續產生的過程,但是在實際觀測過程中,很難得到離散性數據,實際觀測的數據也常常含有噪聲,因此,在接收到觀測數據之后,需要對樣本開展函數擬合,這種擬合方式是多種多樣的,常用的有插值法與平滑法.若接收到的觀測數據沒有誤差,即可使用插值法進行擬合;如果接收的數據存在誤差,就需要使用平滑法進行擬合.
2.函數性數據主成分分析
在實際應用過程中,觀測數據常常存在著比樣本量大的情況,如果未進行處理就直接分析,那么是無法得出理想的分析解決的.為了解決這一問題,可以使用兩種方法,即將觀測時間區域減少或者偏最小二乘,如果變量多重共線性嚴重,使用該種分析法雖然能夠有效解決問題,但是卻存在很多噪聲.在遇到該種情況時,即可使用偏最小二乘法來進行回歸建模.
函數性數據樣本協方差矩陣是一種函數模式,常常會產生高維協方差矩陣,該種矩陣表示對變量實施了重復性檢測,且每次得到的數據都生成了函數數據.在特征方程上,可以使用如下的表達方式:
三、函數性共同主成分
共同主成分已經在形態進化工作中得到了廣泛的應用,分析共同主成分能夠有效解決共同主成分結構與協方差矩陣比例等問題,一般情況下,在建立好矩陣之后需要使用KL展開式進行分析,為了得到函數結構與動態特征,可以使用函數主成分與因子荷載分布來進行確定.在應用KL展開式時,需要應用到相互正交函數,KL展開式有著理想的收斂性,在展開其他類型時,也可以得出很好的效果.采用該種方法之后,即可將問題簡單化,但是由于因子載荷之間存在一定的差異,就需要對函數性數據主成分進行相應的驗證.
四、結 語
綜上所述,函數性數據有效豐富了數據分析領域,為解決數據問題提供了強有力的支撐.該種技術屬于探索性技術,對函數通特征描述與特征提取到起到了理想的成效,但是,由于各種因素的影響,函數性數據主成分分析只能夠解決單樣本問題,難以解決兩樣本以上的問題,因此,在使用該種問題進行分析時,還需要綜合各類因素解決推斷與檢驗的難題.