蘇建超
摘 要:在實際問題研究中,人們感興趣的是研究預測變量的改變對響應變量的影響,線性回歸模型是解決這類問題的方法之一,常用最小二乘法或最小一乘法來估計未知參數。本文重點討論了線性分位數回歸分析的數學原理,以及通過數學建模挖掘其在經濟領域實際問題分析中的應用。
關鍵詞:分位數;回歸分析;經濟;應用
分位數回歸方法從1978年提出后,無論從理論還是應用方面都得到了很大的發展。它不僅能夠拓展模型使用的范圍,而且還能夠度量出回歸變量對分布的影響,以及分布的尾部特征,較之經典的最小二乘法更具有優勢。隨著分位數回歸理論和算法的不斷發展,分位數應用的領域更加廣泛。
一、分位數回歸分析解決實際問題的研究背景
傳統的線性回歸模型具有悠久的歷史,其中經典的最小二乘回歸應用最為廣泛。它描述了因變量的條件均值分布受自變量X的影響過程。最小二乘法是估計回歸系數的最基本的方法。如果模型的隨機誤差項來自均值為零,且方差相同的分布,那么回歸系數的最小二乘估計為最佳線性無偏估計如果隨機誤差項是正態的,那么回歸系數的最小二乘估計,與極大似然估計一致,均為最小方差無偏估計。此時它具有無偏性、有效性等優良性質。
但是,在實際的經濟生活中,這種假設常常得不到滿足。例如當數據中存在嚴重的異方差,或者存在厚尾、尖峰等情況時,最小二乘法的估計將不再具有上述的優良性質,而且穩健性極其糟糕。特別的,對于大量數據而言,應用最小二乘回歸只能得到一條回歸線,而一條回歸線所能反映的信息量是有限的。因此,人們在使用經典的線性回歸的同時,也一直在不斷的探索更新更好的回歸方法。
為了彌補最小二乘法在回歸分析中的缺陷,有科學家提出了分位數回歸,分位數回歸相對于最小二乘回歸,應用條件更加寬松,挖掘的信息量更加豐富。它依據因變量的條件分位數對自變量X進行回歸,這樣得到了所有分位數下的回歸模型。因此分位數回歸相比普通的最小二乘回歸,能夠更精確的描述自變量X對于因變量Y的變化范圍,以及條件分布形狀的影響。分位數回歸能夠捕捉到分布的尾部特征,當自變量對因變量分布的不同位置產生不同的影響時,它就能更加全面的刻畫分布的特征,從而得到全面的分析,而且分位數回歸系數估計比最小二乘回歸系數估計更加穩健。
二、分位數回歸理論和分析方法的優勢
普通線性回歸模型實際上是研究被解釋變量的條件期望,人們當然也關心解釋變量與被解釋變量分布的中位數,分位數呈何種關系。這就是分位數回歸,它最早由Koenker和Bassett提出,是估計一組回歸變量X與被解釋變量Y的分位數之間線性關系的建模方法。
正如普通最小二乘OLS回歸估計量的計算是基于最小化殘差平方和一樣,分位數回歸估計量的計算也是基于一種非對稱形式的絕對值殘差最小化,其中,中位數回歸運用的是最小絕對值離差估計。它和OLS主要區別在于回歸系數的估計方法和其漸近分布的估計。在殘差檢驗、回歸系數檢驗、模型設定、預測等方面則基本相同。所以,分位數回歸的優點是能夠更加全面的描述被解釋變量條件分布的全貌,而不是僅僅分析被解釋變量的條件期望(均值),也可以分析解釋變量如何影響被解釋變量的中位數、分位數等。不同分位數下的回歸系數估計量常常不同,即解釋變量對不同水平被解釋變量的影響不同。
另外,中位數回歸的估計方法與最小二乘法相比,估計結果對離群值則表現的更加穩健,而且,分位數回歸對誤差項并不要求很強的假設條件,因此對于非正態分布而言,分位數回歸系數估計量則更加穩健。
三、分位數回歸分析在經濟問題中的應用分析
線性分位數回歸是近年發展起來的一種統計方法。線性回歸模型要求滿足同方差性,隨機誤差項兩兩不相關等條件,在進行回歸系數的顯著性推斷時,通常還要假設殘差服從正態分布。尤其是當分布是重尾或存在強影響點,以及異常點時,推斷結果的穩健性往往很差。分位數回歸避免了這種缺陷,其結果具有強烈的穩健性。
下面就結合分位數回歸分析在房地產行業中的應用為代表,來剖析其中的科學原理和社會價值。房地產行業作為第三產業,與國民的生活密切相關,是國民經濟的支柱產業之一,同時也是一個自身就很龐大和復雜的系統,對國民經濟的整體態勢和國民的生活水平影響都很大。近年來,我國房地產業十分迅速的發展,一方面為國民經濟發展做出了突出貢獻,另一方面在改善居民居住條件方面發揮了極其重要的作用。與此同時各方對房地產業有諸多爭議,各方都從自己的角度出發,從政策、心理和資金等因素來予以考慮,定性的分析多于定量的分析。顯而易見,從定量的角度來把握各個指標間的數量關系,系統的梳理當前房地產業的發展態勢,深刻的認識房地產業的經濟規律,從而準確的對房地產業進行預見和調控,最終實現可持續發展。由于我國房地產發展的地區差異性大,不能用一個平均水平的模型概況性的估計,因此需要通過建立一個正確并且全面的模型來把握房地產業內在發展規律,弄清房價的增長與其他環境、人口、經濟、社會等因素之間的具體關系。分位數回歸估計模型就能解決這一問題一種方法。
同時要強調的是,位數回歸方法不僅能夠度量回歸變量對分布中心的影響,而且能度量回歸變量對分布上尾和下尾的影響,它是在不同的分位數下進行預測,得到的信息更為全面和精確。我國房地產業發展空間差異巨大,經典的條件均值回歸只能反映平均趨勢,對于房地產業發展水平區域性的特點,這種回歸結果與實際情況有時差別會很大。通過分位數回歸的方法研究,可以建立一種較為全面衡量房價影響因素的指標體系,確立對不同水平下房價起伏狀況與相關影響因素之間的作用性質和強弱。
四、結語
從分位數回歸理論的發展來看,它并沒有一經問世便迅速普及開來,因為分位數回歸本身計算過程較為復雜,隨著計算機的快速發展,以及與線性規劃理論的相結合,各種分位數回歸軟件包才應運而生,進而分位數回歸理論逐漸進入了大眾的視線內。
參考文獻:
[1]解其昌. 分位數回歸方法及其在金融市場風險價值預測中的應用[D].西南財經大學,2012.
[2]李紅梅. 居民收入的分位數回歸與反事實因素分解[D].首都經濟貿易大學,2012.
[3]張利. 線性分位數回歸模型及其應用[D].天津大學,2009.