楊春華 楊玲 李玲 王景艷



摘 要:文章首先介紹了部分回歸模型、空間變系數模型及估計方法等相關理論知識。通過對以前所研究的半參數模型,將單個自變量非線性函數與空間變系數模型進行有效組合,提出了半參數空間變系數回歸模型兩步估計方法,并從試驗設計、模擬試驗結果分析兩個方面入手,對該估計方法運用效果進行模擬,結果具有較高的可靠性和穩定性,實現了對常值系數的有效計算和估計,為相關人員提供有效的借鑒和參考。
關鍵詞:半參數空間 變系數 回歸模型 兩步估計法
中圖分類號:F224文獻標識碼:A
文章編號:1004-4914(2023)09-021-03
一、引言
半參數模型除了表現出參數模型優點外,還表現出非參數模型的優點,該模型被廣泛地應用于生物、GPS定位等領域中,并取得了良好的應用效果。最近幾年,趙珂等學者大膽提出一種新模型,即新型加權半參數模型,該模型在實際運用中,可以對參數和半參數兩者所占比例進行分析和比較,并對最終比較結果進行加權處理,從而驗證該新型模型的可靠性和優越性;朱晉偉等學者充分應用半參數模型誤差低等特點,全面地分析企業運營、績效相關影響因素?,F階段,大量學者均加入到半參數模型的研究中,該模型主要包含以下兩種模型,分別是線性模型和變系數模型,將這兩模型進行組合,從而形成相應的研究熱點。Zeger等人通過運用迭代法,估計非參數部分,并運用后移算法,對線性部分進行有效估計,然后,將該半參數模型與醫學領域研究進行充分結合,從而發揮和利用該模型的應用優勢;Lin等學者在研究半參數模型期間,主要運用廣義估計方程,對線性模型進行全面化分析和研究。He等人在對半參數模型進行估計時,主要采用M-估計法,對該模型線性部分進行分析和研究,并采用回歸樣條方法,對該模型的非參數部分進行分析和研究;封維波等學者嚴格遵循均方誤差等準則,全面地分析和比較了半參數模型以下兩種估計方法,一種是兩步估計方法[1],另一種是最小二乘估計方法,同時,所獲得的參數兩步估計結果精確性和真實性相對較高,遠遠超過最小二乘估計方法所獲得的估計結果。但是,運用該模型分析和解決實際問題期間,部分變量在影響因變量時,表現出一定的空間差異性,而其他變量在影響因變量時,并沒有表現出空間差異性,而是表現非線性差異性。為此,本文通過對以前所研究的半參數模型內部的線性部分進行處理,并將線性部分處理和推廣為非線性函數,然后,將單個自變量非線性函數與空間變系數模型進行有效組合,從而提出相應的半參數模型估計方法。
二、相關理論知識
(一)部分回歸模型
1.參數與非參數模型。在實際生活中,多個變量既相互獨立,又相互依賴。如果回歸系數函數形式不同,所獲得的模型為非參數回歸模型,該模型在實際運用中,要優先選用大樣本方法,同時,還要結合檢驗統計分布復雜性等特點,選用極限分布法,對非參數進行全面化統計。例如:使用直方圖估計密度函數期間,僅僅參考少量數據,難以保證估計結果的精確性和真實性。在實際估計期間,適當地增加數據數目,可以保證估計精確性得以大幅度提高,因此,需要將樣本容量設置在50以上,并采用直方圖法,對非參數模型進行估計。
2.一元非參數回歸模型估計方法。在估計一元非參數回歸模型期間,為了保證回歸函數估計結果的精確性和真實性,要利用高階泰勒法,對其進行有效估計,并運用最小二乘估計法,獲得各個點所對應的估計值。這種估計方法被稱為“局部多項式光滑方法”。
3.變系數模型及估計方法。非參數回歸模型在實際運用中,表現出一定的靈活性,但是,當自變量維數增加一定程度時,會增加估計計算難度,為了解決這一問題,現研發一種新型變系數模型,通過運用該模型,可以降低自變量維數,確保模型運用的科學性和靈活性。目前,比較常用的變系數模型主要包含部分線性模型、變系數模型等多種模型。其中,變系數模型在實際運用中,可以將參數系數直接設置為另一個自變量,可以有效地避免高維數問題,提高模型應用靈活性和有效性。
(二)空間變系數模型及估計方法
在具體應用實踐中,數據會變得越來越復雜,此時,如果僅僅考慮回歸系數,難以滿足實際應用需求。以某城市房價為例,影響房價因素主要包含房子面積、地理位置等因素。另外,為了更好地預測房價變化趨勢,除了考慮以上幾個因素外,還要在參照變系數模型,充分考慮空間因素。地理位置不同,所對應的系數函數具有一定的差異,通過運用該方法,不僅可以突破空間非平穩性問題,還能確保所獲得的數據真實、有效地反映出實際情況,此時,還要利用空間變系數模型,影響房價的空間位置因素進行分析和研究,經過分析發現,通過將空間信息與空間變系數模型進行有效結合,可以確定出相應的回歸系數。此外,通過運用回歸系數所對應的估計值,可以預測和評估回歸系數未來空間變化趨勢。
三、半參數空間變系數回歸模型及估計
在構建空間變系數回歸模型期間,當空間位置出現變化時,所允許的回歸系數也出現明顯變化,但是,在實際問題分析和解決中,需要做出以下合理假設[2];當空間位置變化時,回歸系數會出現改變,其他的系數為常數,本文構建半參數空間變系數回歸模型表達式如下:
y=β+βKx+βvx+ε(1)
在對空間變系數回歸模型進行研究期間,通常會用到以上模型,通過運用該迭代算法,對該模型進行分析。該迭代算法在實際運用中,會出現計算耗費時間長等問題,只能獲得常值系數近似估計值,而且在半參數空間變系數回歸模型的運用過程中[3],會導致矩陣呈現出非對稱冪狀態。結合以上模型特點和存在的問題,本文提出一種行之有效的兩步估計方法,并運用該方法,在指定的條件下,獲得精確的常值系數估計值。首先,利用常值系數向量,對模型進行轉換處理,使其轉變為空間變系數回歸模型[4],該回歸模型表達式如(1)式所示,,并采用GWR方法,對該模型進行擬合處理,同時,利用加權最小二乘法,對變系數進行精確化計算。其次,結合變系數最終估計結果,確定出合適的線性回歸模型形式,并采用一般最小二乘法,對常值系數進行估計。通過采用兩步估計方法,可以獲得良好的擬合效果。
四、模擬試驗
與半參數回歸模型相比,保證常值系數估計的有效性,在確定各個自變量對因變量的影響程度以及相關空間位置變化情況等方面具有重要作用[5]。通過采用模擬試驗方法,對該模型常值系數估計方法進行驗證,驗證該方法的精確性和穩定性。
(一)試驗設計
在進行模擬試驗期間,需要將m-1個單位正方形進行組合,從而形成相應的空間區域,然后,觀察空間區域邊長在m×m個格子點上,并計算各個格子點之間的距離,經過計算,發現該距離值為一個長度單位。然后,使用x、y別代表觀測點所對應的橫坐標和縱坐標,同時,嚴格按照從左到右、從下到上的順序[6],對各個觀測點進行有序排列。此外,還要模擬處理多個混合空間變系數回歸模型,該模型模擬所獲得的誤差項完全滿足正態分布N(0,σ2)規律,為了更好地分析和研究噪聲方差對估計值的影響程度,現將σ值分別設置為0.2,0.6,1。各個模型中,自變量值均滿足正態分布規律[7],在單個模型中,將σ分別設置為0.2,0.6,1,將m分別設置為6,7,8,9,10,然后,對其進行科學模擬。當m、σ和模型確定后,需要對誤差向量進行改變[8],并將重復計算次數設置為500次,對于單個常值系數而言,可以獲得500個估計值[9],然后,對500個估計值求平均值,所獲得的平均值就是該常值系數的最終估計值,并用“■■”表示,獲得樣本標準差計算公式,通過運用該公式,可以實現對該估計方法有效性和穩定性的有效衡量。
(二)模擬試驗結果
本次試驗,所獲得的試驗結果如表1所示,從表1中的數據可以得出以下幾個結論:(1)模型不同,所對應的m、σ也不同,通過運用后向擬合法,可以獲得常值系數最終估計值,該估計值與其真實值相吻合,這表明該估計方法具有較高的有效性和穩定性。(2)觀測點會隨著m的不斷增加而呈現出不斷增加的趨勢,盡管估計精度并沒有明顯提高,但其穩定性不斷提升。(3)當σ越來越大時,說明噪聲方差不斷增加,該模型表現出較高的干擾程度,估計精度并沒有出現明顯的變化,但其穩定性有所下降。(4)該模型變系數項不斷增加時,該模型中會出現兩個變系數項,說明估計精度越來越低。
五、半參數空間變系數回歸模型及兩步估計方法在經濟領域中的應用
在經濟水平的不斷提高下,通過運用本文所提出的兩步估計方法,對某城市房價數據進行定量分析,從而研究出該城市房價空間差異結構及其影響因子,為房地產行業發展提供重要的依據和參考。
(一)數據收集
本文以某城市多個小區的空間數據為樣本,這些樣本部分數據如表2。
(二)空間變系數模型建立
運用相關性分析法,確定出小區的房齡、公交站個數、距地鐵站距離、距醫院距離,并將這些變量標記為X=(X1,X2,X3,X4),使用(U,V)坐標表示小區實際的空間地理位置;使用(x1,x2,x3,x4,μi,vi,Yi)表示第i個小區的觀測數據,i=1,2,...,n。基于空間系數回歸模型如下:
Y=β(μ,v)X+εi (i=1,2,...,n)(2)
(3)式中β(μ,v)(m=1,2,...,p)代表(μ,v)觀測點位置處所對應的影響因子系數參數,εi代表正態誤差項。
(三)數值模擬
以小區的空間數據為樣本,運用Matlab軟件編程法,對該空間數據進行處理,模型自變量系數運行結果如表3所示。
從表3中的數據可以看出,學校、醫院參(下轉第27頁)(上接第22頁)數變化幅度相對較大,其影響量級相對較高,這表明學校、醫院參數會對房價空間差異性產生明顯影響。地鐵參數變化幅度相對較小,并對房價空間差異性產生影響程度較小,這表明地鐵對房價整體影響程度較小。
六、結束語
綜上所述,本文結合半參數空間變系數回歸模型構建情況,提出兩步估計方法,并確定出常值系數的精確估計表達式,通過對該方法進行大量數值模擬,有效地驗證了該方法的有效性、合理性。另外,通過運用Bootstrap方法,實現對常值系數估計偏差和方差的有效研究。最后,將本文所提出的兩步估計方法被廣泛地應用于房價空間差異性分析,應用結果表明:影響房價空間差異性較大的因子是學校、醫院。但是,本文研究仍然需要進一步優化和完善,需要相關人員不斷創新和改革兩步估計方法,便于后期更好地推廣和應用該方法。
[基金項目:云南省哲學社會科學規劃項目“復雜數據半參數分位數回歸模型方法在社會經濟領域應用研究”中期成果(項目編號:YB2021096)]
參考文獻:
[1] 陳建寶,喬寧寧.半參數變系數回歸模型的空間相關性檢驗[J].統計研究,2015,32(07):87-92.
[2] 魏傳華,梅長林.半參數空間變系數回歸模型的Back-Fitting估計[J].數學的實踐與認識,2006,36(03):177-184.
[3] 程慧燕,朱道元.半參數空間變系數模型的局部線性二階段估計[J].數學的實踐與認識,2017,47(07):292-296.
[4] 陳建寶,喬寧寧.半參數變系數空間誤差回歸模型的估計[J].數量經濟技術經濟研究,2017,34(04):129-146.
[5] 唐慶國,晉鵬.空間半參數變系數部分線性分位數回歸中的B-樣條估計法[J].統計與信息論壇,2018,33(06):9-13.
[6] 袁芳.糾正傳統回歸誤差的半參數變系數估計模型設定及應用[J].統計與決策,2018,34(03):20-24.
[7] 胡亞南,王金天,田茂再.半參數空間分位回歸模型的估計與變量選擇[J].數理統計與管理,2022,41(04):647-661.
[8] 曹連英,張博.非線性半參數空間變系數模型的兩步估計[J].統計與決策,2016(22):12-14.
[9] 梁永玉,田茂再.空間部分線性變系數模型的分位回歸估計[J].統計與決策,2022,38(09):36-41.