999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多元線性回歸的房價預測模型改進

2019-03-15 01:30:06張若天
電子制作 2019年4期
關鍵詞:方法模型

張若天

(濟寧孔子國際學校,山東濟寧,272000)

0 引言

過去的十年里,我國經濟蓬勃發展,房價也隨之飛速提高,讓大量的投資者從中攫取利益,也讓無數人成為“房奴”,幾乎人人都開始關注房價的波動走勢,力圖對房價做出科學有效的預測。因為房價的變動原因在經濟學上仍有很大的爭議,所以,預測也成為領域炙手可熱的問題。

縱觀全局,從2007年至2017年,各地房價都有了長足的提高,尤其是上海、浙江、江蘇為首的東南沿海地區和以北京、天津為首的華北地區。

由于房價與國計民生休戚相關,房價預測無論是在經濟學、數學還是計算機科學都成為了熱門也同樣十分困難的問題,因為其中涉及了許多隨機影響因素,而且影響因素多元,無法通過簡單的統計學模型進行預測。目前,學界對房價預測有了多種方法,如多元回歸線性模型、灰色理論預測模型、馬爾科夫預測模型、遺傳算法和神經網絡等等模型。

多元線性回歸模型是一種常用的多元統計方法,原理明確,結構簡單,在房價預測方面被十分廣泛地運用,可是效果卻不盡人意,常常在使用的過程當中出現各種各樣的問題,而且近期一些“先進”的方法并不能從根本上解決這個問題,反而引入了額外的解釋復雜性,多元線性回歸模型的改進亟待解決。

本文瞄準中國樓市,基于多元線性回歸模型,提出了自己的改進辦法,本方法并未拋棄多元線性回歸模型,而是從模型結果和因變量處理上提出了自己的看法,通過與其他的一些方法相結合,使組合模型的結果與實際情況更加吻合,更能使人信服,為人們提供更加優質的預測方法,必免一些不必要的麻煩。經過檢驗,本文提供的方法,可以在一定程度上提高房價預測的穩定性和準確性,使其更加實用。

1 模型介紹

1.1 多元線性回歸模型

1.1.1 術語介紹

回歸分析:一種統計學上分析數據的方法,目的在于了解兩個或者多個變量之間是否相關、相關方向與強度,并建立數學模型以便于觀察特定變量預測研究者感興趣的變量。

1.1.2 模型引入

多元線性回歸模型形式如下:

其中 β0,, β1…βm-1為待估參數,ε為誤差,服從標準正態分布,對于待估參數的確定,有以下求解方法:

1.1.3 缺點論述

顯然,多元線性回歸模型有著難以避免的缺點。

第一,運用多元線性回歸模型時,需要涉及大量的矩陣公式計算,因此,多元線性回歸模型本身就具有計算量大和不易編程的特點,對人們的研究造成了極大的困擾,常常在一些不必要的地方進行不必要的計算,大大降低了模型的預測效率。

第二,多元線性回歸模型極易受個別異常數據的影響,常常會在存在異常數據的情況中出現模型不符合其實際意義的問題,造成其自變量與因變量之間出現不合理的關系系數。如,符號相反,數值過大或過小,這時就需要更加穩健的回歸方法對其進行優化和修改。

第三,多元線性回歸模型計算過程中對最小二乘法有著極大的依賴性,但是,最小二乘估計中也有著一定的缺陷。其平方運算會使估計值與實際值之間產生一定的誤差,若計算較為復雜的話,誤差就會越積越大,嚴重脫離實際。

第四,多元回歸線性模型不能實現跟蹤響應變量變化,其估計值只能對一段時間內的結果產生較好的分析,如果是長期分析,就會顯得有些捉襟見肘。

接下來,本文將提出一些改進這些問題的方法。

1.2 多元線性回歸模型的改進

1.2.1 主流改進方法

為了改進樸素多元線性回歸的若干缺點,目前有一些比較成熟的改進方法,如嶺回歸、穩健回歸、主成分回歸等,這些方法的復雜度都比較高,還可以使用偏最小二乘估計代替最小二乘估計進行待估參數的計算。要規避多元共線性,可以使用刪減變量或者引入附加方程的房價進行處理。

1.2.2 基于灰色預測的多元線性回歸模型

灰色預測是一種對含有不確定因素的系統進行預測的方法。灰色預測通過對各個變量進行關聯分析,并對原始數據進行生成處理來尋找整個系統的變化規律,生成具有強烈規律性的數據數列,然后通過對預測的數據建立方程,從而得到其他關聯數據的變化情況,來預測未來某一特定時間的某數據。灰色關聯理論是鄧教授創立的。其對少數據、貧信息不確定性問題的研究作出了重要的貢獻。

(1)GM(1,1)模型

GM(1,1)模型有一個單變量的一階微分方程構成。它主要用于復雜系統某一主導因素特征值擬合和預測,以揭示主導因素變化規律和未來發展變化趨勢。

GM(1,1)模型不僅有連續的形式,還具有離散形式,而兩者之間有著一定的聯系。從其中的聯系入手,便可得到離散GM(1,1)模型。

(2)灰色組合預測

與回歸分析一樣,灰色組合預測模型也是通過各個因素之間的關系而建立的預測模型,他將根據自變量與因變量所占的比重來建立模型。

其使用方法大致如下:得到各組序列后,通過灰色分析得出關聯度系數序列,再得出自身的預測值。通過加權計算,得到一個最合理的權重,再對因變量序列中的預測值進行分析,基于灰色關聯系數建立因變量預測值的回歸模型,從而得到計算后位置元素的預測值。

運用灰色組合模型可以使預測值與自變量聯系更加緊密,擬合度更高,從而參考價值更高,與其他更先進的回歸模型得到的結果十分相近。

(3)灰色預測運用到多元線性回歸

上文對灰色預測模型相關內容進行了介紹,易知,灰色預測模型具有能夠跟蹤響應變量動態變化、能夠避免少量異常數據對預測值的影響,并且建模難度小的優點。因此,將其與多元線性回歸模型相結合,可以對其缺點進行極大的彌補。

(4)應用方法

假設因變量y受到p個自變量的影響,現在有n組已知數據。首先,先計算灰色關聯度,以確定影響因變量的主要因素,再將其按照灰色關聯度排序,從而得到m個主要因素。然后在對數據進行分析,建立多元線性回歸模型

便得到了一個以(m個系數)為總體回歸參數,且(m個誤差)服從均值為0,方差為σ2的序列通過代入公式計算,得到各個回歸參數的估計值。然后在用過灰色組合模型進行對自變量的預測,得到m個預測值,代入,便可得到灰色組合多元回歸模型

然后再對其進行擬合度計算,檢驗模型的準確度,做最后的調整,最終得出想要的預測值。

2 數據處理

2.1 介紹數據

數據是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合。它是可識別的、抽象的符號。

數據雖然是抽象概念,但是,它也具有規模和屬性。通俗來講,數據規模就是數據的多少,數據越多,規模就越大,現在所說的大數據就是規模極大的數據;數據屬性就是數據所具有的性質,數據具有的性質越多,我們稱其屬性越多,或維度越大,人們常說的數據降維處理就是盡可能地減少數據的無關屬性,以達到篩選的目的。

同樣,數據也有用來描述自己的單位,這個人們就接觸的比較多。數據的單位常常被稱作數據的寬度,日常生活中的網絡速度、下載速度、存儲空間等等都應用到了數據的單位方面的內容。

2.2 數據預處理的方法

數據預處理的主要方法就是數據清洗和數據歸約。

數據清洗主要包括對數據集進行異常檢測、識別并消除數據集中近似重復對象、對缺失數據進行清洗。數據集的異常檢測主要就是消除少數異常數據對總體的影響,常常運用均值和標準差進行檢測;重復記錄的清洗主要就是篩掉重復的數據,使數據集更加精簡,減少不必要的數據分析;對缺失數據的清洗與灰色預測模型有些相似,旨在對缺失數據進行預測,其中涉及了許多高級的理論方法,這里就不再一一描述。

數據歸約主要包括高維數據的降維處理和離散化技術減少給定連續屬性值的個數。高維數據降維處理其本質就是刪除數據的冗余屬性,避免其對預測過程造成影響,簡化對數據分析的過程;而離散化技術減少給定連續屬性值的個數這種方法大多數是遞歸進行的,看似花費了大量的時間,其實卻節省了后面步驟的時間。

2.3 分析房價數據

對于房價數據而言,每一個數據維度都是具有現實意義的,因此如果想要降低數據維度,不能直接使用PCA、SVD等降維方法來降低數據復雜性,而是應該使用特征子集選擇、特征創建方法。在處理某些特殊屬性時,如“是否是學區房”、“是否有重大國家政策”等屬性時,應該將原有數據處理成離散形式,如1代表“是”,0代表“否”等。在降低數據的復雜度之后,還應該使用簡單的變量變換,對各個維度的數據進行規范化以消弭不同維度之間的數量級差別。在進行萬以上處理之后,房價數據已經可以應用到我們的模型中。

3 結論

3.1 模型優勢

本文的改進不僅保留了多元線性回歸模型結構簡單、原理明確的優點,而且避免了多元線性回歸模型的各種缺點,使多元線性回歸模型的應用更加廣泛。同時,本文提出的模型還汲取了灰色預測模型的優勢,使數據擬合度更高,更有價值去預測。

經過實例的驗證,本文模型的構造是成功的,比傳統多元線性回歸模型要準確得多大大增強了本文提出模型的可行性,但還不能做到絕對的準確,還需進一步的研究。

3.2 改進方向

目前的數據量比較小,而且分布范圍狹窄,基于統計學的模型無法發揮出最大的優勢,因此之后的一個改進方向是尋找更多更可靠的數據來源,收集比較多的前期數據。除此之外,要想更加深刻地發現房價變動背后的規律,尋找更多的房價關聯屬性,即發掘更高的數據維度也是一個重要的改進方向,當數據維度足夠高時,才能夠還原出影響房價的更多細節。

目前本文在改進多元線性回歸模型上做出的主要努力是結合了灰度預測模型,但是模型的整體復雜度尚有欠缺,無法擬合出數據更加復雜的變化,因此在現有的改進基礎上,嘗試將模型做得更加復雜也是使得模型具有更加良好表現的一種方法。除了以上的改進方向,對于迭代出的模型還應該有一個更加智能的函數來對當前模型進行打分以評判模型的好壞,有了這樣的評價函數之后,模型的表現也會變得更好。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 国产SUV精品一区二区| av一区二区三区在线观看| 国产精品视频白浆免费视频| 四虎影视国产精品| 久草视频精品| 一本久道久久综合多人| 欧美亚洲一区二区三区在线| 伊人久久大线影院首页| 99久久精品国产麻豆婷婷| 88国产经典欧美一区二区三区| 91精品最新国内在线播放| 国内熟女少妇一线天| 中文字幕无码制服中字| 99爱在线| 久久久久夜色精品波多野结衣| 日韩欧美视频第一区在线观看| 国产主播一区二区三区| 色综合天天综合中文网| 亚洲精品成人7777在线观看| 亚洲精品第1页| 亚洲成在人线av品善网好看| 91亚瑟视频| 韩日无码在线不卡| 欧美天堂在线| 无码综合天天久久综合网| 天天做天天爱夜夜爽毛片毛片| 一本大道无码日韩精品影视| 99这里只有精品在线| 成AV人片一区二区三区久久| 免费精品一区二区h| 男人的天堂久久精品激情| 国产一级无码不卡视频| v天堂中文在线| 国产综合精品一区二区| 亚洲色图欧美| 久久天天躁狠狠躁夜夜躁| 制服丝袜在线视频香蕉| 国产人成乱码视频免费观看| 国产欧美日本在线观看| 亚亚洲乱码一二三四区| 欧美激情视频一区| 国产幂在线无码精品| 国产在线观看一区二区三区| 精品无码日韩国产不卡av| 亚洲综合中文字幕国产精品欧美 | 日本一区中文字幕最新在线| 九色视频线上播放| 午夜啪啪福利| 欧美一级夜夜爽www| 亚洲精品va| 中文字幕日韩丝袜一区| 国产精品无码作爱| 国产资源免费观看| 国产成人AV综合久久| 99这里精品| 国产99在线观看| 亚洲人成网站18禁动漫无码| 婷婷丁香色| 麻豆精选在线| 国产美女精品人人做人人爽| 日韩午夜伦| 国产亚洲欧美日韩在线一区| 亚洲资源在线视频| 91精品国产91久无码网站| 久久窝窝国产精品午夜看片| 国产情精品嫩草影院88av| 尤物特级无码毛片免费| 日韩AV手机在线观看蜜芽| 国产91高跟丝袜| 九色在线视频导航91| 在线观看欧美国产| 亚洲 欧美 中文 AⅤ在线视频| 为你提供最新久久精品久久综合| 找国产毛片看| 亚洲第一区欧美国产综合| 欧美区一区二区三| 波多野衣结在线精品二区| 亚洲成人精品| 亚洲AV无码久久精品色欲| 亚洲综合色区在线播放2019| 国产大全韩国亚洲一区二区三区| 全部无卡免费的毛片在线看|