999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

房價(jià)大數(shù)據(jù)分析模型檢驗(yàn)方法

2017-04-22 12:25:04陸紅
教育教學(xué)論壇 2017年17期
關(guān)鍵詞:大數(shù)據(jù)

陸紅

摘要:大數(shù)據(jù)分析模型構(gòu)建完成后,最重要的是對模型進(jìn)行檢驗(yàn),如何檢驗(yàn)是困擾我們的一個(gè)難題,本文圍繞房價(jià)大數(shù)據(jù)分析模型,介紹幾種大數(shù)據(jù)分析模型的檢驗(yàn)方法,供從事大數(shù)據(jù)分析研究的人員借鑒和參考。

關(guān)鍵詞:大數(shù)據(jù);分析模型;檢驗(yàn)方法

中圖分類號(hào):G712 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2017)17-0082-02

一、引言

房價(jià)大數(shù)據(jù)分析模型通過機(jī)器學(xué)習(xí)方法構(gòu)建,模型建立完成后需要對模型進(jìn)行檢驗(yàn),房價(jià)大數(shù)據(jù)模型需要檢驗(yàn)擬合的情況,欠擬合說明模型對數(shù)據(jù)的覆蓋程度不夠,過擬合無法反應(yīng)模型的通用性。通過回歸診斷,診斷殘差情況,殘差是反映真實(shí)值與假設(shè)值之間的差,希望模型殘差盡量小,假設(shè)值極大地逼近真實(shí)值。通過檢驗(yàn)可以剔除奇異數(shù),剔除一些干擾項(xiàng)。

二、回歸診斷

1.房價(jià)大數(shù)據(jù)分析模型。price1<-data.frame(price=c(130,140,150,135,200,220,210,280,300,320,350),size=c(50,55,60,55,80,90,90,110,120,130,140),room=c(1,1,1,1,2,2,2,3,3,3,3));tline<-function(){plot(price~room+size,data=price1,pch=16,col='red');model1=lm(price~room+size,data=price1);)tline();summary(model1)。模型構(gòu)建采用最小二乘算法進(jìn)行機(jī)器學(xué)習(xí),經(jīng)過訓(xùn)練數(shù)據(jù)訓(xùn)練,訓(xùn)練出房價(jià)大數(shù)據(jù)分析模型。通過summary(model1)函數(shù),生成模型檢驗(yàn)數(shù)據(jù),檢驗(yàn)?zāi)P蛿M合情況、殘差數(shù)據(jù)、正態(tài)分布情況、方差檢驗(yàn)、奇異數(shù)檢驗(yàn),通過模型檢驗(yàn)數(shù)據(jù)分析模型是否需要進(jìn)一步優(yōu)化。

Residuals:

Min 1Q Median 3Q Max

-7.5556 -2.6667 -0.2222 3.5556 8.6667

殘差最小是-7.5556,最大是8.6667,中值是-0.2222。估計(jì)的值與真實(shí)值存在一定的誤差,通過求極值算法使之最小。

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.7778 5.7061 7.672 0.000256 ***

size 1.5111 0.2461 6.140 0.000855 ***

room 15.7778 10.7282 1.471 0.191782

Signif. codes: 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘.‘ 1

Residual standard error: 5.837 on 6 degrees of freedom

Multiple R-squared: 0.9949,Adjusted R-squared: 0.9932

F-statistic:582.3 on 2 and 6 DF, p-value: 1.346e-07

2.模型參數(shù)。采用最小二乘法算法,經(jīng)過機(jī)器學(xué)習(xí),訓(xùn)練出模型參數(shù),構(gòu)成房價(jià)大數(shù)據(jù)分析模型:房價(jià)大數(shù)據(jù)分析模型為y=aX1+bX2+C,其中:X1=size(面積),X2=room(間數(shù)),y(總價(jià))。經(jīng)過機(jī)器學(xué)習(xí)得到模型以下參數(shù):Size=1.5111;Room=15.7778;截距=

43.7778;y=1.5111*X1+15.7778*X2+43.7778,此函數(shù)為房價(jià)大數(shù)據(jù)分析模型。

3.顯著性檢驗(yàn)。

Estimate Std. Error t value Pr(>|t|)

(Intercept) 43.7778 5.7061 7.672 0.000256 ***

size 1.5111 0.2461 6.140 0.000855 ***

room 15.7778 10.7282 1.471 0.191782

Signif. codes: 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘.‘ 1

殘差自由度為6的殘差標(biāo)準(zhǔn)誤差為5.837,p-value:1.346e-07,P值很小說明無自相關(guān)性,殘差項(xiàng)之間獨(dú)立。自變量與應(yīng)變量相關(guān)性,截距和size顯著性均為三顆星***,說明截距和size與Y相關(guān)性顯著;room沒有星,說明room與Y房價(jià)相關(guān)性不顯著。

4.擬合情況分析。

通過數(shù)據(jù)可視化,觀察房價(jià)大數(shù)據(jù)散點(diǎn)圖,可以看出房價(jià)大數(shù)據(jù)訓(xùn)練樣本呈直線分布。可以用線性回歸進(jìn)行房價(jià)大數(shù)據(jù)分析模型的構(gòu)建。

通過殘差與擬合圖,觀察和分析模型對訓(xùn)練數(shù)據(jù)集擬合程度,從上圖擬合線(紅線)對數(shù)據(jù)的擬合情況看,基本上擬合了大多數(shù)數(shù)據(jù)。沒有發(fā)生欠擬合或過擬合。Multiple R-squared: 0.9949,Adjusted R-squared: 0.9932,從這兩個(gè)數(shù)據(jù)可以看出擬合達(dá)到99%以上,擬合程度很高。

5.假設(shè)性檢驗(yàn)。從正態(tài)Q-Q圖上可以看出,數(shù)據(jù)分布在45°直線周圍,標(biāo)準(zhǔn)殘差成正態(tài)分布,滿足正態(tài)性假設(shè)。

6.方差檢驗(yàn)。同方差性,若滿足不變方差假設(shè),位置—尺度圖縱坐標(biāo)為標(biāo)準(zhǔn)化殘差的平方根,殘差越大,點(diǎn)的位置越高。從圖中可以看出經(jīng)過對殘差處理為標(biāo)準(zhǔn)化殘差的平方根,擬合的總體趨勢還可以,個(gè)別點(diǎn)可以看出遠(yuǎn)離擬合線如“點(diǎn)5”、“點(diǎn)7”,奇異點(diǎn)已經(jīng)顯露。

7.奇異數(shù)檢驗(yàn)。從殘差與杠桿圖中可以看出離群點(diǎn)和影響強(qiáng)度。Cook's distance值衡量強(qiáng)影響點(diǎn)的強(qiáng)度,從圖中可以看出“點(diǎn)7”這個(gè)點(diǎn)Cook's distance值超過0.5是所有數(shù)據(jù)中Cook's distance值最高的數(shù)據(jù),它是目前的強(qiáng)影響點(diǎn)。杠桿值高的數(shù)據(jù)是離群點(diǎn),目前“點(diǎn)4”杠桿值也較高,它也是離群點(diǎn)。

三、交叉驗(yàn)證

從訓(xùn)練數(shù)據(jù)集中提取一部分?jǐn)?shù)據(jù)作為驗(yàn)證數(shù)據(jù),將驗(yàn)證數(shù)據(jù)代入房價(jià)大數(shù)據(jù)分析模型,得出的結(jié)果與真實(shí)數(shù)據(jù)進(jìn)行比較。如果與真實(shí)值很接近,說明分析模型預(yù)測房價(jià)比較準(zhǔn)確;如果模型得出的結(jié)果與真實(shí)的房價(jià)相差較大,需要優(yōu)化房價(jià)大數(shù)據(jù)分析模型算法。

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時(shí)代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動(dòng)作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 毛片免费视频| 激情乱人伦| 免费va国产在线观看| 69视频国产| 国产一区二区三区免费| 国产黄网永久免费| 欧美成人国产| 久久6免费视频| 99在线视频精品| 激情五月婷婷综合网| 91网在线| 国产成人高清精品免费5388| 欧美亚洲一区二区三区导航| 尤物成AV人片在线观看| 67194在线午夜亚洲| 91精品久久久久久无码人妻| 国产超碰一区二区三区| 91精品网站| 国产视频一区二区在线观看 | 色哟哟国产精品一区二区| 不卡视频国产| 日韩天堂在线观看| 国产三级成人| 一本大道无码日韩精品影视| 国产亚洲视频免费播放| 在线播放精品一区二区啪视频| 拍国产真实乱人偷精品| 国产成人精品一区二区秒拍1o| 亚洲成人精品久久| 国产精女同一区二区三区久| 亚洲国产成人久久77| Jizz国产色系免费| 8090成人午夜精品| 91精品国产无线乱码在线| 成人国产免费| 一本大道视频精品人妻| 国产天天射| 久久一本日韩精品中文字幕屁孩| 国产一区二区三区在线精品专区| 久久精品最新免费国产成人| 国产主播喷水| 国模私拍一区二区| 久久婷婷国产综合尤物精品| 亚洲成A人V欧美综合天堂| 免费毛片在线| 成人无码一区二区三区视频在线观看 | 熟女日韩精品2区| 一本一道波多野结衣av黑人在线| 精品视频福利| 久久婷婷五月综合97色| 国产欧美精品午夜在线播放| 亚洲成人精品久久| 亚洲免费成人网| 激情在线网| 国内精品久久人妻无码大片高| 丝袜无码一区二区三区| 丝袜亚洲综合| 色婷婷视频在线| 日本午夜视频在线观看| 精品久久久久成人码免费动漫| 午夜久久影院| 国产乱人免费视频| 久久无码av三级| 免费一级全黄少妇性色生活片| 亚洲成A人V欧美综合| 亚洲色欲色欲www网| 国产第八页| 国产91小视频在线观看| 真实国产乱子伦视频| 无码久看视频| 亚洲一区二区三区中文字幕5566| 新SSS无码手机在线观看| 午夜a视频| 成人精品免费视频| 欧美另类视频一区二区三区| 伊人国产无码高清视频| 999在线免费视频| 国产国模一区二区三区四区| 亚洲欧美日韩成人在线| 国产精品视屏| 欧美在线伊人| 男女猛烈无遮挡午夜视频|