999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Python的線性回歸案例分析

2022-12-07 01:11:02何小年段鳳華
微型電腦應用 2022年11期
關鍵詞:案例模型

何小年,段鳳華

(湖南醫藥學院,醫學人文與信息管理學院,湖南,懷化 418000)

0 引言

Python是一種專門處理金融、高級數學、統計和時間序列,便于繪制圖像工具,可應用于科學統計、人工智能、教育、Web開發、GUI開發、操作系統開發等諸多領域的編程語言。由荷蘭人吉多·范羅蘇姆開發的免費開源編程軟件,具有免費性、開源性和非美國直接起源性[1]。統計分析常用的軟件有Excel、MATLAB、SPSS和R等[2-4],本文嘗試應用Python語言進行統計學線性回歸內容實訓,實現對源于美國的許多教學科研技術產品的替代。

回歸分析(regression analysis)主要是探討自變量與因變量間的相互關系,通過構建自變量與因變量之間相互關系的回歸模型,對因變量的未來演變趨進行預測,也可用于理解哪些自變量與因變量的相關程度,并探索這些關系的形式。業界已經開發了許多用于執行回歸分析的技術,其中較為常見的回歸分析方法包括線性回歸、多項式回歸、邏輯回歸、嶺回歸、逐步回歸等[5]。本文運用Python進行線性回歸分析。

1 運用sklearn庫構建線性回歸模型的基本過程

在Python的第三方庫中,以sklearn (scikit-learn)較為常見,是著名的機器學習庫,對機器學習方法提供了封裝,包括回歸(regression)、降維(dimensionality reduction)、分類(classfication)、聚類(clustering)等,擁有完善的文檔,這種優點使其上手簡單。因為其包含了大量數據集,節約了收集和整理數據集合的時間,所以是目前比較流行的的機器學習與實踐的工具。

運用sklearn庫構建線性回歸模型時,需要經過如下步驟:

(1) 根據預測的目標,確定自變量和因變量;

(2) 繪制散點圖,選擇回歸模型的類型;

(3) 估計模型參數,建立回歸模型;

(4) 對回歸模型進行檢驗;

(5) 利用回歸模型進行預測。

2 線性回歸案例實現

案例1 本文采用文獻[6]中《華爾街日報年鑒》(1999)公布的美國部分航空公司業績案例,案例信息見表1,問題為研究航班正點率與投訴率之間有何關系?若目前已知美國航空公司航班正點率為出發點,預測每10萬旅客投訴的人次數是多少?

航班正點率與投訴率之間的線性關系回歸分析步驟如下。

(1) 根據案例的已知信息,來確定自變量和因變量。

已知航空公司的航班正點率,預測每10萬名旅客投訴的次數,所以,航班的正點率為自變量,每10萬名旅客投訴次數為因變量。我們以y表示因變量,x表示自變量。

表1 航空公司航班正點率與乘客投訴率信息

(2) 繪制出所有自變量和因變量的散點圖,并觀察圖形,來判斷是否能夠建立回歸方程。

根據案例中數據所繪的散點圖(見圖1),航空公司航班正點率與每10萬名旅客投訴次數之間具有明顯的線性相關,即航空公司航班正點率越大,每10萬名旅客投訴次數也就越小。由此,可以繪出航班正點率與每10萬名旅客投訴次數之間的線性回歸圖(如圖2)。

圖1 航班正點率和投訴率散點圖

圖2 航班投訴率預測值圖

(3) 估計模型參數,建立回歸模型

根據圖2,可以建立航班正點率與每10萬名乘客投訴次數之間的一元線性回歸模型如下:

y=α+βx+ε

(1)

這里的α為常數項(即Y軸上的截距),β為回歸直線的斜率,ε為隨機誤差,ε的平方和即為殘差,殘差是確定線性回歸系數擬合性好壞的最主要方法之一。

(4) 對回歸模型進行檢驗

回歸方程的精度是表示實際觀測值和與回歸方程的擬合程度的指標,即對擬合優度進行度量。

(2)

可決系數R2越大即越接近于數字1,則表示回歸模型擬合的程度就越好。如果擬合的回歸模型精度符合需求,就可以利用擬合出的回歸模型,根據已有的自變量數據來估計因變量相對應的結果。

由圖3可以看到,模型的擬合優度(即R2=0.779)說明模型的擬合效果很好,可以使用這個模型進行未知數據的預測了。

圖3 航班正點率和投訴率回歸分析結果截圖

(5) 利用回歸模型進行預測

由圖2顯示預測直線,由圖3可知α=6.018,β=-0.07即可建立如下的線性回歸模型

(3)

假設航空公司航班的正點率等于70%,則使用回歸方程預測每10萬名旅客投訴次數約為1.088 8;如果航空公司航班的正點率等于80%,使用回歸方程預測每10萬名旅客投訴次數約為0.384 7。

運行結果如圖1~圖3所示。

案例2 為了探討中國部分區域居民平均消費開支及平均可支配收入之間數量關系,通過中國統計年鑒獲得2016年中國部分區域居民平均消費開支及平均可支配收入統計數據(見表2)。

表2 2016年中國部分區域居民平均消費開支及平均

問題為對居民消費支出和居民可支配收入作相關分析;對居民消費支出和居民可支配收入進行回歸分析;利用所建立的回歸模型,預測某地區居民人均可支配收入為60 000元和65 000元時人均消費支出水平的預測值。

采用案例1的代碼,運行結果如圖4~圖6所示。圖4是中國部分區域居民平均消費開支和平均可支配收入散點圖;圖5是中國部分區域居民平均消費開支的預測值預測值圖;圖6是中國部分區域居民平均消費開支和平均可支配收入回歸分析結果圖。從圖6可能得出中國部分區域居民人均可支配收入和居民人平均消費支出相關系數為0.986 791,表明二者之間有高度的線性相關關系;R2=0.974,說明回歸模型擬合程度比較好;線性回歸模型為y=1 496.505 210 203 147 7+0.660 270 886 170 55x,其中,y是消費支出,x是可支配收入;當居民人均可支配收入達到60 000元和65 000元時,預計居民人均消費支出y的預測值分別為 41 112.758 380 44和44 414.112 811 29。

圖4 中國部分區域居民平均消費開支和平均可支配

圖5 中國部分區域居民平均消費開支的預測值圖

圖6 中國部分區域居民平均消費開支和平均可支配

3 總結

本文采用2個案例的數據,建立了一元線性回歸模型,使用Python中的sklearn庫構建線性回歸模型,估計了變量之間的相關系數,對因變量進行了估計,從而得出了比較好的回歸模型和預測的結論,在教學中可以采用直觀的圖形方法來揭示統計學中的較為復雜的數學模型。為學生提供直觀認識,解決了課程中概念抽象不直觀、難理解的難題,可以加深學生對知識的理解,實現了復雜問題簡單化,對于激發學生學習興趣、從而改善教學效果,提高教學質量,具有重要的作用。

猜你喜歡
案例模型
一半模型
案例4 奔跑吧,少年!
少先隊活動(2021年2期)2021-03-29 05:40:48
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
隨機變量分布及統計案例拔高卷
發生在你我身邊的那些治超案例
中國公路(2017年7期)2017-07-24 13:56:38
3D打印中的模型分割與打包
隨機變量分布及統計案例拔高卷
一個模擬案例引發的多重思考
中國衛生(2015年4期)2015-11-08 11:16:06
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 欧美一区二区三区香蕉视| 欧美久久网| 毛片久久久| 97国产在线视频| 国产无码在线调教| 欧美精品另类| 极品私人尤物在线精品首页| 国产91成人| 国产毛片不卡| 成人毛片免费在线观看| 中文无码毛片又爽又刺激| 中文成人在线| 欧美精品啪啪| 人妻无码中文字幕第一区| 播五月综合| 91久久大香线蕉| 日本国产精品一区久久久| 97在线公开视频| 亚洲AV无码乱码在线观看代蜜桃| 久久a级片| 久久国产拍爱| 亚洲swag精品自拍一区| 国产美女在线观看| 精品第一国产综合精品Aⅴ| 国产第四页| 午夜无码一区二区三区| 国产视频大全| 91系列在线观看| 国产精品白浆在线播放| YW尤物AV无码国产在线观看| 亚洲永久免费网站| 久久久精品国产SM调教网站| 中文字幕资源站| 国产成人综合在线视频| 亚洲成网777777国产精品| 91精品国产情侣高潮露脸| 欧美午夜久久| 欧美精品伊人久久| 国产男人的天堂| 成人a免费α片在线视频网站| 99这里只有精品在线| 亚洲成aⅴ人在线观看| 欧美区一区| 一级爱做片免费观看久久| 日韩亚洲综合在线| 亚洲天堂免费观看| 91麻豆国产视频| 中国一级毛片免费观看| 中文字幕调教一区二区视频| 精品国产91爱| 国产91色在线| 亚洲国产无码有码| 永久成人无码激情视频免费| 国产香蕉97碰碰视频VA碰碰看| 久久久无码人妻精品无码| 色九九视频| 亚洲成人高清在线观看| 欧美日韩中文国产va另类| 露脸一二三区国语对白| av一区二区无码在线| 亚洲综合九九| 国产精品无码翘臀在线看纯欲| 国产一级精品毛片基地| 啦啦啦网站在线观看a毛片| 久久公开视频| 成人在线观看一区| 欧美一级色视频| 亚洲中文字幕精品| 欧美成人一级| 国产91丝袜在线播放动漫 | 久久不卡精品| 91精品啪在线观看国产91| 91网在线| 国产后式a一视频| av无码一区二区三区在线| 国产永久在线视频| 国产成人高清精品免费5388| 亚洲不卡av中文在线| 亚瑟天堂久久一区二区影院| 国产精品视频免费网站| 激情综合激情| 欧美亚洲激情|