999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

2011—2017年基于百度搜索指數(shù)的全國(guó)手足口病預(yù)測(cè)研究

2020-07-27 05:32:52紀(jì)煥林張燕婷羅淦豐
關(guān)鍵詞:百度模型

紀(jì)煥林,張燕婷,羅淦豐,李 克

(1.汕頭大學(xué)醫(yī)學(xué)院公共衛(wèi)生與預(yù)防醫(yī)學(xué)教研室,廣東 汕頭 515041;2.中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系,廣東廣州 510080;3.中山大學(xué)公共衛(wèi)生學(xué)院(深圳),廣東 深圳 518107)

手足口病是以多種腸道病毒為病原體的傳染病,目前已成為全國(guó)傳染病報(bào)告發(fā)病率排名前五的丙類傳染病[1],對(duì)5歲以下的兒童造成了嚴(yán)重的疾病負(fù)擔(dān)[2]。傳統(tǒng)的疾病監(jiān)測(cè)系統(tǒng)是通過(guò)逐層上報(bào)的形式,數(shù)據(jù)發(fā)布上有延遲。近年來(lái),已有不少研究通過(guò)挖掘互聯(lián)網(wǎng)搜索數(shù)據(jù),建立數(shù)學(xué)模型對(duì)傳染病進(jìn)行預(yù)測(cè)[3-4],證明了網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)傳染病疫情有一定的預(yù)測(cè)能力。本研究旨在建立一個(gè)結(jié)合百度關(guān)鍵詞搜索指數(shù)和全國(guó)手足口病發(fā)病數(shù)的自回歸移動(dòng)平均模型(autoregressive integrated moving average,ARIMA),對(duì)手足口病的發(fā)病進(jìn)行監(jiān)測(cè)和預(yù)測(cè)。

1 資料與方法

1.1 數(shù)據(jù)來(lái)源

2011—2017年手足口病的發(fā)病數(shù)據(jù)來(lái)源于中國(guó)疾病預(yù)防與控制中心公布的數(shù)據(jù)(http://www.phsciencedata.cn/Share/),其中2011年1月—2016年12月數(shù)據(jù)用于模型擬合,2017年1—12月的數(shù)據(jù)用于模型驗(yàn)證。對(duì)應(yīng)時(shí)間的百度關(guān)鍵詞搜索指數(shù)數(shù)據(jù)從百度指數(shù)官網(wǎng)(http://index.baidu.com)上以月為單位進(jìn)行收集。

1.2 研究?jī)?nèi)容與方法

1.2.1 構(gòu)建綜合百度搜索指數(shù) 從手足口病的疾病名稱、癥狀、治療和預(yù)防4個(gè)維度入手,結(jié)合相關(guān)領(lǐng)域文獻(xiàn),參考百度關(guān)鍵詞挖掘工具(http://tool.chinaz.com/baidu/words.aspx)選擇關(guān)鍵詞并擴(kuò)展,初步獲取了240個(gè)與手足口病相關(guān)的基礎(chǔ)關(guān)鍵詞,計(jì)算每個(gè)關(guān)鍵詞的搜索指數(shù)與手足口病發(fā)病數(shù)的Spearman相關(guān)系數(shù),按照相關(guān)系數(shù)r>7且有統(tǒng)計(jì)學(xué)意義(P<0.05)的原則,篩選出最終納入分析的關(guān)鍵詞。然后構(gòu)建綜合百度搜索指數(shù),即計(jì)算每個(gè)關(guān)鍵詞的搜索指數(shù)與發(fā)病數(shù)的相關(guān)系數(shù)在所有相關(guān)系數(shù)之和中的權(quán)重系數(shù),再將該權(quán)重系數(shù)與對(duì)應(yīng)的關(guān)鍵詞的搜索指數(shù)相乘,最后求和得到。最后計(jì)算綜合百度搜索指數(shù)與全國(guó)發(fā)病數(shù)據(jù)的Spearman相關(guān)系數(shù),確定相關(guān)性的大小。相關(guān)公式如下:

式中,ρi為第i個(gè)關(guān)鍵詞的搜索指數(shù)與發(fā)病數(shù)的相關(guān)系數(shù);Weighti為第i個(gè)關(guān)鍵詞的權(quán)重系數(shù);Keywordi為第i個(gè)關(guān)鍵詞的搜索指數(shù)。

1.2.2 模型擬合 ARIMA模型是一種將ARMA模型與差分運(yùn)算組合的時(shí)間序列預(yù)測(cè)方法,即建立一個(gè)由因變量和隨機(jī)誤差對(duì)平穩(wěn)時(shí)間序列的滯后值影響的模型,公式為ARIMA(p,d,q)×(P,D,Q)s,該模型應(yīng)用的前提條件是所要預(yù)測(cè)數(shù)列的個(gè)體值需相對(duì)穩(wěn)定[5]。本研究通過(guò)時(shí)序圖及單位根檢驗(yàn)來(lái)判斷時(shí)間序列的平穩(wěn)性,采用差分處理將不平穩(wěn)的序列轉(zhuǎn)換為平穩(wěn)序列,用極大似然法估計(jì)模型參數(shù)。模型殘差通過(guò)Ljung-Box方法判斷是否為隨機(jī)序列。根據(jù)赤池信息準(zhǔn)則來(lái)判斷模型的擬合優(yōu)度,AIC值最小時(shí)為最優(yōu)模型。以上方法通過(guò)R軟件中的“tseries”和“forecast”包實(shí)現(xiàn)。

1.2.3 模型預(yù)測(cè) 模型的預(yù)測(cè)效果使用均方根誤差百分比(root mean squared percent error,RMSPE)和平均絕對(duì)百分比誤差(mean absolute percent error,MAPE)來(lái)評(píng)價(jià)[6],其值越小,說(shuō)明模型預(yù)測(cè)性能越好。計(jì)算公式如下:

式中,Ti表示第i個(gè)真實(shí)值;Pi表示第i個(gè)預(yù)測(cè)值。

1.3 統(tǒng)計(jì)學(xué)方法

模型的分析及作圖使用軟件R 3.4.1,檢驗(yàn)水準(zhǔn)均為a=0.05,P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。

2 結(jié)果

2.1 2011—2017年全國(guó)手足口病發(fā)病概況

2011—2017年全國(guó)共計(jì)發(fā)病達(dá)14 787 625人,月平均發(fā)病數(shù)176 043人,年平均發(fā)病率約154/10萬(wàn)。

2.2 關(guān)鍵詞的篩選與綜合百度搜索指數(shù)的構(gòu)建

分別對(duì)240個(gè)百度關(guān)鍵詞搜索指數(shù)和全國(guó)手足口病發(fā)病數(shù)進(jìn)行相關(guān)分析,按r>0.7,P<0.05的條件,篩選出19個(gè)關(guān)鍵詞,見(jiàn)表1。根據(jù)19個(gè)關(guān)鍵詞的百度搜索指數(shù)及其與全國(guó)手足口病發(fā)病數(shù)的相關(guān)系數(shù)進(jìn)行加權(quán)來(lái)構(gòu)建綜合百度搜索指數(shù)。全國(guó)手足口病發(fā)病數(shù)與綜合百度搜索指數(shù)的相關(guān)系數(shù)r=0.94,P<0.05。

2.3 模型擬合

2.3.1 時(shí)間序列平穩(wěn)化 用2011年1月—2016年12月的發(fā)病數(shù)據(jù)構(gòu)建時(shí)間序列,繪制時(shí)序圖,發(fā)現(xiàn)序列為非平穩(wěn)序列,需進(jìn)行差分處理。差分后通過(guò)單位根檢驗(yàn)得DF=-4.176 5,P<0.05,說(shuō)明該序列已經(jīng)平穩(wěn),d與D取值為1。序列的季節(jié)周期為12個(gè)月,故s=12。

2.3.2 模型的定階 繪制自相關(guān)圖和偏自相關(guān)圖后發(fā)現(xiàn)自相關(guān)系數(shù)拖尾,q可取值0。偏自相關(guān)系數(shù)2階后截尾,p可取值1或2。P,Q值一般不會(huì)超過(guò)2,分別對(duì)P,Q值取0、1逐個(gè)嘗試,結(jié)合AIC值判斷,最終確定的模型為ARIMA(2,1,0)(0,1,1)12,此模型的AIC值最小。

表1 19個(gè)百度關(guān)鍵詞與手足口病發(fā)病數(shù)的相關(guān)性

2.3.3 模型驗(yàn)證 對(duì)此模型殘差進(jìn)行白噪聲檢驗(yàn),Ljung-Box統(tǒng)計(jì)量Q=0.165,P=0.684,未通過(guò)顯著性檢驗(yàn),殘差是隨機(jī)序列,證明該模型已充分提取原序列信息,可進(jìn)行預(yù)測(cè)。

2.4 模型預(yù)測(cè)效果比較

2017年1—12月手足口病實(shí)際發(fā)病數(shù)與模型預(yù)測(cè)發(fā)病數(shù)見(jiàn)表2,進(jìn)一步計(jì)算模型的預(yù)測(cè)效果指標(biāo),得到基于百度指數(shù)的模型的MAPE=24.86%,RMAPE=29.86%;單獨(dú)利用發(fā)病歷史數(shù)據(jù)的模型的MAPE=27.58%,RMAPE=35.50%,說(shuō)明前者的預(yù)測(cè)準(zhǔn)確度要更好。基于百度搜索指數(shù)建立的ARIMA模型與單獨(dú)利用發(fā)病歷史數(shù)據(jù)建立的ARIMA模型的預(yù)測(cè)效果見(jiàn)圖1、圖2。

3 討論

百度指數(shù)是大數(shù)據(jù)時(shí)代重要的統(tǒng)計(jì)分析數(shù)據(jù),客觀地記錄了各個(gè)關(guān)鍵詞每日的搜索量。網(wǎng)絡(luò)搜索詞量的動(dòng)態(tài)變化一定程度上反映了該地區(qū)相關(guān)疾病流行情況和人群中發(fā)病及求醫(yī)的信息[7]。ARIMA模型是應(yīng)用于傳染病預(yù)測(cè)最常用的方法之一[8-9],其綜合考慮了傳染病的周期性、季節(jié)性、隨機(jī)性等可能影響序列平穩(wěn)性的因素,提高了模型的預(yù)測(cè)和擬合效果。利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行傳染病的預(yù)測(cè)已成為研究熱點(diǎn)之一,國(guó)外研究基于“谷歌”搜索引擎已有登革熱[10]、流行性感冒[11]谷歌趨勢(shì)預(yù)測(cè),國(guó)內(nèi)更多的研究是挖掘百度搜索指數(shù),進(jìn)行不同數(shù)學(xué)模型預(yù)測(cè),如流行性感冒[12]、登革熱[13]、紅斑性肢痛癥[14]等,也有對(duì)清遠(yuǎn)市做基于百度指數(shù)的手足口病不同數(shù)學(xué)模型的預(yù)測(cè)研究[15-16],但目前尚無(wú)基于百度搜索指數(shù)的全國(guó)手足口病ARIMA發(fā)病預(yù)測(cè)模型研究。

表2 2017年1—12月的實(shí)際發(fā)病數(shù)與模型預(yù)測(cè)發(fā)病數(shù)(人)

圖1 基于百度搜索指數(shù)的ARIMA模型預(yù)測(cè)效果圖

圖2 基于發(fā)病歷史數(shù)據(jù)的ARIMA模型預(yù)測(cè)效果圖

本研究利用關(guān)鍵詞挖掘工具,從240個(gè)百度關(guān)鍵詞最終篩選出19個(gè)相關(guān)系數(shù)大于0.7的關(guān)鍵詞,然后加權(quán)構(gòu)建綜合百度搜索指數(shù),提高了預(yù)測(cè)的精確度。綜合百度搜索指數(shù)與手足口病發(fā)病數(shù)的相關(guān)性為0.94,同時(shí),兩者變化的趨勢(shì)較為一致,說(shuō)明使用百度指數(shù)進(jìn)行手足口病發(fā)病的預(yù)測(cè)是合理且可靠的。利用建立的ARIMA模型進(jìn)行預(yù)測(cè),發(fā)現(xiàn)用結(jié)合百度搜索指數(shù)建立的ARIMA模型相對(duì)于只基于手足口病發(fā)病數(shù)建立的ARIMA模型,前者的MAPE值以及RMSPE值都比較低,說(shuō)明使用百度搜索指數(shù)可以更好地提升ARIMA模型的預(yù)測(cè)性能。

本研究也存在一定局限性,百度關(guān)鍵詞受到網(wǎng)民文化教育水平、個(gè)體健康需求等的影響,導(dǎo)致關(guān)鍵詞范圍寬泛;另一方面,人們也可能受媒體報(bào)道的影響,使百度指數(shù)存在媒體效應(yīng),造成百度指數(shù)的虛浮。盡管如此,挖掘互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)傳染病進(jìn)行發(fā)病預(yù)測(cè)的方法,為傳染病的監(jiān)測(cè)和防控提供了一個(gè)新思路。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,百度指數(shù)作為一個(gè)方便、免費(fèi)、易得的數(shù)據(jù)來(lái)源,應(yīng)用前景廣泛,未來(lái)可以使用不同的數(shù)學(xué)模型,結(jié)合全國(guó)或不同地區(qū)的傳染病發(fā)病數(shù)據(jù),建立預(yù)測(cè)性能更優(yōu)的傳染病監(jiān)測(cè)系統(tǒng)。

猜你喜歡
百度模型
一半模型
重要模型『一線三等角』
Robust adaptive UKF based on SVR for inertial based integrated navigation
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
百度年度熱搜榜
3D打印中的模型分割與打包
做一個(gè)“百度”不知道的老師
百度遭投行下調(diào)評(píng)級(jí)
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
百度醫(yī)生
主站蜘蛛池模板: 中文字幕丝袜一区二区| 国产福利免费在线观看| 国产精品漂亮美女在线观看| 国产高清又黄又嫩的免费视频网站| 狠狠ⅴ日韩v欧美v天堂| 国产第一页第二页| 91香蕉国产亚洲一二三区| 国产成人91精品| 亚洲最新网址| 亚洲男人天堂久久| 国产一区二区免费播放| 中文字幕伦视频| 91久久偷偷做嫩草影院免费看| 日韩成人午夜| 久久狠狠色噜噜狠狠狠狠97视色| 丝袜亚洲综合| 午夜精品国产自在| 青草国产在线视频| 国产一级在线播放| 亚洲国产理论片在线播放| 她的性爱视频| 国产高颜值露脸在线观看| 国产精品护士| 高清视频一区| 99re在线视频观看| 亚洲精品无码专区在线观看| 亚洲αv毛片| 欧美不卡视频在线观看| 女人18一级毛片免费观看| 国产精品极品美女自在线网站| 99精品在线视频观看| 婷婷六月综合| 欧美一区精品| 国产尤物jk自慰制服喷水| 亚洲 成人国产| 亚洲精品视频免费| 999国产精品| 欧美 亚洲 日韩 国产| 欧美日本在线一区二区三区| www亚洲精品| 99无码中文字幕视频| 激情综合图区| 人禽伦免费交视频网页播放| 在线观看av永久| 亚洲三级a| 久久久久久尹人网香蕉 | 亚洲国产一区在线观看| 国产另类视频| 国产jizzjizz视频| 国产麻豆91网在线看| 国模极品一区二区三区| 国产精品偷伦在线观看| 国产精品浪潮Av| 91青青视频| 欧美天堂久久| 日韩在线观看网站| 国产精品无码AV片在线观看播放| 日韩精品一区二区深田咏美| 91久久夜色精品国产网站| 久久黄色免费电影| 在线综合亚洲欧美网站| 免费国产不卡午夜福在线观看| 性欧美精品xxxx| 国产h视频免费观看| 国产SUV精品一区二区6| 婷婷久久综合九色综合88| 久久久成年黄色视频| 一本无码在线观看| 不卡国产视频第一页| 麻豆国产精品| 国产黑丝一区| 国产一级精品毛片基地| 国产精品va免费视频| 日本成人在线不卡视频| 波多野结衣视频一区二区| 中国一级特黄视频| 欧美成人A视频| 国产1区2区在线观看| 久久久久久尹人网香蕉| 国产精品30p| 久久亚洲国产最新网站| 久久a毛片|