999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在氣溫預測中的應用

2021-03-23 06:37:34王江波李景詩
科學技術創新 2021年7期
關鍵詞:模型

王江波 白 雪 徐 景 李景詩

(南京信息工程大學 數學與統計學院,江蘇 南京210044)

1 概述

氣象溫度的預測一直以來都是天氣預測的重點問題,天氣不僅直接影響人們的健康、甚至影響人們的心情[1];此外,天氣變化還會影響一個國家的經濟狀況。據美國氣候中心報告,美國每年因為氣象災害的損失要達到1000 億美元[2]。短臨預報是近年來的熱點問題,其根據大氣科學原理,運用統計學知識對未來變化趨勢預測。提高短臨預測的準確率和效率,對國民經濟有重要指導意義[3]。

在統計學理論范疇下,氣溫預測技術種類繁多。最新的數值預報有如下幾個方面:一是多元統計分析,主要運用數理統計學的相關知識,在多對象多因素的關聯下進行相關性分析,進而得到規律;二是運用概率預測的統計方法,以此來預測某類天氣現象是否可能發生,并給出其發生可能性大小;三是時間序列分析,通過挖掘歷史數據中的規律,進而來預測未來的天氣。

隨著計算機技術的快速發展,機器學習在氣象預測中展現出巨大的潛力,其能夠有效避免過擬合過高維數等問題,而且求解速度快,精度也更高。

在國外,Khan M R[4]等人提出簡單遞歸網絡對氣溫進行預測,SinghS[5]等人對氣象中的溫度屬性以及特定數據采用依賴性研究,提出了基于遺傳算法和神經網絡相結合的綜合反向傳播溫度預測模型。國內針對氣溫的預測相對滯后,比如黃文杰,曹鴻興等人[6]在20 世紀以ARIMA 作為季節模型定量分析,這一期間ARIMA 時間序列模型被廣泛用于預測研究,南京信息工程大學的智協飛[7]等運用貝葉斯模式平均法將三個模式預報結果進行多模式氣溫集成。

2 數據預處理

2.1 數據采集

本文選取了海口地面觀測站點的觀測數據集作為樣本數據集,其中采集了2019 年6 月到2020 年6 月的相關氣象觀測數據。原始觀測數據的部分見表1。

據表1 顯示,該氣象站的數據更新頻率為1 小時/次,即每1 小時更新一次海口站點的相關要素值,其數據要素采集包括區站號、時、本站氣壓、氣溫、相對濕度、小時降水量、瞬時風向、瞬時風速、最小能見度,其中后面7 個要素的單位分別為:百帕、攝氏度、百分率、毫米、度、米/秒、米。

2.2 數據處理

2.2.1 清洗數據。數據清洗是數據預測中最為重要的環節。首先處理表中的重復值,其中區站號都是??谡军c59757,對氣溫的預測沒有實際作用,所以刪除此列;其次要對缺失值進行處理,本文采用中位數代替缺測值。

2.2.2 歸一化處理。觀察表可知,不同的變量有不同的量綱,這將對最終的預測結果產生不利的影響。本文采用數據歸一化以解決氣象要素之間的可比性問題。歸一化后氣象要素的取值范圍在[0,1]之間,具體公式如下所示:

其中,max 為最大值,min 為最小值。歸一化后,能加快LSTM的處理速度,也能減小輸出誤差。

2.2.3 將時間序列數據轉化為有監督數據。本文采用的輸入t 時間步各要素的觀測值,輸出t+1 時間步氣溫值。具體就是將時間序列數據向后滑動一個單位,然后進行拼接,這就是有監督的數據集。

3 方法與原理

長短期記憶網絡(Long Short-Term Memory,LSTM)是循環神經網絡RNN 的分支,LSTM 有效解決了長期依賴問題,其設計的目的意在更好的存儲和訪問歷史信息。一方面,LSTM 由隱藏層、輸出層和輸入層組成。另一方面,LSTM 又是一種特殊的RNN,隱藏層由一個或多個記憶單元組成,每個記憶單元擁有3個“門”結構,其中包括遺忘門、輸入門和輸出門。LSTM 的單元結構如圖1 所示。

表1 原始觀測數據

圖1 LSTM 結構圖

由圖1 所示,有一條直線橫穿了整個單元,并且通過線性計算與輸入門、輸出門、遺忘門鏈接,下面列出相關公式:

其中,ft、it、ct、ot分別表示當前時刻的遺忘門、輸入門、單元狀態和輸出門;ht則是LSTM 的輸出;b 是偏置項,w 是各類輸入循環權重;σ 是sigmoid 函數,用來調節權重;在LSTM 結構中,因為3 種門結構和特殊單元,以至于LSTM 能夠學習歷史信息,并從中舍棄無效的信息,將有價值的信息保留下來。其次,單元ct在遺忘門舍棄了一些信息,所以需要通過輸入門來學習新的信息。最后,通過計算單元狀態之后,ct得到了更新,再利用輸出門,和tanh 層決定最終的輸出值ht。

4 實驗與結果

4.1 模型結構

圖2 LSTM 時間序列模型結構

4.2 結果分析

本文采集了??诘貐^的氣象數據,并利用采集數據進行訓練的測試。這里隨機選取80%作為訓練集,20%作為測試集。為了評估模型的性能和精度,本文根據預測的值和實際的值,采用了均方誤差MSE 和平均絕對誤差MAE 作為模型的評估指標,它們的計算公式如下所示:

其中,y 為氣溫的預測值,y 為氣溫的實際值,當MSE 和MAE 越小時,說明模型的預測性能越好,同時表明預測誤差較小。不同時間序列長度的模型效果如表2 所示。

表2 模型效果比較基于不同序列長度

序列長度是指我們在預測過程中的數據輸入長度,即用多長序列的數據來預測未來三小時的溫度。由模型效果的結果,可以發現當序列長度為4 天,即96 小時,模型的預測效果最好,因此我們的模型的序列輸入長度為96。接下來對訓練好的模型進行未來三小時的預測,為了盡可能直觀展示未來三小時的預測結果,我們用96 小時的數據對未來三小時分別進行了預測,預測的效果圖如圖3 所示。

圖3 未來三小時氣溫預測值

從預測的結果可以看出,在未來一小時內預測結果良好,預測溫度與實際溫度基本一致,但在第三個小時,出現了輕微的波動。由此可見,LSTM 在氣溫預測中具有良好的預報能力,另外,在不同的參數組合下對結果影響大。在實際業務中,應進行大量的實驗,選取最佳的參數組合,使模型預測效果達到最佳。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 欧亚日韩Av| 尤物国产在线| 久99久热只有精品国产15| 亚洲天堂免费| 国产剧情国内精品原创| 精品久久久久久久久久久| 少妇人妻无码首页| 国产国拍精品视频免费看 | 成人午夜亚洲影视在线观看| 国产日韩久久久久无码精品| 午夜视频免费试看| 亚洲欧美日韩视频一区| 久久久久国产一区二区| 亚洲三级a| 高清大学生毛片一级| 国产粉嫩粉嫩的18在线播放91| 97国产成人无码精品久久久| 内射人妻无码色AV天堂| 国产jizzjizz视频| 性欧美久久| 99热这里只有成人精品国产| 男女猛烈无遮挡午夜视频| 久久久久久高潮白浆| 欧美日韩国产精品va| 亚洲国产成人自拍| 天天综合色网| 精品人妻无码中字系列| 成年看免费观看视频拍拍| 国产无码精品在线播放| 视频二区亚洲精品| 色婷婷综合激情视频免费看| 国产乱人伦偷精品视频AAA| 日韩毛片在线视频| 国产国产人成免费视频77777 | 老色鬼欧美精品| 欧美日韩福利| 久久国产精品嫖妓| 国语少妇高潮| 亚洲视频二| 亚洲黄网在线| 国产美女久久久久不卡| 啊嗯不日本网站| 亚洲午夜片| 色偷偷av男人的天堂不卡| 成人福利免费在线观看| 在线亚洲精品福利网址导航| 先锋资源久久| 国产91丝袜| 国产成人久久综合一区| 中文字幕 91| 欧美国产日本高清不卡| 欧美成人第一页| 欧美亚洲国产精品第一页| 日韩AV无码免费一二三区| 99人体免费视频| 第一区免费在线观看| 亚洲第一视频网| 国产成人午夜福利免费无码r| 992tv国产人成在线观看| 色婷婷狠狠干| 国产欧美视频在线| 欧美综合区自拍亚洲综合绿色 | 亚洲色无码专线精品观看| 亚洲国产av无码综合原创国产| 国产视频一区二区在线观看| 午夜小视频在线| 99久久99这里只有免费的精品| 国产AV无码专区亚洲A∨毛片| 黄色国产在线| 欧洲高清无码在线| 91九色视频网| 国产欧美专区在线观看| 亚洲高清资源| 91精品伊人久久大香线蕉| 亚洲性一区| 2021国产精品自产拍在线观看| 免费无码又爽又刺激高| a级毛片免费看| 国产小视频在线高清播放| 国产成人高清在线精品| 亚洲综合色在线| 国产一在线|