999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

k近鄰算法在空氣質量測定方面的應用—臭氧日判斷

2019-03-15 01:30:04呂昊芝
電子制作 2019年4期
關鍵詞:模型

呂昊芝

(山東省濰坊第一中學,山東濰坊,261000)

1 概述

1.1 重要性和意義

臭氧(O3)又稱為超氧,是氧氣的同素異形體,大氣中的臭氧層可以吸收太陽釋放出來的絕大部分紫外線,使人免遭紫外線造成的侵害。然而,超標的地表臭氧會對人體造成傷害,它會強烈刺激人的眼睛和呼吸道,還會造成人的神經中毒,對人體皮膚中的維生素E也會起到破壞作用。因此,測定地標臭氧濃度是否超標必須引起人們的高度重視。

國內外的許多專家投身于對該指標的分析和預測中,臭氧日一詞隨之誕生,本文選用臭氧八小時作為臭氧日污染衡量標準,即一天中臭氧最高的連續8小時的平均濃度值。相較于過去落后的針對空氣質量的人工推算,利用機器學習分析大氣問題可以極大提高預測的準確率,同時也可以縮短分析預測所需時間,從而保證空氣質量預報的時效性,因此該研究具有極其深刻的現實意義。

1.2 國內外研究現狀

隨著我國科技水平的快速提高、大氣領域數據量的增多,傳統空氣質量測定方法的弊端不斷暴露,傳統法易出現主觀判斷失誤、分析預測速度較慢等一系列問題。相對比而言,人工智能應用于空氣質量預測能夠對大氣相關的海量數據進行極其有效的處理,并且其本身在進行數據挖掘時的高效性和準確性都成為了它獨特的優勢。

由于“人工智能+空氣測定”前景廣闊,政府部門及企業都紛紛布局該領域。比如,由微軟亞洲互聯網工程院在2014年發布的人工智能機器人能夠收集能夠整合來自全國3000多個站點的數據,在極短的時間內作出對霧霾的預測;IBM推出的“綠色地平線”項目也能夠通過機器學習方式對數據進行學習,完善對不同地區污染程度的預測;騰訊公司也在2017年與深圳市氣象局攜手打造了“互聯網+氣象”的新模式,它能夠依托騰訊擁有的海量用戶基礎,打造面向個人的定制化氣象服務。 由此可見,人工智能與環境科學的結合正在一步步走進我們的生活。

1.3 本研究創新點

本研究在空氣質量領域實現了與機器學習的融合,通過已知的臭氧日數據集和k近鄰機器學習算法來構建概率模型,之后收集某一天天氣狀況和大氣各項指標的輸入信息,通過該機器學習模型對輸入數據進行分析,從而判斷該天大氣臭氧是否超標,即是否為臭氧日,極大提高了大氣預測的準確度和時效性。

2 機器學習和訓練數據集介紹

2.1 機器學習背景知識介紹

本文通過機器學習算法對某天是否為臭氧日進行分析和預測,是個典型的二分類監督學習問題。

機器學習研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,從而使自身擁有更強大的預測能力,它是使計算機具有智能的根本途徑。監督式機器學習是從標記的訓練數據來構建概率模型的機器學習方法,在監督學習中,每個實例都是由一個輸入對象即該實例的特征向量和一個期望的輸出值即該實例的標簽組成。

2.2 訓練數據集介紹

本文利用的數據集來自UC Irvine Machine Learning Repository 網 站 (http://archive.ics.uci.edu/ml/index.php),數據集名稱為《Ozone Level Detection Data Set》,該數據集包含七年內(1998至2004年)美國Houston、Galveston以及Brazoria地區每一天的大氣相關數據。其中共有2536個樣本,每個樣本具有73個特征,其中第1項特征為日期,不包含在機器學習建模內;其余特征值為大氣相關特征指標,均為連續值,用于機器學習建模。該數據集的目的為預測某天是否為臭氧日,其中標簽0表示該日不是臭氧日,1表示該日為臭氧日。

臭氧日數據集中各特征極其特征解釋如表1所示。

表1 特征名稱及含義

RH85 在850hpa環境下的相對濕度U85 在850hpa環境下的東西方向的風速V85 在850hpa環境下的南北方向的風速HT85 在850hpa環境下的位勢高度T70 在700hpa環境下的氣溫RH70 在700hpa環境下的相對濕度U70 在700hpa環境下的東西方向的風速V70 在700hpa環境下的南北方向的風速HT70 在700hpa環境下的位勢高度T50 在500hpa環境下的氣溫RH50 在500hpa環境下的相對濕度U50 在500hpa環境下的東西方向的風速V50 在500hpa環境下的南北方向的風速HT50 在500hpa環境下的位勢高度KI K指數TT 氣溫總值SLP 海平面氣壓SLP_ 海平面氣壓相較于前一天的變化Precp 降水量

3 k近鄰模型

3.1 k近鄰算法介紹

3.1.1 算法原理

k近鄰法于1968年由Cover和Hart提出,是一種基本分類與回歸方法,它的優點是易于理解、精度高、理論成熟。其原理為:將新樣本數據點輸入到包含所有訓練數據集所有樣本點的n維空間中,利用距離度量計算所有訓練集樣本點與新樣本點之間的距離,選取k個最近點,最后利用某種分類決策規則確定新樣本所屬類別。

圖1 為k近鄰算法的原理圖。

圖1 算法原理圖

K近鄰算法的一個例子可以從圖1中看到,未知點有兩類:三角形或方形。如果K=3,新樣本點就被分為三角形類,因為在與它距離最小的3個點中,有2個三角形和1個方形;而如果k=5,新樣本點就被分為方形類,因為在與它距離最小的5個點中,有2個三角形和3個方形;當k=9時,新樣本點就會被分為三角形類,因為此時與它距離最小的9個點中有5個三角形和4個方形。

3.1.2 基本要素

針對以上原理,可見k近鄰算法包含三個基本要素,即k值的選擇、距離度量、分類決策規則。

①k值的選擇會對k近鄰算法的結果產生很大影響,如果k值過小,即使用較小鄰域內的訓練樣本點對新樣本進行預測,則會使預測結果依賴近鄰的個別實例點,從而產生過擬合現象;相反,如果k值過大,即使用較大鄰域內的訓練樣本點對新樣本進行預測,則容易忽略訓練樣本中與新樣本相似的樣本點的大量有用信息,使得k近鄰模型過于簡單,從而產生欠擬合現象。本文利用交叉驗證法來選取對于該預測問題的最優的k值。

②距離度量衡量兩個實例點之間的距離,用于判斷兩個點的相似程度。本文使用的是歐式距離,公式為:

其中,d(x,y)表示點x與點y的歐式距離,xi表示點x的第i項特征,yi表示點y的第i項特征。

③分類決策規則的作用為決定新輸入樣本點x的類別y,本文所采用的是多數表決,公式為:

其中 i=1,2,...,N ;j=1,2,...,K,Nk(x)為涵蓋k個最近的訓練樣本點的x的鄰域。I為指示函數, yi為新樣本標簽,cj為第j類,當yi=cj時I為1,否則為0。

3.2 基于k近鄰算法的模型構建

k近鄰算法的模型是包含訓練數據集所有樣本點的n維空間,其中n為樣本特征數。本文構建該模型即把臭氧日數據集中2536個樣本根據其特征值輸入到維數為72的特征空間中。

3.3 利用模型對新數據進行分析和預測

通過信息采集得到一個某天的天氣相關數據指標,后將該數據傳入上文構建完成的k近鄰機器學習算法模型中,計算出所有樣本點與新樣本點的歐式距離,并將距離由小到大排序,取與新本點距離最近的k個訓練集樣本點,所選取樣本點中哪個類別出現的頻率最多,新樣本點就被歸為哪個類別標簽。

3.4 交叉驗證衡量模型準確率

將臭氧日數據集分為訓練集和測試集兩部分,分別為70%和30%,樣本個數分別為1775和761。其中,訓練集用來構建模型,測試集用來測試模型的準確率。本研究k值在10至50內選取,針對k的每個取值構建模型,因此k近鄰模型個數為41,利用交叉驗證計算每個模型的預測準確率,選擇準確率最高的模型作為本研究的臭氧日預測評估模型,其中準確率表達式為:

其中m表示測試集被正確分類的樣本,m′為測試集總樣本。

3.5 試驗結果及評價

本研究利用Python的sklearn機器學習庫來訓練模型并得到模型的準確度,將當k取10至50時的模型訓練結果即準確率保存在名為kvalues的列表中,將列表中的最大值保存在max_value變量中,機器執行結果如圖2所示。

圖2 執行結果圖

由圖2可知,當k取不同值時,k近鄰模型準確率在0.92和0.96之間,最好的準確率為95.8%,程序運行時間約為7.89秒,很好地體現了人工智能應用于空氣質量測定的高準確度和及時性的優點。

4 研究整體過程總結

本研究流程圖如圖3所示。

圖3 總流程圖

整體流程分為兩大部分,即模型構建階段和預測分析階段。

①模型構建階段:本研究從臭氧日訓練數據集出發,利用k近鄰機器學習算法對該數據進行建模分析,得到該系統的核心,即臭氧日預測概率模型。

②預測分析階段:收集某一天的大氣相關數據,總結出數據集中所包含的72項特征,接著系統自動將該特征值進行格式化,即利用Excel電子表格進行封裝。之后將封裝好的新樣本的特征傳入到第①階段所構建的臭氧日預測概率模型中,經過系統模型的分析,最終預測出樣本的標簽(1或0),即表示該日是否臭氧超標的結果。

5 結語

隨著近年來人們生活水平的提高,人們對空氣質量預測的要求也越來越高,但如今氣象預測不準確、有延遲的弊端嚴重影響了人們的生活質量。本研究從該角度入手,將人工智能與氣象領域進行結合,以提高氣象預測的準確率和時效性,從而使人們能夠享有較高質量的生活。

但是,受到科技水平的限制,使得供機器學習使用的數據集不夠充分,格式也不夠規范,這兩個因素共同導致了本文機器學習模型預測不能達到完全正確。不過,隨著我國科技發展和國家政府對于氣象預測領域的重視,筆者相信,機器學習終將登上歷史的舞臺,對人們的生活做出不可忽視的貢獻。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产女人18毛片水真多1| 婷婷色丁香综合激情| 玖玖精品视频在线观看| 欧美成人午夜在线全部免费| 在线播放国产一区| 欧美日韩国产在线播放| 精品人妻一区二区三区蜜桃AⅤ| 99er精品视频| a天堂视频在线| 免费毛片全部不收费的| 视频二区亚洲精品| 色婷婷色丁香| 日韩欧美国产精品| 久久久久国产精品免费免费不卡| 亚洲日韩欧美在线观看| 91福利国产成人精品导航| 亚洲AV无码乱码在线观看裸奔| 四虎永久免费地址在线网站| 青青草原国产av福利网站| 欧美精品一二三区| 在线观看精品自拍视频| 国产又黄又硬又粗| 污网站在线观看视频| 成色7777精品在线| 伊人色在线视频| 国产欧美视频在线观看| 免费人成网站在线观看欧美| 国产国模一区二区三区四区| 黄色成年视频| 波多野一区| 国产在线98福利播放视频免费 | 综合色亚洲| 国产va在线观看免费| 日韩色图区| 国产va视频| 国产真实乱人视频| 精品午夜国产福利观看| 在线观看国产精美视频| 国产精品白浆在线播放| 亚洲成人网在线播放| 久久精品娱乐亚洲领先| 久操线在视频在线观看| 国产91高清视频| 精品国产成人高清在线| 国产激情影院| 欧美成人看片一区二区三区| 亚卅精品无码久久毛片乌克兰| 亚洲日韩图片专区第1页| 蝌蚪国产精品视频第一页| 毛片久久网站小视频| 欧洲欧美人成免费全部视频| 亚洲国产精品一区二区第一页免 | 女人18毛片水真多国产| 日本午夜精品一本在线观看| 欧美成人免费午夜全| 亚洲黄色成人| 中国国产A一级毛片| 一级毛片免费播放视频| 亚洲日韩Av中文字幕无码 | 四虎影视永久在线精品| www中文字幕在线观看| 欧美激情视频二区三区| 亚洲熟女中文字幕男人总站| 日韩av在线直播| 国产成人无码播放| 欧美午夜在线视频| 成人亚洲国产| 亚洲无码高清免费视频亚洲 | 亚卅精品无码久久毛片乌克兰| 精品国产Ⅴ无码大片在线观看81| 欧洲欧美人成免费全部视频| 男人天堂伊人网| 亚洲天堂网在线播放| 亚洲欧州色色免费AV| 国产麻豆91网在线看| 国产成人精品在线| 青青久久91| 真实国产乱子伦高清| 第一页亚洲| 在线观看的黄网| 久久综合色播五月男人的天堂| 麻豆精品视频在线原创|