999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

k近鄰算法在空氣質量測定方面的應用—臭氧日判斷

2019-03-15 01:30:04呂昊芝
電子制作 2019年4期
關鍵詞:模型

呂昊芝

(山東省濰坊第一中學,山東濰坊,261000)

1 概述

1.1 重要性和意義

臭氧(O3)又稱為超氧,是氧氣的同素異形體,大氣中的臭氧層可以吸收太陽釋放出來的絕大部分紫外線,使人免遭紫外線造成的侵害。然而,超標的地表臭氧會對人體造成傷害,它會強烈刺激人的眼睛和呼吸道,還會造成人的神經中毒,對人體皮膚中的維生素E也會起到破壞作用。因此,測定地標臭氧濃度是否超標必須引起人們的高度重視。

國內外的許多專家投身于對該指標的分析和預測中,臭氧日一詞隨之誕生,本文選用臭氧八小時作為臭氧日污染衡量標準,即一天中臭氧最高的連續8小時的平均濃度值。相較于過去落后的針對空氣質量的人工推算,利用機器學習分析大氣問題可以極大提高預測的準確率,同時也可以縮短分析預測所需時間,從而保證空氣質量預報的時效性,因此該研究具有極其深刻的現實意義。

1.2 國內外研究現狀

隨著我國科技水平的快速提高、大氣領域數據量的增多,傳統空氣質量測定方法的弊端不斷暴露,傳統法易出現主觀判斷失誤、分析預測速度較慢等一系列問題。相對比而言,人工智能應用于空氣質量預測能夠對大氣相關的海量數據進行極其有效的處理,并且其本身在進行數據挖掘時的高效性和準確性都成為了它獨特的優勢。

由于“人工智能+空氣測定”前景廣闊,政府部門及企業都紛紛布局該領域。比如,由微軟亞洲互聯網工程院在2014年發布的人工智能機器人能夠收集能夠整合來自全國3000多個站點的數據,在極短的時間內作出對霧霾的預測;IBM推出的“綠色地平線”項目也能夠通過機器學習方式對數據進行學習,完善對不同地區污染程度的預測;騰訊公司也在2017年與深圳市氣象局攜手打造了“互聯網+氣象”的新模式,它能夠依托騰訊擁有的海量用戶基礎,打造面向個人的定制化氣象服務。 由此可見,人工智能與環境科學的結合正在一步步走進我們的生活。

1.3 本研究創新點

本研究在空氣質量領域實現了與機器學習的融合,通過已知的臭氧日數據集和k近鄰機器學習算法來構建概率模型,之后收集某一天天氣狀況和大氣各項指標的輸入信息,通過該機器學習模型對輸入數據進行分析,從而判斷該天大氣臭氧是否超標,即是否為臭氧日,極大提高了大氣預測的準確度和時效性。

2 機器學習和訓練數據集介紹

2.1 機器學習背景知識介紹

本文通過機器學習算法對某天是否為臭氧日進行分析和預測,是個典型的二分類監督學習問題。

機器學習研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,從而使自身擁有更強大的預測能力,它是使計算機具有智能的根本途徑。監督式機器學習是從標記的訓練數據來構建概率模型的機器學習方法,在監督學習中,每個實例都是由一個輸入對象即該實例的特征向量和一個期望的輸出值即該實例的標簽組成。

2.2 訓練數據集介紹

本文利用的數據集來自UC Irvine Machine Learning Repository 網 站 (http://archive.ics.uci.edu/ml/index.php),數據集名稱為《Ozone Level Detection Data Set》,該數據集包含七年內(1998至2004年)美國Houston、Galveston以及Brazoria地區每一天的大氣相關數據。其中共有2536個樣本,每個樣本具有73個特征,其中第1項特征為日期,不包含在機器學習建模內;其余特征值為大氣相關特征指標,均為連續值,用于機器學習建模。該數據集的目的為預測某天是否為臭氧日,其中標簽0表示該日不是臭氧日,1表示該日為臭氧日。

臭氧日數據集中各特征極其特征解釋如表1所示。

表1 特征名稱及含義

RH85 在850hpa環境下的相對濕度U85 在850hpa環境下的東西方向的風速V85 在850hpa環境下的南北方向的風速HT85 在850hpa環境下的位勢高度T70 在700hpa環境下的氣溫RH70 在700hpa環境下的相對濕度U70 在700hpa環境下的東西方向的風速V70 在700hpa環境下的南北方向的風速HT70 在700hpa環境下的位勢高度T50 在500hpa環境下的氣溫RH50 在500hpa環境下的相對濕度U50 在500hpa環境下的東西方向的風速V50 在500hpa環境下的南北方向的風速HT50 在500hpa環境下的位勢高度KI K指數TT 氣溫總值SLP 海平面氣壓SLP_ 海平面氣壓相較于前一天的變化Precp 降水量

3 k近鄰模型

3.1 k近鄰算法介紹

3.1.1 算法原理

k近鄰法于1968年由Cover和Hart提出,是一種基本分類與回歸方法,它的優點是易于理解、精度高、理論成熟。其原理為:將新樣本數據點輸入到包含所有訓練數據集所有樣本點的n維空間中,利用距離度量計算所有訓練集樣本點與新樣本點之間的距離,選取k個最近點,最后利用某種分類決策規則確定新樣本所屬類別。

圖1 為k近鄰算法的原理圖。

圖1 算法原理圖

K近鄰算法的一個例子可以從圖1中看到,未知點有兩類:三角形或方形。如果K=3,新樣本點就被分為三角形類,因為在與它距離最小的3個點中,有2個三角形和1個方形;而如果k=5,新樣本點就被分為方形類,因為在與它距離最小的5個點中,有2個三角形和3個方形;當k=9時,新樣本點就會被分為三角形類,因為此時與它距離最小的9個點中有5個三角形和4個方形。

3.1.2 基本要素

針對以上原理,可見k近鄰算法包含三個基本要素,即k值的選擇、距離度量、分類決策規則。

①k值的選擇會對k近鄰算法的結果產生很大影響,如果k值過小,即使用較小鄰域內的訓練樣本點對新樣本進行預測,則會使預測結果依賴近鄰的個別實例點,從而產生過擬合現象;相反,如果k值過大,即使用較大鄰域內的訓練樣本點對新樣本進行預測,則容易忽略訓練樣本中與新樣本相似的樣本點的大量有用信息,使得k近鄰模型過于簡單,從而產生欠擬合現象。本文利用交叉驗證法來選取對于該預測問題的最優的k值。

②距離度量衡量兩個實例點之間的距離,用于判斷兩個點的相似程度。本文使用的是歐式距離,公式為:

其中,d(x,y)表示點x與點y的歐式距離,xi表示點x的第i項特征,yi表示點y的第i項特征。

③分類決策規則的作用為決定新輸入樣本點x的類別y,本文所采用的是多數表決,公式為:

其中 i=1,2,...,N ;j=1,2,...,K,Nk(x)為涵蓋k個最近的訓練樣本點的x的鄰域。I為指示函數, yi為新樣本標簽,cj為第j類,當yi=cj時I為1,否則為0。

3.2 基于k近鄰算法的模型構建

k近鄰算法的模型是包含訓練數據集所有樣本點的n維空間,其中n為樣本特征數。本文構建該模型即把臭氧日數據集中2536個樣本根據其特征值輸入到維數為72的特征空間中。

3.3 利用模型對新數據進行分析和預測

通過信息采集得到一個某天的天氣相關數據指標,后將該數據傳入上文構建完成的k近鄰機器學習算法模型中,計算出所有樣本點與新樣本點的歐式距離,并將距離由小到大排序,取與新本點距離最近的k個訓練集樣本點,所選取樣本點中哪個類別出現的頻率最多,新樣本點就被歸為哪個類別標簽。

3.4 交叉驗證衡量模型準確率

將臭氧日數據集分為訓練集和測試集兩部分,分別為70%和30%,樣本個數分別為1775和761。其中,訓練集用來構建模型,測試集用來測試模型的準確率。本研究k值在10至50內選取,針對k的每個取值構建模型,因此k近鄰模型個數為41,利用交叉驗證計算每個模型的預測準確率,選擇準確率最高的模型作為本研究的臭氧日預測評估模型,其中準確率表達式為:

其中m表示測試集被正確分類的樣本,m′為測試集總樣本。

3.5 試驗結果及評價

本研究利用Python的sklearn機器學習庫來訓練模型并得到模型的準確度,將當k取10至50時的模型訓練結果即準確率保存在名為kvalues的列表中,將列表中的最大值保存在max_value變量中,機器執行結果如圖2所示。

圖2 執行結果圖

由圖2可知,當k取不同值時,k近鄰模型準確率在0.92和0.96之間,最好的準確率為95.8%,程序運行時間約為7.89秒,很好地體現了人工智能應用于空氣質量測定的高準確度和及時性的優點。

4 研究整體過程總結

本研究流程圖如圖3所示。

圖3 總流程圖

整體流程分為兩大部分,即模型構建階段和預測分析階段。

①模型構建階段:本研究從臭氧日訓練數據集出發,利用k近鄰機器學習算法對該數據進行建模分析,得到該系統的核心,即臭氧日預測概率模型。

②預測分析階段:收集某一天的大氣相關數據,總結出數據集中所包含的72項特征,接著系統自動將該特征值進行格式化,即利用Excel電子表格進行封裝。之后將封裝好的新樣本的特征傳入到第①階段所構建的臭氧日預測概率模型中,經過系統模型的分析,最終預測出樣本的標簽(1或0),即表示該日是否臭氧超標的結果。

5 結語

隨著近年來人們生活水平的提高,人們對空氣質量預測的要求也越來越高,但如今氣象預測不準確、有延遲的弊端嚴重影響了人們的生活質量。本研究從該角度入手,將人工智能與氣象領域進行結合,以提高氣象預測的準確率和時效性,從而使人們能夠享有較高質量的生活。

但是,受到科技水平的限制,使得供機器學習使用的數據集不夠充分,格式也不夠規范,這兩個因素共同導致了本文機器學習模型預測不能達到完全正確。不過,隨著我國科技發展和國家政府對于氣象預測領域的重視,筆者相信,機器學習終將登上歷史的舞臺,對人們的生活做出不可忽視的貢獻。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲成AV人手机在线观看网站| 另类综合视频| 久久人妻xunleige无码| 欧美日韩高清在线| 天堂va亚洲va欧美va国产| 男女性色大片免费网站| 91久草视频| 欧美成人午夜视频| 91麻豆精品国产高清在线| 一级不卡毛片| 国产精品lululu在线观看 | 国产成人精品高清不卡在线 | 亚洲福利片无码最新在线播放| 亚洲成aⅴ人片在线影院八| 综合色在线| 成年女人a毛片免费视频| 天天操精品| 波多野结衣一二三| 综合色亚洲| 国产青青操| 亚洲精品视频网| 国产区免费| 欧美亚洲国产精品久久蜜芽| 免费国产在线精品一区| 五月婷婷伊人网| 国产草草影院18成年视频| 曰韩人妻一区二区三区| 午夜少妇精品视频小电影| 国产精品一区二区久久精品无码| 一本综合久久| 国产精品免费入口视频| 国产农村妇女精品一二区| 国产高清自拍视频| 最新国产你懂的在线网址| 亚洲精品男人天堂| 欧美日本中文| 国产青榴视频在线观看网站| 国产一区二区影院| 亚洲第一精品福利| 中文字幕无线码一区| 免费高清自慰一区二区三区| 欧美亚洲国产精品第一页| 青青青国产精品国产精品美女| 18禁高潮出水呻吟娇喘蜜芽| 久久特级毛片| 很黄的网站在线观看| 亚洲高清无在码在线无弹窗| 夜夜操天天摸| 日韩精品免费一线在线观看| 欧美不卡二区| 波多野结衣AV无码久久一区| 国产三级国产精品国产普男人 | 国产美女在线观看| 91久久国产综合精品女同我| 亚洲无限乱码一二三四区| 2021亚洲精品不卡a| 伊人大杳蕉中文无码| 亚洲成肉网| 日韩在线观看网站| 毛片视频网| 美女高潮全身流白浆福利区| 欧美另类一区| 丰满人妻被猛烈进入无码| 国产99精品视频| 强奷白丝美女在线观看| 亚洲男人的天堂久久香蕉网| 国内精品自在自线视频香蕉| 亚洲视频无码| 一区二区日韩国产精久久| 精品福利网| 欧美色伊人| 美女国内精品自产拍在线播放| 亚洲午夜18| 国产69精品久久久久孕妇大杂乱 | 国产高清国内精品福利| 亚洲国产精品国自产拍A| 日韩激情成人| 色婷婷亚洲十月十月色天| 国产精品私拍在线爆乳| 午夜视频免费一区二区在线看| 日韩欧美国产综合| 久久精品国产精品青草app|