999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ID3算法的飛行時間分析

2021-06-30 01:57:02余士龍吳晨陽許向運
氣象水文海洋儀器 2021年2期

張 祥,陳 軍,余士龍,吳晨陽,許向運

(1.94995部隊,如皋 226500;2.95631部隊,瀘州 646000)

0 引言

隨著計算機技術的高速發展,信息數據量呈現出幾何倍數增長。如何從海量數據中有效地提取有用信息,一直是數據挖掘技術的目的所在[1]。20世紀80年代末發展起來的數據挖掘技術,就是從大量不完全的、有噪聲的實際數據中,提取潛在有用的信息和知識的一種技術手段。在飛行氣象保障領域,為了能夠更好地滿足飛行任務的需求,需要綜合衡量各類快速變化的氣象要素的影響。由于飛行員在飛行水平、飛機性能等各個方面存在著一定的差異,因此,不同氣象要素對飛行時間的長短有著明顯影響。文章將決策樹算法引入氣象要素分析過程中,決策樹算法主要用來對研究數據進行預測與分類,是目前應用最為廣泛的一種數據挖掘算法[2,3]。通過ID3決策樹算法對氣象信息進行充分挖掘,找到對飛行時間長短影響較大的分類規則,用于分析飛行的進展情況,從而提出針對性建議,使飛行保障質量得到提高。

1 ID3算法的構造

ID3決策樹是一種經常使用的分類方法,其利用一種類似流程圖的樹結構進行預測分類建模,將核心問題的搜索空間分為若干個不同的子類[4]。樹的節點是樣本的屬性,屬性的取值為樹的分支。決策樹的產生是對大量樣本的屬性進行分析歸納的結果[5]。應用此種方法自頂向下地建造一棵樹對分類過程進行建模,便可以將數據進行有效地集中并得到分類結果。ID3決策樹算法首先計算訓練樣本集合中所有屬性的信息增益,將信息增益最大的屬性作為測試屬性。創建與判斷屬性值一一對應的各個子葉節點,代表訓練樣本子集;以此類推,調用遞歸繼續劃分各樣本子集,直到無法進一步劃分,算法結束。正是因為ID3算法在每個非葉節點選擇信息增益最大的屬性作為測試屬性,從而保證了當前情況下的最有利拆分,使得樹的平均深度較小,有效地提高了分類效率。

假設訓練集S中包含了s個數據樣本,類別屬性中有m個不同的值Ci(i=1,2,…,m),第Ci類的樣本數記為si,則需要分析樣本的總信息熵為:

(1)

式中,Pi是任意樣本屬于Ci的概率,通常通過si/s得到。

設測試屬性A可以取k個不同的值{a1,a2,…,ak},按照屬性A可以將訓練集S劃分成k個子集{S1,S2,…,Sk},則第j(j=1,2,…,k)個子集Sj包含了訓練集S中屬性A取aj值的樣本,將它們作為從集合S的節點生長出來的新的葉節點。將子集Sj中類別為Cj的樣本數記為sij,得到按照測試屬性A進行樣本劃分的信息熵值為:

(2)

由公式(1)和(2)得到用測試屬性A劃分訓練集S后的信息增益(Gain)為:

Gain(A)=I(s1,s2,…,sm)-E(A)

(3)

E(A)值越小,則Gain(A)值越大,表示選擇測試屬性A進行分類能夠更好地提供信息,應當優先選擇該屬性進行分類,以減小分類的不確定程度。遞歸調用上述過程對訓練集S的k個分支進行劃分,通過信息增益進行選擇,便能夠將其他屬性作為節點的子節點和分支生成決策樹。

2 仿真實驗

2.1 飛行時間影響要素分析

為保證飛行質量,了解各個氣象要素對飛行時間的影響程度至關重要。根據預報員與飛行人員的研究,可以將能見度、云量和風速3個屬性作為基本屬性,構建模型分析晴天條件下能見度、云量和風速對飛行時間長短的影響。模型中的能見度、云量和風速的相互關系產生了多目標協同問題。對于能見度屬性,結合人工觀測與能見度儀數據,將大于等于飛機起飛標準的能見度值定為高能見度屬性值,小于起飛標準為低能見度屬性值;對于云量屬性,將大于等于6成定為多云,小于6成為少云;對于風速屬性,將大于等于13 m/s定為大風,小于13 m/s定為小風。飛行時間為數值型,需要對屬性進行離散化,將其劃分為“長”和“短”兩類。取其平均值作為分界點,大于平均值的屬于“長”類別,小于平均值的則屬于“短”類別。

經過離散化處理,得到50組數據集合如表1所示。

表1 氣象要素與飛行時間數據

2.2 信息增益計算與決策樹生成

根據公式(1),計算總信息熵,總記錄數為50,飛行時間“長”的數據有27,“短”的有23。

根據公式(1)和(2),計算每個測試屬性的信息熵。風速屬性值有“大”和“小”兩種。其中“大風”條件下,飛行時間為“長”的記錄為12,飛行時間為“短”的記錄為17,可表示為(12,17);“小風”條件下,飛行時間為“長”的記錄為15,飛行時間為“短”的記錄為6,可表示為(15,6)。則風速屬性的信息熵計算過程為:

云量屬性值有“多”和“少”兩種:其中“多云”條件下,飛行時間為“長”的記錄為3,飛行時間為“短”的記錄為12,可表示為(3,12);“少云”條件下,飛行時間為“長”的記錄為24,飛行時間為“短”的記錄為11,可表示為(24,11)。則云量屬性的信息熵計算過程為:

能見度屬性值有“高”和“低”兩種:其中“高能見度”條件下,飛行時間為“長”的記錄為19,飛行時間為“短”的記錄為5,可表示為(19,5);“低能見度”條件下,飛行時間為“長”的記錄為8,飛行時間為“短”的記錄為18,可表示為(8,18)。則能見度屬性的信息熵計算過程為:

根據公式(3),計算3個氣象要素屬性的信息增益分別為:

Gain(風速)=I(27,23)-E(風速)=0.0654

Gain(云量)=I(27,23)-E(云量)=0.1502

Gain(能見度)=I(27,23)-E(能見度)=0.1780

由此可見,能見度屬性的信息增益值最大,應選取它的兩個屬性值“高”和“低”作為根節點的兩個分支。

按照上述步驟對兩個分支進行劃分,計算信息增益值,循環進行直到沒有新的節點分支,則計算結束。得到的決策樹模型如圖1所示。

圖1 飛行時間決策樹模型

由決策樹模型能夠得到各類不同的決策規則。

3 結束語

ID3算法是決策樹算法中最典型的算法,文章通過編寫MATLAB程序,仿真實現了對現有數據的挖掘,分析了氣象要素對飛行時間的影響,有助于實現飛行保障的針對化管理。由于ID3算法偏向于選取高度分支屬性,而該選法并不一定全是最優屬性,因此仍有改進提升的空間。

主站蜘蛛池模板: 亚洲第一网站男人都懂| 国产精品蜜臀| 亚洲男人的天堂在线观看| 搞黄网站免费观看| 1769国产精品免费视频| av在线人妻熟妇| 香蕉久人久人青草青草| 亚洲天堂啪啪| 99国产精品国产高清一区二区| 成·人免费午夜无码视频在线观看| 国内精品伊人久久久久7777人| 一本一道波多野结衣一区二区| 国产无码制服丝袜| 538国产视频| 粗大猛烈进出高潮视频无码| 九九久久99精品| 黄色网址手机国内免费在线观看| 国产亚洲欧美日本一二三本道| 青草视频在线观看国产| 老汉色老汉首页a亚洲| 婷婷亚洲天堂| 欧美.成人.综合在线| 制服丝袜无码每日更新| 亚洲中文字幕久久无码精品A| 国产精品流白浆在线观看| 国产一区二区三区在线精品专区| 中文字幕无码制服中字| 免费人成视频在线观看网站| 久久性妇女精品免费| 久久人人妻人人爽人人卡片av| 国产精品分类视频分类一区| 日韩毛片免费| 狠狠躁天天躁夜夜躁婷婷| 亚洲国产精品人久久电影| 97亚洲色综久久精品| 亚洲第一色网站| 国产欧美视频一区二区三区| 日韩欧美高清视频| 一级毛片高清| 国产打屁股免费区网站| 青青青国产视频| 国产欧美在线观看精品一区污| 毛片久久网站小视频| 日本影院一区| 99这里精品| 啪啪啪亚洲无码| 国产精品冒白浆免费视频| 精品福利一区二区免费视频| 无码一区18禁| 婷婷色丁香综合激情| 久久国产香蕉| 国产精品手机在线观看你懂的| 在线a视频免费观看| 好紧好深好大乳无码中文字幕| 亚洲一区二区精品无码久久久| 毛片大全免费观看| 喷潮白浆直流在线播放| 丁香婷婷综合激情| 亚洲A∨无码精品午夜在线观看| 99久久精品国产麻豆婷婷| 亚洲国产日韩一区| 最新亚洲av女人的天堂| 天天操精品| 国产精品va| 国产肉感大码AV无码| 国产精品亚洲欧美日韩久久| 国产黄色爱视频| 精品国产一区二区三区在线观看 | 国产成人8x视频一区二区| 欧美亚洲国产日韩电影在线| 浮力影院国产第一页| 无码一区中文字幕| 人妻21p大胆| 亚洲AⅤ无码日韩AV无码网站| 中文成人在线视频| a色毛片免费视频| 日韩a级片视频| 欧美成人日韩| 波多野结衣久久高清免费| 99精品热视频这里只有精品7| 午夜一级做a爰片久久毛片| 国产jizz|