999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于KNN算法的船舶噸級判別研究

2021-07-01 19:25:50陳冬袁媛
中國水運 2021年5期

陳冬 袁媛

摘 要:針對航運大數據應用中船舶噸級數據難以獲取的情況,本文提出了一種基于K最近鄰(K-Nearest Neighbor,KNN)算法的船舶噸級判別模型。該模型考慮了船舶類型、船長、型寬、型深等參數的影響,以常年在江蘇沿江、沿海運行的船舶為例,選取1萬余條船舶數據進行訓練和驗證。結果表明,該模型在船舶噸級判別上具有較好的準確性,能夠應用于實際航運數據分析。

關鍵詞:船舶特征;判別模型;K近鄰

中圖分類號:U674.13? ? ? ? ?文獻標識碼:A? ? ? ? ? ? 文章編號:1006—7973(2021)05-0104-02

1概述

船舶屬性數據是非常重要的基礎數據,包括船舶身份(IMO、MMSI、船名)、船舶類型、船舶尺度(船舶長度、船舶型寬、船舶型深、滿載吃水)、船舶噸級(船舶總噸、船舶凈噸、船舶載重噸)等內容。在航運大數據應用中,船舶屬性信息與船舶動態信息相結合,能夠為航運各領域發展決策提供支撐,如將船舶屬性信息中的船舶噸級與船舶AIS數據相結合,能夠估算港口在某段時間內的吞吐量。但在航運數據的實際應用過程中,由于航運數據開放共享格局尚未形成,研究人員較難獲得全部船舶屬性數據,尤其是船舶屬性數據中的船舶噸級信息,如AIS數據的船舶靜態信息僅僅包括船舶身份、船舶長度、船舶型深、船舶類型等內容,缺少船舶噸級等內容,使航運大數據的應用缺少關鍵基礎數據支撐。

傳統的船舶噸級推算主要是利用船舶長度通過曲線估計來計算船舶噸位。傳統方法需針對不同的船型選擇不同的曲線(二次曲線、立方曲線、S曲線、冪函數等)進行擬合,建模過程繁雜,使用較為不便[1]。針對船舶噸級信息難以獲得以及傳統估算方法使用不便的問題,本文探索了大數據機器學習方法,提出了基于KNN算法的船舶噸級判別模型。

2 KNN算法

2.1 KNN算法原理

KNN(K-Nearest Neighbor)算法即K最鄰近法,是機器學習算法中最常用的分類算法之一,KNN算法主要應用領域是對未知事物的判別,即判別位置事物屬于哪一類[2-3]。

算法模型首先對給定的一個訓練數據集T進行訓練。其中,xi為實例的特征向量,yi為實例的類別。

輸出過程中,根據給定的距離度量,在訓練集T中找出與x最鄰近的k個點,涵蓋這k個點的x的鄰域為Nk(x);在Nk(x)中根據分類規則決定x的類別y。

KNN算法模型由距離度量、k值的選擇和分類決策規則決定。

2.2 KNN算法實現流程與評價指標

相比傳統的依據船舶長度的曲線估計方法,本次基于KNN的船舶噸級判別模型選取了更多的特征向量并采用不同組合進行建模,模型1選取“船舶總長、型寬、船舶類型”為特征向量,模型2選取“船舶總長、型寬、型深、船舶類型”為特征向量。算法的實現流程如圖1所示。

為驗證模型的可靠性,模型采用決定系數(R2)作為精度評價指標,R2代表目標向量的變化中有多少能通過模型進行解釋,具體計算公式為:

式中,是樣本i的真實值,是樣本的預測值,是目標向量的平均值, R2得分越接近1,代表模型的性能越好。

3 船舶噸級判別模型

3.1 基礎數據

本文數據采用常年在江蘇沿江、沿海運行的約1.5萬艘船舶屬性數據,數據內容包括船名、MMSI號、IMO號、總長、型寬、型深、總噸、凈噸、載重噸、船籍港、經營人等信息,具體數據示例如表1。

沿江、沿海運行的船舶種類較多,主要船舶種類包括散貨船、石油化學品船、雜貨船等。本次根據海港總體設計規范,以船舶載重噸計算了散貨船、雜貨船、石油化學品船、集裝箱船等貨運船舶的船舶噸級。船舶主要類型及等級分布如圖2所示。

3.2 特征數據處理

船舶屬性數據處理步驟包括:

(1)數據清理。對船舶類型、載重噸等關鍵屬性缺失以及船舶類型樣本較少的船舶數據進行刪除處理,最終得到9490條船舶的屬性信息。

(2)數據特征量化。特征向量中的船舶類型和目標向量中的船舶噸級為非數值類型,需將其量化為數值,以實現距離計算。

(3)數據抽樣。訓練集與測試集按照9:1的比例進行數據抽樣,最終得到8541條訓練樣本和949條測試樣本。

3.3 模型參數標定

KNN模型的預測效果依賴于不同鄰近數K值的選定,K值太大容易引起欠擬合,太小則容易過擬合。本文通過交叉驗證確定最優k值,從圖3可以看出,K=3時,交叉驗證得分R2最高,為0.96,因此取K=3標定本次船舶噸級判別模型。

3.4 模型預測結果分析

用上述建立的KNN船舶噸級判別模型對測試集進行測試,從圖4對測試集的測試結果可以看出,兩種模型的預測值與真實值基本吻合,模型決定系數R2均大于0.9,準確性較好,其中選用“船舶總長、型寬、船舶類型”作為特征向量的模型1具有更好的測試效果。

4分析與結論

KNN方法較為適合類域交叉的待分樣本集的類別判別,本文基于KNN算法,以船舶總長、型寬、型深、船舶類型為特征向量,創新性地提出了船舶噸級判別模型,計算的結果與實際情況基本吻合,具有較好的準確性;同時,相比于傳統方法,本次提出的算法適用于不同尺度及類型的船舶噸級判別,應用更為便捷,能夠更好地為航運大數據研究提供基礎數據支撐。

參考文獻:

[1]朱連江.內河船舶交通量換算系數研究[D].大連:大連海事大學,2019.

[2]周志華.機器學習[M].北京:清華大學出版社,2016.

[3]霍豪,沈金星.基于KNN算法的公交到站時間預測[J].交通運輸工程與信息學報,2020,12(18):76-102.

主站蜘蛛池模板: 国产精品蜜芽在线观看| 丁香综合在线| 老熟妇喷水一区二区三区| 中日韩一区二区三区中文免费视频 | 欧美亚洲国产精品第一页| 久久久久亚洲AV成人人电影软件| 亚洲高清日韩heyzo| 思思热在线视频精品| 97久久精品人人| 在线观看无码av五月花| 亚洲愉拍一区二区精品| 欧美另类第一页| 欧美精品成人一区二区在线观看| 国产精品亚洲五月天高清| 在线观看无码av免费不卡网站 | 日本不卡在线| 亚洲三级成人| 超碰aⅴ人人做人人爽欧美| 激情综合网激情综合| 午夜a级毛片| 精品免费在线视频| 91成人试看福利体验区| 2021精品国产自在现线看| 亚洲婷婷在线视频| 中国一级毛片免费观看| 污网站免费在线观看| 国产va在线观看| 又爽又大又黄a级毛片在线视频 | 91 九色视频丝袜| 国产精品亚洲五月天高清| 久久精品欧美一区二区| 久久这里只有精品23| 国产黄网站在线观看| 日本久久久久久免费网络| 亚洲精品视频免费| 找国产毛片看| 欧美日本在线一区二区三区| 五月婷婷综合网| 999国产精品| 亚洲成人网在线观看| 亚洲欧美h| 国内精品九九久久久精品 | 国产激情第一页| 国产亚洲精久久久久久无码AV| 色婷婷成人网| 中文字幕久久精品波多野结| 国产网站黄| 国产免费久久精品99re丫丫一| 992tv国产人成在线观看| 特级精品毛片免费观看| 亚洲第一香蕉视频| 日韩欧美中文| 国产极品美女在线播放 | 欧美日韩北条麻妃一区二区| 久久亚洲国产一区二区| 国产地址二永久伊甸园| 午夜福利亚洲精品| 中文天堂在线视频| 亚洲av无码牛牛影视在线二区| 99久久国产综合精品2023| 免费xxxxx在线观看网站| 午夜国产精品视频| 久久成人免费| 福利视频一区| 国产福利拍拍拍| 国产主播在线观看| 制服丝袜国产精品| 丁香六月综合网| 国产99视频精品免费观看9e| 国产日本一线在线观看免费| 婷婷99视频精品全部在线观看| 久久精品国产精品国产一区| 四虎成人精品在永久免费| 青青草欧美| 亚洲第一黄色网址| 激情亚洲天堂| 不卡色老大久久综合网| 国产亚洲视频中文字幕视频| 尤物成AV人片在线观看| 亚洲AV免费一区二区三区| 无码高潮喷水在线观看| 国产91全国探花系列在线播放 |