999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘聚類算法在船岸一體化平臺中的應用

2014-11-30 03:48:08汪益兵徐顯文
中國航海 2014年2期
關鍵詞:數據挖掘船舶

汪益兵, 王 捷, 徐顯文

(浙江國際海運職業技術學院, 浙江 舟山 316021)

數據挖掘聚類算法在船岸一體化平臺中的應用

汪益兵, 王 捷, 徐顯文

(浙江國際海運職業技術學院, 浙江 舟山 316021)

船舶的遠程動態跟蹤及數據采集、處理與應用是船岸一體化平臺的一項主要內容。船岸一體化平臺收集的數據呈現復雜的關系,而利用數據挖掘技術能從中發現知識或規律,及時分析以提供決策支持。介紹船岸一體化平臺的數據采集過程、對數據的要求以及數據挖掘方法的相關理論。以船舶節能為研究目標,舉例說明k均值聚類算法的應用過程,為船岸一體化平臺的數據處理與功能實現提供一個新的思路。

水路運輸;數據挖掘;k-means聚類算法;船岸一體化平臺;船舶節能

數據挖掘技術是隨著數據庫和人工智能發展起來的,現已成為信息決策領域研究的前沿,得到了學術界和工業界的廣泛關注。[1]近年來,該技術在海上交通的交通流數據特征分析、交通事故分析與預防、船舶行為研究等領域得到了研究或應用。[2-6]日漸發展的船岸一體化平臺在航運公司管理人員實時、高效管理船舶方面顯示出廣闊的應用前景。在船岸一體化平臺中,運用數據挖掘聚類分析技術處理平臺收集的船舶數據,獲得相關知識、規律,為實現成本控制、節能減排、決策分析等功能提供技術支持。

1 船岸一體化平臺及其對船舶數據的要求

船岸一體化平臺是航運公司將利用現代通信、信息技術采集到的船舶各類運行數據進行集中管理與綜合應用,然后將其作為船岸安全與技術管理決策依據的管理平臺。該平臺將公司(岸基)與所屬船舶(船端)所有日常管理、技術管理、安全管理、航運管理、成本控制集于一體,實現船岸信息資源共享與管理一體化,其核心是實現對船舶航行安全、設備運行狀態、在船人員、所載貨物與突發事件等的控制與跟蹤。該平臺能夠提高管理層的調度和經營、決策能力,實現快速、動態地指導一線船員生產實踐以及船舶管理的現代化。[7-9]

船岸一體化平臺由船基數據采集處理、船岸數據通信以及岸基數據挖掘與遠程監控等幾部分組成。船基數據(包括船舶航行數據、機艙工況數據、海上氣象數據和船舶AIS(Automatic Identification System)數據等)經采集處理,在文本文件加密或壓縮后,通過海事衛星和網絡傳輸,以郵件方式發送到岸基。岸基將收到的郵件進行解壓縮和解密后,分發到相應的應用系統或儲存到指定的數據庫中,實現船岸數據的同步與共享。[10-11]

通過數據交換平臺,將不同的數據結構和數據格式轉換成統一的、便于應用的形式,包括數據的解密或解壓縮、數據類型的轉換、數據長度的轉換等。為滿足不同業務對數據的要求,在對數據進行重組分類的基礎上,再應用數據挖掘技術進行分析與處理。以船舶減少油耗實現節能目標為例,進行船舶數據挖掘與研究,研究對象除船舶航行數據外主要是機艙監測數據。此外,為簡化船舶營運過程中的油耗分析和得到精確的決策規則,收集的是排除了特殊航行狀態(如船舶抵離港、在港靠泊、錨地錨泊等)后兩個連續掛靠港口間的船舶數據。

2 數據挖掘中的k均值聚類算法

數據挖掘是通過分析大量數據揭示新的關系、趨勢和模式的過程,其主要任務是對數據庫中的大量業務數據進行抽取、轉換、分析和模型化處理,從中提取可輔助決策的關鍵性數據和隱藏的預測性信息。通過數據挖掘,能發掘數據間潛在的模式,找出可能忽略的信息,以可理解和觀察的形式反映給用戶,并給出基于知識的決策分析意見和結論。[12]

聚類算法是數據挖掘中的一個重要研究領域。聚類是一種常見的數據分析工具,其目的是把大量數據點的集合分成若干類,使得同類中的數據最大程度地相似,而不同類中的數據最大程度地不同。聚類的實質是將性質相似的點聚在一起,以發現其中的規律。基于劃分的方法是最常用的聚類分析方法之一,k均值聚類算法是其代表算法。[13]

k均值聚類算法又稱基于k-means聚類算法,在數據挖掘領域中得到了廣泛應用。k均值聚類算法給定一個例子的集合X(其中包括n個數據對象),并將數據對象劃分為k個聚類(k≤n),通常會采用一個劃分準則(稱為相似度函數),以使同一簇中的對象是相似的,而不同簇中的對象是相異的。k均值聚類算法的處理過程是:對于給定的一個包含n個d維數據點的數據集X={x1,x2,…,xi,…,xn}(其中xi∈Rd)以及要生成的數據子集的數目k,k-means聚類算法將數據對象組織為k個劃分C={ck,i=1,2,…,k},每個劃分代表一個類ck,每個類ck有一個類別中心μi。選取歐氏距離作為相似性和距離判斷準則,計算該類內各點到聚類中心μi的距離平方和J(ck)為

(1)

(2)

式(2)中:若xi∈ci,則dki=1;若xi?ci,則dki=0。

顯然,根據最小二乘法和拉格朗日原理,聚類中心μk應該取為ck類各數據點的平均值。

k均值聚類算法從一個初始的k類別劃分開始,將各數據點指派到各個類別中,以減小總的距離平方和。該算法是一個反復迭代過程,目的是使聚類域中所有的樣品到聚類中心距離的平方和J(C)最小,算法具體流程見圖1。

圖1 k均值聚類算法流程圖

實踐中,著重發掘與主要因素相關的船舶運行特性與規律。k均值聚類算法需要用戶提前輸入聚類作業所要形成簇的數量,即k值。k值的選取對聚類的結果具有很大影響,通過調整k值評價不同的可能性。k均值聚類算法的優勢在于能夠挖掘出包含多個屬性信息的潛在趨勢,可用于識別特定情況與趨勢,但結果分析需要基礎資料的支撐。

3 數據挖掘聚類算法在船岸一體化平臺實現船舶節能功能中的應用

3.1在船岸一體化平臺中數據挖掘聚類算法的基本程序

1) 針對船岸一體化平臺收集的船舶數據,把船舶節能作為研究目標,明確數據挖掘的要求與任務。

2) 對船舶數據采集與監控系統收集的數據進行清洗,即對原始數據進行加工(一般包含數據標準化、數據平整、丟失數據處理、時間相關數據處理以及異常數據的分析和處理等),以生成用于數據挖掘的數據庫。

3) 采用k均值聚類算法實施數據挖掘任務,從船岸一體化平臺的大量數據中尋找船舶主機高效(率)數據集(簇),在各聚類中心點(簇的中心點)與負荷的對應關系上建立基準值模型;針對所屬類別,設計或選擇有效的算法,實施數據挖掘。

4) 對挖掘結果進行解釋、評估與優化。

5) 通過分析、整理,將結果輸出到航運管理實際工作中,為決策提供依據。

3.2船舶油耗數據的預處理

為處理模糊和不確定知識,將粗糙集理論作為數據挖掘的數學工具,把研究對象的屬性分為決策屬性和條件屬性。在對船舶營運油耗的研究中,決策屬性采用的是船舶主機日耗油量與日累積航程的比值,稱作單位航程油耗。而影響耗油的可能條件屬性有:

1) 船舶因素:船舶種類與大小、裝載狀態、船舶吃水和吃水差、船舶穩性與搖擺性、船殼狀況等。

2) 機器因素:主要指船舶主機、副機、鍋爐等裝備及其性能、技術狀態等。

3) 燃油因素:主要指燃油品質與性能等。

4) 環境因素:風、流、浪和天氣狀況等。

5) 操縱因素:航向、航速和主機轉速等運轉工況。

在船岸一體化平臺中,采集的數據來自于公司所屬的各船舶。由于公司同系列船舶在船舶、機器等方面存在許多相似的屬性,應用數據挖掘技術具有更豐富、科學的數據基礎。這也是利用船岸一體化平臺進行數據挖掘的有利條件。

在進行油耗分析前,需將油耗相關數據轉換為船舶油耗信息系統的形式,以確定條件屬性和決策屬性。由于船岸不同的軟硬件設備,數據結構各異,可能造成彼此不能識別對方的數據。因此,需對數據進行標準化。同時,設備故障或其他因素可能導致個別船舶數據不確定或缺失的現象,需對經典粗糙集理論進行擴充,以適應不完備的信息系統。

3.3建立基準值模型

對某一具體船舶節能而言,在一定負荷和環境參數下,單位航程油耗最小時對應的主機工況為最佳工況,在此工況下,主機效率及相關運行監控參數稱為參數基準值。采用k均值聚類算法,在大量數據中尋找船舶機器高效數據集(簇),利用各聚類中心點(簇的重心點)與負荷的對應關系建立基準值模型。隨后,對船舶主機運行數據進行分析,尋找各負荷工況下船舶主機的高效運行工況,將其對應的運行參數作為基準值建模的樣本數據,并確定其基準值模型。[14]

選擇船舶主機功率、單位航程油耗和主機轉速3個屬性進行分析。

1) 將主機功率分成N個區間,如果一個區間的點數太少,則與相鄰的區間合并,這樣就保證了每個主機功率區段有足夠多的記錄。

2) 對每個區段的點進行聚類,找到各簇數據對應的聚類中心中單位航程油耗最小的一簇數據,其聚類中心對應的主機功率和主機轉速就是要找的一個基準值樣本點。

3) 對每一個主機功率區間進行相同的操作,直到找到所有劃分區間的樣本點。

4) 將樣本點進行正交曲線擬合,得到主機轉速的基準值模型。

3.4實施數據挖掘

為方便說明,以某公司對3 590 TEU同系列全集裝箱船采集的數據為例,對通過數據挖掘聚類算法實現船舶節能的目標作詳細描述。

1) 采集船舶主機功率、單位航程油耗和主機轉速3個屬性參數的所有數據,在對數據預處理后,把該類船舶正常航行時主機功率在10 000~22 000 kW內的所有有效數據生成用于數據挖掘的數據庫,并以每2 000 kW劃分主機功率區間,共把數據分為6個區間。

2) 采用k均值聚類算法對主機功率在各個區間的單位航程油耗進行聚類分析,并列出聚類分析結果,其中主機功率在14 001~16 000 kW的聚類分析結果見表1。

在完成聚類分析后,從分析結果中找出單位航程油耗最小的一類,如果該類又包含足夠多的數據記錄,則可被認定為主機功率在該區間的一個樣本點。例如在表1中,可認定Cluster-5為主機功率在14 001~16 000 kW的一個樣本點。對其他功率區間依次類推,得到船舶主機功率在各區間對應單位航程油耗最小的樣本點集合(見表2)。

根據表2,以主機功率、轉速分別為橫、縱坐標作樣本點位置圖(見圖2),從圖中可直觀地發現船舶單位航程油耗最小時主機功率、轉速的變化規律。公司根據船岸一體化平臺的數據挖掘處理結果,獲得同類型船舶在具體航次承受不同負荷下為實現船舶單位航程油耗最小可采用的主機轉速,再把該運行工況應用于其他同類型船舶的航行實踐中。

表1 主機功率在14 001~16 000 kW下的船舶主機轉速聚類分析結果

表2 主機功率各區間對應船舶單位航程油耗最小的樣本點

圖2 樣本點位置圖

3.5評估優化與結果應用

從數據挖掘結果可以看出,船舶在每個主機功率區段采用對應主機轉速的條件下,該樣本點的單位航程油耗最小,與基準值定義的高效運行工況的定義是一致的。船舶在海上航行時,如果受風影響,單位航程油耗將會受到較大影響。海上天氣對船舶單位航程燃油消耗的影響主要是通過影響船舶航程和航速產生的。增加主機轉速和航速也會提高船舶單位航程的燃油消耗。為降低單位航程油耗,在實踐中通常運用良好的船藝,通過調整、控制和穩定船舶航向,并采用數據挖掘處理得到一定主機功率下相對應的主機轉速,實現船舶節能的目標。

4 結 語

鑒于數據挖掘技術的人工智能特征和針對復雜數據的處理能力及其已在多個行業的分析預測中取得的良好效果,提出在船岸一體化平臺中利用數據挖掘技術對數據進行處理以輔助管理人員決策分析的思想。結合船舶節能實例,運用k均值聚類算法挖掘出影響船舶節能因素的潛在規律,給管理決策提供信息支撐,為航運公司提高船舶營運效率、降低營運成本提供科學依據。船舶營運油耗是一個受多因素影響的綜合性過程,采用數據挖掘聚類算法研究分析船舶節能問題,為更好地發揮船岸一體化平臺功能提供了一個新的思路。

[1] 殷瑞飛.數據挖掘中的聚類方法及其應用[D].廈門:廈門大學,2008.

[2] 鄭濱,陳錦標,夏少生,等.基于數據挖掘的海上交通流數據特征分析[J].中國航海,2009,32(1):60-63.

[3] 牟軍敏,鄒早建,齊傳新.數據挖掘技術在內河交通事故分析和預防中的應用[J].中國航海,2004,27(1):27-29.

[4] 朱飛祥,張英俊,高宗江.基于數據挖掘的船舶行為研究[J].中國航海,2012,35(2):50-54.

[5] 潘家財,邵哲平,姜青山.數據挖掘在海上交通特征分析中的應用研究[J].中國航海,2010,33(2):60-62.

[6] 朱飛祥.遠洋船舶調度數據挖掘技術研究與應用[D].大連:大連海事大學,2008.

[7] 岳躍申,鄭士君,黃愛平.新型船岸一體化管理平臺的設計及其功能[J].航海技術,2009(9):70-72.

[8] 汪益兵,聶建濤.基于嵌入式技術的船岸一體化管理平臺設計與開發[J].上海海事大學學報,2013,34(4):23-26.

[9] 蔡曄敏,周亞蘭,朱蕊.船舶自動化系統網絡的設計進展[J].上海工程技術大學學報,2010,24(2):142-144.

[10] 韓建鋒,陳星.嵌入式船舶數據采集與監控系統[J].儀表技術與傳感器,2008(8):61-62.

[11] 薛明剛,徐承飛,趙衛麗,等.船岸一體化數據同步的實現[J].中國修船,2011,24(1):21-24.

[12] 劉同明.數據挖掘技術及其應用[M].北京:國防工業出版社,2001.

[13] 行小帥,焦李成.數據挖掘的聚類方法[J].電路與系統學報,2003,8(1):59-67.

[14] 錢瑾,王培紅,李琳.聚類算法在鍋爐運行參數基準值分析中的應用[J].中國電機工程學報,2007,27(23):71-74.

ApplicationofClusteringAlgorithmforDataMininginShip-ShoreIntegrationPlatform

WANGYibing,WANGJie,XUXianwen
(Zhejiang International Maritime College, Zhoushan 316021, China)

Ship-shore integration platform performs ship tracking, data acquisition and processing, and management services. The large amount of data collected in ship-shore integration platform shows a complex relationship and the data mining technique is necessary for extracting knowledge and discovering laws from data and timely supporting decision making. The data acquisition process of the platforms and their requirements for the information as well as some concepts of data mining are introduced. The practical application ofk-means clustering algorithm aiming for energy saving is illustrated. This study demonstrates a new approach of developing a ship-shore integration platform.

waterway transportation; data mining;k-means clustering algorithm; ship-shore integration platform; ship energy saving

2013-12-22

浙江省公益性技術應用研究計劃項目(2013C33084)

汪益兵(1970-),男,浙江蘭溪人,副教授,船長,從事航海技術、交通運輸管理研究。E-mail:zimcwyb@126.com.

1000-4653(2014)02-0122-05

TP311.13

A

猜你喜歡
數據挖掘船舶
計算流體力學在船舶操縱運動仿真中的應用
基于改進譜分析法的船舶疲勞強度直接計算
探討人工智能與數據挖掘發展趨勢
船舶!請加速
BOG壓縮機在小型LNG船舶上的應用
船舶壓載水管理系統
中國船檢(2017年3期)2017-05-18 11:33:09
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
主站蜘蛛池模板: 亚洲最黄视频| 午夜小视频在线| 一级毛片在线播放免费| 玖玖精品在线| 婷婷久久综合九色综合88| 香蕉国产精品视频| 日本不卡在线播放| 久久不卡国产精品无码| 亚洲动漫h| 亚洲IV视频免费在线光看| 免费无遮挡AV| 高清欧美性猛交XXXX黑人猛交| 国产99精品久久| 午夜啪啪福利| 国产福利拍拍拍| 久久久亚洲国产美女国产盗摄| 91尤物国产尤物福利在线| 午夜三级在线| 欧美在线综合视频| 综合色在线| 免费可以看的无遮挡av无码 | 2021最新国产精品网站| 综合色区亚洲熟妇在线| 国产成人综合亚洲网址| 美女被操黄色视频网站| 国产精品99久久久久久董美香| 国内99精品激情视频精品| 日本黄网在线观看| 91精品国产自产在线观看| 亚洲黄色成人| 国产91蝌蚪窝| 在线免费观看a视频| 丁香婷婷激情网| 一区二区三区成人| 黄色在线不卡| 色婷婷久久| 欧美精品啪啪| 久久久久国色AV免费观看性色| 中文字幕丝袜一区二区| 国产精品视频导航| 性色生活片在线观看| 中国国产高清免费AV片| 久久精品一品道久久精品| 九色最新网址| 91视频99| 欧美色视频在线| 欧美一级黄片一区2区| www.av男人.com| 国产亚洲精品在天天在线麻豆| 久久久噜噜噜| 欧美日一级片| 精品91视频| 久久久久久久久久国产精品| 大学生久久香蕉国产线观看| av一区二区无码在线| 四虎永久在线视频| 91精品人妻互换| 色综合久久88| 久久国产精品嫖妓| 在线播放91| 久久国产精品嫖妓| 色婷婷电影网| 尤物精品国产福利网站| 国产专区综合另类日韩一区| 天堂久久久久久中文字幕| 91欧美在线| 四虎精品国产AV二区| 91欧美在线| 亚洲人成网7777777国产| 日韩欧美国产成人| 亚洲精品777| 久久99久久无码毛片一区二区 | 婷婷六月激情综合一区| 国产视频久久久久| 波多野结衣一区二区三区四区视频 | 精品少妇人妻一区二区| 国产美女自慰在线观看| 亚洲一道AV无码午夜福利| 国产又粗又爽视频| 亚洲最大看欧美片网站地址| 国产一级精品毛片基地| 四虎免费视频网站|