左毅 孫卓




摘要:近年,大量的數據朝著公開化發展,很多數據已經可以在網絡上直接進行存儲、讀寫乃至計算等操作。隨之而來的大數據時代和云計算時代,要求學生具備效率的數據存儲能力、快速的數據處理能力以及有效的數據分析能力。因此,在教學中針對以上三個主要問題,將引入云存儲和云計算等新一代信息技術,并結合航海特色對實際數據進行存儲、讀寫和分析等處理。使學生在大數據時代和云計算時代,掌握實際應用的一系列相關技能和技術。
關鍵詞:云存儲;云計算;大數據;航海科學與技術;AIS數據
21世紀是海洋的世紀,“向海則興,背海則衰”已在世界范疇形成廣泛共識。2019年,交通運輸部聯合中央網信辦、國家發改委等7部門發布《智能航運發展指導意見》,同樣為智能航運未來30年發展指明方向,要求以一流的技術、一流的管理為“一帶一路”建設服務好,提升港口碼頭和航運基礎設施的信息化智能化水平。根據《智能航運發展指導意見》,將通過融合大數據、云計算、人工智能等新一代信息技術、建設“1個平臺+N個應用”的綜合智能航運示范工程,以突破關鍵技術瓶頸,填補國內交叉學科領域的空白。
一、新技術需求下面臨的主要科學與技術問題
在各行各業都熱烈擁抱人工智能,推動數字化改革的創新新時代,航運業的信息化、網絡化乃至智能化的發展略顯滯后,甚至出現與時代脫節的種種跡象。究其原因,主要體現在以下幾個方面:
(1)現有的船舶管理多集中于線下服務、以人工為主,航企亟需從傳統的粗放管理模式向信息化的精細管理模式轉變。
(2)由于航運業務建設的階段性,業務數據呈現出多樣性,采用不同的存儲方式,使得數據多源異構問題尚未得到根本解決,航運數字化進程推展緩慢。
(3)缺乏深度挖掘海事大數據價值的系統性技術和智能化方法,在數據計算、結果分析以及決策支持等方面仍存在一定的技術性空白亟待填補。
二、新時代引領下航海類創新人才的必備條件
在“十四五”和國家一流學科建設規劃中,明確提出了“興海強校”發展戰略,并把海事大數據以及航運通用人工智能等作為學科建設的重點科研發展方向。本課程旨在通過整合學校優勢資源,圍繞主要研究方向開展聯合攻關,以高素質拔尖創新人才和學際融合數據科學家培養為首要目標,以建成交通運輸工程以及海上信息工程領域航海類人才培養高地為最高遠景。
(1)通過引入數據庫基礎知識,使學生掌握數據的結構化特點,并能夠掌握效率化的存儲、讀寫等技巧。
(2)通過引入統計學基礎知識,使學生具備數據分析能力,并掌握基本的數據可視化技術。
(3)應用實驗室的云平臺,使學生掌握云存儲、云計算、機器學習等相關技能。
三、新一代信息技術在教學中的應用實踐
本課程立足于新一代信息技術、交通運輸工程與計算機科學的交叉學科領域,推動技術進程和產業進程交互發展,培養航海類學生在大數據、云計算和人工智能三個方面的理論應用與實踐創新。
3.1 AIS數據的云存儲
AIS(Automatic Identification System)即船舶自動識別系統,是一種不依賴于雷達的助航系統,將船舶的航行信息包括經緯度、航速、航向等信息實時的傳送至AIS基站以及附近船舶,多用于船舶航行監管以及會遇預警等方面。在船舶高速行駛中,AIS的傳輸頻次高達2秒/次,即使在使用信息壓縮等技術前提下,依然會產生海量數據,也使得AIS數據成為真正意義上的大數據。本課程中,將通過非關系型數據庫來對AIS數據進行存儲,并將AIS數據庫置于云端服務器,解決多用戶同時訪問帶來的高并發問題。同時,課程給學生提供多樣化的終端訪問,包括個人電腦和智能手機,讓學生可以隨時隨地的訪問AIS數據,并對數據進行各種操作。
3.2 AIS數據的云計算
在存儲空間受限、以及通信實效性高等前提要求下,AIS數據通常采用了壓縮編碼的方式進行存儲,僅在需要的時候,利用解碼技術將數據轉化為實際的AIS數據。通常需要轉化的數據包括:記錄時間、經緯度、航速和航向。授課中,學生可以通過各自的客戶終端對服務器云端的數據進行直接訪問,根據船舶的MMSI(Maritime Mobile Service Identify)水上移動通信業務標識碼提取目標船舶的航跡信息。之后,根據各自需求,可以將提取的AIS數據下載到本地,以便后續進行分析。
3.3 AIS數據的應用實踐
本課程在應用實踐方面,將引導學生自主完成基于AIS數據的航跡預測專家系統建立,包括以下3項內容:
(1)AIS數據的預處理:主要是剔除AIS數據中異常點的過程,包含位置異常點、航速異常點以及航向異常點。位置異常點通常指航跡位置信息超出目標區域邊界,通過邊界約束條件來剔除異常點;航速異常點和航向異常點通常指相鄰兩點的航速/航向變化超過規定閾值,通過閾值來判定并剔除異常點。
(2)航跡的特征提取:通常采用的方法有DP法(Douglas–Peucker algorithm)和LCSCA(Least-squares Cubic Spline Curves Approximation)最小二乘三次樣條擬合算法,在保持航跡復現率的情況,優化航跡的簡化率。
(3)航跡擬合及預測:為學生提供線性回歸、支持向量回歸以及人工神經網絡等方法,讓學生自主完成航跡預測模型的建立,形成從數據的存儲讀寫、計算分析到應用實踐的體系化閉環培養模式。
四、結語
隨著大數據、云計算、人工智能等技術的推進,各行各業在規劃、管理、決策等方面都要以大數據分析為基礎,依托云計算平臺的支撐,通過基于人工智能的專家系統來提供決策支持服務。因此,在推動技術進程和產業進程交互發展的雙輪驅動下,滿足產業發展需求的數據科學家成為新一代信息技術時代最為緊缺的人才。所以,本課程以培養能夠科學地分析各行各業大數據的專業型人才為目標,使學生們掌握云存儲和云計算等實際應用的一系列技能和技術,為學生們提供數理統計、計算機科學、人工智能等交叉學科領域的跨學科教育體制,拓展他們的學術視野,助力他們成為新一代學際融合數據科學家,為各行各業提供高素質拔尖創新人才。
參考文獻:
[1]交通運輸部.智能航運發展指導意見.交海發〔2019〕66號,2019.
[2]李建中、王珊.數據庫系統原理.電子工業出版社,2008.
[3]劉志紅. Excel統計分析與應用.電子工業出版社,2016.
[4]Christopher M. Bishop. Pattern Recognition and Machine Learning. Springer,2006.
本文系遼寧省教育廳普通高等學校校際合作項目委托課題“研究生聯合培養”(10151)的成果之一。
作者簡介:
左毅,大連海事大學航海學院特聘教授/海事大數據與航運通用人工智能協同創新中心主任,博士研究生,從事數據科學、機器學習、人工智能等研究;
孫卓,大連海事大學交通運輸管理學院教授,博士研究生。