

摘""要:深度學習是人工智能領域的一個研究熱點,在學術界、工業界以及政府部門均可發揮重要的作用。深度學習在船舶運動姿態領域的研究尚處于起步階段,目前可查的研究成果甚少。該文首先概述了4種機器學習算法,包括監督學習、無監督學習、半監督學習和強化學習,介紹了幾種重要的神經網絡模型及常用大規模訓練方案,然后分析幾種常用的深度學習優化算法;在此基礎上,結合船舶橫搖/艏搖運動模型,闡述了船舶橫搖角和艏搖角的數據訓練系統、數學模型和預測方法;最后總結了該領域存在的問題和發展前景。
關鍵詞:深度學習""機器學習""神經網絡""船舶橫搖""運動姿態控制
中圖分類號:TP18"""""""""""文獻標識碼:A
The"Research"Review"of"the"Ship"Roll"Motion"Attitude"Control"Based"on"Deep"Learning
SONG"Weiwei1,2"""DUAN"Xuejing1
(1.Shandongnbsp;Ship"Control"Engineering"and"Intelligent"System"Engineering"Technology"Research"Center;"2.Weihai"Ocean"Vocational"College,"Rongcheng,"Shandong"Province,264300"China)
Abstract:"Deep"learning"is"a"research"hotspot"in"the"field"of"artificial"intelligence,"which"can"play"an"important"role"in"academic"circles,"industry"circles"and"government"departments."The"research"of"deep"learning"in"the"field"of"ship"motion"attitude"is"still"in"its"infancy,"and"there"are"few"searchable"research"results"at"present."This"paper"first"summarizes"four"machine"learning"algorithms,"including"supervised"learning,"unsupervised"learning,"semi-supervised"learning"and"reinforced"learning,"introduces"several"important"neural"network"models"and"common"large-scale"training"programs,"and"then"analyzes"several"common"optimization"algorithms"of"deep"learning."Based"on"this,"and"combined"with"ship"transverse/yaw"motion"models,"this"paper"expounds"the"data"training"system,"mathematical"model"and"prediction"method"of"ship"roll"angle"and"yaw"angle."Finally"it"summarizes"the"existing"problems"and"development"prospects"in"this"field.
Key"Words:"Deep"learning;"Machine"learning;"Neural"network;"Ship"roll;"Motion"attitude"control
隨著人工智能和大數據時代的到來,在學術界、工業界以及政府部門等很多領域,如何從海量的、多維的、多形式的大數據中,獲得細致的、有深度的、有規律可循的數據,成為人工智能研究領域的一個熱點問題。因此,越來越多的學者專家投身于數據分析技術的研究中來,深度學習由于立足于神經網絡,同時可以發展出多層神經網絡,并且完全可以利用輸入的數據自行模擬和構建相應的神經網絡模型結構,且具備根據不同的訓練數據進行自由化的能力而備受青睞。目前,深度學習仍然存在諸多問題[1],包括訓練時間長、訓練難度大、過于依賴帶標簽數據、魯棒性差、學習模型太大、可解釋性差、任務完成能力差、應用領域受限等諸多問題。
鑒于目前國內深度學習的相關研究仍處于起步階段,與其他深度學習研究的相關綜述相比,該文系統地從深度學習算法、神經網絡結構模型、深度學習算法優化以及多種學習算法在船舶橫搖運動姿態控制中的應用等進行綜述。
1""多種學習算法
1.1""深度學習
深度學習神經網絡起源于2006年,是一種學習能力強,能提取樣本特征并進行特征轉換的深層機器學習算法。在圖像處理、語義識別等方面有較為成熟的應用,但在船舶運動姿態控制和跟蹤方面應用的研究還處于起步階段。
1.2""監督學習
各種各樣的實際應用程序已經使用了監督學習。例如:計算機網絡的入侵檢測、高光譜遙感波段選擇、配電系統中的非技術損失檢測以及自動水草識別。監督學習的定義是在“基礎現實”之上的學習,其中每個樣例都包含了相關的屬性x和真實的觀測目標值y[2]。
在數據學習中,分類是最頻繁遭遇的決策任務。分類問題的核心特征是學習算法對K個預定義的類別之一指定一個對象。這并非意味著“正確答案”必然屬于其中一個類別。分類問題的典型方法包括預處理、特征提取、訓練和分類4個部分。監督算法的精度是訓練集特性的函數,特性包括樣本大小在內。通常,訓練樣本的規模增加,分類精度也會提高。因此,重點是訓練樣本需要足夠大,以便對類別特性提供既有代表性又有無偏性的描述。
監督學習的兩個核心方法是生成算法和理解判別算法。貝葉斯分類器是一種生成分類器,是一種決策規則,它很好地使用了貝葉斯法則,把x=[x1,x2,…,xn]表示為特征/屬性的輸入向量,而K個類別記作c=[c1,c2,…,cK]。對每個輸入特征或屬性給定了的集合觀測,估計可能性最大的類別ci[3]。
1.3""無監督學習
實際生活中,對于缺乏足夠先驗知識的問題,難以進行人工標識類別。無監督學習的主要任務是進行網絡模型預訓練,首先選擇一批具有代表性的樣本數據進行標注并分類訓練,然后再對所有樣本數據自動分類并人工標注,最后在沒有類別的情況下提取比較好的特征[4]。聚類是無監督學習的典型例子,一般有5種方法,劃分算法和層次算法是最主要的兩種算法。K-means算法、K-medoids算法和CLARANS算法是典型的分割聚類算法。目前,無監督學習仍未取得突破性的成果,未來還有更廣闊的發展空間[5]。
1.4""半監督學習
相關學者通過研究發現,無監督學習和監督學習都與人類的學習習慣不相符,由此而提出了介于二者之間的半監督學習方法。半監督學習網絡主要有卷積深度網絡、深度置信網絡等[6]。
1.5""強化學習
與其他機器學習相比較,強化學習沒有監督者,只有量化獎勵信號;反饋延遲方面,只有進行到最后才知道當下的動作是好還是壞;屬于順序決策,根據時間一步步決策行動,訓練數據不符合獨立同分布條件;每一步行動都影響下一步狀態和獎勵。強化學習需要依賴人工提取特征,利用深度學習的感知能力,將深度學習與強化學習相結合,互補共贏,以期達到預期的學習效果。
2""神經網絡模型架構
2.1""深度前饋網絡
深度前饋網絡是最基本的深度學習網絡結構,為多層感知器,每一層包含若干多個神經元,激活函數常采用徑向基函數。多層感知器的前向傳播如圖1所示。
2.2""深度置信網絡
受限玻爾茲曼機(Restricted"Boltzmann"Machine,RBM)是深度置信網絡的最基本結構單元"[7]。其訓練過程就是將每個訓練樣本看成是一個狀態向量,使每個訓練樣本出現的概率盡量大。常用對比散度(Contrastive"Divergence,CD)算法來對受限Boltzmann機進行訓練,CD算法對每個訓練樣本計算出隱層神經元狀態的概率分布,然后根據概率分布得到隱層的狀態向量。整個訓練過程分為無監督訓練和微調訓練兩個階段"。深度信念網絡DBN"(Deep"Belief"Network,DBN)的靈活性較高,拓展能力強,目前在圖像、文本、語音等多個領域中已經得到了廣泛的應用,也是構建新型深度學習網絡的結構基礎。
2.3""階梯網絡
該網絡的主要特點是對于局部學習所得到的學習結果具有良好的可擴展性[8]。在每一層網絡都有具體的學習目標,對深度較深的神經網絡更加有效。這種網絡模型更適合用于半監督學習算法,在經過實驗訓練后,對現已有的數據集均能夠取得極佳的訓練結果。半監督學習將在學習模式方面會有更多的創新研究結果。
2.4""遞歸神經網絡
遞歸神經網絡RNN(Artificial"Neural"Network,"ANN)[9]對于反饋有較好的效果,該網絡能夠很好地儲存當前和過去的狀態,更加適用于文本、語言等時間序列特征明顯的數據處理[10]。在預測文本和語音識別中表現得比較優異;在實際應用中,"GRU(Gated"Recurrent"Unit,GRU)模型更具競爭力,性能更加穩定。
3""船舶橫搖運動姿態控制方法及模型
3.1""船舶橫搖運動姿態控制方法
將深度學習神經網絡和無監督學習結合,選擇特定的船型以及減搖鰭類型和大小,選擇特定的1~3組有義波高和遭遇角,利用無監督機器學習方法中基于劃分的聚類方法模糊K-均值法對橫搖數據分類后構建船舶橫搖數據分類模型;然后在此基礎上利用深度信念網絡DBN[11]對船舶橫搖運動的實驗數據進行訓練,該深度信念網絡中的每一層都是一個受限玻爾茲曼機Boltzmann,在進行無監督訓練時,首先訓練第一層(按標準RBM訓練),然后將第一層預訓練好的隱結點視為第二層的輸入結點,對第二層進行訓練,最后再利用BP算法對整個網絡進行訓練。RBM通過學習將數據表示成概率模型,一旦模型通過無監督學習被訓練或收斂到一個穩定狀態,還可用于生成新數據,從而給出船舶橫搖運動的自動學習結果。與傳統的PID控制、自適應控制、魯棒控制以及單一的神經網絡方法相比較,該算法將在自動學習能力、縮短訓練時間以及控制系統的穩定性等方面都將有所提高。
3.2""船舶橫搖運動姿態控制模型
設計的船舶橫搖運動姿態控制系統,包括:橫搖檢測裝置、基于深度學習神經網絡的船舶橫搖運動控制器、鰭伺服系統和單體鰭。橫搖檢測裝置檢測船舶在運動過程中產生的橫搖數據,并將數據發送至所述基于深度學習神經網絡的船舶橫搖運動控制器,進而生成鰭控制信號,鰭伺服系統根據鰭控制信號控制鰭的運動。
基于多種學習算法的船舶橫搖運動姿態控制系統的結構原理圖如圖2所示。其中,φ(k)測量系統輸出;φm(k+1)為辨識器NNI序列預測輸出;根據φg(k+1)和φm(k+1)之差,使用深度學習神經網絡訓練控制器NNC;根據φ(k+1)和φm(k+1)之差,使用深度學習神經網絡訓練辨識器NNI;NNC輸出的控制信號為鰭控制信號α(k+1)。
所設計的深度學習神經網絡[12]控制系統在系統參數攝動或者存在建模誤差情況下,根據在線觀測所積累的信息,修正控制器和辨識器的權值和閾值,對系統實施有效控制,保證單體鰭橫搖控制系統的運行性能。
4""結語
深度學習神經網絡DLNN具有多個隱含層,可以利用實驗監測所獲得的大量船舶橫搖數據完成模型的預訓練過程。首先構建分類深度學習神經網絡模型,然后,結合船舶運動控制實驗在線監測獲得的船舶橫搖數據,提出一種新的船舶橫搖/艏搖運動規律學習方法。目的在于利用深度學習神經網絡(DLNN)模型及算法,實現提高船舶橫搖運動控制和預測的精度問題或者在同等預測精度條件下延長預測時間。
參考文獻
[1]孫影影,賈振堂,朱昊宇.多模態深度學習綜述[J].計算機工程與應用,2020,56(21):1-10.
[2]解帥.深度學習和深度強化學習綜述[J].信息技術與信息化,2020(5):225-227.
[3]張菊,郭永峰.深度學習研究綜述[J].教學研究,2021,5(44):6-11.
[4]張軍陽,王慧麗,郭陽,等.深度學習相關研究綜述[J].計算機應用研究,2018(7):1921-1928.
[5]吳澤智,陳性元,楊智,等.信息流控制研究進展[J].軟件學報,2017,28(1):135-159.
[6]席亮,劉涵,樊好義,等.基于深度對抗學習潛在表示分布的異常檢測模型[J].電子學報,"2021,49(7):1257-1265.
[7]"WAN"Y"Q,"CHEN"Y"Z,"YAN"C"R,"et"al."Similarity-based"Sales"Forecasting"Uusing"Improved"ConvLSTM"and"Prophet[J].Intelligent"Data"Analysis,2021,25(2):383-396.
[8]聞佳,王宏君,鄧佳,等.基于深度學習的異常事件檢測[J].電子學報,2020,48(2):308-313.
[9]ZHOU"X"H,XIONG"J,ZHANGnbsp;X"C,et"al.A"Rradio"Aanomaly"Detection"Algorithm"Based"on"Modified"Generative"Adversarial"Nnetwork[J].IEEE"Wireless"Communica?tions"Letters,2021,10(7):1552-1556.
[10]RAJENDRAN"S,LENDERS"V,MEERT"W,et"al.Crowdsourced"Wireless"Spectrum"Anomaly"Detection[J].IEEE"Transactions"on"Cognitive"Communications"and"Networking,2020,"6(2):694-703.
[11]劉全,霍建偉,章宗長.深度強化學習綜述[J].計算機學報,2018(1):1-27.
[12]VUKOTI"V,PINTEA"S"L,RAYMOND"C,et"al.One-step"Ttime-dependent"Future"Video"Frame"Prediction"with"a"Con-volutional"Eencoder-decoder"Neural"Network[C]//Proceed-ings"of"the"19th"International"Conference"on"Image"Analys-is"and"Processing.Catania,2017:140-151.