楊恩平 薛棟吉
(南京理工大學計算機科學與工程學院 南京 210000)
從2006 年,深度學習泰斗Hinton[1]提出深度置信網絡和新的訓練方法,克服了神經網絡遇到的瓶頸,到2013 年深度學習位列十大突破性科技之首,再到后來AlphaGo 橫空出世擊敗了人類的圍棋大師,到現在人工智能的廣泛運用。這些都是深度學習帶給我們的改變。深度學習目前在圖像識別、語音識別、文本處理和大數據分析方面已經被廣泛應用,在控制領域方面,深度學習也有一定的嘗試。不過目前主要突出的是對控制目標識別和狀態特征提取方面,對于控制領域最核心也是最基礎的控制策略上,深度學習目前成果不多。
深度學習是由機器學習和多層神經網絡發展而來,其作為機器學習的一個重要的分支存在。在機器學習算法中,EM 算法[2]是對自動控制領域方面具有重大貢獻的算法。有了該算法,就可以很方便地使用高斯混合模型(GMM)[3]來表示隱馬爾科夫模型(HMM)狀態與輸入之間的關系,從而開發新的控制系統。在深度學習出來之前就有人通過多層神經網絡實現了自適應模糊邏輯控制系統[4]。
作為機器學習的分支,深度學習擁有更多的隱藏層和神經元,并且提高了學習性能,通過深度學習算法可以解決很多常規神經網絡解決不了的復雜問題。本文就是來探索深度學習在控制策略上的應用。目前韓國慶北大學的Cheon K[5]等用DBN網絡來代替PID 控制器進行過研究,證明了深度學習算法可以用來代替PID 控制器來控制空載的直流電機。……