楊恩平 薛棟吉
(南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 南京 210000)
從2006 年,深度學(xué)習(xí)泰斗Hinton[1]提出深度置信網(wǎng)絡(luò)和新的訓(xùn)練方法,克服了神經(jīng)網(wǎng)絡(luò)遇到的瓶頸,到2013 年深度學(xué)習(xí)位列十大突破性科技之首,再到后來AlphaGo 橫空出世擊敗了人類的圍棋大師,到現(xiàn)在人工智能的廣泛運(yùn)用。這些都是深度學(xué)習(xí)帶給我們的改變。深度學(xué)習(xí)目前在圖像識(shí)別、語音識(shí)別、文本處理和大數(shù)據(jù)分析方面已經(jīng)被廣泛應(yīng)用,在控制領(lǐng)域方面,深度學(xué)習(xí)也有一定的嘗試。不過目前主要突出的是對(duì)控制目標(biāo)識(shí)別和狀態(tài)特征提取方面,對(duì)于控制領(lǐng)域最核心也是最基礎(chǔ)的控制策略上,深度學(xué)習(xí)目前成果不多。
深度學(xué)習(xí)是由機(jī)器學(xué)習(xí)和多層神經(jīng)網(wǎng)絡(luò)發(fā)展而來,其作為機(jī)器學(xué)習(xí)的一個(gè)重要的分支存在。在機(jī)器學(xué)習(xí)算法中,EM 算法[2]是對(duì)自動(dòng)控制領(lǐng)域方面具有重大貢獻(xiàn)的算法。有了該算法,就可以很方便地使用高斯混合模型(GMM)[3]來表示隱馬爾科夫模型(HMM)狀態(tài)與輸入之間的關(guān)系,從而開發(fā)新的控制系統(tǒng)。在深度學(xué)習(xí)出來之前就有人通過多層神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了自適應(yīng)模糊邏輯控制系統(tǒng)[4]。
作為機(jī)器學(xué)習(xí)的分支,深度學(xué)習(xí)擁有更多的隱藏層和神經(jīng)元,并且提高了學(xué)習(xí)性能,通過深度學(xué)習(xí)算法可以解決很多常規(guī)神經(jīng)網(wǎng)絡(luò)解決不了的復(fù)雜問題。本文就是來探索深度學(xué)習(xí)在控制策略上的應(yīng)用。目前韓國(guó)慶北大學(xué)的Cheon K[5]等用DBN網(wǎng)絡(luò)來代替PID 控制器進(jìn)行過研究,證明了深度學(xué)習(xí)算法可以用來代替PID 控制器來控制空載的直流電機(jī)?!?br>