摘要:本文分析了授課對象情況,針對本課程在控制科學與工程學科博士生培養中的地位作用,以及要達到的教學目標,重點論述了所采用與應用的教學方法,最后指出了本課程教學的特色與亮點,以期對博士生的同類專業基礎和專業課程授課有所幫助。
關鍵詞:自適應控制;智能控制;課程教學;方法創新
一、課程授課對象情況分析
“自適應與智能控制”課程授課對象為控制科學與工程學科博士生,授課對象成分復雜、基礎參差不齊:既包括有軍籍博士生,也包括地方無軍籍博士生;既包括常規博士生,也包括直博生;授課對象中有的本科碩士階段均為控制學科,有的本科或碩士至少有一個為非控制學科出身,尤其是現有的研究生政策是本校控制科學與工程應屆本科畢業生考研指標較少。因此,授課對象中絕大多數是非本學科出身,尤其是有軍籍學生這一問題比較突出。由于授課對象成分較為復雜,因此他們的學科與專業基礎差別較大。有的博士生從外專業考來,嚴重缺乏自動控制原理、線性系統理論以及系統辨識與狀態估計等控制學科經典基礎課程知識。要提高自適應與智能控制課程的授課質量,首要的就是要精確掌握授課對象的特點,因材施教,才能有的放矢。
二、本課程在人才培養中的地位與教學目標分析
“自適應與智能控制”課程是控制科學與工程學科博士生的一門學科基礎課程,該課程學習研究的內容包括自適應控制與智能控制的基本理論、方法及應用,對學科所需控制理論基礎知識具有重要的儲備作用,對于提高博士研究生的自適應與智能控制理論和應用水平,學習本學科其他專業課程,研究和解決復雜系統的控制問題具有重要的支撐作用。
通過本課程的學習,學員能夠熟悉自適應與智能控制理論來源和基本方法,可以使用自適應控制與智能控制的基本理論和方法來設計控制系統,知曉自適應控制的發展趨勢、知識挖掘和智能搜索等理論在智能控制領域的應用前景,提高自覺應用自適應控制和智能控制方法發現和解決復雜系統控制問題的能力。同時,引導學員站在科學技術的前沿,增強掌控系統全局、把握問題關鍵和善于理論與應用創新的意識和能力。在教學內容方法方面,通過本課程的學習,學員能夠掌握模型參考自適應控制、自校正控制、模糊控制、神經網絡控制、群體智能等算法的原理和推導過程,學會各種控制算法的算法公式和應用技術,提高解決復雜實際工程控制問題中的自適應控制與智能控制的思維能力。
三、采取的創新教學方法和特色與亮點
通過對上述教學對象和教學目標的分析可知,本課程一方面對控制學科博士生掌握知識及后續專業課的學習和學位研究具有非常重要的作用,另一方面本課程授課對象的基礎和成分又頗為復雜。要上好這門課、取得好的授課效果,并非易事。因此,研究探索創新適合本門課程教情的教學方法,對于提高授課效果非常必要。
(一)采取的創新教學方法
1.問題驅動的教學方法
“自適應與智能控制”課程包含的課程內容多,但是每章之間相對獨立,比如模型參考自適應控制、自校正控制、模糊控制、神經網絡控制、群體智能優化等知識點,均具有相對較為完整的知識體系和特定的應用方向。講授每個知識點時,首先要從工程實際中提出存在的問題,由問題驅動引出某類方法的必要性,接著對該類方法的起源和關鍵的標志性方法和進步點進行必要的描述,再對核心知識點進行詳盡的講授和學習,這樣學員對所學知識才能有較為透徹的理解,方能做到知其然知其所以然。例如在自適應控制方法的講授中,以導彈或飛機的控制過程為例,其質量、質心位置隨燃料消耗而改變,氣動參數隨飛行速度、飛行高度、大氣密度而改變,并且導彈飛行速度、飛行高度大范圍變化,導致導彈數學模型大范圍變化,而傳統的一般反饋控制或最優控制難以完成這種控制需求,進而引出自適應控制方法。進一步地,從人們是否適當地掌握被控制對象的性能,是否可提供相應的參考模型,又可將自適應控制分為模型參考自適應控制和自校正控制兩大類。在講授每一類控制方法時,一定要講清楚其工程需求來源和已知條件,采用問題驅動的教學方法,提高學員學習的主觀能動性,便于搭建形成完整的知識體系。
2.基礎理論的補弱強化
“自適應與智能控制”課程各章節或大知識點不僅相對獨立,而且知識點的基礎知識差距很大,如模型參考自適應控制基礎知識涉及各種梯度優化算法、李雅譜諾夫穩定性理論、超穩定性理論等,而自校正控制的基礎知識是系統辨識與參數估計、最小二乘估計及其各種拓展算法、閉環系統穩定性分析等理論,而模糊控制和神經網絡控制等需要模糊邏輯和神經網絡基礎等知識。為了便于課程學習,國內自適應與智能控制教材從不同角度進行教學內容的編排:有的專門提供函數正實性、李雅譜諾夫穩定性、超穩定性理論等基礎理論章節;有的專門提供系統辨識與狀態參數估計理論章節;有的是在講授具體控制算法時再講授必要的基礎知識。如前所述,本授課對象來源成分復雜、理論基礎參差不齊,要想取得較好的授課效果,一定要對相應的基礎知識進行補弱強化,才有可能掌握所學的核心控制算法。我們采取的方法是充分利用課下時間,通過線上視頻教學資源和課后作業的方式,強化控制理論基礎,課上再對學員反饋的基礎理論難點進一步解析、答疑,做到基礎知識不掌握,不學習核心知識。
3.關鍵環節的理論推導
“自適應與智能控制”課程是一門理論性強的專業基礎課程,核心控制方法都需要大量公式推導才能導出算法。對于這樣一門課程,不能只給出各種算法的結果,一定要使學員知其所以然,透徹掌握核心公式的來龍去脈。我們的做法是,對于核心算法,從算法推導源頭開始,首先講述清楚算法推導所依賴的準則函數和前提條件的物理意義,然后從自適應和智能優化理論出發,步步為營,在課堂上與學員一起推導公式。采用引導、發問方式,啟發學員一步一步來推,這樣得到的算法學員才理解深刻、掌握透徹。如廣義最小方差自校正控制器設計方法,就需要采用這樣的推導思路。在講授基于李雅譜諾夫穩定性理論的模型參考自適應控制算法時,關鍵環節包括:如何從系統的廣義狀態誤差方程來構造合適的李雅譜諾夫函數;如何應用線性定常系統的李雅譜諾夫穩定性理論等來推導算法。再如,講授基于超穩定性理論的模型參考自適應控制算法中,關鍵環節包括:如何由所研究的問題和系統求出等價的非線性時變反饋系統;如何使等價的反饋方塊滿足積分不等式進而推導相關正定矩陣;如何根據等價前向方塊正實性要求確定線性補償器;如何選擇合乎要求的正定矩陣問題。對于以上關鍵環節,一定要與學員一起進行啟發式推導,這樣才能取得較好的教學效果。
4.知識、方法及思維深化提煉
博士生課程授課不同于本科生課程授課,也不同于碩士生課程授課,這是由博士生的特點決定的。博士生的最核心任務是要創新,要推動科學技術的進步,要為他人創造知識。在博士生的學習階段,當然要掌握本學科領域堅實寬廣的基礎理論和系統深入的專門知識。基礎理論和專門知識的掌握是從事創新的基礎,但是擁有大量學科領域知識只是具有了創新的可能,并不意味著一定能取得創新成果。要創新,一定要有方法、有工具,但是更為重要的是要有新思想,在某些思想指導下才能取得創新成果。因此,在博士生課程授課中,除了講授知識外,更重要的是與學生一起分析每個知識點之外,究竟有哪些方法、哪些思想值得挖掘。
講授每個知識點或一個大方法后,重要的是要對其中的知識點提出時的創新方法和創新思想進行深入挖掘。從大的方面出發,可以針對其中蘊含的一些哲學思想或大的學術思想、大的創新方法等入手,進行課程創新思想大討論,目的是讓學員不僅知其然,還要知其所以然,提高創新能力,增長創新本領,掌握創新手段,為下一步學科專業課程、開展學位論文和科學研究奠定一個良好的基礎。從小的方面,要注意一些公式推導細節,尤其是一些合理的近似、合乎邏輯的由整體到局部的拆分等,從中體會一些方法邏輯和思想,提高學員理論創新、數學推導的本領。例如,模糊PID控制相比傳統的PID控制算法,相當于設計了在線的PID參數整定方法,能夠根據控制系統輸入情況動態調整PID參數,因此控制性能明顯優于傳統的PID控制算法;遺傳算法遵循自然選擇規律,按照“物競天擇、適者生存”的規則,進行個體的選擇和繁衍,實現群體的進化;在粒子群算法中,每個粒子在自身飛行慣性的基礎上,要結合個體經驗和群體經驗確定下一步飛行方向和速度,體現了學習過程的方法論;在強化學習中,采用蒙特卡洛方法求解數學期望,實現滿足算法需求的有限近似,體現了工程化實現的思想。
(二)特色與亮點分析
1.啟發研討推導,化繁為簡
本課程理論性很強,各個算法均具有非常復雜的公式推導。不進行公式推導,難以體會到這些算法的創新奧妙;只是死推公式,會使學生望而生畏,無從下手。對控制學科博士生而言,推導公式是基本技能,不然難以做出有意義的創新。本課程授課基于其理論性強、理論與工程結合緊密的特點,在核心知識點的學習上采取啟發研討推導,將紛繁復雜的公式推導化簡,并引入實際的應用場景明確其物理含義,使學生體會其中科學的奧妙,培養學生對算法理論研究的興趣,學習理論算法推導的技巧和思路,提高博士生的理論算法創新研究能力。例如,在前向神經網絡的反向傳播推導中,基于鏈式求導法則逐步分解參數梯度,簡化梯度求解,消除學生的畏難情緒。同時,基于三層神經網絡進行反向傳播的編程實踐,打通理論推導到實際應用的渠道,便于學生掌握、應用;在深度強化學習中,以控制電子游戲中的角色動作、贏得游戲為目的,從不同的訓練路徑出發,對深度強化學習的訓練方式進行分析、討論,從而引出不同的深度強化學習方法,便于學生理解和理論推導。
2.融入前沿理論,反哺教學
在授課中,不能只就書本知識或內容講授,要結合自己承擔的前沿科研項目(如國家自然科學基金等項目),將最新的、前沿的理論或算法方面的進展及時地傳授給學生,讓書本知識很好地與科研前沿、與工程問題對接,培養學生的科研創新能力;要將正在講授的書本理論與方法運用到實際的科研過程中,例如講授、討論李雅譜諾夫穩定性理論在實際控制系統中的拓展推廣應用,開闊學生視野;在卷積神經網絡的講授中,以ImageNet視覺識別競賽為牽引,引導學生了解神經網絡典型的架構和發展潮流,緊跟學術前沿;在深度強化學習的講授中,結合谷歌開發的AlphoGo和AlphoZero智能對弈算法,闡述具體應用中深度強化學習的精巧構思和應用落地,并從AlphoGo到AlphoZero的發展進化,探討深度強化學習的發展方向。
3.方法思維提煉,啟迪智慧
對每個知識點講授后,重要的是要學習科學先賢們如何一步一步在前人基礎上創新,用了哪些方法來創新提出新算法;在每個知識點學習中,這些科學先賢們運用了哪些思想,例如哲學思想或科學思想,要深度挖掘;尤其是對于不同的大類方法,要首先對這類方法的思維、框架等進行深度挖掘,對不同方法之間的異同多對比、多分析,這樣可以啟迪智慧、開拓思維,對于博士生創新研究的開展具有非常重要的作用。例如,在群智能優化算法中,存在遺傳算法、粒子群算法、蟻群算法等不同種類的仿生尋優算法,這些算法都受不同的生物現象啟發,并進行了相應的數學化描述和抽象,最終歸納總結形成迭代更新的尋優算法過程。在課上教學過程中,通過對比群智能優化算法的尋優思路和關鍵步驟,并針對同一優化問題采用不同算法進行求解,引導學員思考不同算法的特色亮點、應用范圍和改進方向。
四、教學效果分析
近年來,幾乎所有的控制學科博士生均選修“自適應與智能控制”課程,這門課程的授課質量對本學科博生生的后續專業課程學習和學位研究均具有重要作用。本課程所含內容豐富,其中的控制算法穩定性分析、算法優化、系統辨識與參數估計、模糊控制和神經網絡控制等知識點對其他課程和博士生學位論文研究均具有重要的支撐作用,育人效果明顯。近五年來,本課程選修博士生的學術水平普遍得到提升,一大批高平學術論文發表在《IEEE工業電子》《信號處理》《神經網絡與學習系統》《控制學》《可靠性》《工業信息》等本領域權威學術期刊,博士生畢業學位論文質量有較大提升,有6名博士學位論文獲得軍隊、陜西省優秀學位論文,2020年1名博士生獲第十二屆“中國青少年科技創新獎”(全國僅有30人獲獎),1名博士生入選陜西省青年人才托舉工程、軍事科技領域青年人才托舉工程。
結語
本文詳細分析了授課對象的復雜情況,并針對本課程在控制學科博士生培養中的地位作用,以及要達到的教學目標,重點論述了所采用與應用的教學方法、特色與亮點,最后分析了教學效果。本文所提出的教學方法等對博士生其他課程教學均有參考借鑒價值。
參考文獻:
[1]李言俊,張科.自適應控制理論及應用[M].西安:西北工業大學出版社,2005.
[2]柴天佑,岳恒.自適應控制[M].北京:清華大學出版社,2016.
[3]王雪.人工智能與信息感知[M].北京:清華大學出版社,2018.
[4]李航.統計學習方法[M].北京:清華大學出版社,2019.
[5]王樹森,黎彧君,張志華.深度強化學習[M].北京:人民郵電出版社,2022.
[6]劉馳,王占健,戴子彭.深度強化學習:學術前沿與實戰應用[M].北京:機械工業出版社,2020.
作者簡介:孔祥玉(1967—),男,漢族,山西洪洞人,博士,教授,研究方向:自適應控制與系統辯識;姚二亮(1991—),男,漢族,安徽鳳陽人,博士,講師,研究方向:機器人控制與自主導航;李紅增(1979—),男,漢族,河北無極人,博士,副教授,研究方向:測試控制與故障診斷。