秦 宇
(廣東省外語藝術職業學院,廣東 廣州510640)
自從“人工智能”這一個概念在1956年被正式提出,至今經歷了多個發展階段。當前,人工智能已經深深融入人們的日常生活之中。為搶抓人工智能發展的重大戰略機遇,國務院于2017年發布了“新一代人工智能發展規劃”。教育部也在近兩年在本科和高職院校批準增設了人工智能相關專業。由于人工智能涉及數學、計算機科學、邏輯學、哲學、神經科學、語言學等不同領域的知識,是一個交叉學科,所以人工智能專業的課程設置比較復雜。本文根據社會對于人工智能的人才需求,結合高職院校教學特點,對于如何合理地設置人工智能專業的相關課程進行了分析,并且提出了總體的框架。
近年,由谷歌旗下的DeepMind公司開發的人工智能圍棋軟件AlphaGo戰勝了世界頂尖的圍棋專業棋手,其中用到的核心技術包括了強化學習、深度學習和蒙特卡洛樹搜索技術。機器學習分為有監督、無監督和強化學習三大類,其中的強化學習強調的是在一系列的情景之下,選擇最佳決策,通過多步恰當的決策,來逼近一個最優的目標。強化學習在理論上依賴于理查德·貝爾曼的動態規劃和Lev Pontryagin的控制論。整個強化學習由智能體、環境、獎賞、狀態、動作5個部分組成。其中的環境通常被規范為一個馬爾可夫決策過程,許多強化學習算法就是在此基礎上使用動態規劃技巧。馬爾可夫決策過程提供了一個數學模型,用于面對部分隨機,部分由決策者控制的狀態下,如何進行最佳決策。由以上分析可以看出,強化學習需要掌握如下知識:
(1)動態規劃
(2)控制論
(3)隨機過程
由于高職院校的學生在理論基礎的學習上并不是很強,所以同時開設這幾門課程會增大學生學習的難度,所以可以由任課教師抽取這幾門課程中和強化學習相關性較大的部分融合到一門課程“強化學習”中進行授課。課程大綱主要應該包括:
(1)強化學習基本理論
(2)馬爾可夫決策理論
(3)智能搜索和蒙特卡洛樹搜索
(4)深度Q網絡算法和應用
(5)強化學習平臺Gym搭建和算法實踐
強化學習的最大特點就是可以不需要大量的訓練樣本來訓練,而是通過自己不停地嘗試來學會某些技能,所以強化學習的運用也會越來越廣泛。強化學習需要具備一定的數學基礎和機器學習的基本理論,所以建議此門課程放在第五學期開設,學習課時建議64個學時,4個學分。
AlexNet網絡在2012年ImageNet競賽獲得冠軍,創造了人工智能技術在圖像識別領域的又一個里程碑。AlexNet用到的核心技術是深度卷積神經網絡。AlexNet將LeNet的思想發揚光大,把CNN的基本原理應用到了很深的網絡中。深度學習近些年來已經成為了人工智能領域的主流技術。深度學習是在人工神經網絡的基礎上發展起來的。其實早在20世紀50~60年代,科學家羅森布拉特就已經提出了擁有輸入層、輸出層和一個隱藏層的神經網絡,并命名為“感知器”。輸入層的特征向量通過隱藏層變換達到輸出層,在輸出層得到分類結果。但是,單個隱藏層的感知器面臨一個嚴重的問題是難以擬合復雜的函數,典型的如“異或”計算,這使得神經網絡的發展遇到了瓶頸。隨著科技的進步,多層感知器被提出,輕松地解決了“異或”問題。然而,隨著網絡層數增加,函數容易陷入局部最優解,這是神經網絡遇到的第二個瓶頸。2006年,著名科學家辛頓教授利用預訓練的方法,緩解了局部最優解的問題。這以后,人們又利用ReLU等新激活函數替代了傳統的sigmoid函數,才讓深度神經網絡成了人工智能中一個極其重要的研究領域。由以上分析可以看出,“深度學習”課程應該作為專業核心課程開設,由于其重要性,學時建議96學時,學分6學分,開設學期建議在第三學期開設,其前導課程包括了一些數學基礎課程、網絡基礎課程、編程基礎課,后續的課程可以是強化學習,或者智能機器人等課程。深度學習的教學主要內容應該包括以下內容:
(1)深度學習發展概述
(2)人工神經網絡原理和實踐
(3)深度學習的主流結構、激活函數、正則化技術,實用算法細節和應用案例
(4)前饋神經網絡和應用
(5)卷積神經網絡和應用
(6)循環神經網絡和應用
(7)深度學習實驗平臺的搭建和代碼編寫
人工智能的另外一門核心技術就是機器學習,其實早在深度學習大量應用之前,人們就已經采用邏輯推理和機器演算的方法來模擬了人類的思維。深度學習的一個較大弱點是其不可解釋性,即人們發現深度學習經過大量的樣本學習后,在某些方面可以達到近似人類的智力水平,但一直對于其運行機制無法做出很好的解釋,這個弊端讓深度學習很難用在非常重要的場合,比如醫療、救治等場合。而機器學習中采用邏輯推理和機器演算來模擬了人類思維的方法就顯示了其可以解釋的優點。所以開設機器學習這門課程就顯得很有必要。由于機器學習領域涉及較多內容,而且也是人工智能的基礎,所以建議作為專業基礎課,設置在第二學期或者第三學期,其前導課程包括高等數學、線性代數、概率與數理統計、高級語言設計等,學時96學時,6學分,主要內容如下:
(1)機器學習的基本概念
(2)聚類(K均值聚類及其改進算法,聚類的任務等)
(3)回歸(回歸任務與評價方法等)
(4)分類(全局最優、凸優化等機器學習中的最優化理論,迭代法、梯度下降法、牛頓法等最優化方法)
(5)特征工程、降維與超參數調優
人工智能的專家系統以及人工神經網絡都需要提前收集大量的數據,這就用到了大數據技術,所以也有必要開設一門“人工智能數據收集與處理”課程,主要講述如何利用大數據技術和網絡爬蟲等技術收集數據和處理數據,其前導課程包括高級語言程序設計,linux操作系統。建議開設在第三學期,64個學時,4個學分。主要講授內容如下:
(1)大數據的定義和特征
(2)大數據分析的過程、技術及工具
(3)大數據的應用
(4)大數據的處理流程
人工智能現在已經廣泛應用于自然語言處理和圖像識別領域,所以可以分別開設兩門課程:“自然語言處理”“模式識別和圖像處理”。由于自然語言處理課程涉及建模等復雜的理論,所以可以在制定課程標準時,避開較復雜的理論,把重點放在運用環節,“自然語言處理”課程建議設置在第四或者第五學期,32學時,2學分。“模式識別和圖像處理”課程相對自然語言處理模型較少一些,可以設置在第四學期,32學時,2學分。
高職院校應更注重與技術運用,所以還可以設置“智能產品營銷與服務”課程,在第五學期講授,32學時。
除了以上專業核心課程外,還應該開設高等數學、線性代數、概率與數理統計、高級語言設計、網絡原理、操作系統等基礎課程,建議在第一和第二學期進行講授,為后面的核心課程打下基礎。
本文對于高職院校人工智能技術服務專業的課程設置進行了研究分析,提出了總體的設計框架。人工智能技術發展迅速,應用廣泛,人工智能專業在高職院校開展時間較短,所以還需要在不斷的實踐教學中優化培養方案,細化課程設置。