張晶
摘 要 針對模式識別課程特色不鮮明、方法理論陳舊、實踐內容相對薄弱等情況,通過緊跟人工智能學術前沿、融合學術研究驅動的教學思想探究模式識別教學方法。從課程內容和實驗設計等環節出發,注重關鍵技術理論和實踐相結合,幫助學生掌握模式識別領域的經典及前沿方法和研究方向,通過半開放實驗作業在提高學生對理論知識的深入理解的同時,培養學生的創新性思維和科研素養。
關鍵詞 模式識別;研究生教育;課程建設;教學實踐
中圖分類號:G424 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ?DOI:10.16400/j.cnki.kjdk.2021.31.041
The Exploration of Course Construction and Teaching Practice for
Pattern Recognition Course
ZHANG Jing
(College of Software, Beihang University, Beijing 100191)
Abstract In view of the lack of distinctive characteristics of the Pattern Recognition course, the outdated method and theory, and the relatively weak practical content, the Pattern Recognition teaching method is explored by closely following the academic frontier of artificial intelligence and integrating the teaching ideas driven by academic research. This paper focuses on the course content and experimental design as well as the combination of key technical theory and practice to help students master the classic and cutting-edge methods and research directions in the field of pattern recognition, improve students' theoretical knowledge through semi-open experimental assignments, and cultivate students' innovative thinking and scientific research literacy.
Keywords pattern recognition; postgraduate education; course construction; teaching practice
2017年以來,我國先后發布了《“互聯網+”人工智能三年行動實施方案》《新一代人工智能發展規劃》等戰略性文件,系統布局我國人工智能相關技術產業及應用的發展。隨之而來,人工智能人才培養成為教育界和產業界共同關注的焦點。[1]自2012年以來,以深度學習為代表的人工智能技術在各個領域激發了層出不窮的新算法新技術。在圖像識別、機器翻譯等應用上,其性能已經遠遠超越了傳統機器學習和模式識別算法。在過去近十年中,深度學習已經成為新一代人工智能的發展主線,涌現出前所未有的新方法、新問題。高校承擔著主要的新一代人工智能下的人才培養任務,應該順應時代、與時俱進,加強人工智能相關課程的建設。為了貫徹國家發展戰略,助力中國人工智能行業的發展,探索和促進人工智能領域人才培養,很多高校同時開設機器學習和模式識別等人工智能相關課程。[2][3]北京航空航天大學軟件學院的軟件工程和電子信息方向開設了模式識別課程作為一門重要的專業理論核心課程,其主要內容是對數據進行自動模式發現、特征學習與識別等理論技術。本課程主要講授模式識別領域的基礎理論和經典方法,包括模式預處理、特征提取和表示、模式分析、模式分類等主要內容。然而,課程內容受經典課程影響,其覆蓋的理論和方法在新一代人工智能浪潮下略顯陳舊。此外,多門相關課程同時開設導致不同課程之間內容重疊度較大,影響學生的學習興趣。而且,經典課程以理論講授為主,忽略了學生實踐和創新能力的培養。因此,模式識別作為人工智能方向的重要分支學科之一,現有的課程設置存在內容陳舊、特色不鮮明、實踐環節薄弱、對學生的創新能力培養欠缺等問題。
本文分析模式識別課程在內容設置以及教學和考核方案面臨的問題,提出課程內容設計方案,以及理論講授結合實踐作業的教學模式,結合模式識別領域的發展前沿,激發學生的創新思維和科研興趣。
1 模式識別課程設計
1.1 課程目標
通過具有特色的課程內容設置以及創新能力導向的教學方法,幫助學生全面清晰的了解領域的發展史,對經典方法有理論層面和感知層面的理解,對當前的研究前沿和主流方法有客觀的認識,能夠針對某個特定的研究問題提出創新想法,拓展學生的創新視野和創新意識。并通過課程實驗提高學生的理論知識理解、動手編程實踐、文獻閱讀、算法復現、結果分析、報告撰寫等綜合能力。
1.2 特色突出的課程內容
現有模式識別課程主要參考Duda等編著的《模式分類》、[4]Bishop編著的《Pattern Recognition and Machine Learning》 [5]以及周志華教授編著的《機器學習》 [6]等教材。其講授內容更多關注的是傳統機器學習算法,涉及的技術主要包括:貝葉斯決策理論、概率密度估計、線性分類器、非線性分類器、近鄰法、決策樹、特征提取、無監督模式識別等。
然而,模式識別在機器學習相關技術的基礎上,同樣需要關注的是針對不同類型的數據發現、學習與抽取具有魯棒性、可泛化性、可遷移性的特征或模式。這些內容在現有模式識別課程中尚未得到充分的體現,導致模式識別課程缺乏其獨特性。因此,本課程的教學中,在經典機器學習算法的基礎上,為突出模式識別領域特點,重點介紹不同數據類型(比如圖像、文本、時序數據)的模式發現和特征抽取方法,以及具有魯棒性、可泛化性、可遷移性、可解釋性的特征學習前沿方法。因此,本課程的教學內容設計為三大主要的模塊:
第一,機器學習及深度學習簡介。主要介紹基本的機器學習算法基礎概念、核心思想和主要步驟,并從線性模型到非線性模型,從神經網絡到深度學習,沿著機器學習的發展脈絡讓學生對機器學習和深度學習的發展和核心內容有感性的認識。
第二,模式發現和特征表達學習。在學生了解了機器學習的核心思想基礎上,介紹特定數據類型(比如一般數據,圖像數據,文本數據,時序數據等)的模式發現和特征表達學習方法。
第三,可遷移、可泛化、可解釋及魯棒的特征表達。通過介紹模式識別中的針對模式發現和特征表達的可遷移性、可泛化性、可解釋性及魯棒性的前沿方法,幫助學生理解可遷移、可泛化、可解釋及魯棒的特征表達如何成為模式識別領域的前沿科學研究問題和實際落地的新需求與技術瓶頸,以及對相應的基本解決方法的感性認識。
1.3 創新思維導向的教學方法
課堂上的理論教學是學生掌握基本知識的主要渠道,模式識別課程內容的知識點具有跨度較大、原理抽象、不易理解等特點,限制學生的創新性思維發展。此外,在人工智能領域迅速發展的背景下,模式識別課程中涉及的經典和前沿算法和理論是培養創新性思維和拓展創新性視野的優秀案例。因此,教學過程中并提出創新思維導向的教學方法:
首先,幫助學生理解模式識別領域的發展過程、構建整個領域的整體知識體系。創新性思維的建立通常以全面完善的知識儲備為前提。因此,在介紹算法過程中,從傳統的經典算法出發到前沿技術的發展歷程,讓學生在掌握經典的前提下,了解前沿技術的發展依據和動向,從而建立領域發展的整體知識體系并理解本領域的系統思維方式。比如,從一般數據的經典主成分分析特征提取方法到前沿的深度自編碼器的發展,從圖像數據的傳統的濾波器算子到基于卷積神經網絡的深度學習模型的發展,從文本及時序數據的word2vector和RNN模型到自注意力機制、Transformer模型和BERT語言模型的發展等。建立經典方法和前沿技術之間的聯系,幫助學生理解模式識別領域發展歷史、規律和方向,對創新思路和角度有感性的認知。
其次,引入模式識別領域前沿問題,消除學生對本領域的理解偏見,幫助學生建立批判性思維,培養其創新思維和能力。比如,基于深度學習的數據驅動前沿模式識別算法可以實現有效的模式發現和特征表達,在多個領域的不同應用中取得極大的成功,再比如人臉識別等任務上甚至超越了人類智能。但這些算法的優越性能多數僅局限于經過人工選擇的標準數據集,其在真實場景中的泛化能力仍然較低。僅介紹此類算法將造成學生對模式識別乃至整個人工智能領域的理解偏見。因此,將遷移學習、魯棒性學習、可解釋的人工智能等前沿課題引入到模式識別課程中,這些算法是體現創新性和批判性思維的良好案例,啟發學生對模式識別領域進行深入的思考,鍛煉其批判性思維,培養創新性思維、意識和能力。
最后,在培養學生的創新思維、創新意識和創新能力的同時,注重創新視野的拓展。課程內容中引入模式識別與機器學習等領域頂級期刊和會議的最新研究成果。在對前沿問題和方法進行介紹的過程中,從研究動機、觀察發現以及創新性體現等方面出發,再到核心算法的介紹。指引學生了解正確的研究思路,培養學生的批判性思維和創新能力。同時也幫助學生了解技術發展的熱點和趨勢,培養學生對技術發展的洞察力,激發學生的創新意識。
2 實驗案例的設計與探索
2.1 實驗設置目標
模式識別是一門實踐性強的學科,要求學生不僅有扎實的理論基礎,還要有動手實踐和解決問題的能力?,F有模式識別課程實驗設置存在多方面問題。首先,實驗環節應該與教學內容統一規劃,構成總體的建設思路和體系。現有的模式識別課程實驗設計各個知識點互相割裂,學生無法建立整體概念。其次,實驗案例通常比較陳舊,缺乏與實際問題的結合以及最新研究成果的展現,阻礙學生的實踐熱情和創新性思維鍛煉。最后,與教學配套的實驗平臺建立不足導致實驗內容簡單,與前沿問題嚴重脫軌。因此,實驗設置目標如下:第一,實驗設計緊扣教學內容,融合多個知識點,構建實驗內容體系。第二,以實際科研問題為導向,引入前沿技術,設計從易到難的半開放實驗項目。第三,構建大數據環境下的實驗平臺,避免由于軟硬件環境限制導致的實驗內容限制。
2.2 實驗案例的規劃與設計
圍繞教學內容設置共設計了4個課程實驗項目作業,每個作業均以經典及前沿實際研究問題為導向,最大程度上涵蓋了課上講授過的不同算法和內容。每個實驗項目都包含簡單版本和進階版本的由易到難的不同難度等級。學生可以根據自己的基礎和研究背景選擇實現不同難度等級。簡單版本可以僅通過微調參數和修改模型架構實現,因此,即使沒有足夠編程及相關領域研究基礎的同學也能很好地完成。通過完成基礎版本可以幫助沒有相關背景的同學對模式識別領域有一個感性的認識,實現入門的目標。進階版本要求學生通過自主查找、閱讀相關文獻,動手實現其核心算法,對基礎版本算法進行改進并提高性能。具體而言,4個課程項目的選擇依據、主要任務、目標及要求如下:
基于語音信號的音素分類。本項目的主要任務是根據預處理后的語音信號,設計神經網絡架構,實現語音音素分類任務。音素分類是語音識別任務的第一步,其識別效果直接影響后續的語音識別性能。本項目的目標是幫助學生了解語音信號數據處理方式和特征表示方法,并通過自主設計分類模型熟悉神經網絡的設計及優化方法。基礎版本可以僅通過設計基本神經網絡結構實現。進階版本需要自主設計數據預處理、優化模型架構、選擇合適的損失函數、調整訓練策略、加入正則等方式提高特征的表達和泛化能力,在不公開的測試集上取得更高的識別率。
基于卷積神經網絡(CNN) [7]的物體識別算法。本項目的主要任務是通過設計卷積神經網絡,實現基于圖像的物體識別算法。物體識別/分類是計算機視覺中最基本的任務之一。深度卷積神經網絡作為新一代人工智能領域的突破性成果,在以計算機視覺為代表的等眾多領域得到廣泛應用。卷積神經網絡主要針對圖像等高維矩陣或張量數據,通過卷積算子、感受野、參數共享、多層次抽象特征學習等機制,在基于圖像數據的視覺任務中實現性能的飛躍式提升。本項目的目標是幫助學生了解卷積神經網絡的基本結構,并手動設計卷積神經網絡模型架構,通過提供的有標簽食物圖像數據,實現食物物體分類任務。進階版本要求設計不同數據增廣方法,并利用額外無標簽數據,設計半監督學習或自監督學習損失,進一步提高食物分類識別率。
基于生成對抗網絡(GAN)的人像生成。本項目的任務是熟悉一種無監督的生成式模型--生成對抗網絡,實現人像的生成任務。與基于傳統神經網絡和深度卷積神經網絡的判別模型不同,生成對抗網絡屬于生成模型,其目標是根據某種隱含信息,隨機產生觀測數據。Ian Goodfellow等人于2014年提出了生成對抗網絡 [8](Generative Adversarial Nets)在深度學習領域掀起了一場革命,產生了一些重大的技術突破。其學習性質是無監督的。因此,作為生成模型和無監督學習代表性算法,本項目的目標是熟悉GAN的核心思想,實現基本的GAN模型,并應用于人像生成任務。由于基本的GAN模型具有訓練不穩定,生成質量欠佳等缺點,進階版本要求通過借鑒WGAN、SNGAN、StyleGAN、BigGAN等思想,改進現有模型,實現更高質量的生成效果。
基于增量遷移學習的跨域手寫字識別。為了讓學生熟悉可遷移、可泛化的特征學習方法,本項目的任務是實現多種不同增量遷移學習算法,在跨域手寫字識別任務上進行驗證?,F有模式識別算法多數無法有效實現增量學習的目標,即在舊任務上學好的模型在遷移到新任務時通常可以幫助新任務的性能。然而,提高新任務的性能往往使得新模型對舊任務產生由于災難性遺忘導致的性能大幅度下降。本作業的目標是通過復現最新增量學習算法,并與基于深度學習的基線方法進行對比,通過觀察訓練曲線,直觀理解增量學習算法對跨域任務的非遺忘性的影響。基礎版本要求學生實現一種經典的增量學習算法,并輸出學習曲線,對比和分析增量學習與基線方法的結果差別。進階版本要求學生通過自主閱讀和實現最新增量學習方法,與經典方法進行對比分析。
為了讓學生高效地設計和實現模式識別算法,要求學生使用統一的計算平臺AI Studio,使用python編程語言及由百度開發的PaddlePaddle開源框架完成所有的課程項目。AI Studio提供充足的計算資源,對高質量完成作業項目提供了算力上的保障。另外,作為課程的重要考核依據之一,統一的平臺能夠保證課程項目實驗結果的公平性,實現完善高效的評分機制。
2.3 實驗考核方式
每個課程實驗細節和要求在講授相應教學知識點之后公布給學生。為了給學生足夠的自主調研、學習、代碼實現和調試時間,每次作業要求學生在發布之后的3周左右時間內完成。每個課程項目的具體任務和要求以詳細文檔的形式發布給學生,讓學生對作業目標、要求及考核方式有清晰明確的認知。最終按照學生提交的作業代碼、實驗結果和報告內容等按照評分細則進行打分。為了讓學生重視理論與實踐的結合,成績構成主要由課程實踐項目組成(每個作業20%~25%)。課程實踐中涉及的內容能夠考核學生的包括理論知識理解、動手編程實踐、文獻閱讀、算法復現、結果分析、報告撰寫等綜合能力。
3 結論
為適應新一代人工智能規劃對人才培養的新要求,從課堂教學、實驗設計和考核方法等環節進行探索,進行了“模式識別”課程建設方案的探究。通過突出模式識別課程特色,引入領域最前沿技術、方法和科研問題,設置半開放課程實驗項目,激發學生對課程內容的興趣,幫助學生掌握最前沿技術,提升學生的科研和工程能力。從學生的反饋中發現學生對課程設置較為滿意。隨著時代的發展,模式識別領域不斷涌現新方法、新理論、新技術、新問題,“模式識別”課程將不斷積極探索,以適應新一代人工智能對創新人才培養的新需求。
參考文獻
[1] 王萬森.適應社會需求,辦好新一代人工智能教育[J].計算機教育,2017,10:5.
[2] 侯志強,余旺盛,沈明華,等.模式識別課程教學改革實踐[J].計算機教育,2017.
[3] 張立言.面向大學生創新創業能力培養的本科生模式識別課程改革思路[J].科教導刊(中旬刊),2018(29):25-27.
[4] Duda R O,Hart P E,Stork D G.模式分類[M].機械工業出版社,2003.
[5] Bishop C M. Pattern Recognition and Machine Learning[M].Springer,2006.
[6] 周志華.機器學習[M].清華大學出版社,2015.
[7] Krizhevsky, A, Sutskever, I, Hinton, G E. Imagenet classification with deep convolutional neural networks[C].Advances in neural information processing systems, 2012:1097-105.
[8] Goodfellow I, Pouget-Abadie J, Mirza M, 等. Generative adversarial nets[C].Advances in neural information processing systems,2014.