中國石油大學(華東)計算機與通信工程學院 王雷全 吳春雷 郭曉菲
機器學習科研實踐課程建設
中國石油大學(華東)計算機與通信工程學院 王雷全 吳春雷 郭曉菲
針對本科機器學習課程中的教學實際,分析在教學過程中遇到的問題,結合目前機器學習領域的研究熱點,提出在本科機器學習教學中以深度學習作為課程體系的主導,引入Tensorflow框架,重新整合教學資源、建設相關實驗內容,構建以深度學習為教學內容核心、以Tensorflow為實踐平臺的機器學習科研實踐課程體系。
機器學習;深度學習;Tensorflow;課程建設
機器學習是當前的標志性技術,且已成為電子信息類課程中最為重要的一個專業方向[1]。近年來,深度學習作為機器學習的一個分支,在圖像和語音識別等領域取得了重要突破,是當前計算機領域最具影響力的熱點研究方向。掌握“深度學習”的基本知識與實踐技術是當前對本科生機器學習課程的基本要求。
傳統機器學習課程的授課內容主要以經典機器學習算法為主[2],包括支持向量機、邏輯斯諦回歸和隱馬爾可夫模型等經典算法。隨著深度學習的迅速發展,傳統機器學習的教學內容受到了挑戰,在本科機器學習教學過程中增加“深度學習”的相關內容,已是大勢所趨。然而,將深度學習融入到機器學習課程中卻面臨兩個問題。一方面,在大學本科階段涉及深度學習知識的課程還比較少,教學案例嚴重缺乏,尤其是針對深度學習的實踐類指導資源更為稀少。另一方面,目前主流的深度學習框架較多,在實際科研與開發中,Caffe、Theano、Torch等不同開源深度學習框架種類繁雜。然而,對于課程內容設置來說,很難面面俱到地涉及到所有框架,需要選擇一種主流開源框架為核心,作為課程的主要線索加以展開。為了解決上述問題,機器學習科研實踐課程將機器學習課程與科研實踐課程相結合,并將深度學習框架Tensorf l ow納入到課程體系中。
《科研實踐》課程是針對我校計算機與通信工程學院本科專業第7學期開設的一門科研實踐類課程,共6周,合96學時。該課程是一門以科研實踐為主導,采取小班研討、啟發式教學、結合實際科研案例的綜合性實踐類課程。
《科研實踐》課程的教學過程劃分為理論講解、主題研討和實踐驗證三個部分。該教學方式的要點包括三個方面:
①案例引導的理論知識鋪墊。把深度學習的基礎理論融入到項目案例的細節中,以技術發展的過程重新組織并介紹理論,增強教學效果;
②面向科研主題的研討交流活動。為了充分調動學生學習的積極性和主動性,并培養學生總結科研進展的能力,該課程增設了基于主題的研討式教學環節,通過啟發式教育激發學生的科研創新能力。
③科研項目驅動的完整實踐過程。建立了以科研創新為主線的實踐流程,目標是使學生能夠以行業先進的技術與平臺進行科研訓練,驗證科學想法,規范化、系統化地培養學生科研實踐能力。
根據目前的科研與應用熱點,結合機器學習課程的現狀,課程組將機器學習方向引入到科研實踐課程中,并將深度學習作為機器學習科研實踐課程的主導項目。通過機器學習與科研實踐課程相結合,課程組在課程目標與培養標準、知識體系域教學內容、開發平臺與實踐流程、案例建設與共享交流等方面進行改革,進一步提升機器學習課程的教學質量與本科生的科研實踐能力。
針對本科生科研能力薄弱的特點[3],課程組認為科研案例與實踐指導資源的缺乏,嚴重制約了本科生機器學習實踐層次的提升。目前面向人工智能方向課程主要集中在研究生階段、企業內部以及各類IT培訓機構。在大學本科階段開設該類專門實踐課程的還非常少,尤其是深度學習方向的科研實踐類課程更不多見。因此,一方面,課程組重新審視課程定位,完善知識體系和教學內容;另一方面建設以Tensorf l ow為核心的科研創新與應用平臺,從而提升科研實踐教學水平。
(1)重新定位課程目標與培養標準
根據工業界與學術界對于人才的實際需求,從知識、能力、素質和長期發展規劃等多個角度對培養目標進行分解,形成具有高度可操作性的細化培養標準。修訂科研實踐課程教學大綱,深化深度學習的教學內容,并將Tensorf l ow基礎納入教學大綱,貫穿整個課程教學與實踐體系。課程組借鑒國內外相關優秀課程,走訪國內相關高校與知名企業,調研深度學習的現狀與前景,完善課程的培養目標、知識體系和教學內容。目前機器學習科研實踐課程教學大綱分為四部分內容:
機器學習基礎與深度學習(24學時)
Tensorf l ow基礎與實踐(16學時)
深度學習經典案例研討與Tensorf l ow實踐(24學時)
以Tensorf l ow為平臺的科研實踐課程設計(32學時)
(2)優化課程知識體系與授課內容
借鑒國內外著名大學的課程資料如CS231n、CS224d等,優化當前教學大綱中的知識體系,使知識體系更完整和更具時效性。目前,傳統機器算法已經不能滿足本科生掌握最新機器學習知識的需要,在機器學習科研實踐課程中明確以深度學習為核心教學內容,重新分配教學內容和學時,并編寫配套的參考案例和課件。
根據行業的最新應用需求與科研方向,科研實踐課程將深度學習作為教學的核心內容。基礎理論部分包括梯度下降、BP算法、CNN與LSTM等。在此基礎上,課程為學生提供若干個熱點科研主題供學生自主選擇,如物體檢測、機器翻譯,語音識別等,然后圍繞最新科研項目組織教學,將學生的綜合能力融入到一個完整的科研實踐過程中,在該過程中從不同的側面介紹理論體系、指導科研實踐,重點培養以升學為發展方向的學生科研實踐能力。
(3)規范實踐平臺、完善實踐流程
目前深度學習框架較為混雜,包含了caffe2、mxnet、theano等許多平臺。新的機器學習實踐教學中確定以Tensorflow框架為核心實踐平臺,在課程理論環節的案例教學、實踐環節的實驗教學與科研實踐中均統一應用,對照新的課程開發計劃,增加Tensorflow平臺操作練習題,設置深度學習關鍵技術練習題(如BP、Dropout、Batch Normalization等),建立以Tensorf l ow為核心的實踐平臺,增加Tensorflow基礎的實踐流程,在此基礎上指導學生完成科研項目驅動的完整實踐過程,以提高學生的科研實踐能力。
此外,我校最新一版的電子信息類本科生培養方案加大了人工智能課程群的課時,尤其是實驗課時。例如,《智能計算基礎》的實驗課時設置為8學時;《機器學習》的實驗課時設置為16課時。我們希望通過本項目的實施,能夠指導其它人工智能方向(包含研究生課程)的教學內容與實踐項目的改革,最終實現以Tensorflow為核心的人工智能課程群的實驗與實踐創新平臺。
(4)加強典型教學案例建設
深度學習教學案例的缺乏是當前深度學習方面課程建設的主要問題。課程組成員跟蹤最新深度學習內容,充分利用CVPR、ICLR等知名國際會的最新進展,搜集適于本科生教育的具有縱向發展的主流科研方向作為面向機器學習科研實踐的深度學習教學案例,主要案例包括:卷積神經網絡、物體檢測、CNN-LSTM以及對抗生成網絡等。
在學生科研項目選題時,課程組結合實際科研動向提供科研案例以供選擇或啟發學生自行立意。同時,將優秀的學生科研實踐成果加入教學案例庫。此外,課程組在課程建設中探索了具有石油特色的機器學習教學案例。石油是中國石油大學的辦學核心,近年來我校多個相關專業不斷嘗試如何將石油技術與最新的機器學習方法相結合(比如,深度學習與地質勘探的結合、深度學習與海上溢油區發現的結合)。課程組將該類成果通過Tensorflow平臺轉化出來,豐富具有石油特色的深度學習教學案例,服務于石油石化行業。
目前面向機器學習的課程主要集中在研究生階段[4]、企業內部以及各類IT培訓機構。在大學本科階段開設該類專門實踐課程的還非常少,尤其是深度學習方向的科研實踐類課程更不多見。本課程具備以下特色:
(1)夯實數學理論基礎,培養數學應用能力
考慮到電子信息類專業的特點,絕大多數實踐類課程以工程鍛煉為主,缺少理論應用的訓練[5],導致大多數學生難以理解前期設置的數學類公共基礎課程的作用。因此,課程組認為需要著眼于學生職業生涯的長遠發展,在科研實踐中強調基礎理論的作用,提升學生的理論水平和科研實踐能力。
(2)實時結合業界熱點,彌補教學科研鴻溝
近年來,機器學習與模式識別發展迅速,尤其以深度學習為代表,在工業界與學術界取得了里程碑式的發展。機器學習與模式識別方向,無論在在工業界或是學術界都是熱點,且新的成果不斷涌現。在目前的國內本科生培養方案中,學生難以接觸到學科的最新科研成果,使得教學與科研嚴重脫節。因此,需要在授課過程中,實時地將該方向的最新研究成果引入到機器學習科研實踐課程中,培養本科生掌握人工智能的相關思維方法和技術手段,并將之應用于以后的科研工作之中。
(3)借鑒國外名校課程,編寫深度學習實踐指導
經典的深度學習課程,如美國斯坦福大學的CS231n、CS224d等,為深度學習的發展起到了尤為關鍵的作用。然而,目前國內深度學習課程并不多見,大多數學校仍然以經典機器學習算法為主要教學內容,尤其缺少適于本科教學使用的深度學習實踐指導。Tensorf l ow在圖像分類、音頻處理、推薦系統和自然語言處理等多種場景下都有豐富的應用,是目前業界最為流行的深度學習框架。因此,建立以Tensorflow為核心的深度學習實踐指導也是本項目的一個特色與亮點。
(4)實施本科生創新教育,鼓勵學生將成果轉化為科研論文與專利
年輕人思維活躍,是人工智能社區的生力軍,在人工智能的科研論文中占有一定優勢。受益于當前中國的教育體制,我國高校本科生具備深厚的數學功底,這對于從事機器學習領域尤為重要。課程組希望通過機器學習科研實踐課程的實施,為學生創造條件,鼓勵他們將學習成果轉化成科研成果,實施本科生創新教育。
通過機器學習科研實踐課程體系改革,為深度學習的教學積累了豐富經驗與經典案例。機器學習科研實踐課程對知識體系的先進性、實踐平臺的規范完整性、項目案例的示范性、交流共享平臺的實用和開放性等方面進行了深化改革,為機器學習實踐教育提供了借鑒和示范作用。
[1]閔鋒,魯統偉.“機器學習”課程教學探索與實踐[J].教育教學論壇,2014(53):158-159.
[2]李勇.本科機器學習課程教改實踐與探索[J].計算機教育,2015(13): 63-66.
[3]胡雪蕾,孫明明,孫廷凱,等.研究生“機器學習”課程教學改革實踐與探討[J].煤炭高等教育,2012(1):118-121.
[4]曲衍鵬,鄧安生,王春立,等.面向機器學習課程的教學改革實踐[J].計算機教育,2014(19):88-91.
[5]曾憲華,李偉生,于洪.智能信息處理課程群下的機器學習課程教學改革[J].計算機教育,2014(19):60-62.
王雷全(1981-),男,遼寧丹東人,博士,計算機與通信工程學院,實驗師,研究方向:計算機視覺。
教育部高等學校計算機類專業教學指導委員會專業課程改革項目(編號:MXF2016-2-1);中國石油大學研究性教學方法改革項目(編號:YK201612)。中央高校基本科研業務費專項資金資助(17CX02041A)。
吳春雷(1980-),男,河南臺前人,博士,計算機與通信工程學院,副教授,研究方向:軟件工程。
郭曉菲(1980-),女,山東平度人,碩士,計算機與通信工程學院,實驗師,研究方向:通信工程。