馬 程
(蚌埠學院計算機工程學院,安徽 蚌埠233030)
目前,大數據、人工智能產業已經成為新經濟重要組成部分與推動力量,需要大量的應用型人才將新的技術落地應用到廣大傳統行業中。因此,在“新工科”大背景下,作為地方應用型高校,更需主動作為,思考如何深度融合新的工程教育理念來支撐新產業鏈的新工科專業建設,堅持以“學生為中心,產出為導向”的理念,協同社會需求與行業企業發展,按照國家對當代大學生提出的新發展理念與要求,采取學科專業交叉融合和共享創新等主要途徑,培養更多具有創新意識和實踐能力的高素質應用型人才,以滿足新興產業應用型對數據人才的需求。通過審時度勢、超前預判,主動適應、探索、實踐工程教育的新理念,形成課程教學的新思路、人才培養的新模式和質量評價的新體系。
機器學習是數據科學與技術專業和人工智能專業建模的核心方法,主要研究機器如何通過模仿人類學習,不斷收獲新的知識或技能,以提升自身學習能力和性能。機器學習交叉融合了智能科學、計算機科學、統計學等多類學科領域知識,與人工智能、數據挖掘同步發展,造成了知識體系間即存在部分重疊交叉,又各有自身特點,而且不斷拓展出深度學習、強化學習、遷移學習等新理論與方法,使得課程內容和體系較為龐雜。同時,機器學習算法以的相關數學知識,如線性代數、微積分、概率論與數理統計等為基礎,對學生專業知識的寬度、深度和實際動手能力都有較高的要求,來解決機器學習建模過程中的問題,旨在學生掌握主流的機器學習理論、方法及模型,并根據實際問題需要進行應用造成了課程學習難度較大。早期,該課程一般作為碩士生限選課在計算機類大數據方向開設;自設置數據科學與大數據技術本科專業以來,國內越來越多高校將機器學習、人工智能與機器學習、神經網絡與深度學習等相關課程列為該專業高年級本科生選修課程,課程總學時和實驗學時分別在24至36學時、8至16學時不等。近兩年伴隨人工智能本科專業的開設,一些獲批高校也紛紛將機器學習課程設為本科專業必修課程,但因本科生基礎知識掌握的完備程度等與碩士生有一定差距,加之在地方應用型本科高校,學生理論基礎相對薄弱,對英語、數學類方面相關的公共基礎支撐課程和程序設計、數據結構、算法設計等專業前導課程掌握不牢固。所以機器學習課程本科教學受教學內容、課程特點、課時限制、本科生知識結構等多個因素影響,造成了面向地方應用型高校本科生開設機器學習課程具有極大的教學挑戰。
在機器學習課程教學過程中,圍繞國家、社會對新型產業人才的需求和相關專業人才培養目標和學生的實際就業需求,從課程的建設目標、教學內容、教學方法、實驗平臺、教學考核五個方面著手探討數據科學與大數據技術專業機器學習課程建設思路。以堅持“以學生為中心,產出為導向”為課程教學理念,明確數據科學與大數據技術本科專業機器學習課程建設目標;面向行業企業,提出遵循“依據課時、知識夠用、重視應用、引入前沿、動態更新”的教學內容選擇原則,搭建教學內容主要框架。緊密結合理論和實踐,加大實際應用案例在教學內容上的比例,緊跟學科發展方向,適當引入相關領域新技術和知識介紹;提出以案例推動教學、以設問提升教學、以應用拓展教學、以科研促進教學4種漸進式教學方式,探索工學交替、項目驅動、問題導向、場景應用的教學模式;規范實驗實踐創新平臺,加強實驗與實踐平臺項目案例、數據的建設和融合工作,不定期安排有項目應用的企業開展線上或線下講座或短期培訓,調動學生主動通過實踐操作學習深化理論知識,提高項目設計和應用能力,提升雙創能力;通過企業需求和相關高校調研、社會反饋,摸索新工科背景下數據人才質量評價機制,設置課程過程性考核方案,促進機器學習課程教學模式持續改進,形成閉環,最終實現人才培養質量與就業質量的明顯提高,獲得社會和學生的認可和滿意。如圖1所示。

圖1 應用型本科高校機器學習課程建設思路
結合地方應用型本科高校數據科學與大數據技術本科專業教學運行和人才培養,從明確課程培養目標、優化課程教學內容、改革課程教學方式、規范實驗實踐平臺、注重課程過程考核五個方面,探索開展新工科背景下該專業機器學習課程建設,以提升課程教學質量,提高學生的專業能力和實踐綜合能力,將學生培養成為具有創新意識和能力的高素質應用型人才,最終實現數據人才培養質量的明顯提高。如圖2所示。

圖2 應用型本科高校機器學習課程教學路徑
調研知名企業機器學習和深度學習的應用現狀,根據工業界對于數據方面人才的實際需求,借鑒國內外相關優秀課程,從知識水平、學習能力、綜合素質和個人規劃等多個維度對課程的培養目標進行分解,形成可操作、能夠細化培養的標準。
考慮學生先修的數學知識掌握情況差異,該門課程在相關專業開設的性質、學時也有所不同,所以,對于機器學習的本科課程教學,既要優化精選教學內容,又要合理分配學時,這樣才能讓學生能夠相對輕松地理解機器學習基本概念和常用方法。基于前期所學的數學和專業知識,應用并改進機器學習模型算法以分析解決實際問題,并針對性地帶領學生了解機器學習的知識和技術發展動態,為有興趣和需要的學生進一步深入學習做好準備。面向“新工科”建設,結合地方應用型本科學生實際能力水平,本課程遵循以“學生為中心,產出為導向”理念,思考教學內容的選擇上依據“依據課時、知識夠用、重視應用、引入前沿、動態更新”原則,課程教學以項目實踐為重點,突出項目實踐比重,并適度引入機器學習新知識和技術,動態更新教學內容,以確保課程內容不落后,并滿足少數有濃厚學習興趣同學的需求。根據機器學習技術不同應用場景,結合實際應用,如設計新型冠狀病毒疫情預測、佩戴口罩的人臉識別等案例。通過項目案例實踐教學,加深學生對機器學習技術的理解、方法的掌握及應用領域場景的認識,鍛煉培養學生的創新意識和學習能力,提升學生分析、解決問題的水平。
首先,以案例推動教學。教學過程中,通過項目案例牽引出相關概念和教學內容,推動理論課程的教學和知識的傳授。項目實踐根據對應理論知識設計,結合生活實際和應用,設計房價預測、手寫數字識別、垃圾郵件過濾、風格遷移等不同難度的項目。重點講解框架性原理,要求學生組隊學習,有利于學生團隊協作能力和溝通技巧的提高,更有助于厘清技術脈絡和實際應用思路,增強學習信心,與培養學生解決復雜工程能力的要求相符。
其次,以設問提升教學。教學過程中,以學生作為課堂主體,設置與本門課程相關的知識和技術問題,采用翻轉課堂方式,引導學生學會分析和解決問題。比如,學習樸素貝葉斯分類部分,可從不同類型估計方法入手,提問“生成式”模型和“判別式”模型的差別;學習集成學習方法部分,可從樣本選擇、樣例權重、是否并行計算等方面提問,進而讓學生思考并明確Bagging和Boosting方法的區別。通過問題設置,為討論學習提供了自由、寬松的氣氛,更易調動學生的學習積極性,以培養學生的創新意識和思維。
再次,以應用拓展教學。教學過程中,根據課程對應章節學習目標和教學內容,設計相應的學生分析問題的應用場景,提供數據集和相關項目案例,組織學生分析討論,幫助學生理解并掌握機器學習核心方法。另外,在課后設置思考作業,如:能否采用多種機器學習方法實現?分析比較哪種方法效果更好?進一步加深學生對問題本質的認識。
最后,以科研促進教學。教學過程中,鼓勵任課教師科教結合,從個人科研項目中提煉出與教學相關的研究問題,鼓勵學習興趣濃厚的學生建立學習團隊,組織學生積極參加Kaggle、天池、泰迪杯、全國AI等大數據和人工智能類賽事,并將實踐案例進一步轉化為科研論文或專利,培養本科生的科研實踐能力,進而為教學服務,切實提升教學質量和學生學習成效。
傳統機器學習課程主要以經典機器學習算法作為主要授課內容,包括邏輯回歸、樸素貝葉斯、支持向量機、神經網絡等,可以使用WEKA測試和二次開發,較快地掌握機器學習核心算法的用法和性能,節省了Java程序編程時間。近年伴隨深度學習的快速發展,如果在機器學習課程教學中仍只傳授傳統機器學習內容,就無法讓學生了解社會和技術進展。因此,在課堂教學中適當增加深度學習相關內容非常有必要,然而在實際教學時卻存在以下問題。一方面,教學案例和實踐指導資源缺乏;另一方面,目前主流的深度學習框架繁雜,如Google的TensorFlow、Facebook的PyTorch、Berkeley的Caffe、Keras、Theano等國外深度學習框架,及百度研發的PaddlePaddle、Intel研發的OpenVINO和清華大學的Jittor、曠視科技的MegEngine、華為的MindSpore等近期新開發的國內深度學習開源框架種類較多。因此,將機器學習部分內容融入傳統機器學習課程教學時,需要選擇至少一種適合學生使用主流的深度學習開源框架。從教學內容層面的課程案例和數據,到學生學情層面的英語水平和編程能力等多方面考量,為使同學們盡快上手操作,考慮推薦使用國內深度學習框架,結合好的教育平臺和嵌入的Jupyter Notebooks交互式開發環境,便于數據分析過程的展示;同時有支持各種方法的中文學習文檔,還提供了免費的GPU算力,較適合作為本門課程入門的實驗與實踐創新平臺,有英語基礎的同學也鼓勵直接采用TensorFlow或PyTorch平臺開展實驗實踐。
建立一套科學可操作的課程考核制度。課程考核按規定教學計劃進行,納入到平時各個教學環節中實施,最后根據每個環節中學生考察情況按權值綜合統計。將考勤、搶答、討論和實驗實踐效果納入平時成績,細化實驗實踐評分方式,加大實驗實踐表現在過程考核中比重。將期末考試形式改為相關學科領域參賽或助力企業解決實際問題,綜合考慮學生課程過程成績、賽程報告(或可行性報告、咨詢報告)和期末答辯表現(分享該課程學習、實踐、參賽及企業合作中的體會)得到期末成績。并在學期中和學期末,根據學生的反饋改進教學評價與考核的內容及評分標準,形成學生積極關注過程參與、注重實際應用導向的“閉環式”課程過程考核方案。具體考核方案表1見。
將學生視為課程教學主體,結合機器學習課程自身特性和教學應用場景,積極探索一套適用于應用型本科高校本課程有效的教學方法、手段、資源與考核手段,注重對學生獨立思考、創新意識和解決問題能力的鍛煉和培養。以保障本科教學計劃有效實施,提升課程教學效果,提高數據人才培養質量。

表1 課程考核方案