



摘要:在人工智能技術的發展和理念下,高等教育向智能化方向發展,這勢必會引起教育教學改革的潮流,人工智能專業更是如此。文章立足于人工智能專業中的核心課程——“機器學習技術”,探索了該課程的教學實踐;通過線上線下混合式、以問題為導向的項目案例化教學方式,解決了傳統教學中教學方式單一、應用實踐較少且簡單的問題。這種教學方式能夠使得學生更容易掌握算法的原理,極大地提升了學生的知識應用能力。
關鍵詞:機器學習;人工智能;教育教學
中圖分類號:TP181;G642.0文獻標志碼:A
0 引言
近年來,人工智能(Artificial Intelligent,AI)技術的發展推動了我國各行各業相關領域的應用和產品的發展,涉及交通、安全、教育、軍事和公益等多個方面。人工智能的本質是讓機器模擬人類的思維,使得機器能夠自主學習,從而具備人類的智能。2024年全國兩會中,“人工智能+”被首次寫入政府工作報告,這意味著人工智能有望成為新質生產力的重要引擎。當前,這種“人工智能+”的模式已經滲透到各行各業,例如:語言、圖像、視頻等領域,并且在計算機視覺、自然語言處理等領域已經展現出其強大的技術應用優勢。
機器學習是人工智能的一個子模塊,也是實現人工智能的一個核心手段,它能使軟件應用程序在預測結果方面變得更加準確。機器學習算法的核心是使用歷史數據作為輸入來預測新的輸出值[1]。當前,國內外許多領先的公司,例如:百度、阿里巴巴、騰訊、微軟、Google、IBM、英偉達等,都將機器學習作為其運營的核心部分,機器學習已成為許多公司的重要競爭優勢。目前,非常火爆的ChatGPT(Chat Generative Pre-trained Transformer)也是基于機器學習發展而來。ChatGPT是一款自動問答式的聊天機器人,與普通的聊天機器人不同,ChatGPT生成的回答非常接近于人類的回答,而不是生搬硬套的答案。ChatGPT能夠理解提問的前后邏輯關系,回答結果邏輯清晰,層層遞進,并非簡單地理解字面意思。同時,ChatGPT的響應速度也非常快,只需等待幾秒,其功能非常接近人類日常交流。在ChatGPT的帶動下,許多公司也推出了同類型的競品。2023年,百度公司推出類ChatGPT的應用——文心一言(ERNIE Bot);不久之后,阿里巴巴也推出“類ChatGPT”項目——通義千問;Google公司推出了“預訓練語言生成模型”——巴德(BARD);復旦大學自然語言處理實驗室推出國內第一個對話式大型語言模型——MOSS。如果說之前的AI是第一代,那么由ChatGPT帶來的人工智能變革可以被稱為是AI2.0。
人工智能技術專業旨在培養政治理想信念堅定、積極踐行社會主義核心價值觀的高素質人才。為滿足我國人工智能產業對人工智能應用人才的需求,本文將專業知識和職業資格認證相結合,構建了專業的理論教學和實踐能力培養體系。人工智能技術專業主要的課程有“Python程序設計基礎”“Python Web開發”“Java程序設計基礎”“Android應用程序開發”“計算機視覺技術應用”“深度學習技術”“機器學習技術”“自然語言處理技術”和“人工智能綜合實訓”等。本文主要以“機器學習技術”這門課程為例來闡述人工智能專業課程的改革探索與實踐。
1 “機器學習技術”課程介紹
“機器學習技術”這門課程是針對人工智能領域內數據標注師、人工智能訓練師、模型部署及運維工程師而開設的課程,也是提升學生掌握人工智能技術的一門專業核心課程。該課程集數據采集、數據清洗、模型搭建、模型訓練、模型調優、模型部署于一體,通過本課程的學習,使學生能夠掌握人工智能的整體開發技術及流程。由于課程跨學科性強,綜合應用要求高,對學生挑戰難度大,如何教授該課程使學生易于理解是一件非常有挑戰且有意義的事情。
“機器學習技術”課程的教學主要圍繞著一些基礎經典算法展開,例如:線性回歸、貝葉斯、隨機森林、K-means聚類等,主要介紹這些算法的思想、流程,重點在于這些算法的使用、調參和優化等。
通過學習本課程,學生可以掌握Jupyter Notebook(PyCharm)開發工具及scikit-learn機器學習庫的使用,理解經典的機器學習算法及數據處理的思想,具備使用scikit-learn進行數據處理的能力。同時,在學習的過程中,該課程培養了學生發現問題、分析問題、解決問題的能力,使學生具備了良好的職業道德、職業素養和創新意識,為學生從事專業化的機器學習技術開發工作奠定基礎。
2 “機器學習技術”的教學實踐
“機器學習技術”課程的設計與教學主要體現在合理設計教學方法,利用各種教學方法和手段使復雜的算法通俗易懂,實現課程的培養目標。
2.1 課程所使用的技術介紹
“機器學習技術”課程的主要目標是使學生能夠使用工具掌握常用的機器學習算法,以理解日常生活中遇到的人工智能場景。課程中主要使用開源的第三方機器學習庫scikit-learn。該學習庫包含了大量的有監督和無監督的學習算法,也提供了許多算法使用教學示例。scikit-learn中的算法實現過程僅需簡單的函數調用即可,對初學者友好,很容易上手學習。
scikit-learn主要包括6類算法,分類結構如圖1所示,具體如下。
(1)分類:標識對象所屬的類別。應用范圍包括:圖像分類、垃圾郵件檢測等,類別中主要包含支持向量機(Support Vector Machine,SVM)、隨機森林和最近鄰(K-Nearest Neighbor,KNN)等經典算法。
(2)回歸:預測與對象關聯的連續值屬性。應用范圍包括:房價和股票價格等數據的預測,類別中主要包含線性回歸等經典算法。
(3)聚類:自動將相似對象歸為一組。應用范圍包括:客戶細分、分組實驗成果等數據的聚類,類別中主要包含K-means、Spectral clustering和Mean-shift等經典算法。
(4)數據降維:減少要考慮的隨機變量的數量。應用范圍包括:可視化、提高效率等。類別中主要包含特征選擇、非負矩陣分解等。
(5)模型選擇:比較、驗證和選擇參數和模型。應用范圍包括:通過參數調整優化模型、改進精度等。類別中主要包含了網格搜索和交叉驗證等經典算法。
(6)預處理:特征提取和歸一化。應用范圍包括:轉換輸入數據,例如文本,以供機器學習算法使用。類別中主要包含數據的預處理和特征的選擇等算法。
2.2 課程項目案例
課程包括4個大項目案例,涉及3個典型常見的模塊:回歸、分類和聚類。項目具體安排如下。
2.2.1 線性回歸模型
線性回歸是機器學習中的一個非常經典的回歸模型。通過線性回歸模型的使用,可以幫助學生理解如何利用機器學習的方法和思路來解決簡單現實生活中遇到的實際問題。
項目案例引入我國居民消費水平數據。通過收集改革開放以來我國居民的食品花費、平均工資等數據,根據數據特征選用線性回歸模型,并對模型進行檢驗及分析。學生通過模型預測的數據與真實值的比較來調整模型的參數以達到最優。
2.2.2 隨機森林模型
隨機森林是機器學習中的一個分類集成算法,結構如圖2所示。隨機森林是由許多不相關的決策樹組成的[2],核心思想是將問題交由多顆決策樹共識完成,以提高預測的準確性和穩定性。教師通過調用scikit-learn框架中的隨機森林算法來構建隨機森林模型,引導學生掌握算法所蘊含的思想,培養學生精益求精、嚴謹治學的科學態度[3]。
2.2.3 貝葉斯模型
貝葉斯模型是機器學習中的一個經典分類算法。項目案例中利用一則和新冠肺炎疫情相關的時事新聞,引出新冠核酸檢測中初篩和復核的問題。項目案例引導學生從貝葉斯模型出發,思考為什么新冠肺炎病毒的確診需要經過多輪的檢測。假設某個人初次檢測獲得陽性,從貝葉斯模型出發算出其真得病的條件概率并不高,因此需要進行二次檢測,甚至三次或四次檢測才能確定其是否得病。通過真實案例,學生切實感受到機器學習模型能夠為實際生活中遇到的問題現象提供的科學理論依據。
2.2.4 K-means聚類算法模型
K-means是機器學習中的一個非常經典的聚類算法,流程如圖3所示。聚類即將相似的對象聚為一組,遵循物以類聚、人以群分的思想。聚類算法的應用非常廣泛,涉及教育、軍事、工業等許多領域。聚類算法將具有相似特征的目標劃分成同一個類別,可以對圖像進行分組。案例通過對給定的數據進行聚類,通過聚成不同個數的類別為例來講解K-means的原理,讓學生掌握聚類算法。
2.3 合理設計教學方法
2.3.1 項目案例化的教學思路
項目案例化教學方法與傳統的學習方式不同,傳統的學習方式首先需要學生學習所有的基礎知識,然后再接觸真正的項目案例應用,這種方式會讓學生產生挫敗感。而項目案例化教學的方法是讓學生直接接觸項目應用,先從簡單的項目開始,激發學生的興趣,再去講解實現的步驟,然后是算法的原理,最后是對算法的復現、調優。這種由淺入深的項目化教學能夠激發學生的學習興趣[1]。因此,“機器學習技術”課程采用項目案例化的教學方法,更適合學生學習本課程。
2.3.2 構建以問題為導向的案例教學
合理地設計問題案例能夠巧妙地導入知識點的學習。合理的問題案例不僅能將晦澀難懂的專業知識形象化,更好理解;還能夠由淺入深逐步瓦解大問題,同時,激發學生的學習興趣,引導學生主動思考、主動探索?!皺C器學習技術”課程中的學習內容對于數學基礎較差的學生而言頗具困難,課程中的教學方法是以問題為導向,引入大量的項目案例,通過大量的實操和正確的案例引導,使學生在掌握課程知識點的同時,樹立正確的三觀。
2.3.3 借助線上超星云課程平臺實現線上線下同步教學
傳統以課堂為主的教學方式逐漸已經不能滿足當前的學習形式。當前的學習模式需要借助線上平臺的配合教學,這種線上線下的混合式教學,能夠極大限度地利用學生的學習時間,提高學習的效率,將課程學習延伸到課堂外。線上線下混合式教學模式結構如圖4所示。教師在超星云平臺上提前建設好“機器學習技術”課程的資源,針對課程中的每個知識點設置好任務點,讓學生提前或者進行課中(后)學習,以檢查學生的學習情況,以便隨時調整課程的教學方法及進度等。同時,超星云課程平臺上的課程資料及學生學習的過程都可以永久保存,學生可以隨時復習,同時,教師也能夠根據超星云平臺上的數據進行課堂分析以調整教學方式。
3 結語
“機器學習技術”課程對學生的知識門檻要求相對較高,傳統的授課和學習方式對于多數學生而言,效果并不是很好。本文通過介紹人工智能專業及機器學習技術課程,探索出一條適合大部分學生進行機器學習教學的方法。本文通過大量的項目案例,使學生掌握基礎的機器學習算法;對各種算法利用參數進行調優,以達到模型求解的最優,從而實現課程的培養目標,滿足人工智能專業的社會需求。
參考文獻
[1]李陽.機器學習課程教學的規劃分析[J].集成電路應用,2022(6):90-91.
[2]車劍.基于機器學習的輸送帶縱向撕裂視聽融合檢測方法研究[D].太原:太原理工大學,2021.
[3]蘭小艷.高職院校機器學習課程的探索與實踐[J].太原城市職業技術學院學報,2022(2):153-155.
Exploration and practical on course teaching of artificial intelligence specialty:
taking the course “Machine Learning Technology” as an example
Abstract: Under the development and concept of artificial intelligence technology,the education in higher colleges is developing towards more intelligent which causes a trend of reforming the education and teaching. It applies all the more so in artificial intelligence specialty. This paper explores the practical of teaching on the core course of “Machine Learning Technology” in artificial intelligence specialty. Through exploration on the online and offline blended and case-based projects which using problem-oriented teaching model, it solves problems on traditional teaching method which is too single and the applications are too few and simple. This teaching model make students easier master the principle of algorithm and greatly improve students’ ability to apply knowledge.
Key words: machine learning; artificial intelligence; education and teaching