陳本晶
關鍵詞:高職建模;人工智能;假設檢驗;描述性分析;機器學習
中圖法分類號:TP311 文獻標識碼:A
1引言
高職院校的任務是培養適應生產、建設一線的高素質技能型應用人才,教學體系是產學研一體化,教學以“必需”“夠用”為度。“高等數學”是高職理工科專業必修的公共基礎課程,由于學生數學基礎普遍比較薄弱,且“高等數學”課程具有抽象性的特點,對學生的邏輯思維、推理能力又有較高要求,學生對數學學習畏難情緒明顯。由于學習興趣偏低、學習信心不足等多方面因素,導致高職院校“高等數學”課程教學現狀及教學效果不理想。高職院校對數學建模的教育教學普遍較弱化,對數學建模競賽的重視程度普遍不夠。對于“數學建模”課程,大多數高職院校也是將其作為選修課,甚至不開設,只是在建模競賽前集中培訓一段時間。因此,數學建模競賽對高職學生來說是非常具有挑戰性的比賽,是學校里最優秀最勇敢的學生才敢于參與的比賽。
2近30年中國數學建模競賽發展趨勢
數學建模是走在時代前沿、與時俱進的競賽,建模的考點都是結合社會時事和經濟熱點的選題。縱觀30年全國大學生數學建模競賽,從無到有,從小到大,辦成了世界上數學建模競賽方面規模最大的一個賽事,從1992年第一屆全國大學生數學建模競賽到1998年,只有A,B兩道題可選,從1999年開始,全國大學生數學建模競賽分為本科組和專科組進行,本科學生只能參加本科組競賽,不能參加專科組競賽。專科(高職高專)學生一般參加專科組競賽,也可參加本科組競賽。1999年到2018年,有A,B,C,D四道題可選,其中A,B題為本科組選題,C,D題為專科組選題。2019年到2022年,有A,B,C,D,E五道題可選,其中A,B,C題為本科組選題,D,E題為專科組選題。
從1992年第一次舉辦全國首屆競賽到2022年的30年來,優化模型一直是建模的主角,每年至少都會有一道關于優化的題目。近年來,建模的發展歷程從優化模型、評價模型為主,到逐漸向統計模型大數據處理技術和人工智能方向轉變。例如,2012年,A題“葡萄酒的質量分析與評價”,2013年,D題“城市公共自行車服務系統運行狀況和效率分析”,2014年,C題“關于生豬養殖場經營管理的研究”,2015年,C題“眾籌筑屋規劃方案設計模型”,主要考察優化、評價模型。2016年,D題“電池剩余放電時間預測”,2017年,C題“顏色與物質濃度辨識”,主要考查統計預測、回歸模型。2018年,C題“大型百貨商場會員畫像描繪”,2019年,E題“薄利多銷分析”,2020年,E題“校園供水系統智能管理”,需要處理規模幾十萬條甚至上百萬條的海量數據以及具備數據挖掘能力。2021年,E題“中藥材的鑒別”,2022年,C題“古代玻璃制品的成分分析與鑒別”,偏向人工智能、機器學習。因此,高職數學建模競賽也需要逐步引入人工智能算法與技術,人工智能在高職數學建模中的教育教學勢在必行。建模常用的軟件也從Lingo,Matlab,Excel,SPSS,到Python,其中Lingo,Matlab,Python要求學生具備編程能力,有較好的編程基礎,Excel,SPSS操作簡單,但是也需要學生對統計思想有深刻理解才能恰當應用。對高職學生來說,他們系統訓練的時間較少,建模思路、編程能力、論文寫作的每一關都不容易通過。但是,即使困難重重,依然有一屆又一屆不畏艱難的學子迎難而上,將建模競賽進行到底,能夠“賽出風格、賽出水平”。
3近6年全國大學生數學建模競賽專科組競賽題目及主要考點
表1匯總了專科組近6年競賽題目及主要考點,從中可以看到,建模競賽隨時代熱點的改變而改變。
4推進人工智能教學,重視實踐操作
目前,在“數學建模”課程中講授人工智能的相關教學內容較少,建模教材以成熟的優化、評價、統計模型為主,許多教師也是在邊學邊教,加之高職院校學生的數學底子薄,因此,在“數學建模”課程中引入人工智能相關內容要根據學生的實際學習情況,以學生能夠接受的方式逐步推進。其中,既要注重人工智能理論的講解,更要注重人工智能算法及相關軟件的應用,目的是讓學生能夠利用人工智能算法與理論去解決數學建模相關的問題。研究最近幾年的數學建模賽題發現,應用在數學建模競賽中最多的人工智能算法有購物籃推薦算法、神經網絡算法、模擬退火算法、遺傳算法、機器學習等,而在使用人工智能相關軟件方面,用得最多的是Matlab,Python。高職“數學建模”課程中講授人工智能相關內容時,應從案例著手,讓學生實際動手編寫程序或者配置參數來解決數學建模問題。
5SPSSPRO為高職學生參加數學建模競賽解燃眉之急
雖然利用Matlab,Python可以靈活編寫程序,但是高職學生普遍沒有編程基礎,
編寫出一段理想的代碼困難重重。而SPSSPRO是一款區別于SPSS,SAS傳統客戶端模式的全新在線數據分析平臺。建模中的十大經典算法都可以用SPSSPRO來實現。在統計類問題的建模中,往往涉及大量的數據需要進行處理、分析,而SPSSPRO界面友好、功能強大,且對原始數據的格式兼容性較強。目前,SPSSPRO上線了200多種算法模型,包含統計建模、機器學習、規劃求解等模塊,常用的層次分析法、主成分分析、線性回歸、時間序列模型等模型求解都可以用SPSSPRO來解決,而且所有的算法模型都是免費使用。同時,這些分析方法的底層算法、分析結果和SPSS軟件是一致的。因此,對高職學生來說,用此平臺進行建模競賽是極其友好的,可以放心使用。我們只需要三步操作,即可完成一個復雜的模型計算。操作步驟:(1)打開SPSSPRO,上傳數據;(2)拖拽變量,點擊開始分析;(3)系統自動分析出結果,含分析步驟、關鍵名詞解釋、圖表、圖表說明等結果,可免費復制、導出代碼,也可導出PDF,Word文檔,十分方便。
6 SPSSPRO的使用方法
下文以2022年數學建模國賽C題“古代玻璃制品的成分分析與鑒別”為例,可以全部使用SPSSPRO來做,其中機器學習分類功能是SPSS,Excel軟件無法代替的。模型建立與求解過程如下。
根據題目中四個問題,首先對數據進行初步整理:將表單1的4個定性數據賦值。異常值處理:將表單2中成分比例累加后介于85%~105%之間的數據視為有效數據,將文物編號15和17的數據刪除。缺失值處理:表單2和表單3未檢測到成分的單元格填充值為0。
針對問題1:(1)使用SPSSPRO機器學習分類決策樹對相關玻璃文物的表面風化與其玻璃類型、紋飾和顏色的關系進行分析,結果得到風化與玻璃類型關系最大,紋飾其次,顏色最次;(2)根據對玻璃類型和有無風化、化學成分含量平均值做二維列聯表,得到高鉀玻璃風化后二氧化硅含量增多,氧化鉀、鈣、鋁、鐵等指標含量迅速減少,鉛鋇玻璃風化后二氧化硅含量減少,五氧化二磷、二氧化硫指標含量增加,其他變化不大;(3)針對表面有無風化,用SPSSPRO描述性統計得到風化前后的玻璃化學成分平均值數據,根據概率統計中的參數估計點和區間估計知識,可以估計風化前的含量。
針對問題2:(1)針對表單1和表單2,用SPSSPRO描述性統計列聯分析得到高鉀玻璃氧化鉀含量多,鉛鋇玻璃氧化鉛、氧化鋇含量多,高鉀玻璃無風化的數量多,鉛鋇玻璃風化的數量多;(2)使用SPSSPRO機器學習分類、隨機森林模型進行分類,得到訓練集,測試集準確率都是100%,分類效果非常好。
針對問題3:(1)針對未知類別玻璃,鑒別其所屬類型,使用SPSSPRO機器學習分類、隨機森林模型進行預測,結果與權威機構公布的參考結果一致;(2)根據判別分析其屬于哪一類玻璃概率大小與0.5進行比較,可以對其判別結果的敏感性進行分析,也可以使用SPSSPRO機器學習分類決策樹、神經網絡分類進行判別,比較結果的相同程度和差異性大小。
針對問題4:(1)針對不同類別的玻璃文物樣品,使用相關性分析其化學成分之間的關聯關系,有些化學成分相關性很高;(2)用獨立樣本T檢驗比較不同類別樣品之間的化學成分差異性,其存在顯著差異。
7結束語
在人工智能時代,相關軟件功能被不斷開發及應用,建模競賽指導教師要積極學習新技術,有責任、有義務深入淺出指導建模活動,千方百計降低建模難度,引導更多的學生參與數學建模競賽。這可以讓“一次參賽,終身受益”的數學建模競賽指導方針落地,惠及更多的學生,以賽促學、以賽促教,引導更多的學生體驗建模的快樂。