◎張繼超 賀 萍 劉鈺靖 (北華大學數學與統計學院,吉林 吉林 132000)
2018 年3 月15 日,教育部辦公廳發布《教育部辦公廳關于公布首批“新工科”研究與實踐項目的通知》(教高廳函〔2018〕17 號),決定認定 612 個項目為首批“新工科”研究與實踐項目.新興產業的專業主要以互聯網和工業智能為核心,包括大數據、云計算、人工智能等相關工科專業.相對于傳統的工科人才,未來新興產業和新經濟需要的是實踐能力強、創新能力強、具備國際競爭力的高素質復合型工科人才.新興工科專業的設置是為了提前布局培養引領未來技術和產業發展的人才,在對國家及產業未來需求和發展方向的準確把握基礎上,成為新工科的“增量補充”.信息學科的數據科學與大數據專業培養的是具有大數據思維、運用大數據思維及分析應用技術的高層次大數據人才.統計學數據分析師的社會市場較為廣泛,能在企業、事業單位和經濟、管理部門從事統計調查、統計信息管理、數量分析等工作,以實現社會經濟的良性運行,或在科研、教育部門從事研究和教學工作.
高校的人才培養模式仍是以傳統的人才培養方式進行的,遵循“設置院系-開設專業-培養人才”的路徑.而在新經濟環境下,新興工科專業的建設路徑是“預測未來人才市場需求-學科建設與專業建設同步進行”.“以市場為導向”不僅是經濟社會發展對高等教育提出的要求,也是高等教育引領社會進步必須承擔的責任和義務.因此,建立新興專業特有的培養方式,有效使用教師資源和更新適用專業特色教材來提高教學效果,合理規劃課程設置等問題急需解決.
“數據分析”課程中的統計與信息技術相結合是改革與創新教學設計的基礎,下面我們分別從兩大專業分析在數據分析課程中存在的優劣來為教學提出相應的改革措施.
數據科學與大數據技術專業,簡稱數據科學或大數據,是學生在掌握豐富的軟件課程和具有較強的實踐操作能力基礎上開設的課程,主要課程包括C 程序設計、計算機操作系統、計算機網絡、Java 語言程序設計、Python 語言程序設計、大數據算法、人工智能、大數據機器學習、大數據平臺核心技術、大數據分析與處理、大數據管理、大數據實踐等.根據以上的理論課程設置和實踐操作課程安排我們可以發現,本專業的學生可以考取軟件工程、計算機科學與技術、應用統計學等專業的研究生或者在政府機構、企業、公司等從事大數據管理、研究、應用開發等方面的工作.
從以上課程的設置來看,數據科學與大數據技術專業的學生在建模中缺乏數據模型理論的創新能力,他們更擅長程序語言編程和軟件操作,特別是對海量數據的挖掘缺乏一些背景知識.但從專業的培養和就業的方向來看,近兩年,批準大數據專業的設立包括理學和工科學位,社會急需大量數據人才,并且他們的就業領域寬廣.由以上可知,目前的專業培養中缺乏統計理論方法知識的補充、數學模型的使用和數據統計分析的手段.
統計學是應用數學的一個分支,主要課程設置中除了必要的數學、物理基礎知識外,還有統計類課程,如多元統計、回歸分析、計算機應用基礎、程序設計語言、數據分析及統計軟件、實驗設計與質量控制、數據結構與算法、數據庫管理系統、計算機網絡系統、系統分析與軟件設計等課程.本課程主要通過概率論建立數學模型,收集所觀察系統的數據,對其進行量化分析、總結,并做出推斷和預測,使學生能具有良好的數學或經濟學素養.
從專業介紹中我們會發現,除了數學知識的儲備外,課程中還有大量的軟件課程,目前用于統計分析的軟件有R軟件、SPSS 軟件等.首先,市場軟件的更新,Python 是目前排名第一的統計分析軟件,已經超過了MATLAB.其次,軟件使用的范圍,Python 強大的軟件包使得其在大數據、人工智能等工科領域很搶手.市面上有很多相關軟件的教材,但關于Python 與數據分析的統計學學科應用的教材較少,特別是結合統計分析模型的Python 數據分析.再次,專業與教材不對稱,目前統計學專業的數據分析課程一般使用的是梅長林著的《數據分析》,教材中配備的是SASS 軟件的使用操作,分為理論部分和實踐部分,符合教學設計.市面上同時存在著如復雜數據統計分析方法——基于R 的應用的教材,其中包括各種數據分析方法的實踐.但考慮經費預算,Python 與R 軟件更受高校歡迎.無論是數據科學專業還是統計學專業,在培養適應市場需求的人才的過程,涉及的不只是一種軟件和模型方法.在創新型社會的競爭中,對人才的要求更加嚴格,這就需要學生不僅能應用一種軟件解決問題,而且要學習多種軟件和模型方法,能在不同的環境要求下運用所學的理論和實踐課程解決實際問題.
下面我們從教學模式、教學資源、教學方法、考核方式四個方面,對跨專業的數據分析課程改革進行說明.
傳統教學模式以教材講授為主,章節之間的連貫性依賴于教師的課程安排和授課技巧,理論和實踐嚴格分開,學生不能很好地將理論知識應用于解決實踐問題,因此這樣的教學效果并不理想.而數據分析是理論和實踐相結合的課程,在開設本課程時,學生已經掌握了相關的理論基礎和軟件技能,不同專業基礎的學生在面對同一數據分析問題時可發揮其獨有的特長.例如,以統計為基礎的學生掌握了多元統計分析、SPSS 軟件和R 軟件等統計建模知識.目前統計分析軟件,如R 軟件、SPSS 軟件等,具有扎實的統計建模理論知識功能.數據分析領域中的另一主角是以數據科學與大數據技術為基礎的學生,他們在建模中缺乏數據模型理論的創新能力,更擅長程序語言編程和軟件操作,特別是對海量數據的挖掘缺乏一些背景知識.因此,混合教學模式可以在一定教學理論指導下建立起較為穩定的教學活動結構框架,使得整個教學活動各要素之間緊密聯系,幫助學生挖掘他們的潛能.
教學資源是混合式教學改革的核心.教師在教學中不能只講理論不講實踐,也不能只講實踐不講理論,理論與實踐在教學課件與教案中要充分融合,但又可以分割開來.教師要根據章節內容合理安排上機操作,不斷修正課件和教案設計,優化板書演示內容,借助互聯網技術的優勢,不斷更新模型案例,如以近年來的建模問題作為例題,以獲獎優秀論文為例講解如何解決實際問題.主要目的是讓學生成為問題解決過程的主角,教師則作為分析過程的配角,實現以學生為主體的教學模式,同時豐富實踐模塊的內容.
針對目前教材不足的現狀,教師應設置適合不同專業不同模型的教學方式,實現數據分析的研究內容,形成專題專項指導.教師可以引入R 數據統計分析、Python 大數據分析的應用等大數據分析理論和軟件介紹,拓寬學生的知識視野并增強他們的技術能力.在軟件應用上,教師應為學生提供 Excel、 Python、R 語言、SPSS 統計分析軟件的操作手冊和使用說明.這里建議至少要用2 種軟件,一種是行業使用,一種是學科專業使用.要對數據分析結果進行對比,通過理論分解和實驗操作,雙向促進學生對知識的理解,提倡學生的獨特思維和創新思想.
混合式教學方法是在融合各類教學資源的情況下,以學生興趣為驅動,項目案例操作為指引,抓住學生的學習觸動點,引導學生喜歡并學好課程內容.同時,混合式教學方法能以自身的經歷為基礎,從興趣出發,將理論和問題之間的關系更加緊密地聯系起來,促使學生更好地理解理論之間的聯系.如2019 年全國大學生數學建模C 題目“機場出租車問題”,將人生選擇問題與時間序列模型結合起來,利用計算機科學技術仿真模擬進行可視化展示,使學生充分理解理論之間的聯系,提升學習效果.在模型講解過程中,以人生的切身感受為例,讓學生在人生感悟中掌握模型的基本原理.同時,對理論知識體系的內在邏輯進行深刻分析,并輔以簡單的計算和推導,使其更加充分地理解理論之間的聯系.
數據分析課程作為專業選修課程,對學生的考核可以以累積分數考核的方式進行.要增加考核的復雜度,使學生的成績不僅僅依賴于期末考試成績和出勤情況,還要注重平時的表現,進行綜合計算.同時,課程結束前,要圍繞一個課題讓學生自己設計調查問卷,采集數據,再對數據進行處理.這樣的考核方式不僅能有效提升學生對課程的興趣,讓學生參與到數據產生和解決的全過程,而且可以提升學生的綜合素養,使學生得到多方面的發展,
經過一年的教學實踐,從學生的評價中可以發現以下改變和收獲.
第一,課堂教學效果成果顯著.混合模式的教學方式使得課堂變得生動、有趣,極大地提高了學生的學習能動性.特別是理論課中添加實際操作效果,讓學生茅塞頓開.
第二,人才培養成效明顯.在實踐環節,學生提交了自主選題的實驗報告,使學生從報告選題、數據選擇與處理、模型構建、模型優化、模型分析等步驟對某一問題進行了較為深入、完整的研究.
第三,成果運用效果明顯.個別同學通過完善實驗報告撰寫了畢業論文,還有同學在數學建模大賽中使用數據分析的方法獲得了獎勵,實現了成果的轉移與應用.這些應用都說明數據分析課程的混合式教學取得了一定的效果.靈活的教學方法和優化的教學內容激發了學生最大的學習興趣,開放的課堂才能使學生成為主人,學生的學習能力和思維能力也才能得以提升.當然,本文中的研究僅僅是對混合式教學改革的初步探索,還有諸多不足之處,希望在今后的教學過程中不斷完善,不斷優化.