孫紅英,劉娟,劉佳
(廣東財經大學 經濟學院,廣東廣州 510320)
經濟統計學專業是統計學在經濟領域中的應用學科,也是財經類院校的熱門專業。經濟統計學專業側重于統計分析方法在社會經濟領域的應用,注重統計分析手段與信息技術的結合,在教學上“知理論、重實踐”。其中大數據分析課程具有統計學、數學、計算機等多學科高度交叉的特點,其基本特點在于方法性和實際應用性強,是經濟統計學專業重要實踐課程之一,也是財經類院校其他專業的選修課程。
快速發展的大數據分析技術對大數據分析課程教學的前沿性提出更高的要求。數據分析的根本任務是從定量角度探索大量數據體現出的規律性。而財經類本科院校的絕大多數學生存在數學基礎知識薄弱的問題,特別是經濟統計學專業的學生在算法理論和公式推導方面常常感到困難,因此,需對理論部分推導過程進行深入淺出的講解,增加案例分析,以滿足經濟統計學專業學生的學習需求。另外,大數據分析課程是全國大學生統計建模大賽、大學生數學競賽等統計賽事的基礎課。大賽中涉及的數據分析方法都可以在大數據分析課程中學習,因此,課程教學前移是非常必要的。考慮到實驗教學能夠激發學生的積極性、創造性,因此,本文探索以“優化內容+案例分析+軟件實現”案例分享式教學為主、理論教學為輔的教學模式,以提高大數據分析課程的教學質量。鑒于此,本文結合財經類院校經濟統計學科的特點和優勢,提出“優化內容+案例分析+軟件實現”的理論教學和實驗教學相結合的教學方法,以案例+實驗教學促進學生對數據分析算法理論的學習,以期為該課程的教學改革和標準化推廣提供新的思路。
經濟統計學專業大數據分析相關課程的教學研究主要集中于實驗室建設、實踐平臺建設和課程教學資源建設三個方面[1-4],有學者研究了大數據分析實踐課程的教學模式,認為實踐課應將前導、理論和實踐緊密銜接起來[5-9]。另外,小組協作學習和項目主導學習的教學模式也被應用于大數據分析實踐課程的教學中,甚至用于挑戰性綜合實驗的設計研究[10-13]。
以上研究均值得借鑒,但財經類本科院校經濟統計學專業需要結合學校培養目標以及學生實際情況,探索合適的大數據分析課程教學方法。經濟統計學專業方向的人才培養目標是在廣東財經大學經濟統計學專業廣東省一流專業建設點的基礎上,培養具有良好政治素質與道德修養,掌握扎實的統計學理論知識,具備大數據應用分析技能,可滿足國家大數據戰略發展需要以及地方和社會經濟發展建設需要的高素質人才。經濟統計學專業方向學生通過此課程可掌握統計學分析及應用技能、大數據分析技術,在實際應用中,能利用統計推斷的基本理論,對數據分析結果進行合理的詮釋,撰寫出規范科學的數據分析報告或者行業調查報告等。據此,本文結合廣東財經大學經濟統計學專業大數據分析課程的教學實踐,提出以“優化內容+案例分析+軟件實現”案例分享式教學為主、理論教學為輔的創新教學方法,將歷年與知識點相關的統計賽事數據融入課程教學,對實驗教學模式提出了見解和建議,以提升學生的學習自驅力和教學質量。
大數據分析課程在本科第6 學期開設,課程總學時為32 學時,全部為實驗課。教學目的主要是為了讓學生能系統運用統計學的基本理論,掌握大數據的處理與挖掘方法,為從事大數據分析、數據挖掘方面的工作,進行數據分析及挖掘等相關方面內容的科學研究打下基礎。其中,多門統計學先修基礎課課程與該課程聯系較為密切,主要有高等數學、統計學、多元統計分析等。多元統計分析中的主成分分析、因子分析、聚類分析,統計學中的經典線性回歸、廣義線性模型等,都為大數據分析課程中的算法提供了豐富的理論基礎。
大數據分析課程的教學過程包括課前、課堂、課后三個主要環節。由于課堂教學全部是實驗課時,所以,課前預習任務對于保證課堂教學效果較為重要,學生需要根據教師在雨課堂、騰訊課堂等教學平臺推送的教材案例和練習案例進行課前預習,提前熟悉案例涉及的數據分析相關知識;課堂任務是通過案例分享和分析來學習數據分析算法知識,以小組為單位討論建模思路,編寫解決案例問題的程序;課后以小組為單位,利用課堂中的算法對練習數據集進行分析和挖掘,并在下次上課時與教師探討遇到的問題。
由于該課程教學全部為實驗課時,因此在考核中加大了學生平時學習和實驗學習成績的占比。課程的總評成績由平時考核成績、實驗考核成績、期末考核成績三個部分組成,分別占總成績的30%、30%及40%。平時和實驗考核成績按小組給分。期末考核需要每名學生根據所學習的數據分析算法知識對給定(或自選,數據量不低于2 000 條)的數據集進行分析與挖掘,并按照教師的要求撰寫數據分析報告。
學生通過大數據分析課程的學習,不僅能加深對大數據分析算法理論知識的理解,還能深化理論與應用相結合的實踐意識,提高綜合運用理論知識解決實際數據分析問題的能力。例如,通過該課程案例的學習,學生不僅對教材中的案例有了系統認識,并利用SPSS Modeler 或其他統計軟件對案例數據進行處理與建模分析,進而獲得有價值的結論,撰寫規范科學的分析報告。而課堂練習數據一般選自當年比較熱門的統計賽事,一方面,學生可以通過分析賽事數據選擇適當的模型與方法,以培養實際應用能力;另一方面,課堂練習數據也為學生參與統計賽事提供思路和信心,培養學生科學創新的能力,并通過最終的期末考核報告讓學生感受到一定的挑戰性,以此更好地培養學生獨立解決復雜問題、完成復雜任務的素質能力。
為提高學生的學習興趣和學習內驅力,教師在使用教材案例的同時也會從歷屆全國大學生統計建模競賽、大學生數學建模競賽等官網中選擇案例,將課堂實驗課與賽事實際應用聯系起來。結合大數據分析課程使用的教材《基于SPSS Modeler 的數據挖掘》[14],本課程將典型知識進行模塊化,教學內容主要分為4 個模塊。
2.1.1 數據讀入、集成和精簡
該教學模塊計劃使用12 學時進行教學,分為課堂學習和課堂練習,并鼓勵學生按小組進行課下實踐。
(1)課堂教學。結合教材以及SPSS Modeler 自帶案例,使用電信數據進行分析。該案例從讀取客戶數據、特征選擇、數據過濾到數據審核,基本上涵蓋了大數據分析的全部步驟。
(2)課堂練習。使用2020 年美國大學生數學建模競賽A 題數據進行練習。教師在課堂給出1970—2020 年海洋溫度數據,學生分成小組,結合教材內容,分別針對識別、預測魚群位置兩個問題在課上及課下進行練習。
2.1.2 決策樹
該教學模塊計劃使用8 學時進行教學,分為課堂學習和課堂練習,并鼓勵學生按小組進行課堂分享,以C5.0 算法為例進行說明。
(1)課堂教學。首先對C5.0 算法進行深入講解,為幫助學生理解,使用思維導圖和算法生成的樹狀結果圖進行對比。其次運用SPSS Modeler 中C5.0 節點對電信客戶的屬性特征進行分析,從數據中分析客戶管理策略,如提高服務質量、增加與客戶的溝通。
(2)課堂練習。結合C5.0 算法,在前面實驗練習已經識別、預測魚群位置的基礎上,對小型漁業公司是否應該改變他們的經營策略進行決策。學生分小組在課上及課下進行練習。
2.1.3 數學建模
該教學模塊計劃用6 學時完成,分為課堂學習和課堂練習,并鼓勵學生按小組進行課堂分享,以人工神經網絡模型為例進行說明。
(1)課堂教學。首先對人工神經網絡的前沿研究進行概述。其次在前面數據選擇、清洗和預處理的基礎上進行數據抽樣。將樣本分為建模樣本和測試樣本,70%用來建模,30%用來對模型進行修正和檢驗。人工神經網絡模型不同于C5.0,該模型需要對數據進行轉換。
(2)課堂練習。結合人工神經網絡算法,在前面實驗已經識別、預測魚群位置后對小型漁業公司是否應該改變他們的經營進行決策。學生分小組在課上及課下進行練習。
2.1.4 聚類分析
該教學模塊計劃用6 學時完成,分為課堂學習和課堂練習,并鼓勵學生按小組進行課堂分享,以K-Means 聚類為例進行說明。
(1)課堂教學。首先對聚類分析的原理進行講解,數據分析中常用的有K-Means 聚類、系統聚類、Meanshift 聚類等,其中,K-Means 聚類最為經典。其次結合教材案例,對電信客戶數據進行講解。先使用算法確定k 的取值,在本案例中使用輪廓系數法確認k=5,將數據按距離劃分到最近的5 個類中,計算每個類的平均值,更新類的中心點,執行迭代直到收斂。
(2)課堂練習。將決策問題構建為單目標優化模型。使用K-Means 聚類來確定捕撈點的位置。例如,將魚群分布設為一個矩陣,并考慮使用一定規則將矩陣變為二分類矩陣,得到01 矩陣。對01 矩陣進行K-Means 聚類分析,獲取聚類中心點,即為捕撈點。學生分小組在課上及課下進行練習。
以“優化內容+案例分析+軟件實現”案例分享式教學為主、理論教學為輔的教學方法,在經濟統計學專業2019 級學生的大數據分析課程學習中已進行了一輪教學實踐,取得了一定的教學效果。學生對此教學方法的滿意度達到90%以上,不僅大數據處理與分析能力等有較大提升,而且2019 級學生參加全國大學生統計調查大賽、全國大學生統計建模大賽,均取得了較好成績,獲得多個獎項。
目前,在大數據分析課程教學中仍存在一些問題,由于實驗考核以小組為單位,導致部分學生即使課程成績較好,也未真正提升數據處理分析能力;還有些學生對于SPSS Modeler 掌握得較好,但是對于其他統計軟件掌握得較差,對編程有畏難情緒。在今后的教學中,將繼續探索和改進教學方法,考慮使用趣味性較強的案例進行教學,以營造輕松愉快的學習氛圍,采取適當的激勵方法,引導學生進行探索性學習,提升學生自主學習意愿,培養其成為具有大數據分析思維和創新思維的統計學專業人才。