茹慧英 李超 閆海琴
摘?要:隨著人工智能的不斷發展,加強了對數據分析的需求,對信息與應用統計學專業人才培養也提出了更高的要求,數據分析課程教學理念與方法亟待改革與創新。在總結數據分析經典課程教學經驗的基礎上,結合大數據時代背景特點以及當代學生的學習特征,提出了增加學生參與度的“理論講授+編程實踐+工程實踐”的教學實踐模式。近兩年的教學實踐探索研究證明,該教學模式具有創新性和有效性,能夠培養學生的學習主動性和積極性,提高學生大數據分析能力和數據挖掘能力,為數據分析課程的教學提供了新思路和新方法。
關鍵詞:數據分析;大數據;教學實踐;機器學習;人工智能;數據挖掘
1?概述
近年來,隨著人工智能及大數據的發展,各行各業都充斥著大量的數據,這些數據一般會呈現數據量大、數據維數大、數據變化快、隱藏價值高等特點,數據結構也從起初的結構化數據轉變為半結構化、非結構化數據,海量的數據中所蘊含的潛在價值成為人們關注的焦點,許多傳統的數據分析與統計方法已無法處理當下信息豐富的數據,因此各行各業都急需一些具有較強數據分析能力的人才,這也是對信息和應用統計學專業的學生提出的新要求。對于信息與應用統計學專業學生來說,數據分析課程的學習及應用顯得尤為重要。因此,基于信息和應用統計學專業數據分析課程的教學理念與實踐方法[1]進行探索改革,以期讓學生在深度掌握數據分析理論基礎的前提下,能夠更好的將數據分析知識應用于生產實踐,為我國的數據分析與人工智能領域增磚添瓦,也為今后數據分析課程的教學方式和教學理念提供參考。
當前,國內外高校教師對數據數據分析課程的教與學進行了不同的探索與實踐。孔莉群[2]將統計與概率、數學建模,函數等數學知識融合在一起,探討通過現象教學提升數據分析核心素養。王婧娟等[3]為提升該課程教學水平,探討了數據獲取、數據分析、數據可視化的能力培養,研究如何將信息技術數據分析課程的設計和教學中。徐小茹[4]在闡述數字媒體課程思政教學要素與現狀的基礎上,提出基于數據分析課程的教改策略,包括強化教師思政能力和意識,構建信息化教學平臺,深化思政教育內容等,以期為各大院校數字媒體課程思政教改提供借鑒。現階段數據分析課程仍以傳統的教師傳授為主,教學方法與手段落后,教學內容陳舊[5,6]。另外還存在:課程講授內容充斥枯燥理論,數據分析技術難度相對較高,學習過程中學生的實際參與程度不高,且由此導致的學習積極性比較低落等問題。作為一門實踐性很強的課程,在理論教學完成后,最大的問題是針對所教授學生缺少系統、科學、合理的數據分析實戰環節[7],導致課程理論與實踐嚴重脫節。針對上述問題,本研究將從理論教學方法,編程實戰,工程應用三個方面對數據分析課程的教學理念和方法進行改革探索,結合大數據時代的數據特點[8],圍繞信息和應用統計學專業人才培養方案、本科人才培養模式、社會人才需求等,充分利用該專業學生具有的深厚數學基礎及當下流行的網絡爬蟲、人工智能算法、Python數據分析、可視化分析等技術,深度挖掘數據分析技術在不同研究領域的應用前景及應用價值,使學生深刻認識到數據分析在生活中的重要性,體會數據分析技術在人工智能領域中的重要價值,并鍛煉和提升所教授學生的數據分析能力和實踐能力,從而使學生掌握數據分析方面的一技之長,以更好的適應社會的需求,為祖國的人工智能領域做出應有的貢獻。
2主體教學改革框架
本教學改革研究所針對課程為數據分析及其相關方向課程,在大數據和人工智能背景下,根據課程教學內容,基于不同地區、不同行業領域實體數據,進行教學改革研究,以期形成具有差異性和層次性的教學模式,為學生搭建基礎的數據分析框架,在實踐的教學中學生充分掌握數據分析方法,為后期的機器學習等課程的學習打下堅實的理論與實踐基礎。
各模塊詳細說明與分析:
前期調研及分析。根據前期各年級學生的數據分析課程的成績,分析學生的成績分布,針對具有典型性、代表性的學生采用“德爾菲”問卷調查法,以獲取學生對課程學習體會和對課程的期望教學方式,挖掘影響成績分布的主客觀原因,從而為該課程的改革提供思路。
數據準備。針對數據分析課程的某一方法或算法的不同應用,選取某一研究領域,利用Python爬取或者通過Skleam庫直接導入相關數據,根據數據特點對數據進行預處理,主要包括數據清洗,數據標準化,去除重復值,空值處理,異常值處理,連續數據離散化處理,非結構化數據結構化處理等,對數據進行初步的可視化分析和描述性統計。
數據挖掘與分析。針對工程實踐中的具體數據,采用相應的數據分析方法,進行知識挖掘和分析。可采用的具體方法包括主成分分析法、層次分析法、上下文相關性分析法、特征提取與訓練法、聚類與分類法等傳統與前沿技術相結合方法等。
決策分析與總結。利用Python中的可視化模塊或可視化工具,對數據挖掘和分析的結果進行可視化展示,針對不同領域數據進行實際分析,在數據形態分析結果的基礎上制訂出相應的決策方案,在實施的過程中同時進行方案適用性、可行性等比較評價。
3?教學研究改革思路與創新
本次教學研究改革的目的和任務在于根據數據處理分析、實體大數據知識挖掘技術及應用等[9],激發學生的主觀能動性,讓學生積極參與課堂教學,讓學生在學習過程中從被動接受轉為主動學習,在掌握基本數據分析與處理技術的基礎上,培養學生科學的數據思維能力,能夠將所學知識應用于具體研究領域,掌握解決實際問題的能力。教學研究改革的總體思路圍繞“理論”“編程”“實踐”三方面進行,緊扣大數據和人工智能時代數據分析研究熱點。
3.1?理論教學方式改革
教學方式的改革是教學改革的重中之重,每章節課程在不同的應用場景的教學當中,根據學生個性、學習能力、創新能力等方面的差異,在保證總體教學質量的條件下,采取因材施教的方式,設置學生教學環節,讓學生充當課堂主體,讓學生在講授知識的過程中深刻理解知識,做到學以致用,促使學生能夠主動地思考問題,同時培養學生解決實際問題能力和創新能力。
3.2?理論教學與編程實踐相融合
通過將理論教學與編程實踐相融合的方式,提升學生對數據分析的重要技術——編程的認知和熱愛程度,每個數據分析方法都設置相應的編程練習,使學生在編程的過程中充分理解并掌握數據分析方法的正在內涵,培養學生的邏輯思維和發散思維,通過大量接近生活且有趣的實驗,在增強學生代碼編寫能力的同時,增強學生的數據分析能力,從而可以更好的適應社會市場的需求。
3.3?理論講解與工程實踐相結合
拋棄傳統的枯燥理論講解,將理論講解與工程實踐相結合,最終目的是提高學生解決實際問題的能力,培養學生科學的數據思維能力。整個課程圍繞數據分析課程的理論知識在現實生活中的應用,課程包括5次上機實驗(學生獨立完成)和一周的課程設計(分組完成)。
實驗目的:圍繞大數據時代特色及要求,讓學生理解并掌握數據分析基本流程和方法,包括數據爬取,數據預處理,數據特征提取,數據描述性統計,數據可視化分析,數據分析模型建立、訓練、預測等大數據思維模式。充分結合產學研一體化教學模式布置實驗環節[10],培養學生科學的數據思維能力,為學生在大數據領域的發展奠定堅實的實戰基礎。
課程的核心知識:Python數據爬取。通過Python數據爬取包爬取研究領域需要的數據集,并進行相關的數據清洗,數據存儲等工作。數據預處理知識。利用Python實現數據的空缺值處理,無效數據處理,重復值刪除,標準化處理等。
數據挖掘知識:涉及有PCA主成分分析,判別分析,聚類分析,回歸分析,LDA主題分析、方差分析、參數檢驗等。
3.4??工程實戰和編程能力的相互促進
通過工程實戰和編程實戰相結合的模式,促進學生獨立應用數據分析技術解決實際問題的能力。
整個課程實驗部分包括5次上機實驗和1周課程設計。其中,課程設計要求各小組同學應用Python數據分析工具,自行選擇某一問題進行數據分析,搭建合適模型,訓練模型,對目標結果進行預測并給出相應的決策方案。具體過程為“問題需要分析——相關數據網絡爬取——所收集數據預處理(正則化、規范化)——特征數據挖掘——大數據分析與處理——典型數據處理實驗結果對比和經驗總結”等。在完成數據分析技術性環節后并未結束,而是要求學生進行PPT分享報告并撰寫形成完善的課程論文。
結語
在大數據時代,數據已成為日常生活必不可少的寶貴財富,數據分析成為快速發現數據內部潛在的價值實現人工智能的重要手段。其中重要的教學研究改革方式方法是大膽縮減傳統數據分析課程中枯燥的理論推導環節,因其已經不再能夠滿足大數據時代數據分析課程的教學目標要求,亟需進行相應改革。與其他計算機課程相比,數據分析課程具有很強的實用性,且貫穿到生活的各行各業,因此數據分析課程以成為信息和應用統計學專業的核心課程。本文在大數據和人工智能時代背景下,針對數據分析及相關課程在現階段存在的問題進行了教學改革研究,具體是對教學內容和教學方式進行了改革,建立了“理論——編程——工程實戰”三位一體的教學模式,并探索了采用多元化教學方式的融合機制,以期能夠讓學生積極主動接受數據分析課程的新知識、新技術、新方法,掌握大數據時代數據分析的前沿理論,如數據挖掘、大數據處理、人工智能編程技術等,并完成相關實驗設計,以提高學生的實踐能力和創新精神,培養科學思維,進而提高該課程的教學效果。
本文在課程的實驗教學改革方面緊扣了大數據和人工智能的時代特點,使學生理解和掌握了當今時代數據分析的基本技術與方法流程。針對具體行業領域的大數據分析需求,本文應用了“相關軟件+大數據挖掘+大數據分析處理+可視化實現”的實驗技術流程,讓學生學會挖掘行業數據的潛在價值,完成搭建具體產業數據分析的學習橋梁。通過這種“產—學—研”相結合的數據分析實戰實驗訓練,能夠提高學生的數據分析與實踐挖掘能力,為學生奠定未來從事相關大數據行業崗位的從業技術基礎,實現了一種創新的數據分析思維培養模式。
由于課程教學改革的實驗部分以青年教師為主,存在教學經驗不足等問題,期望今后能夠在教學經驗豐富的教師指導下得以改進,以豐富充實教學改革研究能力。
參考文獻:
[1]?席耀一,王博,李勇,等.大數據分析課程“四位一體”混合式教學探索與實踐[J].大學教育,2022(12):7-10.
[2]?孔莉群.通過“現象教學”提升“數據分析”素養實踐——以“新冠疫情”話題為例[J].中國信息技術教育,2023(07):65-68.
[3]?王婧娟,那麗春,方玉玲.數據分析與可視化課程教學研究與實踐[J].電腦知識與技術,2023,19(07):148-150.
[4]?徐小茹.基于大數據分析的數字媒體課程思政教學改革及實踐[J].湖北開放職業學院學報,2023,36(01):101-102+105.
[5]?方志軍,楊孜茁,高永彬.數據科學與分析課程混合教學實踐[J].計算機教育,2023(01):35-38.
[6]?李文平,張波.基于數據分析的精準教學實踐探索[J].中小學信息技術教育,2022(S1):13-15.
[7]?蔡賽華.數據分析與挖掘課程教學改革研究[J].電腦知識與技術,2022,18(31):178-180.
[8]?李忠霖.大數據背景下用戶行為數據分析課程教學改革研究[J].電腦與電信,2022(10):27-30.
[9]?何少芳,周麗,李緒孟,等.統計學專業“大數據分析綜合實踐”教學探究[J].科技與創新,2022(17):30-33.
[10]?王堯,劉婷婷,馬宇姝,等.基于數據采集與分析的線上教學效果評價實踐研究——以釘釘網課平臺為例[J].高教學刊,2022,8(15):107-110.
基金項目:2021年河北省高等教育學會高等教育科學研究“十四五”規劃課題“大數據背景下《數據分析》課程教學理念與方法探索研究”(GJXH2021-105)
作者簡介:茹慧英(1987—??),女,漢族,河北張家口人,碩士,講師,研究方向:數據挖掘;閆海琴(1991—??),女,漢族,河北張家口人,碩士研究生,中級會計師,研究方向:政府會計,會計信息化。
*通訊作者:李超(1984—??),男,漢族,遼寧阜新人,博士,副教授,碩士生導師,研究方向:人工智能。