李芬芬 張正偉 于永濤 金圣華 淮陰工學院計算機與軟件工程學院
筆者所在學校于2020年秋季開設Python數據處理課程,該課程作為一門專業選修課,適用于計算機科學與技術、數據科學與大數據技術、網絡工程等相關專業,旨在要求學生掌握數據分析的概念、流程與應用場景,掌握數據處理的基本概念、技術和應用方法,培養學生應用數據挖掘理論和技術解決實際問題的能力,為以后從事數據處理各項技術的學習和研究工作打下基礎。另外,通過本門課程的學習能夠及時更新知識體系,借助快速迭代的Python第三方庫,在數據分析與應用設計開發的過程中應用,有效地解決數據處理應用的各個問題。
2020年秋學期開始,本課程采用線上和線下結合的教學模式,依托國家精品在線開放課程“Python程序設計”“Python數據分析與展示”,以及泛雅課堂學習通校內資源平臺、在線自動評閱平臺,構建了四維模型教學與實踐全過程。
如今的大學生基本具備了在線學習能力,大學課程教學從基于教師、學生和教材的三維模型逐漸轉換為學生、教師、資源和MOOC的四維模型。基于該四維模型(如圖1),筆者構建了從課前準備、線上教與學、線下教與學到課程評價、反饋及持續改進的閉環課程教學的全過程,如圖2所示。

圖1 四維模型下的Python數據處理課程全體系

圖2 Python數據處理課程實踐過程
新冠疫情期間,學生居家學習使用Python語言進行數據處理,學習環境單一,缺少群體共同學習的驅動力,易受到外部環境的干擾,所以建立自主學習的全維度學習空間是很有必要的。在課程學習前,教師可以要求學生在泛雅課堂Python數據處理課程主頁及同步學習通APP的資料中獲取課程資源,如PPT、微視頻、安裝軟件、學習路徑介紹等,滿足學生自主在線學習的需求。
另外,Python的數據處理涉及各種文件操作與預處理,需要進行大量的代碼實踐,學生在編碼過程中容易出現Bug,而一旦出現Bug,學生就容易懈怠。因此,筆者在本課程啟用了Python123 Online Judgement平臺的在線自動評閱代碼單元,學生可以無限次提交編程代碼刷新得分,直到評閱正確,獲得滿分。這樣的情境設置有利于激起學生的挑戰欲望。該平臺模塊包括練習、作業、考試、自主練習計時和自主計時考試五種模塊單元類型。其中的練習單元提供代碼解析和編碼思路,引導學生從易到難用所學知識進行編程練習,作業單元的解析學生只有正式提交后才能看到,需要學生自行獨立思考并自主測試解決。在作業數據提交方面,學生提交基本理論作業與驗證作業到學習通課程平臺。
Python數據處理屬于技術與知識迭代更新較快的課程,結合教學要求的客觀性,在教學過程中,教師需要不斷地迭代更新課程資源。筆者針對Numpy、Pandas、Matplotlib、Sklearn等Python數據處理第三方庫,基于Python123(https://python123.io)平臺構建了系列課程及在線評閱自主測試題。例如,筆者在Python123平臺開設了從Python入門到Python數據分析的一系列課程(如圖3)。

圖3 Python123課程頁面及開設課程列表
同時,筆者利用Jupyter Notebook的交互功能實現了教學交互(如圖4),即通過直播軟件實現教師與學生間的屏幕共享和課堂互動。Jupyter Notebook(Anaconda3)是基于網頁交互的計算方式,以瀏覽器方式打開,在頁面的Notebook中直接編寫和運行Python代碼,編寫說明文檔、數學公式,加載圖片以及其他形式的輸入和輸出,以.ipynb文件存儲,同時可以導出.pdf、.html、.tex等文件。在線上教學中,在教師在線講解理論及代碼后,學生可以在自己的計算機上快速運行Jupyter Notebook編寫和測試代碼,然后共享自己的屏幕,分享運行結果,交流編碼中的“困難”,進而營造全體在線學習環境。課后,學生可以繼續在Python123實踐平臺問答區提問討論,互相解答,進而形成好的互助學習氛圍。

圖4 Jupyter notebook界面
本課程選用人民郵電出版社出版的《Python數據分析與應用》作為學習參考教程。以應用為導向,從數據處理到分析的基本概念與相關知識,以任務描述、任務分析、任務實現、實訓和課后練習等部分構建章節組織,并以航空公司客戶價值分析、財政收入預測分析及家用熱水器用戶行為分析與事件識別等綜合應用案例,為學生展示搭建數據分析路線圖,進而體現教材資源的全面性。
在整體教學內容的設計上,筆者參考國家精品在線課程“Python數據分析與展示”,構建了基于Numpy、Pandas、Matplotlib、Scikit-learn的數據處理分析基本內容框架,其中包括各類數據讀取、統計分析、特征關系分析、數據分布與分散狀況分析,使用Pandas進行數據預處理(合并、清洗、標準化和轉換數據等),使用Scikit-learn(簡稱sklearn)快速構建機器學習模型等。目前,在校內課程平臺學習通的資料包括授課視頻169個和非視頻資源345個,涵蓋了Python數據處理入門及進階的各類知識點,動態更新資源,實現了教學資源能緊跟技術前沿。
MOOC實現了學生、教師、教材的深度融合。結合本校地方應用型高校學生特點,教師可以為學生推薦國家級精品在線課程“Python語言程序設計”“Python數據分析展示”,這樣不僅豐富了Python數據處理課程內容,還擴大了學生視野。
基于新階段大學課程的四維模型,教師與學生積極探索了新的教學相長模式,學生、教師、資源和MOOC相輔相成,將成為新時期大學教學改革的方向。