唐國明,雷 軍,趙 翔,唐九陽,郭得科
(國防科技大學 系統(tǒng)工程學院 信息系統(tǒng)工程重點實驗室,湖南 長沙 410073)
數(shù)據(jù)科學是利用數(shù)學、統(tǒng)計學、概率論等工具對數(shù)據(jù)形式的信息進行收集管理、分析處理以及統(tǒng)計推斷的一門應用科學。隨著大數(shù)據(jù)和人工智能時代的到來,數(shù)據(jù)科學已經成為計算機學科以及眾多交叉領域學科的基礎,數(shù)據(jù)科學相關課程(如數(shù)據(jù)科學導論、機器學習、數(shù)據(jù)挖掘等)也相繼在國內外眾多高校開設,如國外的哈佛大學、斯坦福大學、加州大學伯克利分校等,國內的人民大學、南京大學、國防科技大學等[1-2]。
數(shù)據(jù)科學導論是數(shù)據(jù)科學系列課程的基礎先導課程,對數(shù)據(jù)科學問題從提出到解決的整個生命周期進行系統(tǒng)性介紹。近年來,數(shù)據(jù)科學導論課程在各大高校,尤其是北美的多所頂尖高校均有開設。從調研中可以發(fā)現(xiàn),數(shù)據(jù)科學導論既可以作為大數(shù)據(jù)工程等專業(yè)本科生、研究生的專業(yè)基礎課程,也可以作為通識課程為其他需要學習數(shù)據(jù)科學方法和工具的交叉學科專業(yè)開設(如醫(yī)學和生物化學等)。通過該課程的學習,可以使學生掌握利用數(shù)據(jù)科學工具(如Python)和技術(典型的機器學習和數(shù)據(jù)挖掘方法)解決大數(shù)據(jù)工程中具體問題的能力,同時為綜合運用其他相關技術研究解決更為復雜的數(shù)據(jù)處理問題打下理論和實踐基礎。
意識到數(shù)據(jù)科學導論在塑造數(shù)據(jù)科學思維以及培養(yǎng)數(shù)據(jù)科學家等方面的重要作用,國內高校開始嘗試開設數(shù)據(jù)科學導論課程。國防科技大學于2018年開始增設數(shù)據(jù)科學系列課程,包括研究生選修課數(shù)據(jù)科學基礎和(針對軍事大數(shù)據(jù)工程專業(yè))本科生專業(yè)必修課數(shù)據(jù)科學導論。筆者有幸參與了數(shù)據(jù)科學系列課程的建設和教學,一方面為本課題組提供教學參考和指導,作為未來數(shù)據(jù)科學導論課堂教學的嘗試方向;另一方面由于國內外對數(shù)據(jù)科學導論課堂教學環(huán)節(jié)的研究還比較少(對于課程內容設置[2]、人才培養(yǎng)模式[3]等在先前工作中已有所探究,但是關于課堂教學設計目前還沒有可參考的工作),所以可供開設此(類)課程的高校同行參考借鑒。
(1)學情復雜。在實際教學過程中發(fā)現(xiàn),即使是數(shù)據(jù)科學相關專業(yè)(如計算機科學、數(shù)據(jù)工程等)的學生,對于數(shù)據(jù)科學導論預設課程知識掌握情況的差異也非常大,尤其是工具類的知識。比如說,數(shù)據(jù)科學導論課程對于數(shù)據(jù)的操作全流程自始至終都要使用Python編程和工具包,通過學情調研發(fā)現(xiàn),有一小部分學生對于Python編程已經掌握得非常熟練,還有一小部分甚至沒有接觸過Python編程,大部分學生有一些Python編程基礎知識,但是達不到熟練運用的程度。
對于非數(shù)據(jù)科學相關專業(yè)(如數(shù)理化、生物化學、生命科學等專業(yè))的學生更是如此,其對數(shù)據(jù)科學導論需要的前期基礎知識掌握程度差異更大。比如筆者所在學校面向全校研究生開設的數(shù)據(jù)科學基礎課上,絕大部分學生來自非計算機和數(shù)據(jù)科學專業(yè)(但是其研究需要運用數(shù)據(jù)科學相關的方法和工具),編程基礎普遍薄弱。所以,在充分調研和了解學情的基礎上,如何設計一種面向大多數(shù)學生的課程內容設置方式顯得十分必要。
(2)知識結構繁雜。數(shù)據(jù)科學導論是一門內容豐富龐雜的課程,僅主要內容模塊就涵蓋數(shù)據(jù)獲取、數(shù)據(jù)預處理、數(shù)據(jù)分析與模型應用以及數(shù)據(jù)可視化等方面,如圖 1所示。其中每一個內容模塊又包含若干個子模塊和眾多知識點。以數(shù)據(jù)獲取為例,包含從文本、數(shù)據(jù)庫、網(wǎng)頁、網(wǎng)站API四個源頭獲取所需的數(shù)據(jù)內容;使用Python工具包從每個源頭獲取數(shù)據(jù)的方法又有多種,有的甚至多達十幾種。
如此繁雜的知識結構和內容,對于授課老師自身的知識水平和授課水平是一種考驗。照本宣科式地逐點教授會浪費寶貴的課堂時間,是一種十分低效的授課方式;有選擇性地挑重點教授則十分考驗老師的判斷能力和備課水平,尤其是在如此龐雜的內容中甄別哪些是必要的、哪些是可選的,既耗費精力又有遺漏的風險。因此,如何在有限的課堂時間內盡可能多地教授重點、難點知識,同時兼顧老師的精力消耗和授課水平,是數(shù)據(jù)科學導論課程亟待解決的一個難題。
(3)傳統(tǒng)授課方式效果差。傳統(tǒng)的授課方式是以老師課堂教授為主,學生課前預習、課后復習為輔。在前期數(shù)據(jù)科學導論/基礎等課程的授課過程中發(fā)現(xiàn),傳統(tǒng)授課方式的效果并不理想。問卷調查結果顯示,在“本課程還需要改進的地方”和“對本課程不滿意的地方”兩個問題的回答中,對授課方式直接或間接表達不滿的比例占到50%以上。
根據(jù)學生的反饋,絕大部分課中時間由老師控制,學生只能被動地接受知識,而對于數(shù)據(jù)科學導論這種實操內容豐富的課程來說,被動的知識接受方式讓學生興趣大失,動手操作的欲望得不到滿足。再考慮到課前預習的主動性不高,課后作業(yè)的工作量有限,學生很難做到對課堂知識的理解消化,更難做到熟練掌握。因此,如何提高學生在知識傳授過程中的主動性和主體性,使學生做到課前有效地預習、課中充分動手實操、課后加強鞏固,是提升數(shù)據(jù)科學導論課教學成效的關鍵所在。
云計算自2009年進入教育領域,催生了教育云平臺(又稱“教育云”)[4]。教育云平臺充分利用云計算的優(yōu)勢,以透明的方式為遠程用戶提供所需要的計算、存儲和帶寬資源,理論上可以做到資源按需供應而不受時空的限制。依托當前的智能化教育信息管理平臺,國內外的高校和企業(yè)都在打造屬于自己的智慧學習云平臺,一方面整合大量的教育資源并永久保存,另一方面將可用資源在受教育者之間(以無償或有償?shù)姆绞剑┻M行分享。這種新的教育資源整合和共享模式極大地推動了教育教學模式的改革和進步,慕課在國內外教育機構的盛行就主要得益于教育云平臺的建設和發(fā)展。

圖1 數(shù)據(jù)科學導論課程內容模塊
(1)課程資源類型和數(shù)量豐富,方便學生按需進行知識點的學習。由于數(shù)據(jù)科學導論課程的內容繁雜,知識點眾多,授課老師可以將準備的課程資源盡可能多地上傳到云平臺,資源的類型也盡可能多地提供,如PPT、視頻、音頻等,方便學生有針對性和選擇性地進行學習。另外,由于課程資源的訪問不受時空的限制,云平臺可作為課前預習和課后復習的輔助手段。同時,正是由于云平臺的使用,才使用像翻轉課堂這樣的新型教學方式變得可行。
(2)云平臺提供的運行環(huán)境對學生友好,避免了配置繁瑣和硬件差異帶來的問題。Python程序語言在數(shù)據(jù)科學導論中要頻繁使用,而繁瑣的編程環(huán)境配置對于剛開始接觸編程的學生來說是一個比較頭疼的問題。使用云平臺提供的統(tǒng)一編程環(huán)境可以很好地解決這個問題,學生無需在自己的筆記本或臺式機上進行編程環(huán)境配置,可以把更多的時間和精力投入到編程語言的學習上。另外,學生使用電腦的硬件差異也會產生各種奇怪的問題,而云平臺的使用再次避免了此類問題的發(fā)生,使學生和老師都能更好地專注于本職工作。
(3)后臺數(shù)據(jù)收集和分析功能為授課老師和學生提高教學和學習能力提供了重要的輔助手段。一方面通過精確到秒的學習行為監(jiān)控,可用進行總體概況分析和內容細節(jié)分析,幫助老師全面了解學生的學習效果;另一方面,學生可實時查看課程學習情況和進行學習成效的檢測,便于學生隨時把握課程進度、明確不足的知識點、激勵學生有針對性地學習。
(4)合理使用教育云平臺提供的智能服務可大大減輕授課老師的負擔。比如,教學資源一般支持跨課程調用,資源庫內容也支持多次復用使用,從而避免了授課老師重復準備授課材料;高級的教育云平臺可支持學生進行作業(yè)互評,既解決了授課老師作業(yè)批改量密集、繁重的問題,又能調動學生學習的積極性,培養(yǎng)學生的比較和分析能力。
通過上述4點優(yōu)勢的分析,可以初步判斷,使用教育云平臺將有效應對數(shù)據(jù)科學導論教學所面臨的學情復雜和知識結構繁雜問題。對于傳統(tǒng)授課方式帶來的問題,我們將在第4章節(jié)中引入翻轉課堂這種新型授課方式予以解決。
目前,國內外有很多商業(yè)公司提供教育云平臺服務,面向的群體和提供的服務類別可能各有差異,但是主要內容和服務大同小異。我們以本教學課題組正在使用的高校邦教育云平臺為例進行介紹。北京高校邦科技有限公司(www.gaoxiaobang.com)是慧科集團的下屬子公司,專為中國高校打造智慧學習平臺,并致力于“重構教學、智慧學習”。憑借對高校教學應用的深刻理解,高校邦為不同類型的高校提供有針對性的平臺、服務方案以及一攬子的個性化解決方案。
高校邦下設多個內容制作和供應部門,其中海豚大數(shù)據(jù)實驗室致力于數(shù)據(jù)科學方面的課程內容建設和教育培訓服務。具體地,我們以該實驗室提供的“Tensorflow的介紹和應用”一課為例進行介紹。
(1)理論介紹部分:該部分學習內容由授課老師帶領學生完成,以理論教授為主,介紹Tensorflow的工作原理、圖表構建等內容。通過理論介紹,學生可以了解該知識點背后蘊含的基本原理,即“知其所以然”。
(2)實際操作部分:該部分學習內容主要由學生通過編程練習來掌握,授課老師輔助講解;以實際操作為主,教會學生如何在Jupyter Notebook中導入Tensorflow模塊、創(chuàng)建圖表、操作圖標等。通過實際操作部分的練習,學生可以基本掌握創(chuàng)建和使用Tensorflow的能力。
在實際教學過程中發(fā)現(xiàn),數(shù)據(jù)科學導論課程如果仍然以“老師講、學生聽”的這種傳統(tǒng)授課方式進行,教學效果將得不到保障。翻轉課堂作為一種全新的教學手段,把學生作為課堂教學的主體,強調知識的傳授通過信息技術等輔助在課外完成,而將知識內化在課堂中由老師的幫助與同學的協(xié)助下完成。目前翻轉課堂已被廣泛應用于中高等教育中,并在部分學科的教授中取得了明顯的成效[5]。我們主要從課前和課中兩個環(huán)節(jié)對課程內容的傳授過程進行設計,達到學生在課外完成基本的知識點學習、課內老師輔助學生鞏固提高的翻轉效果,以此提升數(shù)據(jù)科學導論的授課效果和學生的學習體驗。
課前環(huán)節(jié)主要包括老師準備素材、在教育云平臺發(fā)布內容和學生完成課前任務3個步驟。第一步,授課老師準備課程內容的素材,如演示操作過程的小視頻、包含重要知識點的PPT、輔助閱讀的參考文獻等;第二步,授課老師要確保在距離開課前足夠長的時間將內容共享到教育云平臺上,并明確課前環(huán)節(jié)中學生需要預習的內容以及對知識點的掌握程度;第三步,由學生在課前獨立完成,包括對各個知識點的學習以及對學習效果的自測。
授課老師在此環(huán)節(jié)中有針對性地出測試題目,然后利用云平臺的統(tǒng)計分析功能評估學生的預習效果,判斷哪些是需要著重強調的知識點、哪些是學生容易犯錯誤的地方,為課中環(huán)節(jié)的實施提供直接的參考和指導。
將課中教學部分分為情景引入、任務實施、知識點分析、拓展實訓和疑難解析5個環(huán)節(jié),如圖 2所示。
(1)情景引入:為提升學生對數(shù)據(jù)科學導論學習的熱情,強化該課程與實際工作的關聯(lián)性,設定學生為某數(shù)據(jù)科學公司的實習生,需要在一個學期的實習期內完成數(shù)據(jù)科學基本技能的培訓,并完成培訓主管賦予的各項實習任務,根據(jù)任務完成情況和考核結果決定是否留任。
(2)任務實施:針對本堂課所設定的教學目標,授課老師將課前精心準備的、具有代表性的訓練題目分發(fā)給學生(可借助云平臺的任務發(fā)布功能),這些題目的解決一般需要利用課前預習的一個或多個知識點,需要學生花費一定的時間來完成。在任務實施過程中,授課老師可以適時地為學生提供現(xiàn)場指導,也可以事先將學生分成多人的小組,以小組的形式一邊討論一邊完成任務。
(3)知識點分析:當大部分學生或者小組已經完成所發(fā)布的任務時,授課老師統(tǒng)一對任務的標準實施方法和可能的其他實施方法進行公布和講解。學生在這個階段來審查自己或者小組實施方案的正確性(為自己的方案打分),找出存在的問題并進行記錄,為課后復習準備。
(4)拓展實訓:授課老師從實際需求中尋找合適的案例,發(fā)布給學生們去嘗試完成。通常這種實際案例的復雜度高、涉及知識點多,有可能還需要額外的知識才能完成,因此,學生在完成拓展實訓題目的過程中可以進一步提升對知識的綜合運用能力。
(5)疑難解析:在課堂的間隙和最后,授課老師要及時對學生提出的疑惑和問題進行答復和總結,并將這些問題進行記錄,作為課后作業(yè)題發(fā)布給學生,也可以作為期末考題的候選題目。
(1)教育云平臺的采購問題:在高校本科教學成為高等教育重點工作的大環(huán)境下,教育云平臺的使用和采購將越來越普遍。由此,一般高校均將有充足的教育教學財政預算用于本科(和研究生)教學的投入,對教育云平臺的采購也一般不會存在太大的爭議。
(2)授課老師對教育云平臺使用和培訓問題:教育云平臺使用非常方便快捷,僅使用瀏覽器就可以完成基本的操作;對于某些特殊的功能需要,目前的云平臺都支持二次開發(fā)和定制化服務。某些教育云平臺還會組織人員對授課老師進行培訓,使得云平臺使用的門檻大大降低。
(3)如何提升學生參與翻轉課堂的積極性:一個有效的方式是完善考核形式,以測試能力為目標,(選題出題)靈活、(考核方式)多元、(判卷評分)客觀為準則;筆試與機試相結合,筆試部分少考甚至不考死記硬背的內容,以考查數(shù)據(jù)科學思維能力為主;課程設計(大作業(yè))占相當比例,課程設計選題嚴格把關,對課程報告和評分標準的要求具體明確。

圖2 數(shù)據(jù)科學導論翻轉課堂課中模塊設計
(4)如何盡可能提升課中環(huán)節(jié)的質量:選擇具有代表性的案例與練習題,如解決過程中包含的知識點要豐富、具有一定的復雜度和難度、處理方法典型且常用的問題,以此提升有限課中時間的利用效率,并培養(yǎng)學生舉一反三的能力。
在未來的課堂教學設計中,教育云平臺將發(fā)揮越來越大的作用,也將大大減輕授課老師的負擔、提升學生的學習效率。翻轉課堂的引入,使得教育云平臺的使用和發(fā)揮作用變得更加自然。我們針對數(shù)據(jù)科學導論課堂教學中存在的學情復雜、知識結構繁雜以及傳統(tǒng)教學手段成效不顯著等問題,提出基于教育云平臺的數(shù)據(jù)科學導論翻轉課堂設計方案,并給出該課程設計方案的具體實施細節(jié),對數(shù)據(jù)科學系列課程(或類似性質的其他課程)的設計和課堂教學具有一定指導意義。