高騰剛

摘要:隨著大數據時代的到來,國內國外均面臨大數據人才緊缺的問題,都在火急火燎地尋求大數據人才培養出口。高校作為人才培養的重要基地,如何在不同學科背景下培養具備一些大數據知識的相關人才就顯得十分急迫。因此,本課程《大數據概論》正是在這樣的背景下開設的一門面向全校本科學生的通識選修課。全文歸納和總結了基于混合教學模式下的《大數據概論》的課程設計和教改思路,希望起到拋磚引玉的作用。
關鍵詞:大數據概論;混合教學模式;課程設計;教改思路
中圖分類號:G642 ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2019)13-0163-03
隨著物聯網、云計算技術在各行各業的廣泛應用,大數據時代應運而生,當前,大數據技術也正在廣泛被應用于諸多行業中。然而,大數據人才現在十分緊缺,據公開資料顯示,預計未來五到十年,我國大數據市場規模年均增速將超過30%。未來五年,國內大數據人才缺口將突破150萬。在BAT發布的招聘職位中,目前大數據崗位占比已經超過60%?,F在業界有一種觀點:即使把全國所有計算機專業都做成大數據專業,仍然無法滿足國內對大數據人才的需求量[1]。因此,當前我校學生有必要在了解大數據的特點上,掌握一定的大數據分析處理技術,為自己將來更好地融入社會、滿足社會需求提前做好一些準備。所以,我校從2014年就開始面向全校所有專業開設《大數據概論》這門課程。
《大數據概論》是由我校大數據學院教師開設的一門面向理工科專業的通識選修課程。該課程的難度設置是科普和準專業之間,是為全校本科學生搭建起通向“大數據知識空間”的橋梁,并以“講解基本原理、學會初級實踐、了解相關應用”為教學原則,為學生在大數據領域方面奠定基礎和指明方向。課程從大數據在當前各行各業的廣泛應用開始,系統講授大數據的基本概念、云計算和物聯網、大數據采集與預處理、大數據處理架構Hadoop、分布式文件系統HDFS、分布式并行編程模型MapReduce、大數據在各個領域的應用。在Hadoop、HDFS、MapReduce等重要章節,安排了入門級的實踐操作,讓學生更好地學習和掌握大數據關鍵技術。課程自從2014年春季學期面向全校本科生開課以來,已有大約1500名學生參與學習,深受學生的喜愛,學生們普遍反映,通過該課程的學習,對大數據時代及大數據應用有了一定了解,并能進一步延伸思考本專業領域的大數據應用發展方向及前景。以下就該課程基于混合教學模式的課程設計和教改進行總結。
1混合教學模式概念
當今中國對大數據相關方面人才的需求量急劇提升,且我國的教育理念也正在發生巨大變化,以往傳統的教學方式已經不能滿足當前教學需要,特別是以混合教學模式為主的教學方式正在快速被人們認識和接受。所謂混合教學模式就是通過各種教學媒體、教學模式、教學環境等各種要素有效的混合,從而提高學習者的學習滿意度,優化學習資源的組合,達到最優的教學效果。彭濤等[2]指出,混合教學是為了實現特定的教學目標并得到較好的教學成果,其實質在于以“合”為目標,以“混”為手段。因此,混合教學模式就是可以使用各種教學要素有效的混合起來,到達特定的教學目的,在這個“混”與“合”的過程中,特別強調教師不再是整個教學的主體,是而通過學生主體性與教師主導性的結合來強化學生主體作用,即以學生為中心,學生是認知的主體,是知識的主動構建者,因此給予了學生一定的自主性,這就要求學生要具體較高的學習主動性和積極性,即自學能力。
在整個《大數據概論》課程的教學過程中,通過采用混合教學模式的教學方法,一方面學生逐漸從知識的被動接收者轉變為知識的主動學習者,使得學生的自學能力得到極大的提升,另外一方面,教師在整個課堂中只起引導作用,充分發揮每個學生在整個教學過程中的主導作用,調動他們的積極性,讓他們主動走進課堂,與教師進行溝通交流,從而解惑,學到知識,到達教學目標。
2課程設計內容
《大數據概論》課程設計內容如圖1所示。第一章是大數據概述,主要介紹大數據時代的背景、大數據的定義和特征、大數據的影響、大數據的技術以及大數據的計算模式。首先從大數據的誕生、數據大爆炸引出大數據對社會生活產生的影響、對各行各業引起的變革,以及帶來的新的問題和提出的挑戰。然后再講,什么是大數據,大數據的4V特征,以及對人們思維、社會發展、就業市場等方面帶來的影響,需要學生通過與老師的討論進一步加深認識。最后,再講大數據技術的四方面,特別是分布式存儲和分布式處理兩大核心技術,由于大數據處理的問題復雜多樣,任何單一的計算模式都不能滿足不同類型的計算需求,因此,除了MapReduce計算模式外,還要簡單介紹查詢分析計算、圖計算、流計算等多種大數據計算模式,有助于幫助他們較全面系統的學習大數據概述這一章的知識內容。這一章的教學重點是大數據的概念和特征,教學難點是大數據關鍵技術。
要講清楚大數據技術,就要從物聯網和云計算說起。第二章首先介紹了云計算的概念、云計算的分類、云計算的特點、云計算的關鍵技術以及云計算的應用,然后,再介紹了物聯網的概念、物聯網的體系結構、物聯網的關鍵技術及其應用,最后,詳細介紹了大數據與云計算、物聯網三者之間的關系和區別。以幫助學生掌握大數據與云計算、物聯網之間是相輔相成、密不可分的關系。本章的教學重點是云計算、物聯網的概念,云計算的分類,物聯網的體系結構,教學難點是云計算、物聯網與大數據之間的關系。
大數據來源廣泛,通過第二章的學習我們知道物聯網是大數據的重要來源,此外,還有系統日志、網絡數據等。因此,這一章,首先介紹為什么要進行數據采集、什么是大數據采集以及采集的要點,其次,詳細介紹大數據的常用采集方法和Flume、Kafka等常用采集工具的使用,最后,重點介紹大數據的預處理技術包括數據清洗、數據集成、數據變換、數據規約等。通過實例講解使學生掌握大數據的基本采集方法和常用的數據處理技術。本章教學重點是大數據采集方法和大數據采集工具的使用,教學難點:大數據的預處理技術。
現實生活中往往采集到的都是“臟”的數據,這些海量的“臟”數據通過數據預處理后,就可以從中提取有價值的信息了,這時就需要對數據進行分析和挖掘。因此第三章,首先從福特運用大數據分析來促進汽車銷售的案例講起,引出大數據分析的基本概念、面對的數據類型、大數據分析的基本方法、大數據分析的主要技術以及常見的大數據分析系統。最后,介紹了大數據挖掘的概念、大數據挖掘的常用方法以及數據挖掘的應用案例。本章的教學重點是大數據分析的基本方法、數據挖掘的常用方法,教學難點是大數據分析和挖掘的方法。
第五章重點介紹了大數據處理架構Hadoop。首先介紹Hadoop的發展歷史、重要特點和應用現狀,然后,介紹Hadoop項目結構及其各個組件,最后重點介紹Hadoop平臺的安裝和使用方法。本章的教學重點:Hadoop概述,Hadoop生態體系架構,安裝偽分布式Hadoop,教學難點:Hadoop平臺的安裝和使用方法。此外,本章還安排了第一個課帶實驗:Hadoop的偽分布式安裝,需要通過本上機實驗讓學生掌握在單機上進行Hadoop的偽分布式安裝方法,為完成后續上機實驗奠定基礎。
HDFS全稱就是Hadoop平臺上的分布式文件系統,就是為了解決海量數據的分布式存儲問題的系統,它是Hadoop項目的核心子項目。本章第六章首先從HDFS概念、HDFS優缺點。然后介紹塊、名稱節點、數據節點和第二名稱節點的概念以及具體的執行過程,從而引出名稱節點的兩大核心數據結構:FsImage和EditLog,最后,詳細Hadoop分布式文件系統HDFS的體系結構、存儲原理和讀寫過程,并熟練掌握分布式文件系統HDFS的使用方法。本章的教學重點是HDFS基本概念、HDFS存儲原理、HDFS的文件讀/寫操作過程,教學難點是HDFS的基礎編程。此外,本章也安排了第二個課帶實驗:HDFS編程實踐,使得學生通過編寫一個Java程序,打開一個HDFS中的文件,并讀取其中的數據并進行輸出。
第七章重點介紹了分布式編程框架MapReduce的基本原理和編程方法。首先介紹了MapReduce的簡介、MapReduce的功能和技術特征、Map和Reduce任務。然后,重點介紹了MapReduce的工作流程、Shuffle的執行過程。最后,重點介紹了MapReduce的一個編程實例—詞頻統計。本章的教學重點是Map和Reduce任務、MapReduce工作流程、Shuffle執行過程,教學難點是MapReduce的基礎編程。此外,本章也安排了第三個課帶實驗:編寫MapReduce程序實現詞頻統計,通過本次上機培養學生在Map端、Reduce端以及main函數中具備編寫基礎代碼的能力,并調試出不同單詞出現的次數。
隨著大數據時代的到來,每時每刻都有海量數據在不斷生成,需要我們對數據進行及時、全面、快速、準確的分析,呈現數據背后的價值,這就更需要可視化技術協助我們更好地理解和分析數據,可視化成為大數據分析最后的一環和對用戶而言最重要的一環。本章首先介紹什么是大數據可視化、大數據可視化的過程,然后,介紹大數據可視化的工具,最后,重點介紹了數據可視化的一個實例。本章的教學重點:數據可視化概念,大數據可視化工具,教學難點:數據可視化實例制作。此外,本章安排了第四個課帶實驗:可視化工具Tableau操作實踐,旨在讓學生了解Tableau這款可視化工具,學會簡單操作Tableau以及制作簡單的可視化圖表。
最后一章介紹了大數據的應用現狀,以及大數據在智慧醫療、金融行業、智慧校園、智能物流中的應用案例。并重點以“菜鳥網”為例介紹了智能物流案例,從而讓學生了解到可以使用大數據技術來提高物流信息化和智能化水平,降低物流成本,提高物流效率。
3課程教學設計
《大數據概論》的課程教學設計主要由課前教學任務、課堂教學活動和課后教學總結三個部分組成。
3.1設計課前教學任務
由于該門課是面向全校所有專業開設的選修課程,在制定課前教學任務之前,一方面要充分考慮到不同學科背景的學生,另外一方面由于我校屬于二本高校,存在部分學生自主學習的愿望不強,懶惰性比較大的實際情況,因此,教學任務和內容不宜安排過多、復雜。在本次混合教學模式的實施中,課前教學任務通過布置課前導學任務單來實現。課前導學任務單一般由5部分組成,即學習目標、學習任務、課前習題、課后習題、在線討論。
學習目標、學習任務、課前習題要求學生在課前完成。學習目標要緊扣課程教學大綱,明確重點和難點,知識點的掌握程度可以分為了解、掌握、熟悉等層次。學習任務可以由教學視頻、多媒體課件等組成。課前習題可以是選擇題、簡單題、判斷題等。課后習題可以是選擇題、編程題、上機實驗等,提升學生學習的成就感。在線討論可以分為課中和課后,課中討論這個環節是教學向學習目標延伸的一種重要方式,教師可以提出具有一定深度和廣度的問題引導學生參與討論,培養學生獨立思考能力。課后討論可以使用清華在線平臺,學生可以以小組為單位,圍繞本節知識內容,提出一些問題或話題,激發學生課后在線討論。
3.2課堂教學過程設計
每學期第一堂課上,可以根據學生人數進行分組,每組人數在5-6人,并選出組長。組長的職責是服務師生,組織好本組學生完成教學任務。分組的目的有二:1)是為了完成課前任務,包括前面提到的學習目標、學習任務、課前練習,小組成員之間可以相互交流、討論;2)是為了培養學生的團隊協作精神,共同完成教師提問或課堂任務。
課堂教學過程設計分為三步驟:1)教師可以花3~5分鐘檢查學生完成課前導學任務情況,可以以隨機提問的方式,也可以使用“雨課堂”或“清華在線平臺”提前布置一些問題,來檢測學生對知識點的掌握情況,并納入學生平時成績中;2)教師根據學生回答課前導學任務的情況,結合本節知識點,有針對性地在“雨課堂”或“清華在線平臺”上不斷地拋出一些新問題,讓學生積極參與到課堂中去,主動去思考問題,這里要求拋出的問題要與教學環節緊緊相扣,并讓學生明白到底錯在哪里;3)教師總結,教師根據學生參與討論的情況,進行系統的歸納和總結,并再次強調本節知識點的重點和難點。
3.3課后教學設計
教師可以采用任務驅動的方式,通過“雨課堂”或“清華在線平臺”向學生發布本節線下課后習題,并布置下次課的課前導學任務,學生可以通過手機或電腦在線觀看教學視頻,線上完成課前習題,完成必要的預習任務,為下一次課提前做好準備。
4結束語
《大數據概論》以混合教學模式的教學方式來改變傳統的教學方式,是屬于一種比較新的教學模式,在我國很多高校都未實施,其教學模式遠未成熟。雖然該課程通過我校學生的上課實踐,取得了一些教學經驗和成績,但同時也暴露了不少問題,希望在今后的教學過程中不斷改進。教育改革永遠在路上!
參考文獻:
[1]來源搜狐網:http://www.sohu.com/a/128457757_610696
[2]彭濤,丁凌云.混合學習環境下給予學習分析技術的深度教學模式研究[J].繼續教育研究,2019(9):123-125.
【通聯編輯:王力】