楊維明,王時繪,余敦輝,張 瑋
(1.湖北大學 計算機與信息工程學院,湖北 武漢 430062;2.北京中科特瑞科技有限公司,北京 100193)
隨著通信技術的高速發展,互聯網、物聯網積累了大量的數據資源,存儲成本的直線下降、存儲方式的多元化、數據產生方式的巨大變化催生了大數據時代,大數據的主要特征是海量、多樣、快速,為適應大數據特征要求而產生了一系列數據處理技術,包括大數據存儲、預處理、分析和可視化等,并進一步推動了人工智能的熱潮再次興起[1]。當前,以大數據、人工智能技術為代表的新一代信息技術,正在改變人們的生活方式,同時也將導致傳統產業的顛覆性革新。企業和社會急需大量的工程實踐能力強、創新能力強、具備國際競爭力的高素質“新工科”人才;現有信息類工科專業存在著與企業行業脫節、學科知識結構與創新能力不適應大數據時代對信息類新工科人才的新要求。
企業需要的數據人才主要包括4種類型:①大數據/人工智能科學家,要求能設計出滿足客戶需求的大數據、人工智能解決方案,包括需求分析、數據流轉設計、特征工程、模型設計與訓練、整體規劃等;②數據/業務分析師,要求能運用大數據處理技術,包括數據處理、可視化、建模分析等方法,解決處理業務中的問題;③大數據應用開發工程師,能根據用戶的業務需求,基于大數據平臺開發出行之有效的應用程序,包括數據集成、數據加工處理、可視化等多個方面;④大數據管理工程師,要求了解大數據基本組件的架構原理、配置,并能對這些組件進行安裝、使用、運維與優化等操作[2]。不同類型的數據人才的知識能力結構要求見表1。
國家信息中心發布的《2017中國大數據發展報告》明確指出,大數據產業人才需求的崗位特征,并提供了對應的調查數據,其中需求最為旺盛的前三類崗位是分析類、技術研發類和管理類崗位,三大類別的崗位在整個大數據產業人才需求的占比高達88.61%,同時,報告明確指出,本科學歷的人才是目前大數據產業人才的絕對主力軍。

表1 大數據人才與大數據知識能力要求對應關系表
數據科學與大數據技術屬于計算機科學與技術專業類,因此,大數據教育要以計算機教育為基礎,要根據不同專業的計算機基礎,開展分層次模塊化的大數據課程教育。不同專業的計算機教育特點見表2。

表2 不同IT專業的計算機教育比較
從以上數據人才的分類以及不同專業的計算機教育基礎特點可以看出,IT專業(計算機類/電子信息類等)畢業生朝著技術型人才方向發展,適合大數據技術研發類崗位、大數據管理類崗位;計算機/統計/數學等相關專業畢業生適合數據分析類崗位、大數據管理類崗位;而非IT類畢業生適合大數據管理類崗位。
據統計,80%的大數據技術型人才主要來自IT專業畢業生,其他專業畢業生只占20%;大數據分析類崗位中,IT專業畢業生占30%,數學/統計/信息系統專業畢業生占50%,其他專業畢業生占20%;大數據管理類崗位中,市場/營銷/貿易/經濟/工程等非IT專業畢業生占80%,其他專業畢業生占20%。
目前,大數據行業技能要求包含5個層次:①認知能力,包括理論、技術和應用3個層面;②基本技能,包含編程能力和數據庫操作能力;③基礎架構,包含Hadoop生態體系和Spark生態體系;④業務處理,包含數據采集與預處理、數據分析與挖掘、數據可視化;⑤延展性技術,包括算法、商務智能。
為了培養上述5個層次的技能,需將大數據課程進行模塊化設計[3]。大數據課程與技能關聯矩陣見表3。
1)電子信息類專業大數據課程設置。
電子信息類專業要求學生具有較強的硬件系統設計能力和一定的軟件開發能力,能基于特定硬件系統進行軟件模塊開發。為了適應大數據時代新產業的發展需求以及新工科建設的要求,學生還應掌握大數據、人工智能方面的新技術。
基于電子信息類專業傳統的課程體系和專業特點,應對專業培養方案進行修訂,面向電子信息類相關專業增設大數據應用方向,課程模塊涵蓋5個層次的能力培養,但考慮到學時的限制,對相關課程進行整合,主要大數據課程包括大數據導論、Hadoop技術與應用,將Python程序設計、數據采集與網絡爬蟲兩門課整合成大數據編程與應用一門課開設,將數據導入與預處理、商務智能方法與應用兩門課整合成大數據分析與應用一門課開設,選修機器學習或人工智能技術與應用一門課程。

表3 大數據課程與技能的關聯矩陣
2)傳統計算機類專業大數據課程設置。
面向計算機類相關專業,開設大數據應用方向,課程設置涵蓋5個層次的能力培養,設置的大數據課程見表4。

表4 傳統計算機類專業大數據課程設置
3)數據科學與大數據專業的大數據課程設置。
對于數據科學與大數據專業,開展“大數據+”專業教育。大數據專業作為主修專業時,大數據類課程設置71學分;大數據專業作為輔修專業時,大數據類課程設置47學分。
主修核心課程:面向對象程序設計、操作系統、數據結構、數據庫原理及應用、Java應用開發、算法分析與設計、Python程序設計、大數據分析與內存計算、Hadoop 大數據技術、數據導入與預處理應用、數據挖掘技術與應用、分布式數據庫系統、數據采集與網絡爬蟲、大數據處理與編程實踐、計算機網絡等[5]。
金融大數據方向課程模塊(選修24學分):數學建模、R語言建模與應用、多元統計分析、自然語言處理、機器學習、金融大數據分析、區塊鏈原理與技術、數據可視化技術、商務智能方法與應用、人工智能技術與應用、混合現實技術、智能人機交互、互聯網金融信息挖掘、社交網絡與輿情分析、時間序列分析、統計軟件與應用、工業大數據分析應用案例。
教育大數據方向課程模塊(選修24學分):數學建模、R語言建模與應用、多元統計分析、自然語言處理、機器學習、數據可視化技術、商務智能方法與應用、人工智能技術與應用、混合現實技術、智能人機交互、社交網絡與輿情分析、統計軟件與應用、教育學概論、教育統計學、教育心理學、教育管理學、教育評價學、教育經濟學、教育大數據分析。
新工科建設除了要求對原有工科專業的課程體系進行改革,使之適應新產業的知識結構要求外,更強調工科專業人才培養要聚焦解決復雜工程問題能力的培養,這就要求對傳統的教學模式進行改革。
校企聯合成立VIP項目管理組,項目管理組從項目資源池中遴選適合的項目設立VIP項目,其教學目標是:①以一個真實的大數據項目為主線,循序漸進的讓學生完成包括數據集成、分析挖掘、可視化的數據處理全過程,了解大數據行業項目處理的實際流程;②打造真實的工程場景,盡快建立學生對于學科的學習興趣,在實際工作中培養學生的工作素養與專業能力;③通過實際的大數據行業全流程項目實戰,訓練學生大數據思維;④學生在實踐中完成學科知識系統化的深入理解,具備理論與經驗共同導出行動的能力,完成無法預測結果的任務,更深入地建立課程與實際工作場景的關系。具體實施步驟如下:①各專業課程的理論授課:確定課程教學內容、方法與目的,重點講授關鍵知識點、技術點;②各專業課程的實踐授課:通過不同的子項目覆蓋課程的關鍵知識點和技術點,幫助學生在實踐的過程中進行理論的學習與深入掌握,最終通過一至兩個綜合項目將所有課程相關的知識點、技術點串聯起來,幫助學生對于課程的整體掌握;③專業實戰課程:讓學生分階段(環境部署——數據預處理——數據可視化)的完成項目實戰實訓,建立各門獨立學科與數據處理各個關鍵階段的實際關聯;④VIP項目實踐:以一個真實的大數據項目為主線,讓學生基于Xdata、Insight、Mining等行業系統開展項目實戰,將所有學科知識以及各個數據處理關鍵階段全部貫穿,完整了解并掌握行業實際工作內容與流程;⑤畢業設計部分內容:在工程師與老師指導下,將大學前3年所做的VIP項目進行深度的數據挖掘與分析,最終形成指導行業的大數據分析報告(包含數據采集—預處理—儲存—挖掘—分析—可視化)。
課程學時/學分:64/4。
主要儀器設備:電腦(Windows與Linux雙系統)、曙光Infinity9000平臺。
實驗教學內容:涉及所有專業課程。
大數據VIP實驗教學項目主要內容見表5。

表5 VIP實驗教學項目主要內容
VIP教學法緊密結合學生專業課程的學習及職業素質的培養,強調引導和主導學生大學階段的自我教育設計及教育過程實現;同時VIP項目的內部管理參考企業的研發管理和團隊管理,強調KPI(關鍵績效指標)考核,為學生創造企業化工作氛圍和職業素質培養鍛煉的環境;VIP教學模式貫徹了以學生為中心的教育理念,注重培養學生解決復雜工程問題的能力,其教學內容、考核方式可根據實施效果持續改進,滿足新工科建設的要求[6]。
新工科建設是機遇,也是挑戰。要培養適應大數據時代新產業發展的工程技術人才,要求對原有IT專業的培養方案進行修訂。湖北大學作為教育部數據中國“百校工程”首批試點高校,提出了面向大數據應用的新工科專業建設理念,對信息類專業課程體系進行整體改革,針對不同專業開設不同模塊的大數據課程,開展分層次的大數據教育。對推進學校一流本科專業建設,滿足社會對不同類型的大數據人才的需求,具有重要意義。下一步,學校將進一步貫徹教育部產教融合、協同育人的教育教學改革理念,加強校企混編型大數據師資團隊建設,不斷完善實踐教學平臺建設,以教育部倡導的八大信息類學科競賽為引領,建立適合新工科人才培養的課外創新創業教育體系,建立基于校內質量監控與校外評價反饋的持續改進機制。培養滿足大數據時代要求的學科知識交叉、工程實踐能力與人文素養協調發展,具有解決復雜工程問題能力的IT類新工科人才。