詹玲

摘要:大數據時代背景下,需要培養擅長大數據收集、存儲、管理與分析的專業人才,以適應社會和改革的需求。在計算機專業的大數據課程上,高等院校不管是在課程體系方面還是實踐教育上都需要進行探索式創新改革。本文結合文華學院計算機科學與技術專業應用型人才的培養目標,探討了大數據方向課程群建設的目標和思路,利用現有的浪潮云海大數據一體機平臺,從課程群規劃、理論教學、實踐教學三個方面提出了一系列提高學生綜合應用能力的高效的方法。
關鍵詞:大數據方向;課程群;應用型人才;實踐課程
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2017)28-0274-03
一、背景
大數據的研究正面臨著全球性的人才荒問題。根據麥肯錫報告,預計到2018年美國市場大數據人才(包括高級數據分析專家)缺口將高達19萬。此外,美國企業還需要150萬能夠看出關鍵問題所在并運用大數據來進行分析的相關管理人才。中國是人才大國,但掌握和應用大數據技術的創新型人才仍是稀缺資源,培養大數據相關人才成為最為緊迫的任務。
國內外相關高校先后通過開設《數據科學》課程、開展數據科學學位計劃及數據科學短期培訓班來進行數據科學家和數據工程師的培養。美國加州大學伯克利分校從2011年起開設《數據科學導論》課程,并從2012年起開設《數據科學和分析》課程;麻省理工學院開設《計算思維和數據科學導論》這門課,介紹如何利用計算機來理解真實世界的現象,主要面向具備一定Python編程經驗和計算復雜度基礎知識的學生,課程更加看重涉及面的廣度,而不是一味追求深度,該課程為學生提供了許多主題的簡要介紹,課程的主題包括:繪圖、隨機程序、概率和統計、隨機漫步、蒙特卡洛模擬、數據模型化、優化問題和分類歸并,使得學生對今后職業生涯中計算機的角色有了更多了解;美國華盛頓大學開設了《Introduction to Data Science》,介紹了關系型數據庫、MapReduce、NoSQL、基礎數據分析、機器學習、可視化以及圖論[1]。在英國,大概有七所高校開設了《數據科學》及其相關課程,包括謝菲爾德大學、愛丁堡大學、倫敦大學學院、東英吉利大學、布里斯托大學、曼徹斯特大學、倫敦大學皇家霍洛威學院。
在中國,一批知名企業也開設了自己的大數據研究中心,并與各大高校開展合作,促進了大學中大數據專業的發展。北航軟件學院、北航計算機學院與慧科教育(工信部移動云計算教育培訓中心)聯合打造的大數據技術與應用專業,于2012年開始招收工程碩士[2];2013年,華東師范大學成立了數據科學與工程研究院;2014年,華南理工大學設立了云計算與大數據專業;同年,清華大學成立“清華―青島數據科學研究院”,設立大數據的碩士博士學位項目。另外,開設大數據相關本科專業的院校有貴州師范學院、貴州大學和北京城市學院等。
二、大數據方向課程群構建思路
大數據學科方向是一門交叉專業方向,與不同專業相結合可以發展成特定方向的專業或研究領域。IT、金融、管理、社會、生物等傳統專業方向與大數據學科方向相結合表現出多樣化的差異特征,包括專業研究方向與社會需求崗位。例如統計學專業與計算機專業,前者注重數據統計相關理論與數據挖掘理論的結合應用,而后者則注重其應用領域的IT工程實現方式;從崗位需求層次來看,前者需要數據分析人才,后者需要大數據應用開發和大數據系統開發人才。不同的社會崗位有著不同的教育層次與專業技術背景要求,這就要求在不同的專業方向要有不同的課程規劃。就民辦高校來說,需要設置較為精細的專業課程,除基礎課程之外,還應進行主干專業課程和實踐課程設置的優化改革,這樣才能形成民辦高校特有的計算機專業大數據方向的課程群特色。
三、大數據方向課程群構建內容
我們的課程群設置分為三個層次,逐步深入并加深難度。第一個層次是基礎課程,包括數學基礎課程和專業基礎課程;第二個層次是大數據專業方向課程;第三個層次是大數據實踐課程。從基礎課程、大數據專業方向課程到大數據實踐課程,給學生制定了一個系統、完整的課程體系,如下圖1所示。
1.基礎課程。基礎課程是學生學習計算機知識的入門課程和能力培養的起點課程。包括數學基礎課程和計算機專業基礎課程。(1)數學基礎。主要包括高等數學、線性代數、離散數學、概率論、數理統計等,數學是計算機專業的基礎課程,是進行數據分析和處理的基礎工具。例如:微積分和線性代數為大多數數據挖掘應用程序提供進行矩陣計算的基本算法;數據結構課程中涉及到大量的概念、模型及算法,模型和算法的理解需要學生有較為扎實的數學基礎和較強的邏輯推理能力。通過數學的學習,使學生具有良好的抽象思維和邏輯推理能力。(2)計算機專業基礎。計算機專業基礎課程包含兩部分,第一部分是計算機專業基礎中的語言類課程,包括C語言、C++以及JAVA語言等,程序設計課程作為計算機專業的基礎課程,讓學生掌握解決問題的算法和算法實現的具體過程是該類課程的主要目標,這些都需要通過強化計算思維訓練實現。計算思維是運用計算機科學的基礎概念進行問題求解、系統設計以及人類行為理解等涵蓋計算機科學的一系列思維活動。基于計算思維的程序設計課程要在教會學生計算機編程的同時培養他們的計算思維能力。第二部分是計算機專業基礎中的核心課程,包含計算機專業中必修的一些核心課程,如:數據結構,linux操作系統、數據庫系統原理、計算機組成原理與系統、編譯原理、數據結構和計算機網絡等。
其中《linux操作系統》和《Java語言程序設計》是大數據方向課程的先行課,在選修大數據方向課程之前,要把《linux操作系統》和《Java語言程序設計》作為必修課程。
2.大數據方向課程建設。了解和掌握大數據的整個處理流程是該課程群建設的關鍵,因為只有結合具體的大數據處理流程才能做到有的放矢,而大數據的處理流程主要包括以下幾個部分[3]:①數據采集:使用傳感器、ETL工具、爬蟲等數據采集工具獲得結構化、半結構化(或稱之為弱結構化)及非結構化的海量各類數據,經過清洗、轉換、集成,最后加載到數據倉庫,成為聯機分析處理、數據挖掘的基礎。②數據存儲:分布式存儲與訪問是大數據存儲的關鍵技術,雖然采集端本身會有自己的數據庫,但如果要相對海量的數據進行有效分析,就應該將這些前端的數據導入到一個大型分布式數據庫,并且可以在導入基礎上做一些簡單的預處理工作,從而減輕后續的數據處理壓力。③數據分析:數據分析就是用適當的統計分析方法對收集來的大量數據進行詳細研究和概括總結,提取出有用信息并形成結論的過程。通常會使用相關性分析、多元回歸等來揉合各種數據,從不同角度進行預測性和指導規范性建模,學會使用R、SAS、SPSS、SciPy、Stata等統計工具軟件。④數據挖掘:數據挖掘就是從大量的、不完全的、隨機的實際應用數據中,通過算法搜索隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。其常通過機器學習、專家系統和模式識別等方法來實現。⑤數據建模和預測建模:從ERWin、Agile Data Modeling、ORM Diagrams、ML class diagrams、CRC cards、Conceptual/logical/physical schema、DDL、Bachman diagrams、Zachman Framework等數據建模工具開始,掌握建模技術和方法。⑥數據可視化:清晰有效地在大數據與用戶之間傳遞信息是數據可視化的重要目標,將大數據分析和處理的結果以易于理解的方式呈現出來,讓用戶對結果有更加直觀的認知。⑦數據安全:隨著大數據的不斷增加,對數據存儲的物理安全性需求也越來越高,數據的多副本與容災機制也面臨更高的要求。同時,相對于傳統的數據模式,大數據更加容易成為網絡攻擊的目標,大數據分析技術也更容易被黑客利用到攻擊當中去。大數據方向課程目前包括以下課程:大數據與云計算概論、Hadoop系統應用、數據挖掘與數據倉庫、R語言數據分析。這些課程能夠讓學生系統地學習和掌握大數據基本架構和整個處理流程。
3.大數據方向實踐課程建設。大數據特色專業,目前存在著理論教學要求較高,而學生實際設計和動手能力偏弱的問題,不能滿足當前企業事業單位的需要。所以,實踐課程的設置對于大數據方向的教學體系建設至關重要。因此,我們結合民辦類院校學生的實際情況,在課程設置和教學內容安排上做出改變,將“大數據及數據挖掘”的理論教學與浪潮大數據系統平臺的實操實訓相結合,安排了《大數據應用開發》和《R語言實訓》課程,使學生能夠掌握大數據處理方向的理論基礎和應用技能,對數據采集、數據存儲、統計分析、數據挖掘和模型預測等問題有了深入了解,具有較為熟練的應用技能和面對具體應用進行分析處理的能力。學校除了讓學生完成教學計劃中的實訓課程以外,還應該給學生提供加強實際動手能力的輔助課程設置。例如:鼓勵學生參加大數據相關的學科競賽,鼓勵學生參加教師的科研項目,指導學生申報大學生課外科技創新基金項目,組織學生到合作企業實習,通過畢業實習和畢業設計來綜合訓練大學生利用四年所學知識去系統完成某一方面科研課題的全過程,培養學生綜合知識運用及解決實際問題的能力等。這一系列實踐及輔助課程的設置使得大數據方向相比校內其他專業具有同級乃至跨級別的專業優勢,使學生更具競爭力。
四、結論
通過對現有計算機專業大數據方向培養方案的修訂,把大數據方向課程的先行課程作為必修課程,增加了大數據方向的實踐課程,并在此基礎上探討了適合于應用型民辦高校計算機專業培養特點的大數據人才的課程群的設置與建設。以社會崗位的實際需求作為根本出發點,把大數據系統基本理論學習與大數據實訓結合起來,為當前蓬勃發展的大數據市場培養一批既具備扎實理論基礎知識,又具備實際設計和動手能力的人才,提高學生在就業市場的競爭力[4]。民辦高校計算機專業的大數據人才培養也還在摸索過程中,隨著大數據技術的不斷發展,現有的課程群也在不斷完善和建設,根據學生在學習過程中的反饋和學生就業的情況,不斷地探討和改進課程體系及課程設置,使得學生能夠得到最好的教育。
參考文獻:
[1]何海地.美國大數據專業碩士研究生教育的背景、現狀、特色與啟示:全美23所知名大學數據分析碩士課程網站及相關信息分析研究[J].圖書與情報,2014,(2):48-56.
[2]張曉芳,王芬,黃曉濤.國內外大數據課程體系與專業建設調查研究[A].Proceedings of 2nd International Conference on Education,Management and Social Science (ICEMSS 2014)[C]. 2014.
[3]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.
[4]程彥博.大數據專業人才急需培養[N].中國計算機報,2014-07-21(24).
Abstract:With the evolution of big data,we need to train professional talents,good at collection,storage,management and analysis of big data,to meet the needs of society and reform. In the big data course of computer science,colleges and universities should bring forth new ideas in both the curriculum system and practical education. According to the practical talents cultivation target of computer science in Wenhua College,we explore the idea and goal of big data course group implementation. Finally,we propose some effective methods,mainly about course group programming,theoretical teaching and practical teaching,to improve the comprehensive ability of students by taking full advantage of Inspur big data platform.
Key words:big data;course group;applied talent;practical course