張聰
摘要:大數據技術與應用發展前景廣闊,如何在新形勢下設置人才培養目標,培養掌握該專業相關技術跨界意識和跨界實踐的合格人才、實現專業的可持續發展,是目前必須考慮的首要問題。文中從專業內容、培養目標、培養方案等幾方面做了闡述和研究。
關鍵詞:數據科學 ,大數據技術, 培養目標
中國互聯網行業經歷了20年的蓬勃發展,現代人們的衣食住行都離不開網絡,每個人產生的數據正在快速增長,數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素。人們對于海量數據的挖掘和運用預示著新一輪生產率增長和消費者盈余浪潮的到來,由此產生大數據工程師的崗位。大數據工程師就是一群“玩數據”的人,玩出數據的商業價值,讓數據變成生產力。重視數據的機構已經越來越多,上到國防部,下到互聯網創業公司、金融機構需要通過大數據項目來做創新驅動,需要數據分析或處理崗位也很多;常見的食品制造、零售電商、醫療制造、交通檢測等也需要數據分析與處理,如優化庫存,降低成本,預測需求等。
面對百萬級人才缺口,教育部和各大高校顯然也意識到這一數據人才的奇缺,各大高校紛紛開設數據科學與大數據技術這一本科專業。那么該專業培養目標是什么?應該學些什么?如何能夠切合實際的培養出有跨界意識和跨界實踐的人才呢?
一、培養目標
“數據科學與大數據技術” 專業的核心是計算機和統計分析,具備經濟、金融、商業、管理等相關學科作為應用拓展性學科,推動并引領未云計算、大數據技術在各領域的深入應用,具有較強的實踐創新能力、跨文化交流能力和跨領域研究能力的高素質復合型人才。
二、學習內容
大數據是交叉學科,走的是“復合型”培養路線,需要了解和掌握的知識面比較廣,在四年制的本科學習中,數學方面應該掌握數學分析、高等代數與解析幾何、概率論、數理統計;計算機學科需要掌握Linux基礎、java程序設計、pyhon語言基礎、R語言基礎、數據庫應用技術、數據采集與網絡爬蟲、數據挖掘、Hadoop大數據存儲與運算、Hbase大數據快速讀寫、Spark大數據快速運算、深度學習、與數據可視化。綜合學科需要掌握金融大數據分析、健康醫療數據分析、交通物流數據分析等行業領域相關知識。
三、培養方案
隨著科學技術的迅速發展與網絡信息技術的不斷革新,大數據技術這種新一代技術構架不斷涌現和發展,人才培養與行業發展存在差距。那么如何切實可行的落實數據科學與大數據技術專業“產、學、研”一體化的教學模式,與企業接軌,與社會接軌呢?
首先高校可以與企業協作一同完成專業共建,從數據采集,數據接入與存儲,數據分析與可視化,到最終的產品智能的驅動,實現數據驅動的四部曲。可以在網絡爬蟲的實踐教學中采集數據,也可以與生產企業合作,獲取脫敏后的數據。數據存儲需要建設分布式生態系統,即使在PB及的數據存儲下,只需要選擇合適的分析模型,點選關注的屬性和指標,達到一鍵便可查詢分析結果,數據實時更新、秒級響應,分析業務表現從而驅動決策,挖掘出數據的價值,疊加學習算法,反饋到產品,從而驅動產品智能。
其次高校在教學體系中加強理論與實踐教學,建立大數據教學實驗室,全面落實“產、學、研”一體化的思想和模式,從教學、實踐中注重專業人才和特色人才的培養。利用虛擬化教學資源,搭建教學系統和集群平臺,將理論學習、實踐教學和大數據項目實戰融為一體,由難而易、循序漸進,逐步提升學生的學習技能和實踐水平,提高“學”的質量和成效。利用大數據分析主流軟件框架,搭建與業界主要用戶一致的實驗與科研環境,將理論課程中學到的數據挖掘算法運用到實際的數據分析過程中,提升學生的動手操作和項目實踐能力。使得學生所學與企業項目人才需求無縫銜接,與教師的科研工作緊密配合。
最后項目案例訓練作為實踐教學的一個重要閉環,充分支撐教育科研工作。通過采集的行業數據及案例剖析用于基礎研究,對行業數據進行分析統計,按需求生成數據報表例如某地區經濟數據分析,電商商品交易數據分析,房屋租售交易分析,食品價格行業分析等。面向當前的海量數據應用,教學研究關鍵理論模型算法及各種軟件體系架構,以理論研究為指導,深入研究企事業單位的各種應用信息系統,具體研發方向包括:
1.數據庫倉庫理論研究:研究數據倉庫的多維模型、OLAP技術,多數據庫信息集成技術,分布式數據庫理論研究,面向互聯網的信息智能處理技術,基于WEB的數據倉庫技術和數據挖掘技術。
2.大數據環境下的數據存取技術:面向大數據環境的列式數據庫技術,面向大數據環境的NoSQL技術。
3.數據模型的數學理論研究:基于數學的思想進行組合矩陣論、圖論相關的研究。
4.軟件體系架構研究:研究基于SOA體系下各種云應用系統的構建、實施與開發。
5.企事業單位信息化研究:研究各種企事業單位信息化的方法論與實施過程,開發各類企事業單位的各種信息系統。
雖然大數據目前在國內還處于初級階段,但是其商業價值已經顯現出來,特別是有實踐經驗的大數據分析人才更是各企業爭奪的熱門。為了滿足日益增長的大數據分析人才需求,很多大學開始嘗試開設不同程度的大數據分析課程。“大數據分析”作為大數據時代的核心技術,必將成為高校數學與統計學專業的重要課程之一。在實踐教學中通過一定理論指導下,通過引導學習者的實踐活動,從而傳承實踐知識,形成技能,發展實踐能力,提高綜合素質的教學活動。
總之大數據在帶來極大商業價值的同時,也面臨著巨大的人才需求。據數聯尋英發布的《大數據人才報告》稱:目前我國大數據人才僅46萬,在未來3-5年內大數據人才缺口達 1,500,000 之多!面對如此巨大的人才缺口,應該深入探討高校如何開展大數據分析與實踐教學這一課題,讓學生在校期間學習的專業知識在未來的職場生涯中有一定的用武之地。為各大企事業單位以及研究院所輸送復合型跨界人才
參考文獻
[1]劉鳳娟 . 大數據的教育應用研究綜述[J].軟件導刊(教育技術),2014卷(G40-057):47-51
[2] 胡鐵生.微課、慕課的建設誤區與房展建議[D]南京:南京農業大學,2014
[3]鄭怡文,陳紅星,白云暉.基于大數據在課堂教學中對學生精準關注的實驗研究[J].現代教育科學,2016,(2):54-57.