丁詠梅
摘要:在大數據時代背景下,將大數據與統計學教育、人才培養結合,剖析大數據的特征,分析大數據時代對統計人才的需求,從而總結出當前統計教育人才培養方向,迎接大數據時代對統計教育改革、發展的機遇和挑戰。
關鍵詞:大數據;統計教育;人才培養
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2017)44-0124-02
一、前言
2015年8月,《國務院關于印發促進大數據發展行動綱要的通知》對大數據的發展思路進行了明確標識,標志著大數據已經成為國家發展的重要戰略資源;2016年3月發布的“十三五”規劃綱要指出,“把大數據作為基礎性戰略資源,全面實施促進大數據發展行動,加快推動數據資源共享開放和開發應用,助力產業轉型升級和社會治理創新。”大數據時代的到來,帶來了能源、交通、醫療、通訊、氣象、環境、工程、教育等領域的全面變革和技術更新。社會發展由工業革命進入數據革命,數字化和可視化已成為各個領域的風向標。
大數據給科學和教育事業帶來了新的生命力,同時對于傳統教育也提出了新的挑戰。它將對現有的科研、教學體制、培養方案等帶來大的變革,用數據來研究科學,科學的研究數據,對教育領域的影響已經顯現[1]。如2013年9月北京航空航天大學計算機學院、軟件學院、工信部移動云計算教育培訓中心聯合啟動大數據技術與應用碩士高端項目。
大數據時代,對于擁有三百多年歷史的統計學來說,既是機遇又是挑戰。機遇在于大數據的分析主要建立在統計學的基礎上對數據進行處理、分析,從而使得大數據“可視化”,而挑戰在于,當下傳統統計學的方法比較有局限性,需要我們進一步對統計學進行發展與創新。谷歌公司的經濟學家兼加州大學的教授哈爾·范里安先生認為,統計學家將會成為像電腦工程師一樣受歡迎的工作[2]。在將來,不僅是教育領域,在各領域都需要數據專家對大量數據進行分析處理,提取有用信息。由于數據量龐大,數據結構多樣,統計教育在新的形勢下如何順應市場需要,調整人才培養方案和方向,是我們亟待解決的重要課題。
二、大數據時代對統計人才的需求
受傳統思想的影響,傳統統計主要是對行業和部門內部的各項工作進行統計。如今的統計學已有很大不同,不論是統計方法還是研究理論都有很高的要求,力求通過對大量數據的分析整理發現真理。在大數據時代,統計原理與方法與其他學科如金融、醫學、計算機等的融合,使得統計學發揮了更大的價值。值得注意的是,當前市場上已經十分渴求統計人員、數據科學家。據統計,當前我國專業數據分析人才缺口達1400萬,專業數據處理人才已從“走俏”變成“緊缺”。拿今年的就業市場情況來說,統計專業人才成為搶手的稀缺人才,薪資也要高于傳統的金融行業。另一方面,一些學校因為資源整合而放棄了統計學專業人才的培養,比如湖北大學。在這樣雙重的壓力下,根據大數據時代的需要,高校如何構建人才培養機制,尤為重要。而市場的需要是人才培養的原動力,綜合市場導向和各方面信息可知,基礎平臺架構人才和數據科學家這兩類人才將成為大數據時代的“寵兒”。
(一)基礎架構人才
大數據分析是在研究大量的數據的過程中尋找模式、相關性和其他有用的信息,可以幫助企業更好地適應變化,并做出更明智的決策。當前的數據分析已經從傳統的統計分析平臺到Hadoop大數據分析平臺,涉及到的技術構件有Hadoop、HPCC、Storm、Apache Drill、RapidMiner、entaho BI。Hadoop是一個能夠對大量數據進行分布式處理的軟件框架;HPCC需要開發千兆比特網絡技術,擴展研究和教育機構及網絡連接能力;Storm是自由的開源軟件,一個分布式的、容錯的實時計算系統;Apache Drill用于幫助支持廣泛的數據源、數據格式和查詢語言;RapidMiner是世界領先的數據挖掘解決方案,它的數據挖掘任務涉及范圍廣泛,包括各種數據藝術,能簡化數據挖掘過程的設計和評價。
眾所周知,IT行業人員一直緊俏,而在大數據時代,具有計算機基礎軟件平臺構建能力和編程能力的技術人員,需求缺口更大。而作為統計專業來說,掌握R/R Studio、SAS、Python,并輔以shell scripts和knitr等軟件,也構成當前統計人才的必備技能。
(二)數據科學家
隨著市場環境的不斷變化,企業未來發展方向已經不能再僅憑經驗做決策,這需要數據科學家對大量的業務數據進行精準地分析解讀,從而得出準確結論,輔助決策者做決定,規避不利發展因素。由此,不難發現,在企業未來發展中,數據科學家發揮的作用越來越重要。作為數據科學家,首先需要具備扎實的統計學基礎。很多數據分析理論都是基于統計科學,如概率分布、假設檢驗、貝葉斯理論、回歸分析、主成分、聚類分析等,只有具有堅實的統計基礎才能正確地解讀數據。其次,要具有數據可視化的能力。將設計融合到數據分析結果中,使非專業人員看不懂的數據分析結果以簡單易懂的形式出現在客戶面前。因此,數據可視化技術是數據專家必備能力之一。
三、大數據發展下的統計教育發展方向
數據科學家是21世紀最熱門的職業之一。統計學人才培養成數據科學家是在新時代發展統計學的必然趨勢。大數據融合了數學、計算機、統計學三門學科,來實現數據可視化過程,完成虛擬現實,提升各個領域的智能化水平。因此,數學知識的加固、計算機技能的拓展、數據可視化教育的開啟、校企合作的加強,是當前統計教育培養大數據科學家的必經之路。
(一)加固數學基礎知識
數據分析沒有扎實的數學基礎是不行的。要成為數據科學家,除了要學習大學期間的數學基礎課程,還要對例如隨機過程論、函數逼近論、圖論等這些理論進行深入學習。因為,隨著數據分析的逐步深入,統計問題、計算機問題等,這些問題最終都將轉化為數學問題,最終都要用數學知識來解決。只有具備深厚的數學基礎才能成為優秀的數據科學家。endprint
(二)拓展計算機技能
計算機是進行數據分析的基本工具,掌握熟練的計算機操作技能是開展數據分析的基本要求。因此,在數據科學家的知識構架中,計算機技能也同樣占有很重要的地位。這里的計算機技能主要包括:計算機語言、數據庫、數據結構、數據可視化等技能的運用。另外,數據挖掘技術在數據處理中也發揮著重要作用。EXCEL、SPSS、WEKA、MAHOUT、REPIDMINER 等這些軟件也要熟練掌握。
(三)加強數據可視化教學
作為數據科學家僅僅能夠對數據進行分析處理是不夠的,還要求能夠使用API,通過圖形、表格等手段將分析結果以簡單易懂的形式呈現出來。將數據化的信息轉換為簡單易懂的圖形化信息。要做到這些就需要引進數據可視化這門新興學科,加強數據可視化教育。
(四)加強校企合作
作為一名數據分析人員要成為數據專家,除了要具備扎實的統計學知識,還要具備扎實的數學基礎和計算機技術,能夠綜合處理海量的數據信息。因此,學校結合數據分析人才培養的需要,將理學院、信息學院、計算機學院聯合起來為培養數據科學家服務。同時,大力開展校企合作模式,為學生提供大數據分析資源和實踐機會。校企合作后,擁有大數據資源的企業可以提供大量數據讓學生有機會進行數據分析研究,鍛煉學生的數據分析的實踐能力。從另一方面來說,校企合作共同培養出數據分析人才可以直接投入企業工作,為企業積累大量數據分析人才奠定基礎。
四、結論
教學改革不可能一蹴而就,統計學教育的改革需要順應時代發展的需要,在引進先進思想和理論的基礎上不斷發展的過程中進行。在大數據時代背景下,統計學專業人才培養的問題同樣需要與時俱進,以滿足社會的需求。我們應將大數據與統計學有機地結合在一起,在未來的科學發展和教育教學過程中,保持統計學旺盛的生命力,為國家產業發展和工業進程開創新的局面。
參考文獻:
[1]朱建平.大數據時代下數據分析理念的辨析[J].統計研究,2014,31(2):10-19.
[2]耿直.大數據時代統計學面臨的機遇與挑戰[J].統計研究,2014,31(1):5-9.
[3]邱東.大數據時代對統計學的挑戰[J].統計研究,2014,31(1):16-17.
[4]崔路云.基于大數據時代背景對統計學教育的幾點思考[D].首都經貿大學,2014.
[5]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016,33(2):3-9.endprint