徐博+李盛新
【摘要】隨著信息技術與統計學理論的深入發展,大數據已經深入到國民生活的各個方面,大數據分析日益成為人們進行預測和決策的重要手段。在大數據分析和應用中,其各種數據與決策模型需要被不斷地測試和優化,更需要相應人員高質量的計劃和執行力。因此,國家對大數據人才的知識結構與綜合能力提出了很高的要求。本文在大數據背景下探討數據科學家的含義和所具備的素質,分析國內外高校數據科學專業碩士課程設置的內容和特點,對完善我國高校數據科學專業碩士課程建設具有重要的研究意義。
【關鍵詞】大數據 數據科學專業碩士 大數據人才
【中圖分類號】C81-4;G643.2 【文獻標識碼】A 【文章編號】2095-3089(2017)41-0228-02
一、引言
1.研究大數據高校數據科學專業碩士培養方案的背景和意義
(1)研究大數據高校數據科學專業碩士培養方案的背景
20世紀60年代,數據科學一詞開始出現在人們的視野中,但在統計學和數據挖掘社區應用中的實現卻剛剛起步。數據科學旨在通過數學和算法技術的應用實現對最復雜的商業問題進行分析進而使其得到合理解決,并利用原始信息數據找出隱藏在表面之下的洞見,是一門建立在數據推理和探索基礎上進而發現深層次知識的科學。
不斷測試、優化大數據分析及應用中的各種數據和決策模型,提高相應人員的計劃和執行力已成為必然要求。大數據相關書籍為大數據相關專業的興起奠定了基礎,知名學者和專家的文章在美國主流媒體上的發表對大數據相關專業的開設和發展也起到了推波助瀾的作用。例如:2012年10月托馬斯·達文波特(Thomas Davenport)和帕蒂爾(D.J.Patil)在《哈佛商業評論(Harvard Business Review)》雜志上發表的《數據科學家:21世紀最受歡迎的職業》(DataScientist: The Sexiest Job of the 21st Century)文章,指出大數據科學家應該具備的基本知識結構與綜合能力:會編寫程序代碼;充滿好奇心;具備數據分析和交流溝通能力等。也有文章對數據科學家其他方面的能力提出一些看法:作為大數據科學家,良好的數學、統計學和計算機科學等專業知識當然是必須具備的。與此同時,其他專業領域的知識背景也應有所涉獵,但最重要的是要有創造故事的能力(ability to create narrative-to create storytelling),數據是沒有生命的,而數據科學家能夠把握其本質,利用其價值,進而賦予其生命。對相關人才應具備的素質與能力進行研究和探討,對大數據相關專業的開設具有極其重要的意義。
綜上所述,我們對數據科學家的要求可以說是全方位的,因此將數據科學家定義為集科學家、物理學家、數據分析家、藝術家的基本素質于一身的高端復合型人才并不為過。目前,世界各國名校紛紛設置數據科學專業碩士學位課程,致力于培養具備數據科學家基本素質和能力的復合型人才。在對課程設置、實地授課方式、在線授課方式等方面都進行了大膽地嘗試。
(2)研究大數據高校數據科學專業碩士培養方案的意義
如今大數據已經隨著統計學理論與信息技術的發展逐步深入到國民經濟生活的各個方面,在社會經濟生活的預測和決策中,大數據分析的作用不可替代,大數據分析能力也已作為一項必備的基本技能得到越來越多的重視。
在許多發達國家的戰略中,大數據的研究占據重要地位,而我國的高等教育體系卻還未對大數據投入足夠多的目光。隨著大數據時代要求的進一步提高,傳統的數據處理技術已無法再滿足要求,我們越來越迫切的需要一群具有大數據視野和分析能力的綜合性人才。統計學作為研究數據的一門科學,已經在與多種專業領域逐步完成融合,在大數據時代來臨之際,對高層次統計專業人才進行培養已成為當今的大趨勢。數據科學專業碩士的招收,是我國在大數據時代下邁出的一大步,我們也期待著一批高級人才能夠在當今時代條件下涌現。
2.研究高校數據科學專業碩士培養方案的優勢
現有大數據分析理論的梳理,有助于學科基礎的總結,這為我們今后人才的培養奠定了基礎,也在無形中搭建起大數據理論與統計理論之間的堅固橋梁。通過對新舊分析方法與理論的研究探討,使得新的思維方式逐步建立起來。我們主要目標和方向是在開設課程的過程中將學生的分析能力逐步培養起來,熟練掌握解決問題的基本工具,數據搜集、數據整理、數據分析、數據呈現等基本能力也需逐漸培養起來,并將這些本領應用于實際問題的解決。在此基礎上,開設一些必備的與之息息相關的選修課程。
大數據分析人才的培養要善于集合社會各界力量,以數據科學專業碩士為依托,同時將高等院校、科研機構和行業實際部門的師資力量及校內外相關實習、實踐、實訓資源整合起來,使得研究方向在現有基礎上進一步得到拓展,力求與國際主流接軌,從而使數據科學專業高端應用型人才的培養走在全國乃至世界前列。
二、推行大數據背景下的高校數據科學專業碩士的培養與實踐
1.數據科學家的內涵與應具備素養分析
對于數據科學家應具備的條件和背景,當前環境下也眾說不一。創新、堅韌、好奇、技術功底深厚是偉大的數據科學家應當具備的四項素質。當今時代背景下,對數據科學家的要求不再僅僅是具備客觀、誠實、嚴謹等科學家的基本素質,還要求其能夠應用數據說話,使數據驅動決策并主導產品的開發。與此同時,數據科學家還應具備分析能力、技術能力、溝通合作能力。分析能力是我們始終在強調的,它主要是指在統計工具和數學工具的靈活應用下進行數據分析和可視化的能力;技術能力及與同事、客戶的溝通技巧和合作精神也是數據科學家應該具備的。
2.國外高校數據科學碩士培養模式與課程設置分析
當前,世界各國對數據科學的研究都逐步提上日程,而各國名校對其課程的設置大都具備以下幾個特點:(1)由高校中與其密切相關的學院如計算機科學學院或信息科學學院作為數據科學專業碩士的主要培養機構;(2)授課方式上,區別于傳統方式,由網絡授課與在校授課兩種方式組成;(3)授課內容上,圍繞數據技術方面的核心課程,輔助以大數據、云計算等內容,除此之外,也選擇性增加了企業管理、金融管理等管理學方面的課程。學生實踐課程的開展無疑是大膽而有效的嘗試,許多高校已開始為學生提供參與大數據領域項目的機會,力求在此過程中使學生的實踐能力得到盡可能大的提升。endprint
3.國內高校數據科學碩士課程設置現狀與存在問題剖析
深入的分析與對比典型高校的培養模式。從我國各高校課程設置方面來看,技術能力的培養一直作為數據科學專業碩士培養的重點方向,如北京航空航天大學對數據科學專業碩士課程做出了專業基礎課程、專業核心課程和學位基礎課程這樣的劃分和設置,在開設大數據技術方面的基礎內容上融入數學、統計方面的教學內容,對管理學方面的內容卻很少涉及。由此來看,當前時代背景下,我國各高校越來越重視數據科學人才復合型特點的培養,通過加強與企業的緊密合作,將理論與實踐更加緊密地結合起來,聯合辦學的方式也開始被越來越多的高校所接受,擴展了實踐場所,為能力的培養和發揮提供了更加廣闊的空間。
4.我國高校數據科學碩士課程設置及培養方案完善策略
(1)進一步鞏固加強數據科學人才培養模式。
高校+政府+企業合作培養模式自形成以來體現出巨大優勢,但仍需進一步完善。各高校雖不生產大數據,但事實證明,其在大數據理論和技術研究領域具有獨特優勢,而政府和企業的大數據又恰好能夠為人才培養提供重要的實踐場所,這就使得人才培養的環節更加流暢和完整。
(2)建立多樣化的授課方式。
線上+線下的授課模式已被眾多高校所采納,其授課方式與傳統模式相較更加多樣化的同時也依舊存在一些不足,如英文課程資源比較豐富而中文課程資源比較缺乏等,這就需要我們通過合理有效的方式使得課程內容更加豐富,使得求學者有更多選擇。
三、結語
數據科學家是什么?其定義也是眾說紛紜。有學者認為,數據科學家是集技術專家與數量分析師角色于一身的職業;也有學者認為,最好的數據科學家是“硬的科學家”。總之,隨著大數據應用的興起,為更好地滿足社會需求,數據科學專業碩士學位課程也逐漸出現在許多世界著名高校。他山之石,可以攻玉,在批判性地繼承國外先進策略的基礎上,深入和分析國外高校數據科學碩士培養模式以及開設的課程也是我們必須完成的任務。
可預見的是,全社會對數據科學領域的研究都已逐步提上日程,在此時代條件下,我們有理由對數據科學專業研究生培養質量的研究充滿期待!
參考文獻:
[1]徐嘉. 90后大學生素質教育現狀調研與分析[J]. 學校建黨與教育思想. 2011,(8):36-38.
[2]崔璐云. 基于大數據時代背景對統計學教育的幾點思考[D]. 首都經經貿大學碩士學位論文,2014.
[3]劉鴻. 我國研究生培養現狀的調查報告[J]. 現代大學教育,2004,(4):26-28.
[4]張引,陳敏,廖小飛. 大數據應用的現狀與展望[J]. 計算機研究與發展,2013.50(增刊):216-233.
作者簡介:
徐博(1982-),男,博士生導師,博士后,副教授,主要研究方向為無人航行器導航制導與控制、光纖陀螺慣性導航系統。endprint