胡文玉,劉漢明
(贛南師范大學 數學與計算機科學學院,江西 贛州)
當前,大數據已在科學研究和商業領域獲得了巨大成功,國際社會對大數據相關人才的需求也在日益增加。有研究表明,2015年美國的數據科學人才供應非常充足,但據麥肯錫報告美國2018年的數據分析人才出現嚴重短缺,人才缺口高達150萬人;而在我國,據《中國大數據發展調查報告(2015)》預測:到2025年,我國數據分析領域人才缺口將達到200多萬人[1]。面對各行各業對大數據專業人才的大規模需求,黨的十八大以來,習近平總書記強調:中國要高度重視大數據發展,改善民生及保障國家數據安全。2015年,國務院通過《促進大數據發展行動綱要》,提出要將發展大數據提升至國家戰略。同時指出:要加強大數據專業人才培養,鼓勵高校設立數據科學與大數據技術相關專業,重點培養專業化的大數據人才[2]。
隨之,全國高等院校陸續開始數據科學與大數據技術專業的申報。2016年,教育部發布的《2015年度普通高等學校本科專業備案和審批結果》中首次增設數據科學與大數據技術專業,學位為工學或理學,代碼為080910T,其中北京大學、對外經濟貿易大學和中南大學是該年第一批獲批開設該專業的3所高校。經過五個批次的增設,至今全國共新增了631個數據科學與大數據技術本科專業,各批次增量見圖1。贛南師范大學數學與計算機科學學院作為江西省地方師范院校信息人才培養的主要機構,于2019年3月第四批次被批準設立數據科學與大數據技術本科專業,承建單位為數學與計算機科學學院,學位為工學。

圖1 全國各批次新增數據科學與大數據技術本科專業的高校數量
作為一個新興專業,目前全國尚未形成統一的專業人才培養模式。同時各開設高校的實際情況不盡相同,故不能照搬別校的人才培養模式。基于此,本文將結合地方師范院校的實際情況,對我校數據科學與大數據技術專業的人才培養機制進行分析,旨在構建以數學思維、理論與方法為基礎,以大數據平臺構建、工程實現技術為重點的大數據復合型人才的培養體系。
在國內外,如何培養數據科學與大數據技術專業合格人才已成為研究熱點問題。在國外,數據科學類專業最早可追溯至北卡羅來納州立大學,該校在2007年以數據分析專業為基礎率先成立數據分析碩士專業。而由“數據分析”向“數據科學”進行實質性過渡則出現于2013年,例如紐約大學當年新開設了數據科學碩士專業。截止到2017年11月,國外數據科學專業的學位項目已超過1000項,主要分布在美國、英國、德國等歐美國家,設立于加州大學伯克利分校、紐約大學、華盛頓大學等知名大學。由此可見,國外一流大學的數據科學專業建設至少早于國內3年。但是,絕大部分國外高校尚未在本科教育中將數據科學作為獨立學科專業,而我國部分高校則主要側重在數據科學本科教育方面[3-6]。
在國內,開設數據科學與大數據技術專業的高校數量自2016年以來逐年增加(如圖1所示),關于該專業人才培養的研究工作也隨之逐漸增多。例如,針對數據科學本科教育的人才培養要求,石兵和何文斌等就該專業的課程體系建設、實踐平臺建設等問題進行了探討;余亞輝等人歸納分析部分學校開設的數學類課程,梳理數學課程與大數據專業課的關系,并對大數據專業開設數學課程提出了意見[7];林剛等從課程與思政雙向融合、混合教學、多課程綜合、與工程要求接軌4個方向,討論了該專業課程思政的建設思路[8];陳欣等則介紹了重慶工程學院的人才培養方案情況[9];唐小勇等以大數據技術專業課程體系建設為研究對象,討論適用于地方高校的人才培養知識體系和相應的課程教學體系[10]。然而,當前我國在數據科學與大數據技術專業人才培養模式方面仍存在諸多問題,如專業建設思路不清晰、專業定位不準確、課程設置不合實際、實踐平臺缺乏、師資配置不合理等[2]。
本節將結合我校現狀,從專業內涵、我校專業概況、人才培養方案制定與實施(包含培養目標、課程體系架構、培養特色、大數據創新平臺搭建、應用創新型人才培養)等多方位進行研究和探討。
數據科學與大數據技術專業是以數學思維、理論與方法為基礎,以大數據平臺構建、工程實現技術為重點的寬口徑專業,以計算機科學、數學和應用統計學為三大基礎支撐性學科,以大數據分析為核心軸線的交叉學科。大數據專業的典型特點就是與實際應用緊密結合,離開應用來談大數據基本屬于空談,它的出現符合我國創新驅動發展的需求、人才市場變化的需求及技術和產業發展的需求等[3]。
贛南師范大學數據科學與大數據技術專業隸屬于數學與計算機科學學院,學院始建于1958年,現有數學、控制科學與工程和電子信息工程等3個一級學科碩士授權點,設有數據科學與大數據技術、計算機科學與技術、數學與應用數學、應用統計學4個本科專業,其中計算機科學與技術專業和數學與應用數學專業是“省級一流專業”建設點。2019年數據與大數據技術專業獲批后,學院依托數據分析與人工智能團隊籌建了專業教研室,全面開啟了新專業建設。自2019年9月首屆招生,專業招生規模一直穩定在50人。現有與本專業相關的專任教師21人,其中,教授5人、副教授9人、博士15人,有“贛鄱英才555工程”特聘教授,有全國優秀教師、省級優秀共產黨員、省級學科帶頭人等高水平教師(見表1)。

表1 師資隊伍基本情況
1.培養目標。本專業結合大數據分析人才的特點以及經濟、社會發展對高等教育培養高素質應用型技術技能人才的需求,培養具備厚實數據科學理論、較強創新與實踐能力及德、智、體、美全面發展的復合型專業人才。通過本專業的培養,學生應具有良好的計算機科學、數學、應用統計學、數據科學以及相關業務領域的基本理論和技能,熟練掌握大數據的采集、存儲、預處理、分析處理、可視化和數據安全等技術,能夠從事大數據有關科研、開發和應用領域的各類工作。不僅可以在各IT公司及傳統行業公司占據一席之地,同時也能在大數據、計算機科學、數學、統計學等眾多相關領域繼續深造。
2.課程體系架構。為了培養符合我國大數據產業需求,具有可持續競爭力的交叉創新人才,數據科學與大數據技術專業課程體系必須有機融入課程思政元素,強調以數學和計算機學科為基礎,算法能力為手段,面向行業和應用領域解決問題。因此,本專業構建了融思政、厚基礎、強能力和重創新應用的課程體系架構,主要分為學科基礎課程、專業主干課程、專業選修課程和行業實踐與考研課程4個部分,具體見圖2。

圖2 數據科學與大數據技術專業的課程體系架構
數學、統計和計算機構成數據科學與大數據技術專業的核心課程要素,但數學基礎知識是該專業建設的核心知識體系,三者有重要的相互依賴和學科支撐關系。數學知識對大數據技術的重要性毋庸置疑。具體來講,高等數學和線性代數是數據挖掘的基礎知識環節,為應用程序提供基本算法和原理。概率論與數理統計是統計學原理的基本理論,以概率論為基礎的信息論和特征分析在大數據分析應用中影響巨大,數理統計中的知識體系則是大數據挖掘和可視化的重要載體。因此,高等數學、線性代數、概率論與數理統計作為數據科學與大數據專業的基礎知識模塊是必要而且是必需的。
數值計算方法課程是利用計算機求解數學計算問題的理論和方法,研究分析并設計針對一些數值問題的計算方式,可得到近似但也較為精確的數值結果,該課程也是數據挖掘的基本理論和方法[7]。最優化模型與算法課程是運用數學理論研究各種模型系統的優化策略及方案,為用戶提供科學的決策依據,是大數據相關項目管理與決策的重要方法和手段。因此,我們采用數值計算方法和最優化模型與算法兩門課程作為數據科學與大數據專業的專業基礎和專業主干課程。
3.培養特色。作為地方師范院校的學校定位,結合我院數學與計算機兩大學科交叉的優勢,數學專業開設早、積累厚,專業特色定位為“數學+大數據”,人才培養重視“實踐+創新”。既要求學生具有扎實的數學和統計理論基礎,受到比較嚴格的科學思維和邏輯思維訓練,具有嚴謹的大數據思維能力,也要求具有數據采集、存儲、分析處理能力以及應用大數據技術解決實際問題的能力。堅持理論教學與實際應用相結合,將核心課程、科學實踐與科研項目相融合,培養學生的創新思維與實踐能力。
4.大數據創新平臺搭建。依托江西省數值模擬與仿真技術重點實驗室和憶源人工智能研究所,在理論教學和實踐教學各方面,注重問題為導向、應用為驅動,鼓勵學生參與科研項目研究,引導學生創新創業;在數據科學與大數據技術專業推行科教融合和產教融合思路,常態化聘請校內外大數據、人工智能領域的知名專家學者進行線上線下的課外科技和競賽活動的指導,著重技術人才培養。同時,為滿足學生實訓要求,構建了系統化的實驗環境,擁有充足的軟、硬件資源以供本專業的學生使用,具體情況見表2。

表2 數據科學與大數據技術專業的實驗設備資源
5.應用創新型人才培養。應用型人才需要更多地注重學生實踐能力的培養。一是鼓勵學生參加各類競賽,例如“高教社杯”全國大學生數學建模競賽、“互聯網+”創新創業大賽、“挑戰杯”全國大學生課外學生科技作品競賽、“泰迪杯”全國數據挖掘挑戰賽等各種高水平競賽活動,并成立導師組負責賽事指導和培訓。二是實施案例教學,通過淡化理論教學與實踐教學、教室與實驗室、實驗室與企業的界限,打破傳統教學布局,形成教與學、學與做一體化教學實踐模式;依托于競賽和案例教學,培養學生的實踐能力和創新能力,形成能適應于企業與需求發展的專業技能和綜合能力。
其次,我們在學校和學院協助下,與國內多家公司企業對數據科學與大數據技術專業的學生建立了實習、實訓基點,提升學生畢業時應具備企業所需的大數據知識與實踐能力。具體的實習、實訓單位有:北京學佳澳軟件科技發展有限公司、宏脈信息技術(廣州)股份有限公司、江西憶源多媒體科技有限公司合作協議、北京軟峰科技集團贛州分公司、南京松勤網絡科技有限公司、中國聯合網絡通信有限公司贛州市分公司、贛州市南康區龍回鎮人民政府、江西省家具產品質量監督檢驗中心、江西贛諾環保科技有限公司、江西升偉家具實業有限公司、江西移動贛州經濟技術開發區分公司、南康區家具協會唐江分會、國家統計局贛州調查隊和北京中軟國際信息技術有限公司等14家。
本文以地方師范類院校為例,對數據科學與大數據技術專業的人才培養模式提出了一些建設方法和思路。未來將基于上述專業人才培養模式的建設實踐,依托該專業的自我評估與反饋機制,通過持續改進不斷提高人才培養質量。