□劉俊宇
數據科學與大數據技術簡稱數據科學或大數據,是一門融合了數理統計、計算機科學與技術、軟件工程等專業知識的新興交叉復合型專業。它綜合運用概率統計、分布式計算、軟件工程等知識,探索商業貿易、生物醫療、金融證券、社交網絡等眾多領域的大規?;蚪Y構復雜的數據集,實現數據的采集與預處理、數據融合與共享、大數據分析與挖掘、數據可視化和精準預測。近幾年,國家連續制定的一系列政策已將大數據提升為國家戰略,大數據更是成為推動經濟社會發展的新引擎,如何獲取、存儲、分析、應用大數據將是這個時代最熱門的話題。2015年,國務院印發《促進大數據發展行動綱要》,教育部為落實國家政策隨即設立了這一專業。
該專業培養德智體美勞全面發展,具有扎實計算機學科理論基礎、良好科學素養和社會責任感與使命感,具有寬廣國際視野、創新創業能力和團隊合作精神,掌握大數據領域扎實的數學、自然科學、工程基礎和專業知識,能與人工智能、物聯網、經濟金融等各領域深度融合,能運用所學知識與技能去分析和解決復雜工程問題,能在計算機和互聯網領域以及相關大數據應用行業從事數據科學研究、大數據相關應用開發、技術管理與咨詢等工作,能繼續深造攻讀數據科學、計算機科學與技術及相關學科的后續學位。
該專業主干課程有大數據導論、大數據算法設計與分析、數據庫原理及應用、數據可視化、數據倉庫和數據挖掘、數據倫理與算法倫理、分布式與云計算、深度學習理論及應用、計算機組成原理、操作系統等。
1.工程知識:具有扎實的計算機、數學、自然科學和工程科學等領域的基礎知識,以及將其用于解決數據科學領域復雜工程問題的能力。
2.問題分析:能夠鑒別和評價大數據領域當前流行和新興的技術,根據用戶需求評估其適用性,并通過信息綜合研究得到合理有效的結論;能夠運用所學知識,識別、表達和研究分析數據科學與大數據技術相關領域的復雜工程問題。
3.設計/開發解決方案:具有設計開發數據科學與大數據相關領域功能模塊和系統的能力,并具有較強的創新意識和創新能力;能夠設計針對復雜工程問題的解決方案,并能夠在設計環節中綜合考慮社會、健康、安全、法律、文化以及環境等因素。
4.研究能力:能夠基于科學原理、采用科學方法并運用大數據技術對復雜數據科學工程問題進行研究,包括設計實驗、分析與解釋數據,并通過信息綜合得到合理有序的結論。
5.使用現代工具:能夠針對數據科學領域的復雜問題,開發、選擇與使用恰當的技術、資源,充分利用計算機技術工具,對復雜問題進行模擬與預測,并能夠理解其局限性。
該專業全日制本科學制四年,實行彈性修業年限,允許學生在三至六年內完成學業。畢業學分第一課堂不低于166學分,第二課堂不低于4學分。對符合學位授予條件者授予工學學士學位。
大數據相關領域需要三類人才:一是數據分析類人才,二是系統研發類人才,三是應用開發類人才。其對應崗位分別是大數據科學家、大數據系統研發工程師、大數據應用開發工程師、大數據分析師等,包括大數據開發、大數據運維、數據挖掘與分析、人工智能等多個方向。此外,本專業的學生還可通過公務員錄用、選調生考試等方式,進入政府相關部門從事數據分析和處理等方面的工作;也可以通過推免、考試等方式,進入高校繼續深造,攻讀相關專業的碩士和博士。
目前,我國開設數據科學與大數據技術專業的高校非常多。綜合來看,北京大學、復旦大學、中國科學技術大學、哈爾濱工業大學、電子科技大學、同濟大學、華中科技大學、華東師范大學、西北工業大學、中國人民大學等院校該專業的實力較強。
當前,我國高校開設數據科學與大數據技術專業的模式主要有兩種:
一種是高校自主開設。如果高校在計算機科學一些前沿技術領域實力較強,或者在數學、統計學、數據挖掘、機器學習等方面有較強的師資團隊,是非常值得報考的。比如北京大學是在數學學院開設了該專業,偏數學的內容更多一些,致力于培養運用統計分析、機器學習、分布式處理等技術,能從大量數據中提取對科學研究和生產實踐有意義的信息,以可視化等技術通過通俗易懂的形式傳達給決策者,并創造出新的數據運用服務的人才。有的大學在信息學院開設本專業,有的開設在計算機學院,還有的在經管學院。比如對外經濟貿易大學將該專業設在信息學院,因為財經是學校傳統優勢,專業還會偏重經濟、金融等相關學科領域的知識。
還有一種是校企合作辦學。在這種模式中,高校負責基礎理論方面的教學,企業負責專業技術及實踐方面的教學,側重培養應用型人才,在就業方面比較有優勢。例如貴州理工學院與阿里云合建的“貴州理工學院—阿里巴巴大數據學院”,計劃在5年內為貴州省培養1萬名大數據專業技術人才;黃河科技學院是與中科院、云和數據以及中國科普開等知名大數據相關研究機構及公司開展交流合作,在學校建立聯合實驗室、在企業設立學生實訓基地,實現更好地培養人才。
總之,考生和家長可以從各高校的傳統優勢學科、行業背景出發進行考慮。
另外,如果有同學沒有被大數據相關專業錄取,又特別想學習這方面內容,也可以從相關專業(比如應用統計學專業)跨考此專業的研究生,可實現快速切入,但還應注意關注行業發展最新狀況并著重彌補能力差距。
在選科方面,按照《普通高校本科招生專業選考科目要求(3+1+2模式)》所列,各高校開設的數據科學與大數據技術專業的首選科目要求為“僅物理”,再選科目一般為“不提科目要求”,只有少數為“化學(1 門科目考生必須選考方可報考)”。考生在報考時需要注意,尤其要注意查看當年招生計劃中學校所列要求以及學校公布的招生簡章。