許萍 孫康 王詩瑩
摘 要:在大數據與人工智能高速發展的背景下,全國掀起了興辦數據科學與大數據專業的熱潮。同時,越來越多的人疑惑,與傳統的統計學專業相比,數據科學與大數據專業的差異在哪里?從專業設置現狀、專業建設與人才培養方案、教學模式、就業方向四個方面比較了數據科學與大數據專業和統計學專業的差異,對數據科學與大數據專業的穩步發展,統計學專業的教學改革提供有針對性的建議。
關鍵詞:數據科學與大數據;統計學;比較
中圖分類號:G4 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2019.28.089
2016以來,數據科學與大數據技術專業的開設高校數量以倍數方式在猛增。截至目前,數據科學與大數據專業開設院校共1161所,其中普通本科學校479所,高等職業院校682所。在近期召開的2019中國大數據教育大會上,眾多專家圍繞大數據系列教材建設、人才培養、專業建設、產教融合等教學領域進行了探討和交流。在此背景下,探討數據科學與大數據專業和統計學專業的差異更為迫切,這對數據科學與大數據專業的穩步發展,統計學專業的教學改革都具有重要的現實意義。
1 專業設置現狀比較
我國統計學專業最早開設在1950年,是一個較為成熟的專業;數據科學與大數據專業最早開設在2016年,是當前非常熱門的新專業。
從開設學校數量來看,統計學專業普通本科學校約300所;數據科學與大數據專業普通本科學校479所,其中211和985學校所55所,辦學數量排名前5的省份分別為河南、北京、山東、湖北、廣東。
從所屬科目及學院看,統計學專業主要包括:統計學(071201)、應用統計學(071202)、經濟統計學(020102)。一般開設在數學學院、經濟或金融學院。統計學、應用統計學多頒發理學學位,經濟統計學多頒發經濟學學位。數據科學與大數據專業(080910T)一般開設在計算機或信息學院,多授予工學學位,部分也授予理學學位。
2 專業建設與人才培養方案比較
對于專業建設與人才培養方案的比較,我們以第一批開設數據科學與大數據專業的3所高校——北京大學、對外經濟貿易大學、中南大學為例,分別就這兩個專業的人才培養方案進行比較分析。
從培養目標看,統計學專業更強調:培養具備較強的運用統計方法和統計軟件分析數據和解決實際問題能力的復合型人才。數據科學與大數據專業更強調:培養具備大數據采集、預處理、存儲、分析、挖掘等行業核心技術的應用能力,能夠勝任大數據系統開發、系統運行與維護、大數據分析與挖掘等工作的專業型和研究型人才。
從課程設置看,我們通過詞云圖分別展現了這兩個專業的課程設置方面的差異。從圖1可以看出,統計學專業主要核心課程有應用時間序列分析、應用多元統計分析、非參數估計、數學分析、統計軟件、應用隨機過程、抽樣調查等;從圖2可以看出,數據科學與大數據專業更傾向于計算機網絡、數據科學導論、操作系統原理、Java程序設計、深度學習、數據結構、離散數學等課程。這表明,統計學的專業課程更注重統計方法的教學,數據科學與大數據專業課程更注重計算機操作及深度學習能力的培養。
從軟件工具看,統計學專業更強調R、SAS、Stata、SPSS等軟件的使用,通過統計建模解決實際中結構化的問題。數據科學與大數據專業面對的大數據的來源往往是多元、異構的,它強調處理技術平臺、獲取存儲、處理和展示各個環節與計算機深度融合。因此,數據科學與大數據專業更注重Python、SQL、C語言、Java、Hadoop/Spark大數據開發技術、更傾向于解決半結構化、非結構化的問題。
3 教學模式比較
在大數據的背景下,當前的統計學專業教學遇到了一些挑戰。為了更適應時代的發展,當前不少高校的統計學專業教學模式向以下三個方面改革:第一,完善課程體系。在保留傳統的統計學核心課程體系的同時,增設數據分析類的課程,如:數據挖掘、機器學習、深度學習等。第二,加強軟件運用及報告撰寫能力。目前已有高校所有統計學核心課程全部采取R軟件教學,輔助Python、stata、Latex、Markdown等軟件教學,提高學生的數據分析能力,報告撰寫能力。第三,完善學生導師制度,注重學生競爭力指標建設。在當前大數據背景下,數學建模、統計建模、泰迪杯、市場調查大賽等各種專業競賽絡繹不絕;大學生創新訓練項目、攀登計劃、挑戰杯等各種項目接踵而來,導師不僅是學生的專業、學業修讀指導,更應該是學生參加競賽、科研項目的指導,指導學生在競賽和項目中成長,增強其競爭力。
數據科學與大數據專業設立時間不長,百事待興。首先,從培養計劃、教學大綱、教材建設等方面可以多借鑒統計學、計算機等相關成熟專業的經驗。其次,數據科學與大數據專業和統計學專業,應優勢互補,資源整合。如:兩個專業的老師可以就一些共同課程,進行交叉授課;對于kaggle數據科學競賽、阿里云天池大賽、全球AI挑戰賽等一些專業賽事,可以組織兩個專業的學生一起參加,增強競爭力。最后,“產、學、研、用”融合,辦出特色。數據科學與大數據專業成立的一個很重要的原因是現有的專業已不能滿足社會對云計算、人工智能、算法分析等行業的人才需求。所以本專業教學模式應注重“產、學、研、用”融合,搭建合理的大數據實踐平臺,注重在工程教育認證核心理念方面的實踐。
4 就業方向比較
統計學專業是一個比較成熟的專業,其就業領域非常廣泛,畢業生的主要就業流向有三個部分:政府部門及企業事業單位從事統計調查、信息管理、數據分析工作;銀行、證券、保險公司等金融部門從事數據分析、應用管理、風險評價工作;市場調查公司、咨詢公司、各類公司從事市場研發工作。
數據科學與大數據專業近年來就業缺口較大。目前,大數據主要有兩大方向:大數據分析師、大數據工程師(包括系統研發類、應用開發類)等。大數據分析師是用適當的統計分析方法對收集來的大量數據進行分析,強調的是數據的應用。如從事經濟、金融、貿易、商務等行業的產品經理,通過數據建立金融模型,來推出一些理財產品。大數據工程師側重于技術,主要是圍繞大數據平臺系統的研發,偏開發層面。如在生物、交通、醫療等領域從事大數據的采集、管理、處理,開發基于大數據的新產品和新業務等。
5 結語
數據科學與大數據專業的思維很多來源于統計學,在大數據的背景下統計學專業也面臨著改革問題。基于以上兩個專業的差異比較,我們提出兩點建議:
(1)數據科學與大數據專業的穩步發展,應學科交叉、產學研用融合。一方面,打破院系壁壘,專業壁壘,研究大數據與統計學、計算機等相關學科之間交叉融合方式,優化課程體系;整合師資隊伍,以共同課程、學科競賽為契機,形成優勢互補、資源整合,各有所長的新局面。另一方面,依托大數據實踐平臺,培養既有嚴格專業技術訓練,又有深刻數據視野的數據科學人才,滿足大數據相關產業對基礎人才的需求。
(2)統計學專業的教學改革,應與時俱進、穩中求競。一方面,進行課程改革,增設一些數據分析的課程;教學更強大的統計軟件,如R、Python等;另一方面,提高學生競爭力。統計學和大數據專業就業領域有所交叉,側重點不同。我們應以學生為中心,激發學生興趣,提高其專業競賽參與率、項目課題參與率,進而提高其專業化水平。
參考文獻
[1]聶淑媛.數據科學的發展與人才培養研究[J].統計與信息論壇,2019,34(01):117-122.
[2]王國仁,金福生,劉馳,等.面向國際化的數據科學與大數據專業課程體系建設[J].中國大學教學,2018,(12):43-45+51.
[3]賀文武,劉國買,劉建華.新工科專業育人共同體與學習共同體構建研究——以數據科學與大數據技術為例[J].教育評論,2018,(08):46-51.
[4]孫欣,尹彪.大數據時代背景下統計學學科的應對[J].統計與決策,2017,(06):2+189.
[5]朱建平,張悅涵.大數據時代對傳統統計學變革的思考[J].統計研究,2016,33(02):3-9.