周建英 李廣明 王雙成
[摘 要] 近年來,很多高校均開設了大數據相關專業,但是整體上,我國大數據人才培養相較于西方發達國家還處于初級階段,專業建設及課程體系也處于探索階段。在分析國內數據科學人才培養現狀的基礎上,以上海立信會計金融學院數據科學專業人才培養方向為例,從數據科學人才培養目標和社會人才市場需求入手,探討“數據科學導論”在課程教學過程中的問題,結合專業發展方向和目標定位,初步形成具有特色的課程體系設置方案。作為導論課程,將以培養學生專業認知基礎為目標,采用理論教學、前沿講座以及實踐教學相結合的方式進行多方式教學,成效顯著。
[關鍵詞] 數據科學;課程教學;人才培養
數據科學是關于數據的科學或者研究數據的科學,數據科學研究和探索計算機中數據中存在的規律、處理方法以及技術,研究的對象是計算機中的數據。那么數據科學應該包括兩方面內涵:一個是數據本身,比如數據的各種類型、狀態、屬性及變化形式和數據的變化規律;另一個是數據能夠為自然科學和社會科學研究提供新的研究方法、研究依據,包括用于研究和探索自然界和人類行為現象和自然規律。近些年來,很多高校,包括雙一流的高校,以及地方院校均在響應人才市場需求和技術發展需求前提下,開設了大數據相關專業。但是整體上,我國大數據人才培養相比較西方發達國家還處于初級階段,專業建設及課程體系也處于探索階段,而針對大數據方向的實踐課程構建更是沒有成熟的經驗可借鑒。本文在分析國內數據科學人才培養現狀及研究現狀的基礎上,以上海立信會計金融學院數據科學專業人才培養方向為例,從數據科學人才培養目標和社會人才市場需求入手,探討“數據科學導論”在課程教學過程中的幾點思考和建議,結合專業發展方向和目標定位,初步形成具有特色的課程體系設置方案,作為導論課程,將以培養學生專業認知基礎為目標,從加強教師隊伍建設以及提高教師教學責任心入手,采用理論教學、前沿講座以及實踐教學相結合的方式進行多方式教學,成效顯著。
本文給出了數據科學實驗課程教學改革的幾點思考建議,結合專業發展方向和目標定位,形成了具有顯著時代特色的課程體系設置方案,以提升學生動手能力為目標,從加強教師隊伍建設以及提高教學責任心入手,采用學評教與同行評價相結合的辦法來提高教學質量,并將實驗教學方法與考核辦法配套結合,成效明顯。
一、數據科學人才培養現狀
目前無論是西方發達國家還是發展中國家,數據科學,包括大數據行業,數據科學行業人才的短缺,為高校數據科學專業建設提供了發展空間,也給高校數據科學人才培養提出了更大的挑戰和機遇。尤其是在人工智能高速發展背景下,各國政府的大力扶持和數據產業鏈的不斷完善,更要求高校數據人才培養要切合實際需求,為社會服務輸出高質量的人才,我國各地地方院校以及重點院校,也在積極申報“數據科學與大數據技術”相關專業,或至少已經開設“大數據”“數據科學”等人才培養課程。香港中文大學從2008年起設立“數據科學商業統計”科學碩士學位,復旦大學從2007年起開設數據科學討論班,2010年開始招收數據科學博士研究生,并從2013年起開設研究生課程“數據科學”,在2014年,清華大學設置了大數據技術的相關碩士學位,目標是多學科交叉培養大數據技術人才。2016年,我國開始建設本科“數據科學與大數據技術”相關專業,教育部批準中南大學、對外經濟貿易大學、北京大學建立“數據科學與大數據技術”本科專業;在2017年,教育部批準32所高校設立“數據科學與大數據技術”本科專業,2018年,國家進一步批準248所高校設立“數據科學與大數據技術”本科專業。2019年初,教育部又公布了203所高校獲批設立“數據科學與大數據技術”新專業,其中包括上海立信會計金融學院。截至2019年,我國共有406所高校獲得招收“數據科學與大數據技術”本科專業資格。在這些院校中,不僅有很多“985”“211”高校,也有地方特色院校。但是在這么多學校獲批數據科學專業時,專業建設、課程建設等工作是迫在眉睫的一件事情。
二、數據科學課程體系構建
數據科學,從統計學、人工智能/機器學習、數據挖掘、數據庫與數據處理、大數據分析等領域,吸取有效的成分,不斷創建起來。上海立信會計金融學院的數據科學專業中,數據科學涉及方方面面,包括數理統計學、計算機科學以及具有行業特色的財經金融學科等,其中統計學是建模的數學基礎,而計算機科學是數據建模的手段和方法,財經金融背景又是數據的行業背景。近年來,上海立信會計金融學院開設數據科學專業,正是在數字金融、人工智能背景下,將機器學習模型和金融數據結合起來,通過基礎課和專業課,培養學生具有理解模型、推理模型、數據建模以及行業應用能力。而“數據科學導論”正是這些專業課中的一門較為基礎,也是較為重要的課程,通過這門課主要闡述了一些數據科學領域的基本概念、基本原理和分析方法,為數據建模提供基礎知識、方法,是數據科學專業的一塊敲門磚,通過這門課,達到拋磚引玉的作用,為后續的專業課提供很好的引導和鋪墊作用,同時又與后續課程互相滲透、互相補充,成為必不可少的基礎課程。
“數據科學導論”作為數據科學專業較為基礎的課程,從以下四個方面開展了教學探索和實踐。
(一)課程目標
“數據科學導論”作為數據科學專業的基礎專業課,涉及數據科學的各個環節,因此該課程的主要目標是為數據科學專業提供一個入門導引的作用,通過這門課達到拋磚引玉的效果,使學生掌握數據科學的基本概念、方法,對數據科學描述一個體系和框架,因此該門課的設置尤其重要。“數據科學導論”起到提綱挈領的作用,在本課程中講解到的每一個知識點,均會在后續課程中展開詳細介紹。本課程的主要目的是希望學生通過本課程培養對專業體系的整體認識,對學科發展的脈絡有初步的把握和認知,掌握專業基礎知識,為后續課程陸續展開做好鋪墊。
(二)課程設置
數據科學研究數據科學的本源—數據的來源、采集、存儲、建模等各個環節,不同行業背景下,數據的來源不同,針對上海立信會計金融學院的財經金融特色,數據的專業來源將是金融財經方向的時序數據為主,針對數據的采集、存儲、建模等各個環節,分別介紹數據清洗、預處理等數據清洗內容,以及數據的存儲倉庫,數據的建模方法等,但是在數據建模方法前,將首先針對常用的數據建模方法和常用的數理統計背景進行介紹,以便學生更好理解數據建模的理論、方法等。
(三)課程實驗
針對課程實驗,本課程主要針對常用的數據清洗、數據存儲技術、數據分類和聚類模型展開實驗,并結合程序設計Python語言,實現數據的采集、清洗以及存儲和加載等目的,并實現模型的建模和優化,在課程實驗中,實驗過程中的數據是中小規模的,同時結合數據的規模和模型規模,具有一定大數據量,但是最重要的是培養學生對數據的采集、清洗、建模和優化分析流程。為后續大數據和機器學習等專業課程起到鋪路作用。
(四)課程案例
數據科學是一門實踐性很強的學科,同時也是針對數據進行抽象和建模的學科。本課程主要結合上海立信會計金融學院的財經金融背景方向,以量化交易為案例,以量化交易的數據為本源,分析數據的類型、數據的特征、數據建模的模型基礎、模型的優化以及模型在量化交易中的決策支持作用等,通過該案例將數據科學的各個環節在量化交易中的作用一一解釋,給予學生理論聯系實際的案例分析。
三、結語
針對國家對數據科學人才的迫切需求,本文根據我校數據科學專業及數據科學方向的教學實踐,探討了“數據科學導論”的課程體系建設以及教學模式,今后我們還將進一步針對該問題進行探討、總結和分析實踐經驗,構建更好更加科學的課程體系。
參考文獻
[1]歐高炎,朱占星,董彬,鄂維南.數據科學導引[M].北京:高等教育出版社,2017.
[2]覃雄派,陳躍國.數據科學概論[M].北京:中國人民大學出版社,2018.
[3]李航.統計學習方法[M].北京:清華大學出版社,2012.
[4]朝樂門.數據科學[M].北京:清華大學出版社,2016.