程實 周梓軒 王昭 吉凱熙
摘 要:數據人才需求日趨強烈,數據科學專業教育所培育的人才在數量上無法滿足社會需求。文章結合數據科學課程建設的必要性,依循國內外高校數據科學課程建設研究現狀,在總結并借鑒優秀經驗的基礎上,從課程目標確立、課程模塊設置、課程體系建設、課程制度建設等四個方面,探討了面向通識教育的數據科學課程建設路徑。
關鍵詞:通識教育; 數據科學課程; 課程體系; 課程探索
中圖分類號:G642.0? ? ? ?文獻標識碼:A? ? ? ? ?文章編號:1006-3315(2021)11-043-002
為了順應大數據時代的要求,國家出臺了《促進大數據發展行動綱要》,明確要求借助大數據全面助推國民經濟發展、改善社會治理模式、提升政府服務與監管職能。從2010年起,國內外高校紛紛開設數據科學專業與大數據學院,國內高等教育也從2016年起開始設置數據科學專業,以致力于培養具有專業素質的數據科學人才。然而,由于高校數據教育起步晚,數據科學通識性體現不足,專業教育培養對象多聚焦于研究生群體。可見,數據教育除了要設置專業教育,更要以通識教育為導向,全面推進跨學科、交叉學科及課程體系建設。
1.數據科學課程建設的必要性
1.1大數據產業高速發展的時代要求
現階段,大數據已然滲透到社會各領域、各行業,大數據產業的高速發展呼吁數據人才的培養,據不完全統計,2020年大數據領域人才需求缺口約150萬人,且需求缺口呈逐年遞增趨勢。因此,全面推動數據科學課程建設儼然成為大數據產業高速發展形勢下的現實所需、時代所迫。
1.2國家大數據戰略實施的應然選擇
2015年,為了應對大數據時代的深刻變革,十八屆五中全會明確提出全面推行“國家大數據戰略”,這標志著該戰略成功上升至國家戰略層面。為了配合該項戰略的順利實施,各大高校需要立足“人才強國”戰略視角,在提升數據人才培養意識的同時,注重推進數據科學課程建設,強化校企、校校之間的合作與聯盟,通過大數據競賽、合作辦學等多元途徑,推動數據教育資源共建共享。此外,數據科學教育不應局限于計算機或統計學等關聯專業,而要推進通識類數據科學課程建設,為國家大數據戰略及人才強國戰略的實施保駕護航[1]。
1.3當代大學生素質教育的必要支持
在實際工作領域,數據技術僅僅是解決問題的一種手段,真正發揮核心作用的是數據思維與創新能力。為了培育當代大學生的數據思維、創新能力等數據科學素質,還需借助數據科學通識教育強化各學科間交叉、融合與協作。
2.國內外數據科學課程研究現狀
大數據課程最早是從2011年起,在佛羅里達大學、哥倫比亞大學、加州大學伯克利分校等知名院校率先設置的。根據涉及“數據科學”或“Data Science”等字樣的課程群,可細化為三大類:其一,基于理論基礎的數據科學課程。此類課程多位于數據課程鏈的上游,鮮少涉及數據關聯知識,多為數據科學課程教學前的知識準備,如哥倫比亞大學設置的面向數據科學講授機器學習知識的《Machine Learning for Data Science》等。其二,基于基礎理論的數據科學課程。此類課程集數據科學理論、方法、技術、工具及應用于一體,在數據科學課程鏈中居于核心地位。如紐約大學設置的講授數據科學定義、方法及應用等基本問題的《Intro to Data Science》課程。其三,基于實踐應用的數據科學課程。此類課程居于數據課程鏈的下游,指向的是學科領域中數據科學的應用方法論、應用實踐等,如伯克利分校設置的關于數據科學在智慧城市領域應用的《Data Science for Smart Cities》等[2]。
從上述內容可知,國外知名高校數據科學課程建設較早,課程鏈劃分也相對成熟、富有層次性。與之相比,國內高校數據科學教育起步較晚,特別是通識教育、交叉學科發展方面毫無經驗,多數數據科學課程均面向的是專業教育。因此,有必要面向通識教育構建數據科學課程,以推進我國數據科學教育的發展。
3.面向通識教育的數據科學課程的建設路徑
3.1課程目標確立
通識類數據科學課程要結合高校辦學特色、不同專業特點,強化數據科學教育與專業教育的融合性、滲透性。一方面,課程目標要聚焦復合型人才培養,為了達到這一目標,課程整體顯示出選修課數量超出必修課的特點。其中,必修課集中在數據科學基礎理論層面,結合不同專業方向的選修課程,為各專業學生提供了充分的選擇范圍,學生可依循未來職業規劃選擇與自身職業發展最為契合的課程展開學習。選修課程多聚焦于數據分析、處理、挖掘、可視化等內容,以此培養出具備數據分析、計算機編程、數據可視化等綜合能力的復合型人才。另一方面,課程目標突出跨學科培養的實踐性。為了滿足專業要求,通識類數據科學課程目標多聚焦于跨學科、多元化教育理念要求,綜合全面介紹大數據背景下新的技術體系,還需結合數據科學實踐性強這一突出特點,設置實踐性課程及專業實驗室,并通過案例教學、項目驅動教學等方法,使學生在真實場景下利用大數據技術解決實際問題,通過實戰積累豐富的崗位經驗[3]。
3.2課程模塊設置
面向廣大大學生的通識類數據科學課程要著力培養學生“數據就是生產力”的意識,使之在專業領域大數據中自覺運用數據思維、技術、方法、工具挖掘價值。基于此,課程要面向數據科學工作流程進行知識模塊的設置,并借助前沿應用引入關聯學科最新成果,幫助學生在工作崗位中更好地開展實踐應用。課程模塊設置如下:其一,問題描述。數據科學的應用往往并非針對專業大數據“單刀直入”式的挖掘與分析,而是在面對專業問題、明確數據分析目標、方向及需求的基礎上展開的。因此,該模塊要引導學生發現業務問題,思考該問題涉及領域知識,分析其能否轉換為數據問題,以此培養學生數據思維與意識。其二,數據準備。該模塊重點培養學生數據獲取能力,依循問題需求,利用互聯網爬取、業務系統生成、設備記錄等方式獲取數據。再依循業務邏輯去除冗余、無效數據,填補缺失數據,最終獲取可供分析的標準化數據。其三,數據探索。該模塊利用統計學、圖形化方式考察數據,獲取數據統計學特征及數據關聯性,并在數據可視化的支持下提供數據概覽,探索有意義的模式。其四,預測建模。結合分析目標判斷問題類型,如分類預測、描述性或關聯性分析問題,結合問題類別選擇以統計學或機器學習等方式構建模型。其五,數據可視化。將分析結果采用報表、二維圖、信息圖等多元方式予以展示,培養學生“數據說話”能力及圖表表達能力。其六,數據解決方案。使學生自行闡釋結果,獲取數據解決方案,并在此基礎上考慮業務問題,提出有針對性的解決方案[4]。
3.3課程體系建設
通識類數據科學課程體系建設要圍繞國家戰略需求、行業發展趨勢及高校專業特點展開,在課程規劃設計中要夯實數學基礎,強化通識教育,加強理論學習與技術實踐,構建面向基礎、面向能力、面向領域的課程體系。其一,基礎課與通識課。由于數據科學的核心在于統計整合,因此,基礎類課程要覆蓋數學、統計相關課程,設置通識教育學分。其二,面向基礎的專業必修課。此類課程涉及兩大模塊,即統計分析模塊、系統與數據挖掘模塊,前者涉及統計學導論、統計建模、數據分析等課程;后者包括數據科學導論、大數據技術應用、大數據新技術專題等課程。其三,面向專業領域的專業選修課程。此類課程集中指向大數據技術在計算機、廣告、位置服務、智慧城市、社會計算等典型領域的應用,方便不同專業學生依循專業應用背景自由選擇選修課,獲取針對性的技術應用學習。其四,面向能力的實踐課程。數據科學課程實踐性極強,為了提高學生技能應用水平,要求高校針對不同專業設置不同層次的大數據實踐課程,設置一定的課內實踐學時,并依托虛擬仿真實驗教學平臺、計算機實驗教學中心等,為學生實踐課程提供良好的環境。其五,問題驅動的畢業設計。為了深化數據科學課程與專業課程的融合,提高學生綜合利用所學知識、獨立解決實際問題的能力,數據科學課程體系還需增設問題驅動的畢業設計內容,由責任導師負責審核畢業設計題目,并將審核合格的題目開放給學生,由學生自由選擇題目,運用數據思維、理論、方法、工具解決問題[5]。
3.4課程制度建設
面向通識教育的數據科學本科學制涉及全日制、非全日制兩種類型,高校可借鑒國內外高校優秀經驗及專業特點調整學位年限,效仿加州大學伯克利分校增設非全日制在線課程。針對數據科學專業的培養途徑,除了傳統學位教育,還要增加認證學習的人才培養方式,提供CAS數據科學高級研究認證,并將該認證作為學位課程的一部分。與此同時,高校除了要提供校內授課,還應積極探索在線網絡課程,利用遠程教育方式拓展數據科學教育機會及教學質量,確保課程制度的靈活性。除此以外,高校要構建課程考核機制,除了終結性考試以外,還要增加專業領域大數據技術實踐、大作業等考核形式,重點考察學生對數據科學知識的掌握程度、運用所學知識解決復雜問題的能力[6]。
基金項目:教育部協同育人項目(編號:202101189001)中國交通教育研究會 2020-2022年度交通教育科學研究課題(編號:JTYB20-42)
參考文獻:
[1]宋暉,劉曉強,杜明,王洪亞.大學計算機基礎類數據科學課程的探索與實踐[J]計算機教育,2019(09):88-91
[2]王國仁,金福生,劉馳,王樹良.面向國際化的數據科學與大數據專業課程體系建設[J]中國大學教學,2018(12):43-45+51
[3]覃雄派,陳躍國,李翠平,柴云鵬,徐君,文繼榮,杜小勇.“數據科學”課程群與“數據科學導論”課程建設初探[J]大數據,2018,4(06):19-28
[4]蘇日娜,楊沁.LIS學科中數據科學課程體系設置研究——以iSchools高校課程調研為中心[J]圖書館論壇,2019,39(04):40-49
[5]朝樂門,楊燦軍,王盛杰,趙俊鵬,許夢甜.全球數據科學課程建設現狀的實證分析[J]數據分析與知識發現,2017,1(06):12-21
[6]徐昊,秦玥,黃嵐.面向通識教育的數據科學課程建設[J]計算機教育,2016(08):158-162
第一作者簡介:程實,男,高級實驗師,碩士生導師,研究方向為智能計算、虛擬現實。通訊作者簡介:吉凱熙,男,講師,研究方向為新媒體研究。