周蕾 王留洋 洪龍


摘? ? 要:作為一個(gè)多學(xué)科交叉的新興學(xué)科,目前數(shù)據(jù)科學(xué)專業(yè)的人才培養(yǎng)和專業(yè)建設(shè)工作還在不斷的探索中。合格的數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生應(yīng)該擁有基本的專業(yè)特征和良好的數(shù)據(jù)敏銳能力。針對(duì)這個(gè)培養(yǎng)目標(biāo),文章設(shè)計(jì)了一個(gè)通用的基于數(shù)據(jù)敏銳的數(shù)據(jù)科學(xué)專業(yè)課程體系框架,框架以數(shù)據(jù)敏銳極小課程集來(lái)保證學(xué)生的專業(yè)特征,輔以數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域集合中的眾多課程、實(shí)踐課程以及其他領(lǐng)域知識(shí)課程。為更好地培養(yǎng)學(xué)生的數(shù)據(jù)敏銳能力,文章從課程實(shí)施角度探討了數(shù)據(jù)敏銳愿景下的數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)路徑,提出強(qiáng)化極小課程集中的課程教學(xué)來(lái)夯實(shí)專業(yè)基礎(chǔ),重視大數(shù)據(jù)實(shí)踐教學(xué),加強(qiáng)專業(yè)和不同領(lǐng)域不同學(xué)科之間的合作,以更好地滿足社會(huì)對(duì)數(shù)據(jù)科學(xué)人才的需求。
關(guān)鍵詞:數(shù)據(jù)科學(xué);數(shù)據(jù)敏銳;極小課程集;課程體系;強(qiáng)化教學(xué)
中圖分類號(hào):G642? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? 文章編號(hào):1002-4107(2024)02-0046-04
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,社交網(wǎng)絡(luò)、電子商務(wù)等各種應(yīng)用的普及,數(shù)據(jù)以前所未有的速度增長(zhǎng),各行各業(yè)都迫切需要數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)管理和決策等各類數(shù)據(jù)人才。在此背景下,全球各大高校紛紛開(kāi)設(shè)數(shù)據(jù)科學(xué)相關(guān)專業(yè),包括密歇根大學(xué)、史密斯學(xué)院、墨爾本大學(xué)、愛(ài)丁堡大學(xué)等眾多名校。我國(guó)最早在2016年開(kāi)設(shè)大數(shù)據(jù)專業(yè),截至到2022年,中國(guó)教育部批準(zhǔn)設(shè)立“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”和“大數(shù)據(jù)管理與應(yīng)用”這兩個(gè)本科專業(yè)的高等學(xué)校分別達(dá)到679所和141所。
對(duì)學(xué)校而言,開(kāi)設(shè)數(shù)據(jù)科學(xué)專業(yè)首先需要制定這個(gè)新專業(yè)的人才培養(yǎng)目標(biāo)和教學(xué)方案,以“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)為例,不同的高校人才培養(yǎng)目標(biāo)和定位不同,相應(yīng)的人才培養(yǎng)方案也有很大的區(qū)別。美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)對(duì)此給出了建議[1],它認(rèn)為數(shù)據(jù)科學(xué)與大數(shù)據(jù)分析緊密關(guān)聯(lián),是統(tǒng)計(jì)、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)超級(jí)集合,其中數(shù)據(jù)挖掘不僅需要數(shù)學(xué)和統(tǒng)計(jì)技能,還需要對(duì)相關(guān)領(lǐng)域知識(shí)的理解。作為一個(gè)多學(xué)科交叉的專業(yè),在培養(yǎng)專業(yè)人才的過(guò)程中,如何更好地體現(xiàn)專業(yè)特征,應(yīng)根據(jù)不同培養(yǎng)目標(biāo)構(gòu)建更科學(xué)且切實(shí)可行的人才培養(yǎng)方案。國(guó)內(nèi)外很多學(xué)者對(duì)此進(jìn)行了深入的研究。EDISON數(shù)據(jù)科學(xué)框架對(duì)NIST提出的數(shù)據(jù)科學(xué)能力進(jìn)行了擴(kuò)展,將數(shù)據(jù)科學(xué)能力(CF-DS)分為5種,每個(gè)能力有與之配套的知識(shí)體系和模型課程,用于指導(dǎo)數(shù)據(jù)科學(xué)專業(yè)教育和培養(yǎng)框架設(shè)計(jì)[2-3]。LI XIN等針對(duì)應(yīng)用型大學(xué)數(shù)據(jù)科學(xué)專業(yè)本科學(xué)生的培養(yǎng)目標(biāo)設(shè)計(jì)了人才培養(yǎng)方案[4]。王國(guó)仁等提出面向基礎(chǔ)、面向能力、面向領(lǐng)域、問(wèn)題驅(qū)動(dòng)、國(guó)際化的大數(shù)據(jù)專業(yè)課程體系[5]。朝樂(lè)門等從特色課程的視角提出了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)這一新專業(yè)應(yīng)重視的10門特色課程[6]。石兵等以培養(yǎng)具有行業(yè)特色和可持續(xù)競(jìng)爭(zhēng)力的大數(shù)據(jù)卓越人才為建設(shè)目標(biāo),提出構(gòu)建多層次、多類型、健全的卓越人才培養(yǎng)體系[7]。
雖然眾多文獻(xiàn)對(duì)大數(shù)據(jù)人才培養(yǎng)和專業(yè)建設(shè)進(jìn)行了研究和實(shí)踐,但從課程框架設(shè)計(jì)角度研究數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)路徑的文獻(xiàn)相對(duì)比較少。本文將從數(shù)據(jù)科學(xué)專業(yè)學(xué)生數(shù)據(jù)敏銳能力培養(yǎng)角度,來(lái)探討通用的數(shù)據(jù)科學(xué)專業(yè)課程框架設(shè)計(jì)和培養(yǎng)路徑。
一、數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域與數(shù)據(jù)敏銳
美國(guó)國(guó)家科學(xué)院在一份數(shù)據(jù)科學(xué)本科教育的研究報(bào)告將數(shù)學(xué)基礎(chǔ)、計(jì)算基礎(chǔ)、統(tǒng)計(jì)基礎(chǔ)、數(shù)據(jù)管理和處理、數(shù)據(jù)可視化等納入數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域[8],指出數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生必須擁有一定的數(shù)據(jù)敏銳能力。基于此,我們提出數(shù)據(jù)科學(xué)關(guān)鍵概念領(lǐng)域的集合DASKCA(Data Science’s Key Concept Areas)和數(shù)據(jù)敏銳+集合DACUP(Data Acumen Plus),其中DASKCA={數(shù)學(xué)基礎(chǔ),統(tǒng)計(jì)基礎(chǔ),計(jì)算基礎(chǔ),數(shù)據(jù)知識(shí)與技術(shù)},用于表示數(shù)據(jù)科學(xué)的專業(yè)特征,DACUP={獲取數(shù)據(jù)的能力,理解數(shù)據(jù)的能力,數(shù)據(jù)組織和管理能力,數(shù)據(jù)分析能力,基于數(shù)據(jù)做出判斷和決策的能力}[9]。合格的數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生應(yīng)該擁有DACUP中表述的能力。
盡管各個(gè)大學(xué)設(shè)置的課程不盡相同,但培養(yǎng)數(shù)據(jù)敏銳必然包含一些最基本的、不可或缺的課程,這些課程構(gòu)成了數(shù)據(jù)科學(xué)專業(yè)的極小課程集。為了從DASKCA中析出極小課程集,使其可以支撐學(xué)生專業(yè)能力的培養(yǎng),需要分析DACUP中的數(shù)據(jù)敏銳能力與DASKCA中各個(gè)關(guān)鍵概念領(lǐng)域元素之間的支撐關(guān)系,最終確定相關(guān)概念領(lǐng)域的課程,實(shí)現(xiàn)對(duì)能力培養(yǎng)的支撐。
下面將根據(jù)DACUP中定義的每種數(shù)據(jù)敏銳能力要求,在DASKCA中確定可以支撐的關(guān)鍵概念領(lǐng)域和相關(guān)的課程集。
1.與獲取數(shù)據(jù)相關(guān)的課程。數(shù)據(jù)是數(shù)據(jù)科學(xué)的靈魂,是一切操作的基礎(chǔ),高質(zhì)量數(shù)據(jù)的生成有助于提高處理效率和結(jié)果的正確性。大數(shù)據(jù)采集主要包括系統(tǒng)日志采集、網(wǎng)絡(luò)數(shù)據(jù)采集以及特定接口數(shù)據(jù)采集等,通過(guò)分布式日志收集系統(tǒng)或網(wǎng)絡(luò)爬蟲技術(shù),可以從系統(tǒng)日志或網(wǎng)站上抓取需要的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換等預(yù)處理,為后續(xù)數(shù)據(jù)分析提供真實(shí)完整可靠的數(shù)據(jù)。培養(yǎng)學(xué)生獲取高質(zhì)量數(shù)據(jù)能力的主要課程包括在DASKCA的“數(shù)據(jù)知識(shí)與技術(shù)”“計(jì)算基礎(chǔ)”和其他領(lǐng)域知識(shí)之中。具體課程包括系統(tǒng)日志采集、流數(shù)據(jù)采集、網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)清洗以及數(shù)據(jù)轉(zhuǎn)換等。
2.與數(shù)據(jù)組織和管理相關(guān)的課程。采集處理后的數(shù)據(jù)一般都是以數(shù)據(jù)庫(kù)方式保存在計(jì)算機(jī)中,可能是本地?cái)?shù)據(jù)庫(kù),也可能是分布式數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)可以是傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù),也可以是新型的NoSQL數(shù)據(jù)庫(kù)。根據(jù)不同的應(yīng)用場(chǎng)景和需求,可能對(duì)數(shù)據(jù)進(jìn)行傳統(tǒng)的OLTP
(On-Line Transaction Processing)處理,也可能需要利用ETL(Extract-Transform-Load)工具對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行操作,完成更高層次的OLAP(On-Line Analytic Processing)操作。為了培養(yǎng)學(xué)生組織和管理數(shù)據(jù)的能力,需要DASKCA集合中的“數(shù)據(jù)知識(shí)與技術(shù)”和其他領(lǐng)域的知識(shí),可能涉及的課程包括數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)存儲(chǔ)與檢索、高級(jí)數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、海量數(shù)據(jù)存儲(chǔ)、可擴(kuò)展的數(shù)據(jù)系統(tǒng)、Hive等。
3.與數(shù)據(jù)分析相關(guān)的課程。對(duì)數(shù)據(jù)進(jìn)行分析以獲得知識(shí)是數(shù)據(jù)的價(jià)值所在。統(tǒng)計(jì)學(xué)是對(duì)大數(shù)據(jù)進(jìn)行搜索、比較、歸納等方面的應(yīng)用基礎(chǔ),利用各類統(tǒng)計(jì)分析模型分析數(shù)據(jù),得到具有說(shuō)服力的結(jié)論。數(shù)據(jù)知識(shí)與技術(shù)中的統(tǒng)計(jì)分析工具對(duì)高效率的完成數(shù)據(jù)分析提供了幫助,學(xué)生需要熟練掌握。在數(shù)據(jù)分析中,包含于計(jì)算基礎(chǔ)的人工智能,特別是機(jī)器學(xué)習(xí)相關(guān)算法,已成為判斷、決策和從大數(shù)據(jù)中挖掘有價(jià)值模式的主要工具,可見(jiàn)計(jì)算技術(shù)在數(shù)據(jù)分析的過(guò)程中發(fā)揮了非常重要的工具作用。另外,由于處理數(shù)據(jù)時(shí)往往計(jì)算量巨大,傳統(tǒng)串行算法已難以滿足操作的性能要求,因此需要高性能的云計(jì)算和并行處理技術(shù)。這些技術(shù)涉及到統(tǒng)計(jì)基礎(chǔ)、計(jì)算基礎(chǔ)、數(shù)據(jù)知識(shí)與技術(shù)和其他領(lǐng)域的知識(shí),可能涉及的課程包括程序設(shè)計(jì)語(yǔ)言、數(shù)據(jù)結(jié)構(gòu)、機(jī)器學(xué)習(xí)、人工智能、分布式處理與并行計(jì)算、大數(shù)據(jù)分析、R語(yǔ)言、數(shù)據(jù)可視化、概率論與數(shù)理統(tǒng)計(jì)以及應(yīng)用多元統(tǒng)計(jì)分析等。
4.與判斷和決策相關(guān)的課程。擁有較強(qiáng)的數(shù)據(jù)判斷和決策能力對(duì)數(shù)據(jù)科學(xué)專業(yè)人才的培養(yǎng)至關(guān)重要,集合DASKCA中的數(shù)學(xué)基礎(chǔ)和統(tǒng)計(jì)基礎(chǔ)可使學(xué)生能應(yīng)用推理、建模和數(shù)據(jù)分析等基本概念檢驗(yàn)假設(shè),了解隨機(jī)試驗(yàn)和非隨機(jī)研究的方法,建立和評(píng)估數(shù)據(jù)模型,從大量紛繁復(fù)雜的數(shù)據(jù)中找出規(guī)律,給出決策建議,提升決策者的效率和水平。可能涉及的相關(guān)課程包括高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)、數(shù)學(xué)建模、優(yōu)化算法、統(tǒng)計(jì)學(xué)、統(tǒng)計(jì)推理與建模等。
5.與理解數(shù)據(jù)相關(guān)的課程。大數(shù)據(jù)來(lái)源復(fù)雜多樣,如何正確理解來(lái)自不同行業(yè)領(lǐng)域和不同類型的數(shù)據(jù)?數(shù)據(jù)科學(xué)畢業(yè)生在處理和分析不同領(lǐng)域大數(shù)據(jù)時(shí)需要具備行業(yè)相關(guān)的背景知識(shí)。數(shù)據(jù)的歸屬和使用有什么約束?虛假的數(shù)據(jù)會(huì)給人類社會(huì)帶來(lái)什么樣的危害?如何確保數(shù)據(jù)安全,保護(hù)用戶隱私?數(shù)據(jù)科學(xué)專業(yè)的畢業(yè)生應(yīng)具備與數(shù)據(jù)相關(guān)的法律、道德、經(jīng)濟(jì)、哲學(xué)等方面的深刻認(rèn)知,具備大數(shù)據(jù)時(shí)代基本的數(shù)據(jù)倫理、數(shù)據(jù)素養(yǎng)和社會(huì)責(zé)任感,必須認(rèn)識(shí)到數(shù)據(jù)歸屬、隱私、安全等的重要性和對(duì)其不重視可能帶來(lái)的嚴(yán)重后果,比如為了從數(shù)據(jù)分析中得到正確的結(jié)果或有效的結(jié)論,必須采用真實(shí)數(shù)據(jù),故意采用假數(shù)據(jù)是不可原諒的道德問(wèn)題;數(shù)據(jù)隱私、數(shù)據(jù)安全涉及法律,這些應(yīng)是數(shù)據(jù)科學(xué)專業(yè)畢業(yè)生謹(jǐn)記的底線。需要特別說(shuō)明的是,DASKCA集合中并沒(méi)有這部分能力直接對(duì)應(yīng)的關(guān)鍵概念領(lǐng)域,其培養(yǎng)是貫穿在其他能力培養(yǎng)的學(xué)習(xí)和活動(dòng)中,數(shù)據(jù)的獲取、存儲(chǔ)、組織管理和分析、建模等,每一個(gè)環(huán)節(jié)無(wú)不要求學(xué)生正確理解數(shù)據(jù),恪守?cái)?shù)據(jù)操作規(guī)范和職業(yè)道德約束。理解數(shù)據(jù)的能力培養(yǎng)需要相關(guān)的領(lǐng)域知識(shí)和數(shù)據(jù)倫理、職業(yè)道德規(guī)范等課程的支持。可能涉及的課程包括數(shù)據(jù)科學(xué)道德、大數(shù)據(jù)中的人與價(jià)值、數(shù)據(jù)倫理與隱私以及大數(shù)據(jù)應(yīng)用的相關(guān)領(lǐng)域知識(shí)等。
綜上,數(shù)據(jù)敏銳能力DACUP的能力培養(yǎng)必須有DASKCA中相關(guān)課程和活動(dòng)的支撐,與此同時(shí),還需要行業(yè)領(lǐng)域知識(shí)、職業(yè)道德規(guī)范等其他領(lǐng)域知識(shí)的支持。
二、數(shù)據(jù)敏銳極小課程集
數(shù)據(jù)科學(xué)專業(yè)課程涉及數(shù)學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等多個(gè)知識(shí)領(lǐng)域,盡管各個(gè)大學(xué)設(shè)置的課程不盡相同,但培養(yǎng)數(shù)據(jù)敏銳必然包含一些最基本的、不可或缺的課程,這些課程構(gòu)成了數(shù)據(jù)科學(xué)專業(yè)的極小課程集。基于極小課程集的特性,我們構(gòu)建的數(shù)據(jù)敏銳極小課程集由7門課程組成,具體課程及其目標(biāo)如下。
1.“數(shù)理邏輯”。邏輯學(xué)是研究推理的學(xué)問(wèn),判斷與決策離不開(kāi)推理。其課程目標(biāo)是培養(yǎng)學(xué)生的思維能力,也為學(xué)習(xí)有關(guān)計(jì)算、數(shù)據(jù)的課程打下基礎(chǔ)。
2.“統(tǒng)計(jì)學(xué)”。根據(jù)第四范式,統(tǒng)計(jì)方法是處理大數(shù)據(jù)的基本手段。該課程目標(biāo)是使學(xué)生理解其基本理論,掌握基本方法,為數(shù)據(jù)分析技術(shù)的學(xué)習(xí)建立基礎(chǔ)。
3.“程序設(shè)計(jì)與數(shù)據(jù)結(jié)構(gòu)”和“計(jì)算機(jī)原理與應(yīng)用技術(shù)”。處理數(shù)據(jù)離不開(kāi)計(jì)算機(jī)和程序。前者的課程目標(biāo)是使學(xué)生能熟練地掌握一種高級(jí)語(yǔ)言,并能建立適當(dāng)?shù)乃惴ㄋ枷搿:笳叩恼n程目標(biāo)是使學(xué)生具有概念性的計(jì)算機(jī)基本知識(shí),并了解基于網(wǎng)絡(luò)的計(jì)算機(jī)應(yīng)用。這里強(qiáng)調(diào),教學(xué)內(nèi)容應(yīng)符合“數(shù)據(jù)科學(xué)”專業(yè)的特征,避開(kāi)專業(yè)所不需要的、復(fù)雜的硬件。
4.“數(shù)據(jù)科學(xué)導(dǎo)引”。該課程向?qū)W生講解什么是數(shù)據(jù)以及處理數(shù)據(jù)的基本理論和方法,其課程目標(biāo)是使學(xué)生對(duì)數(shù)據(jù)科學(xué)有較全面的了解,并引發(fā)學(xué)生的專業(yè)興趣。
5.“數(shù)據(jù)庫(kù)技術(shù)”和“數(shù)據(jù)挖掘”。“數(shù)據(jù)庫(kù)技術(shù)”是傳統(tǒng)課程,課程目標(biāo)是使學(xué)生具有應(yīng)用數(shù)據(jù)庫(kù)的基本技能,并了解現(xiàn)代數(shù)據(jù)庫(kù)技術(shù)的內(nèi)容。“數(shù)據(jù)挖掘”介紹從數(shù)據(jù)中尋找有效模式的理論與技術(shù),課程目標(biāo)是使學(xué)生理解、掌握分析數(shù)據(jù)的基本方法。
極小課程集中的課程是各關(guān)鍵概念領(lǐng)域的基礎(chǔ)課程和必修課程,以確保數(shù)據(jù)科學(xué)專業(yè)學(xué)生必須擁有的基本專業(yè)特征。
三、基于數(shù)據(jù)敏銳的課程體系設(shè)計(jì)
極小課程集為學(xué)生數(shù)據(jù)敏銳基本能力的培養(yǎng)奠定了基礎(chǔ),將這種能力提升為具有數(shù)據(jù)敏銳競(jìng)爭(zhēng)力的能力,還需要DASKCA中的眾多專業(yè)課程、其他領(lǐng)域的課程以及實(shí)踐課程的支持。按照課程的先后關(guān)系以及可能的培養(yǎng)路徑,設(shè)計(jì)基于數(shù)據(jù)敏銳能力培養(yǎng)的數(shù)據(jù)科學(xué)專業(yè)課程體系,如圖1所示。
圖1中最底層的“數(shù)據(jù)科學(xué)”表示專業(yè)的名稱而不是課程,最右邊虛線橢圓框中的數(shù)學(xué)基礎(chǔ)類課程代指左側(cè)的高等數(shù)學(xué)、線性代數(shù)等課程以簡(jiǎn)化設(shè)計(jì)。圖中的每個(gè)節(jié)點(diǎn)(子節(jié)點(diǎn))都得到位于其下節(jié)點(diǎn)(父節(jié)點(diǎn))的支撐,即子節(jié)點(diǎn)是父節(jié)點(diǎn)的應(yīng)用,父節(jié)點(diǎn)是子節(jié)點(diǎn)的基礎(chǔ);實(shí)線方框表示的節(jié)點(diǎn)均為極小課程集中的課程,是規(guī)定的必修課;實(shí)線橢圓框表示專業(yè)自選課程;虛線方框表示綜合實(shí)驗(yàn)課程,它們結(jié)合行業(yè)課程開(kāi)設(shè);點(diǎn)線方框表示實(shí)訓(xùn)課程和實(shí)習(xí)課程,這些課程應(yīng)有企業(yè)教師參與。在完成一門課程的學(xué)習(xí)后,學(xué)生可以根據(jù)興趣上下求索,從該節(jié)點(diǎn)向上選擇應(yīng)用型課程,或向下選擇基礎(chǔ)型課程。
圖1給出的是一個(gè)通用的數(shù)據(jù)科學(xué)專業(yè)課程體系框架,各個(gè)學(xué)校可以在極小課程集的課程基礎(chǔ)上,根據(jù)自己的人才培養(yǎng)目標(biāo),自由選擇不同的課程以構(gòu)建體現(xiàn)學(xué)校自身特色的人才培養(yǎng)方案。由于極小課程集中的課程是必不可少的,所以以此為基礎(chǔ)構(gòu)建的課程體系可以保證學(xué)生擁有基本的專業(yè)特征和數(shù)據(jù)敏銳能力。依據(jù)課程關(guān)系圖,學(xué)生能憑興趣和發(fā)展意愿自主選課。他們既可以由淺入深,逐步提高;又可以自上往下,追蹤溯源;還可以縱橫交叉,廣識(shí)博學(xué),在知識(shí)海洋中自由遨游。例如,受極小課程集中“數(shù)據(jù)庫(kù)技術(shù)”的啟發(fā),如果某學(xué)生希望了解鐵路訂票、衛(wèi)星導(dǎo)航是如何實(shí)現(xiàn)的,那么他就可以選修含有“分布式數(shù)據(jù)庫(kù)”和“空間數(shù)據(jù)庫(kù)內(nèi)容”的“高級(jí)數(shù)據(jù)庫(kù)技術(shù)”。在相關(guān)課程的誘導(dǎo)下,他有可能逐步釋放數(shù)據(jù)工程師的潛質(zhì);如果某學(xué)生對(duì)數(shù)據(jù)庫(kù)中有關(guān)“關(guān)系”的理論感興趣,那么他可以選修“集合論”,并根據(jù)興趣由此向上選修數(shù)學(xué)類課程和統(tǒng)計(jì)學(xué)類課程,向著數(shù)據(jù)科學(xué)家的理想邁進(jìn)。
需要特別注意的是,由于數(shù)據(jù)科學(xué)是一個(gè)新專業(yè),課程的設(shè)置正在探索中,隨著技術(shù)的發(fā)展,課程體系中的很多課程也需要與時(shí)俱進(jìn)。此外,也許有些較重要的課程未列入本文,特別是課程體系中極可能缺少未來(lái)研究生入學(xué)應(yīng)考的未知課程,因?yàn)槲覈?guó)目前還沒(méi)有在“數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)”專業(yè)招收研究生,但這些問(wèn)題都可以通過(guò)后期課程的調(diào)整或增設(shè)來(lái)解決。
四、數(shù)據(jù)敏銳能力培養(yǎng)的基本路徑
數(shù)據(jù)科學(xué)專業(yè)課程體系給出了專業(yè)完整的課程框架,在實(shí)施過(guò)程中如何保證學(xué)生基本的數(shù)據(jù)科學(xué)專業(yè)特征,如何更好地培養(yǎng)學(xué)生的數(shù)據(jù)敏銳能力,使其較好地滿足社會(huì)對(duì)數(shù)據(jù)科學(xué)人才的需求?本文從課程實(shí)施角度給出幾條基本的培養(yǎng)路徑。
(一)強(qiáng)化極小課程集課程的教學(xué),保證扎實(shí)的專業(yè)基礎(chǔ)
雖然數(shù)據(jù)敏銳極小課程集的教學(xué)內(nèi)容保證了學(xué)生的基本專業(yè)特征,但只有使學(xué)生充分掌握它們才可能使這些內(nèi)容轉(zhuǎn)化為他們的能力,如何順利地實(shí)現(xiàn)這種轉(zhuǎn)化呢?
采用強(qiáng)化教學(xué)實(shí)現(xiàn)這種轉(zhuǎn)化。所謂強(qiáng)化教學(xué)就是對(duì)基礎(chǔ)課程和核心課程給予更充足的學(xué)時(shí)[10],通過(guò)細(xì)致、系統(tǒng)地講授課程的主體內(nèi)容,使學(xué)生較好地掌握理論,為后續(xù)課程和實(shí)踐打下堅(jiān)實(shí)的基礎(chǔ)。基于此,筆者建議極小課程集中課程的學(xué)時(shí)如表1所示。
在計(jì)算機(jī)專業(yè)中,“程序設(shè)計(jì)”和“數(shù)據(jù)結(jié)構(gòu)”是兩門課程,一般需要120學(xué)時(shí)。在數(shù)據(jù)科學(xué)專業(yè)課程體系中將他們合并為“程序設(shè)計(jì)與數(shù)據(jù)結(jié)構(gòu)”一門課程,并
分配充足的學(xué)時(shí),為后續(xù)課程的學(xué)習(xí)及應(yīng)用打下扎實(shí)的基礎(chǔ)。這里“程序設(shè)計(jì)與數(shù)據(jù)結(jié)構(gòu)”課程中的計(jì)算機(jī)語(yǔ)言建議采用C或C++。作為程序設(shè)計(jì)語(yǔ)言的基礎(chǔ),如果學(xué)生能很好地掌握這門語(yǔ)言,那么后續(xù)其他程序設(shè)計(jì)語(yǔ)言的學(xué)習(xí),比如數(shù)據(jù)科學(xué)領(lǐng)域廣泛使用的Python、R語(yǔ)言等,學(xué)生完全可以通過(guò)自學(xué)很好地掌握,所以在圖1所示的課程體系中未專門列出具體的程序設(shè)計(jì)語(yǔ)言課程。
此外,在計(jì)算機(jī)專業(yè)中計(jì)算機(jī)原理主要由“計(jì)算機(jī)組成”和“操作系統(tǒng)”兩門課組成,每門課一般是56學(xué)時(shí)。與其相比,表1中的“計(jì)算機(jī)原理與應(yīng)用技術(shù)”課時(shí)則相對(duì)較少,該課程只包含上述兩門課程的基本內(nèi)容和相關(guān)的應(yīng)用,以使學(xué)生了解計(jì)算機(jī)的基本原理,且避免不必要的硬件知識(shí)和系統(tǒng)軟件的細(xì)節(jié)。
通過(guò)強(qiáng)化極小課程集中課程的教學(xué),讓學(xué)生有足夠的學(xué)習(xí)和實(shí)踐時(shí)間,確保數(shù)據(jù)科學(xué)專業(yè)學(xué)生具有基本的專業(yè)特征,可以讓學(xué)生未來(lái)有更多選擇的可能,在專業(yè)的道路上按照自身的發(fā)展愿望走得更好更遠(yuǎn)。
(二)建設(shè)大數(shù)據(jù)實(shí)訓(xùn)平臺(tái),強(qiáng)化課程實(shí)踐教學(xué)
數(shù)據(jù)科學(xué)是一個(gè)實(shí)踐性要求很強(qiáng)的專業(yè),雖然不同高校數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)的層次各不相同,所有大數(shù)據(jù)人才都必須重視實(shí)踐和應(yīng)用能力的培養(yǎng),因此數(shù)據(jù)科學(xué)課程的開(kāi)設(shè)也需要采用新的模式,即理論課和實(shí)踐課相結(jié)合的模式,加大課程實(shí)踐環(huán)節(jié)的建設(shè)力度。
實(shí)踐課程包含課程實(shí)驗(yàn)和綜合實(shí)驗(yàn)。課程實(shí)驗(yàn)是使學(xué)生深刻理解已學(xué)課程的理論,并提高技能的手段之一。數(shù)據(jù)敏銳極小課程集中的“統(tǒng)計(jì)學(xué)”“程序設(shè)計(jì)與數(shù)據(jù)結(jié)構(gòu)”“數(shù)據(jù)庫(kù)技術(shù)”和“數(shù)據(jù)挖掘”等課程都安排了實(shí)驗(yàn),并對(duì)需要較高技能的課程安排了較多的實(shí)驗(yàn)學(xué)時(shí)。除此之外,對(duì)DASKCA中能進(jìn)行實(shí)驗(yàn)的其他課程也安排一定的實(shí)驗(yàn)。綜合實(shí)驗(yàn)是培養(yǎng)學(xué)生數(shù)據(jù)敏銳能力的重要組成部分,它讓學(xué)生有機(jī)會(huì)親身體驗(yàn)數(shù)據(jù)的獲取、處理、分析以及可視化全過(guò)程,以達(dá)到融會(huì)貫通多門課程的內(nèi)容、提高綜合技能的效果。例如,“大數(shù)據(jù)技術(shù)的并行程序設(shè)計(jì)”實(shí)驗(yàn)課程能使學(xué)生在具有刀片、GPU等設(shè)備的云環(huán)境平臺(tái)下,以多維視野綜合理解、應(yīng)用“數(shù)據(jù)挖掘”“分布式處理與并行計(jì)算”“Intel多核程序設(shè)計(jì)”“Hadoop編程”和行業(yè)課程集中的課程等內(nèi)容。
大數(shù)據(jù)相關(guān)的實(shí)踐教學(xué)需要環(huán)境和工具的支持,數(shù)據(jù)科學(xué)專業(yè)必須完成大數(shù)據(jù)實(shí)訓(xùn)平臺(tái)的建設(shè),課程教學(xué)可以在有限的學(xué)時(shí)中,依托大數(shù)據(jù)實(shí)訓(xùn)平臺(tái),以數(shù)據(jù)為基礎(chǔ),理論聯(lián)系實(shí)際,通過(guò)大數(shù)據(jù)行業(yè)應(yīng)用的實(shí)際案例強(qiáng)化學(xué)生對(duì)知識(shí)的理解和應(yīng)用,提高數(shù)據(jù)敏銳能力。
(三)針對(duì)行業(yè)需求,加強(qiáng)專業(yè)和不同領(lǐng)域不同學(xué)科之間的合作
產(chǎn)業(yè)界匯聚了最新的技術(shù)和大量的行業(yè)數(shù)據(jù)。和其他專業(yè)培養(yǎng)相比,數(shù)據(jù)科學(xué)專業(yè)尤其需要開(kāi)展和不同行業(yè)的合作,依托企業(yè)平臺(tái)和資源,由教師聯(lián)合企業(yè)經(jīng)驗(yàn)豐富的工程師,從大量實(shí)踐案例出發(fā),結(jié)合企業(yè)實(shí)際需求,帶領(lǐng)學(xué)生開(kāi)展課程教學(xué),讓學(xué)生熟悉企業(yè)需求,了解相關(guān)行業(yè)領(lǐng)域知識(shí),在項(xiàng)目的實(shí)踐和討論中不斷積累經(jīng)驗(yàn)。良好的實(shí)踐訓(xùn)練不但可以使學(xué)生產(chǎn)生職業(yè)榮譽(yù)感和社會(huì)責(zé)任感,還能使他們?cè)鰪?qiáng)團(tuán)隊(duì)合作意識(shí)和專業(yè)自信。
在基于數(shù)據(jù)敏銳的課程框架設(shè)計(jì)中,建議高校加強(qiáng)與地方有大數(shù)據(jù)應(yīng)用需求的行業(yè)合作,開(kāi)發(fā)面向具體行業(yè)應(yīng)用的大數(shù)據(jù)實(shí)踐課程,給學(xué)生提供真實(shí)的大數(shù)據(jù)實(shí)踐環(huán)境,提高學(xué)生解決實(shí)際問(wèn)題的能力。結(jié)合自己學(xué)校的優(yōu)勢(shì)學(xué)科設(shè)置跨專業(yè)課程是一種睿智的做法,不僅利于培養(yǎng)學(xué)生解決實(shí)際問(wèn)題的能力,還可以推進(jìn)跨學(xué)科研究的發(fā)展。例如,斯坦福大學(xué)結(jié)合自己在醫(yī)學(xué)、生物學(xué)和商務(wù)智能上的優(yōu)勢(shì),開(kāi)設(shè)了“數(shù)據(jù)驅(qū)動(dòng)型醫(yī)
學(xué)”“基于大數(shù)據(jù)的商務(wù)智能”等課程。作為多學(xué)科交叉專業(yè),數(shù)據(jù)科學(xué)很多專業(yè)課程需要和其他學(xué)科聯(lián)合開(kāi)設(shè),加強(qiáng)不同學(xué)科之間的合作也同樣重要。
五、結(jié)語(yǔ)
數(shù)據(jù)科學(xué)專業(yè)領(lǐng)域涉及數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)以及行業(yè)領(lǐng)域等多學(xué)科的知識(shí),如何培養(yǎng)具有基本專業(yè)特征和數(shù)據(jù)敏銳能力的合格的數(shù)據(jù)科學(xué)人才?本文在分析數(shù)據(jù)科學(xué)專業(yè)各個(gè)關(guān)鍵概念領(lǐng)域知識(shí)與數(shù)據(jù)敏銳能力培養(yǎng)之間的支撐關(guān)系后,設(shè)計(jì)了數(shù)據(jù)科學(xué)專業(yè)的極小課程集,以保證學(xué)生具有基本的數(shù)據(jù)科學(xué)專業(yè)特征,并在此基礎(chǔ)上,設(shè)計(jì)了一個(gè)基于數(shù)據(jù)敏銳愿景的數(shù)據(jù)科學(xué)專業(yè)課程體系框架,為各個(gè)學(xué)校構(gòu)建體現(xiàn)學(xué)校自身特色的人才培養(yǎng)方案提供了指導(dǎo)。為更好地培養(yǎng)學(xué)生的數(shù)據(jù)敏銳能力,本文從課程實(shí)施角度提出了三條有效的培養(yǎng)路徑,通過(guò)強(qiáng)化極小課程集中的課程教學(xué)來(lái)夯實(shí)專業(yè)基礎(chǔ)、建設(shè)大數(shù)據(jù)實(shí)訓(xùn)平臺(tái)來(lái)強(qiáng)化實(shí)踐教學(xué)以及加強(qiáng)與不同行業(yè)不同學(xué)科之間的合作來(lái)培養(yǎng)學(xué)生行業(yè)領(lǐng)域應(yīng)用能力,以更好地滿足社會(huì)對(duì)數(shù)據(jù)科學(xué)人才的需求。
參考文獻(xiàn):
[1]? NIST SP 1500-1.NIST Big Data Interoperability Frame-work:Volume 1,Definitions[EB/OL].(2015-09-16)[2022-01-05].https://nvlpubs.nist.gov/nistpubs/SpecialPublica?tions/NIST.SP.1500-1.pdf.
[2]? WIKTORSKI? T,DEMCHENK? Y,BELLOUM? A.Model?Curricula for Data Science EDISON Data Science Frame-work[C]//2017 IEEE International Conference on CloudComputing Technology and Science(CloudCom).IEEE,2017:369-374.
[3]? DEMCHENKO? Y,BELLOUM? A,LOS W,et al.EDISONData Science Framework:A Foundation for Building DataScience Profession for Research and Industry[C]//2016IEEE International Conference on Cloud Computing Te-chnology and Science(CloudCom).IEEE,2016:620-626.
[4]? LIXIN,F(xiàn)ANXIAOPING,QUXILONG,et al. CurriculumReform in Big Data Education at Applied Technical Dollegesand Universities in China[J].IEEE Access,2019(7).
[5]? 王國(guó)仁,金福生,劉馳,等.面向國(guó)際化的數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)課程體系建設(shè)[J].中國(guó)大學(xué)教學(xué),2018(12).
[6]? 朝樂(lè)門,邢春曉,王雨晴.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)特色課程研究[J].計(jì)算機(jī)科學(xué),2018(3).
[7]? 石兵,熊盛武,饒文碧,等.數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)建設(shè)研究與實(shí)踐[J].計(jì)算機(jī)教育,2021(4).
[8]? National Academies of Sciences,Engineering,and Medicine.Data Science for Undergraduates:Opportunities and Options[M].Washington,DC:National Academies Press,2018:22.
[9]? 周蕾,王留洋,洪龍.數(shù)據(jù)敏銳愿景下的數(shù)據(jù)科學(xué)課程框架[J].計(jì)算機(jī)教育,2020(5).
[10]? 李未.變革中的大學(xué)——李未教育文存[M].北京:高等? 教育出版社,2012:139.