程茜 王艷 吳睿 張俊麗

[摘 要]文章以西安歐亞學院數據科學與大數據技術專業實踐課程體系的設置為例,針對專業課程體系的建設尤其是實踐課程體系設置的不足,基于人才培養的目標,從理論和實踐兩個方面提出培養具備數據挖掘能力的應用型人才的策略,旨在促進該專業的發展,為應用型高校的數據科學與大數據專業發展提供可行的參考。
[關鍵詞]數據科學與大數據技術專業;實踐課程;應用型高校;課程體系建設
[中圖分類號] G640 [文獻標識碼] A [文章編號] 2095-3437(2022)01-0158-03
近幾十年,互聯網的廣泛應用使得大量的數據可以被收集、分析,從而使得數據產生極大的價值。企業產生大量的數據從生產制造轉變為一個數據生產平臺,而這種變革也在改變著人們的思維方式。大數據時代的強勢來襲,促使各大高校自2016年開始紛紛申報并設立了數據科學與大數據技術專業。截至2020年,經過前幾年密集的申報、備案與審批,陸續有619所高校開設了數據科學與大數據技術專業。對于這么一個新專業來說,其開設時間短,可參考的經驗非常少,專業人才培養體系、課程體系的設置沒有科學規范的指引,該如何定位,課程體系如何才能符合社會、企業對人才的需求,都是我們必須認真思考的問題。
一、數據科學與大數據技術專業能力培養需求定位
(一)企業對人才能力的需求分析
高校進行人才培養的最終目的是滿足企業對人才的需求。筆者通過對多家數據領域TOP企業進行面訪以及利用網絡爬蟲技術獲取各大招聘網站數據分析崗位的招聘信息這種線上線下相結合的方式,對企業的需求進行了分析。首先,將專業調研得到的學生預期就業崗位名稱作為關鍵詞,在國內影響力排名TOP5的招聘網站(如前程無憂、智聯招聘、中華英才網、應屆生等)上抓取相關企業的招聘信息(包含薪資、就業地區、福利待遇、崗位要求、任職要求等)。這些招聘信息中有一個非常關鍵的信息(字段)“崗位要求”或“任職要求”,它們以非結構化形式呈現。然后通過文本分析、描述統計、回歸分析等技術手段,挖掘出用人單位對數據科學人才的能力需求。最后,根據數據分析結果可知,用人單位非常注重應聘者的數據分析經驗和數據挖掘能力;數據崗位大多要求中等學歷,如大專及本科;薪資會隨學歷水漲船高,本科生的平均薪酬就有可能達到萬元以上。
從企業對人才的專業能力需求分析來看,其對數據應用、數據分析等實踐能力的要求較高。對高校而言,要想培養的人才能滿足企業的需求,學生不只要具備扎實的數學基礎和實戰能力、過硬的編程能力,能夠獲取數據并實現數據的存儲,還要具備將數據思維應用到各領域的能力,能夠對不同領域的實際問題進行分析和挖掘。
(二)數據科學與大數據技術專業能力培養目標
培養目標是人才培養的核心。科學合理的人才培養目標是實現人才培養至關重要的一步,也是高校高質量培養企業所需人才的關鍵。西安歐亞學院數據科學與大數據技術專業(以下簡稱“本專業”)秉承面向業界培養應用型人才,強調培養學生的通識能力,全流程培養學生的“競爭力、自信心、合作精神、創造性和誠信”,使之成為企業需求的人才這一培養理念。本專業從2018年開始招生,通過對市場進行分析,我們確定了自己的人才培養目標。人才培養目標以培養德、智、體、美、勞全面發展的人才為宗旨,引領學生掌握數據科學的理論、技術,包括面向大數據應用的數學、統計、計算機等學科基礎知識,從業務理解、數據獲取、數據展示、大數據分析理論和技術、人工智能等方面對學生進行數據分析全流程的培養,并將產學合作中企業的真實項目轉換為綜合實踐課程,通過對企業真實環境的模擬,訓練學生利用數據思維及技能解決實際業務問題的能力。
二、基于能力的課程體系確立
一個完整的課程體系能夠實現對學生能力的培養。本專業從理論和實踐兩個方面培養具備數據挖掘能力的應用型人才。
(一)理論能力培養的課程體系
理論能力主要是指針對數據挖掘中各種模型、算法的理解和運用。學生需要有較強的數理統計基礎、具備數學建模能力、擁有扎實的數據結構和算法基本功,通過不斷訓練能夠很好地理解和掌握各種機器學習、深度學習中的各種算法,了解與云計算相關的數據處理平臺及其生態系統。理論能力培養主要體現在數據科學與大數據技術專業的理論課程體系中。數據科學分析類相關專業設定的核心課程側重數據分析、計算、計算機技術以及大數據應用等方面的內容,包括數據科學導引、數據采集、大數據應用導論、數據存儲(MySQL)、數據清洗、大數據的Python基礎、數據可視化、數據挖掘、理論與算法、大數據機器學習等課程。
(二)實踐能力培養的課程體系
對于數據科學與大數據技術這樣一個實踐性很強的專業而言,理論教學只是完善人才培養的一個子環節,還應加強學生的實踐能力。將實踐項目貫穿整個課程體系建設,使學生在理論和應用兩方面均得到嚴格的訓練,運用專業的理論、方法、技術和工具解決具體行業中的實際問題,重點培養學生的實戰能力。在此過程中,可以實踐驅動教學,探索實現校企結合多元發展的路徑。實踐課程的建設不能單純依靠高校的力量,必須與行業、企業緊密結合。
1.實踐課程與多行業融合
大數據人才培養要有鮮明的應用特點,具有明確的行業方向,立足于相關行業領域的實際要求,要滿足就業崗位任職的需要,以普及性應用為目的,以必需、夠用的知識體系為度。提升式教學要加強針對性和實用性, 以搭建具體行業場景教學為主,以解決行業真實問題為目標,以項目制的形式推行。
2.校企聯合開發課程
行業、企業要參與課程開發、專業教學、職業能力培訓、質量標準制訂與考核評估等實踐課程的開發與執行全流程。應積極推行生產勞動和社會實踐相結合的培養模式,引入企業中從事大數據工作的師資,讓其將工作與教學結合,并以此作為大數據人才培養模式的切入點,引導課程設置、教學內容和教學方法的實施。應重視學習與工作實際的一致性,探索以項目為導向的教學模式。
課程案例的開發可以采用校企聯合的形式,發揮企業擁有大量真實案例的優勢,針對課程體系不同的知識內容挑選有代表性的典型真實案例,再結合學生的特點將企業真實案例再開發,融入課程案例中,同時配有實訓指導書指導學生進行學習,最終達到提高學生實戰能力的目的。
3.校企聯合共建實驗室
為了與企業構建起實質性的緊密合作關系,學院開辟出聯合實驗室和聯合研究中心等各類校企合作平臺,推動企業將重要但不緊急的項目投放到平臺上,由教師與企業員工共同以項目制的方式推進企業真實問題的解決,讓學生也參與其中。在這個過程中,企業能獲得高校的智力支持,學院能實現師資的有效培養,同時將企業真實項目過程轉化為科研成果、學術論文和教學案例,并將其應用到實際教學中去,高效實現產學研一體化運營。
4.產學項目轉化案例與課程
近年來,在聯合實驗室這一平臺的促進下,本專業教師團隊積極參加產學研項目,項目涉及教育、電商、環保、車聯網、金融等多個領域。教師主導或者參與企業實際項目,這樣一方面可以實現教師不出校就在企業進行掛職,積累行業經驗;另一方面,做過項目的教師可以將產學研項目抽離出來形成實踐課程,以案例、項目、任務等實際場景模擬為中心,強化師生間教與學的交流,充分調動學生的積極性,激發學生的學習興趣。
(三)實踐課程體系實例分析
1.實踐課程體系確立
通過多年探索,西安歐亞學院數據科學與大數據技術專業形成了自己特點的實踐課程體系。在四年的人才培養中,學院始終將企業真實項目實踐貫穿整個課程體系。大一、大二的時候,學院通過專業講座、論壇的形式讓學生了解大數據專業、數據行業,在此過程中,學術導師和企業導師均參與其中。同時,為了讓學生有交流學習的平臺,學院設置了專業社團,并通過工作坊的形式讓學生參加實踐。大三的時候對標不同領域進行真實項目實踐,如教育大數據實踐、電商項目實踐、物聯網項目實踐等。大四要完成環保、金融科技等實踐項目。學生四年的專業學習始終沉浸在實踐項目中,畢業的時候,學生會具備一定的項目實踐經驗,見圖1。
2.實踐課程開發
將項目轉化為基于項目教學法的實踐課程,把基礎理論和基本技能的學習融入數據類項目的實踐課程學習中,讓學生在學中做、做中學,形成基礎理論、基本技能和職業素質一體化學習,從而提高學生的學習興趣,幫助學生掌握課程內容。
環保項目實踐課程來源于“長天思源——廢氣排污預警分析”這一真實項目,課程的內容和形式設計均希望幫助學生掌握使用專業知識解決實際問題的能力,為學生的職業成長提供助力。在課程設計中,應盡可能地讓學生接觸真實的企業業務問題和充分展現業務特征的模擬數據,引導學生學會使用具體而重要的行業數據解決問題。整個課程開發可以分為三個階段。
準備階段。首先,組建課程開發團隊,團隊成員均為本項目成員。其次,確立課程培養的目標。以環保為例,就是希望學生不僅了解相關業務知識,而且能夠使用排放檢測數據分析和建模的方法,理解環保的業務知識,挖掘數據所蘊含的信息,為企業排污預測和生產調整等業務場景提供數據分析支持。最后,基于課程培養目標,討論拆分項目。分析整個項目中哪些適合包裝成課程內容,進而確定每個TASK的任務,形成一份文檔,這份文檔中包含了對項目的介紹以及上面提到的任務序列、實現工具、項目核心。
開發階段。基于第一階段達成的共識,團隊成員進行每個任務的建設。每個TASK需要提供任務文檔、任務數據、評分標準。任務文檔包含對這個任務背景知識的介紹、該任務的提交要求以及相關參考文獻。以環保實踐課程的任務為例,這個任務的目的是讓學生掌握企業廢氣排污異常數據的識別方法。任務文檔不是簡單介紹如何進行企業排污數據異常識別,而是要思考:隨著政策法律懲罰力度的加重,一些污染企業出于畏懼心理造假,針對這一實際問題該如何解決?繼而介紹對企業排污數據進行異常識別的方法。我們在介紹每個項目時,都會結合項目背景來介紹。除了任務背景介紹,我們在任務作業的設置中也基于項目數據(脫敏后)讓學生完成異常數據識別。當然,異常數據的識別手段也可以介紹一部分,剩下1~2個讓學生自己去發散思維。這樣不只可以通過任務判斷學生的掌握情況,還可以看出學生對問題是否進行了思考。因為這部分涉及大量的R語言操作問題,所以我們給出的參考資料也都是跟R語言操作有關的資料。
課程開發收尾階段。第一輪基本資料開發收尾存檔時,需要有整個的課程介紹,所有的任務文檔、任務數據、評分標準、參考資料。第二輪還需要對內容不斷打磨,邀請專家進行評估,開發團隊也可以進行預演,以此保證課程的授課質量。
三、結束語
數據科學與大數據技術專業作為一個實踐性非常強的新興專業,目前課程體系的建設還存在一些不足,尤其是實踐課程體系的設置。如何基于培養目標設置科學的課程體系,從而實現培養目標,使培養的人才符合數據時代企業的用人要求,這個問題還亟待探討。本文以西安歐亞學院數據科學與大數據技術專業實踐課程體系的設置為例進行探討,意在促進該專業的發展,為應用型高校的數據科學與大數據專業發展提供可行的參考,促進專業人才的培養。
[ 參 考 文 獻 ]
[1] 陳欣,周龍福,曹耀欽.探索應用型本科數據科學與大數據技術專業人才培養方案的構建[J]. 現代工業經濟和信息化 ,2017(23):40-42.
[2] 汪連新.互聯網金融和大數據時代金融學課程改革及人才培養的思考[J].教育教學論壇,2015(32):189-191.
[3] 桂勁松,張祖平,郭克華.新工科背景下高校新專業建設思路探索與實踐:以數據科學與大數據技術專業為例[J].計算機教育,2018(7):27-31.
[責任編輯:陳 明]