羅蘭花 曾霖 黃江鑫 余長庚 殷玉玲


關鍵詞:現代產業學院;數據科學與大數據;實踐教學;協同育人
數據科學與大數據技術專業是國家戰略新興產業發展急需的本科專業,是科技革命、產業變革和數據經濟蓬勃發展對高校工科專業發展提出的新要求。我國高校開設大數據本科專業已經進入第六年,全國各類高校已陸續開始圍繞數據科學與大數據技術專業建設展開研究并申報大數據專業。根據教育部公布的數據可知,截至2022年6月,共有764所高校獲批數據科學與大數據技術專業[1]。五年多來,我國數據科學與大數據技術專業在培養目標、課程體系、教學資源及教學模式等方面不斷發展完善,取得了顯著的階段性成效。作為新興的工科專業,數據科學與大數據技術專業更加注重產業需求導向、跨界交叉融合和支撐引領。但是,由于科技變革加速和社會需求變遷加快,數據科學與大數據技術專業建設也面臨諸多挑戰。在未來推進數據科學與大數據技術專業建設過程中,如何構建不同類型高校大數據專業實踐教學體系?如何創新實踐教學模式,激發學生的學習主動性和積極性?如何進一步提高人才培養的質量?這些問題亟待進一步的探索和實踐。
1 數據科學與大數據專業人才培養目標
總體來看,目前數據科學與大數據技術專業人才培養目標大致可以分為兩類:研發類工程師和應用類工程師。其中,研發類工程師包括大數據架構師、大數據系統工程師、大數據研發工程師等;應用類工程師主要分為大數據分析師、大數據運維工程師、大數據算法工程師及數據科學家等[2]。其中,大數據架構師是指能夠承擔大數據平臺的架構設計、技術選型、搭建、開發、監控和性能調優,保證集群高效穩定運行;大數據系統工程師則為搭建、調優、維護大數據系統,在遇到故障的時候及時處理;大數據研發工程師是指對數據清洗、標注和處理,數據建模與設計開發,以及為數據分析師、數據挖掘工程師或數據科學家提供分析使用的數據;大數據分析師是指運用現有算法、模型、工具進行數據分析,解決具體的業務問題或實現業務目標,不對模型進行改進;大數據運維工程師是能對大數據基本組件進行安裝、配置、使用和運維;大數據算法工程師是指能進行大數據算法研發、算法性能優化,并及時掌握前沿的知識與算法;而數據科學家是指采用科學方法,善于運用數據分析與挖掘工具,對大數據進行重現與認識,發現其中的新問題,并且能對已有算法和模型進行改進和優化,以解決新的問題[2]。
不同類型的高等院校在數據科學與大數據技術專業人才培養目標的定位有所不同,比如,985及211等高校大數據專業人才培養致力于大數據架構師、大數據算法工程師、數據科學家等復合型、創新型人才培養為目標,而地方本科院校多以培養大數據架構師、大數據分析師、大數據挖掘工程師等應用型、復合型人才培養為目標。人才培養目標的定位不同,課程體系、教學模式和考核目標等存在較大差別。因此,探索不同類型高等院校數據科學與大數據技術專業建設方案和教學改革實踐具有重要意義,同時也是目前大數據專業建設的研究熱點。
2 數據科學與大數據技術專業特點
2.1 跨學科性質
數據科學與大數據技術專業是基于計算機科學、統計學、信息技術、人工智能等學科不斷創建起來涉及多學科交叉的融合性新興專業。多學科交叉融合教育是為了培養具有比較深厚的理論基礎,掌握多門跨學科知識和多種應用技能,具備解決跨界復雜工程問題的能力和素養的復合型人才[3]。隨著數據驅動的學科發展和研究進展,一方面,數據作為不同學科間同質化的基礎和媒介不斷弱化學科邊界;另一方面,隨著研究方法向探索型轉變,開展跨學科領域的交叉研究將有利于對海量數據進行更全面的關聯性分析,形成學科間優勢互補,解決更多復雜的科研問題。綜上,數據科學與大數據技術專業本質上是跨學科的。
2.2 以數據為核心
沒有數據,數據科學則是無源之水、無本之木。數據采集、清洗、整合、處理、分析以及結果展示全階段是數據科學經驗的核心。學生需要理解和實踐數據生命周期的所有階段,實現知識范式到數據范式的思維轉變,具備良好的數據素養和數據處理能力,才能真正參與實質性的數據科學領域的項目開發和問題研究[4]。建立從基礎課程、通識課程到專業課程再到選修課程的完善的課程體系,將數據素養和數據處理能力的培養貫穿于所有課程實踐中。實踐內容應包括獲取各種來源的原始數據,并應涉及數據清洗、標注、轉換、處理、數據分析與展示的數據處理全過程,自始至終,數據發揮著核心的作用。數據科學與大數據技術專業的學生應掌握數據分析的基本方法、工具以及大數據項目開發所需的相關軟件,理解真實的業務數據,結合真實世界的領域知識進行數據建模分析與決策,實踐經驗的積累顯得尤為重要。
2.3 強調思維能力培養
數據科學與大數據技術專業重點培養學生創新應用、跨界資源整合和復雜工程實踐能力,尤其注重學生多種思維能力的培養,其中包括計算與統計思維、程序設計思維、大數據思維、邏輯思維和工程思維等。數據科學提供整合和使用多種思維來解決問題的能力,而不是一味強調某一種思維。因此,在專業課程體系的構建中應平衡好這些思維能力的培養,將思維能力的培養融入課程教學全過程,以獲得最高效的教學效果。
2.4 對數學基礎要求較高
眾所周知,數據科學通過構建模型來解讀紛繁的世界,而數學則為建立模型提供了描述的語言,為此,數據科學與大數據技術專業的人才培養需要建立扎實的數學基礎[4]。數據科學專業數學基礎課程以概率與統計、高等數學、離散數學為主,同時輔以隨機過程、線性代數、圖論、貝葉斯理論與算法、應用回歸分析等內容。與傳統的數學課程所不同的是,數據科學更關注基于數據驅動的問題進行建模,其重點是數學基礎在數據科學領域的應用,而不是數學的理論推導或證明。
3 地方應用型高校數據科學專業發展現狀剖析
數據科學是大數據時代催生的一門新興學科,我國數據科學與大數據技術專業總體上辦學時間較短,第一批獲批的高校辦學時間也才六年,地方應用型高校則普遍更短。短暫的辦學時間里,我國地方應用型高校人才培養模式方面取得了較快發展。但是,人才培養模式仍存在專業精準度不高、課程設置未契合實際、校企合作的深度和廣度不足等問題;部分高校存在培養思維固化、實踐教學缺乏專業特色、師資力量不足等弊端。具體來說體現在以下幾個方面:
1) 大數據產業快速發展更加依賴于知識和技能的集成與創新,人才規格需求不斷提升,如何精準對接大數據領域產業需求,是專業培養目標的確定與完善亟待解決的問題。目前數據科學專業仍存在人才培養目標不夠清晰,未能緊密對接國家與地方社會經濟發展需求,實踐教學體系與培養目標未能高度統一等問題。
2) 數據科學作為新興工科專業,缺少根據相關標準和要求進行專業建設的經驗。部分高校實踐教學體系和教學模式缺乏創新性,高校、企業等不同主體之間協同不深入,導致校企合作的深度和廣度不夠。
3) 校企合作共建的教學資源建設不充分。業界技術創新需求和人才培養核心能力要求在課程標準、教學內容、教學體系、實驗時間等的具體化機制建設體現還很不充分,導致關乎數據科學與大數據技術專業人才培養核心命題的課程或短課程建設滯后。
4) 師資力量不足,實踐教學缺乏充足的業務或行業工程背景,具有工程實踐背景的教師比例不高,學生工程實踐能力有待提升。
4 現代產業學院模式下數據科學實踐教學改革舉措
將現代產業學院建設作為地方應用型高校教學改革的突破口,有力破解了人才培養供給與產業需求脫節的供需結構性矛盾。通過與企業聯合,深化校企合作辦學模式,雙方共同制定專業培養方案、共同開發項目案例、共同組建教學科研團隊、共同搭建實踐教學平臺,夯實課程基礎實驗、課程實訓、創新創業、項目綜合實踐和畢業實習,積極探索產教協同育人模式,促進學生獲得多樣化發展。實踐表明,現代產業學院是地方高校培養高素質工程技術人才的組織創新,建設現代產業學院是實施校企合作工程人才培養供給側結構性改革的重要途徑[5]。
4.1 堅持需求導向,重塑數據科學與大數據技術人才培養目標
以服務國家戰略規劃為己任,精準對接大數據產業需求、合理對標行業標準、借鑒企業先進技術體系,充分發揮現代產業學院貼近行業前沿的組織優勢,將企業的優質資源、先進技術標準、企業工程師培訓體系和企業文化引入課程教學內容中,促進人才培養鏈、地方產業鏈和創新鏈深度對接,優化數據科學與大數據技術人才培養目標和具體的專業培養規格,夯實人才的科技知識儲備、工程實踐能力和綜合素質。針對地方本科院校數據科學與大數據技術專業特點和實踐教學中存在的突出問題,充分發揮現代產業學院的組織優勢,秉持偏重技術技能、兼顧理論基礎的應用型本科教育辦學理念,以培養高層次應用技術人才為辦學定位,結合已有工科專業建設的經驗,構建出基于現代產業學院的數據科學與大數據技術專業實踐教學體系建設總體架構,見圖1。
4.2 持續優化實踐課程體系,構建實踐教學新范式
校企雙方充分發揮各自優勢,共同修訂與完善實踐課程體系,形成課程設置合作制訂與動態化調整管理機制。借助企業方的反饋和需求,全程監控專業領域動態發展狀況,將前沿技術和行業需求技能及時更新到課程設置中,使課程體系調整緊跟數據科學發展方向和前沿知識更新迭代的步伐,實現課程設置與產業需求無縫對接,課程內容與職業崗位技能無縫對接[6]。同時加強校企聯合對行業標準、崗位需求和課程內容的分析論證,圍繞區域產業發展和專業人才培養實際需求,注重多元復合能力、多崗位職業能力與職業素養的整合,增強人才培養的適應性與針對性,持續優化實踐課程體系。現代產業模式下數據科學與大數據專業實踐教學課程體系如圖2所示。
4.3 賦能教師教學能力提升,打造師資隊伍良好發展生態
數據科學與大數據技術作為一門新興專業,各種新技術新思維不斷涌現。需要教師對相關知識和前沿技術的發展懷有強烈的好奇心,在校企合作不斷深度融合的過程中,專業教師應以此為契機,通過參加各類培訓、觀摩、交流等方式,掌握新知識和新技能,全面提升業務知識水平和職業素養。積極整合利用區域優質創新資源,通過建立企業教師庫等方式,聘請龍頭技術骨干、研發人才等作為教師隊伍的組成部分,實施師資隊伍教學管理體系優化生態,同時為高校教師提供工程實踐和一線鍛煉的機會,加強工科教師與行業人才雙向交流,強化教師行業背景和實踐經歷。此外,健全教師考核制度,促進教師豐富教學資源,爭先創優,打造師資隊伍良好發展生態。
4.4 有序嵌入多方優質資源,持續完善教學資源
現代產業學院模式下的校企合作的精髓之一是充分利用不同主體的資源優勢,積極引入外部主體的資金投入、先進技術、科研人才等資源,對接產業需求融合資源要素,為數據科學人才培養提供強有力的保障支持[5]。其一,促進校企資源整合,共建實驗平臺、實訓基地、培訓基地,共同開發項目化課程,項目案例,出版系列教材,有效整合各類優質教學資源,實現師資、設備、人力、資源多維共享。其二,整合行業規范、企業精神、工程倫理和創新文化等非技術資源要素,將之深度嵌入培養方案、課程標準、教學設計、課程評價等具體培養過程,加強學生領域知識、職業素養和創新思維能力的培養。此外,還應重視將領域知識滲透到實踐教學過程中。在數據科學項目開發中,領域知識和技術技能同等重要,只強調技術技能是遠遠不夠的。數據科學技術解決的是一個具體用戶任務或工程問題,領域知識則是典型的領域背景知識,領域知識有助于更好地理解數據、產品設計理念和問題背景,在數據科學應用開發中,某個數據產品可能關注廣告客戶的匹配和對應,此時就需要除了數據科學之外的心理學、市場營銷、經濟學等領域知識[7]。
4.5 夯實數學基礎,加強思維能力培養
相較于計算機類其他專業,數據科學與大數據技術專業學生需要掌握更為扎實的數學基礎,具備良好編程水平,熟練掌握大數據基礎知識、數據分析與建模的技術、項目開發工具及環境的使用,深入理解業務邏輯,能夠靈活地運用大數據思維、模型和工具解決實際業務問題,畢業生方可從事大數據挖掘、分析、研發、測試、運維和管理等工作。與傳統的數學課程所不同的是,數據科學與大數據技術專業更關注對數據驅動的問題進行建模,其重點是數據科學的應用,而不是數學的理論推導或證明。主要課程包括:高等數學、概率與統計、離散數學、線性代數、圖論、貝葉斯理論與算法、隨機過程、應用回歸分析、數值分析等內容。同時,加強學生程序設計思維、大數據思維、邏輯思維和工程思維等思維能力的培養,將思維能力的培養貫穿整個教學過程。在專業課程教學過程中融入這些思維能力的培養,開設的課程主要包括高級語言程序設計、算法設計與分析、數據分析與挖掘算法、Hadoop大數據技術、機器學習、R語言與數據科學應用等。
4.6 聚焦復雜工程問題解決能力培養,不斷優化考核評價方式
基于科學、全面、客觀、可操作、數據易收集等原則建立課程考核評價體系,使用過程評價為主要考核方式。課程評價體系的建立應與畢業達成度、工程認證標準相結合,并將評價結果運用于培養目標、課程教學體系、教學資源、教學設計與授課過程的持續改進,從而起到長效反饋的作用。考慮數據科學與大數據技術專業的歷史沿革和目前的發展現狀,適用于以過程性考核為主、過程性考核和終結性考核有機結合的課程考核方式,并在實踐過程中不斷完善課程考核體系,堅持以“重過程-多元化-考能力”為指導思想,重點聚焦考查學生的思維能力、領域知識的掌握程度、復雜工程問題解決能力、溝通交流能力、創新能力、合作能力等技術和非技術領域的考核評價。
5 結束語
數據科學與大數據技術專業人才的培養是計算機領域人才培養的熱點問題。既是國家的重大戰略發展需求,也是科技革命、數字經濟和社會發展的時代需求。地方本科院校數據科學專業人才應以區域經濟和行業發展人才需求為導向,依托現代產業學院推進校企合作的深度和廣度,建設校企協同創新的多元化專業實踐教學體系和實踐教學模式;建設從基礎到應用、再到面向特定行業領域有機結合的大數據專業一體化實驗實訓環境,滿足學生數據科學項目實踐能力培養的需求;加強數據科學特色課程的研發,促進學科交叉、課程交叉、實現資源共建共享;以過程性考核為課程主要考核方式,不斷創新過程性考核評價體系,重點考核實踐動手能力、創新應用能力和解決復雜工程問題能力;依托企業方的反饋和需求、專業自我評估和教學反饋機制,持續改進數據科學實踐教學課程體系和實踐教學模式,進一步提升人才培養質量。