王琰 黃欣瑜

[摘 要] 技術的創新發展使社會建設的進程逐漸加快,基于該背景,使技術人才的培養成為當下高校教育教學重點研究的課題。鑒于此,對基于本科生團隊導師制的應用技術型高校大數據人才培養模式的內容展開研究,從闡述當下對大數據人才需求的狀況著手,對高校大數據技術型人才培養面臨的困境予以分析,并提出幾點解決的思路。此次研究的主要目的是為了更好地輔助大數據技術人才的培養,為我國科技與社會發展獻上綿薄之力。
[關 鍵 詞] 本科生團隊導師制;應用技術型人才;大數據人才培養模式
[中圖分類號] G647 [文獻標志碼] A [文章編號] 2096-0603(2017)34-0054-03
一、背景介紹
大數據的海量性、多源性、異構性、不確定性、動態性特征對大數據處理與服務提出了巨大挑戰,傳統的數據挖掘技術已不能滿足大數據高速處理的需求。隨著大數據技術的發展,存儲、處理、分析大數據的解決方案都層出不窮,各種工具的出現讓企業低成本處理大數據成為可能,而工具的多樣化導致嚴重的人才短缺。
以廈門為例,根據《廈門市大數據應用與產業發展規劃(2015-2020年)》預計,近幾年廈門大數據產業將出現高速發展的態勢。到2018年,廈門全市大數據產業實現產值規模500億元,形成年銷售收入100億元以上企業1家,帶動相關產業新增銷售收入超過1000億元。到2020年,全市大數據產業實現產值規模850億元,帶動相關產業新增銷售收入超過1600億元。而廈門目前還沒有一所開設大數據專業的本科院校。
鑒于大數據產業對人才培養的迫切需求,全國一些高校開設了數據科學與大數據技術專業,培養企業所需的大數據應用技術人才。作為一家應用技術型高校,廈門理工學院也要追隨這一潮流。為此,計算機與信息工程學院于2016年在軟件工程專業下開設數據工程方向,并申請于2018年開設數據科學與大數據技術專業。將依托已建設的多個與大數據分析、挖掘相關的省市級科研平臺,將學生納入大數據工程項目的實施和維護中,培養本科生復雜數據工程項目的實戰能力,提高學生分析問題、解決問題的能力,探索適應高水平應用技術大學定位,面向產業需求,支持階段性迭代的大數據人才培養模式,從而推動產學研融合,構建大數據平臺建設和人才培養的閉環。
二、挑戰
對數據科學與大數據技術專業的建設方式和人才培養模式,各高校都處在探索中。主要的挑戰包括以下三點。
(一)專業新
2011年起,美國各校開設數據科學和工程相關課程;2012年起中國設置大數據、數據科學方向的碩士學位;本科生培養則是到2014年才有學校進行初步嘗試,進行這方面人才的培養;2016年國家新增數據科學與大數據技術本科專業,首批僅有3所高校;2017年開辦該專業的高校增長到32所。也就是說,目前為止還沒有一家學校完整培養一屆數據科學與大數據技術本科專業學生。
(二)要求高
大數據技術所需人才是復合型人才,需了解多學科知識,為更好地對業務數據進行建模,除了數學知識外,還應具備特定應用領域知識,并要求掌握分析方法、分析工具,以及業務、管理及設計學知識,以便更好展示數據分析結果。
(三)針對性強
數據工程在不同應用領域有不同特色,要讓學生在短短4年時間內,了解各領域相關知識,并不現實。關鍵是讓其通過1~2個應用領域的數據工程應用,了解數據工程實現的通用性方法,培養其以不變應萬變的能力,使之更好適應畢業后的崗位要求。
這三大挑戰,再加上本科生學識有限,使本科層面大數據人才的培養與研究生層次的培養方向不同。不能追求理論方面的高大上,而應側重于大數據工具的應用和數據工程的實戰。數據工程師除了需要掌握一定的數學知識、分析工具、編程語言外,還要有較強的邏輯思維、協調溝通能力和快速學習能力,而且要對業務有深入理解,能通過數據可視化技術說服客戶。但是,所有能力都達到高分,這超出本科生的要求。數據工程師分為初級數據分析師、高級數據分析師、數據挖掘工程師三類。本科生應按照初級數據分析師的需求進行培養,涉及的數據工程實戰能力包括基于業務快速理解的問題建模能力、分析工具的使用能力和協調溝通能力。而其他方面,例如深度掌握各類編程語言進行數據處理、基于復雜數學知識的模型研發以及對分析結果的評估,則需留待研究生及更高階段的人才處理。
三、實施過程中存在的問題及解決思路
(一)實施過程中存在的問題
基于以上分析,我們認為對本科生數據工程能力的培養而言,主要是讓其具有參與實際項目的經歷,通過由淺到深多個項目的訓練,使其較好掌握和應用各種分析工具,更好了解類似業務的問題建模方法,從而通過項目鍛煉學生的過程協調和溝通能力。然而,現有培養模式傾向于將這類實戰能力的培養放置于實踐性課程、課程設計或畢業設計中,從實施過程中,發現存在一些問題。
1.實踐性課程、課程設計時間太短
目前的實踐性課程都集中在期末的1~2周時間內,容易受期末考的影響,實際能做事的時間不長。因此,這樣的實踐課僅適合于開發不需要循環迭代的簡單項目。而數據工程實戰能力的培養關鍵是試錯的過程,通過不斷的試錯、反復、迭代,逐步了解和掌握數據的特征,發現找到適合該類數據的存儲、挖掘的優化方式。這需要花費很長的時間,不是1~2周就能解決的。
2.畢業設計完成質量低
畢業設計的要求覆蓋了項目的定義、設計、分析、實現、測試的全過程,因此若學生能單獨、扎實完成畢業設計,也能達到數據工程實戰能力的要求。然而,從實際情況來看,由于實踐性課程無法達到目的,學生缺乏這樣全過程的訓練和培養,導致畢業設計的要求對許多學生而言,難度較高。加上學生考研、考公務員、企業面試、實習對畢業設計時間的擠占,總體而言畢業設計的完成質量較低,基本就是實踐性課程成果的水平,無法實現實戰能力培養的效果。因此,需要增加一個培養環節,作為實踐課程與畢業設計的中間環節,達到培養學生數據工程實戰能力的目標。
(二)解決思路
針對現有培養模式的弊端,結合數據工程實戰能力的要求,面向數據工程實戰能力的人才培養模式必須滿足以下需求:需求1:將數據工程實戰能力培養貫穿于數據工程方向學生學習的全過程。讓學生從踏入本專業起就感受到實戰能力培養的氛圍,改變實戰能力與課程學習相脫節的局面。現有模式依靠大三下的小學期和大四上的畢業設計培養學生的實戰能力,很多學生在畢業后反映,大學四年僅僅畢業設計的后兩個月才真正花時間認真去開發項目。這樣已經太遲,整個實戰能力培養的缺環無法補全。需求2:每個學生都要經歷各種數據工程實戰能力的培養,以便在畢業設計的時候能獨立完成數據工程項目。從目前實踐性課程、課程設計的實施情況來看,由于時間較短,任務大多需要組隊完成,常出現抱大腿的情況。一個隊4~5個人中,主要就是1~2個學生在開發,其他學生或者不做事,或者做文檔編寫這類輔助事情,導致大量學生缺乏全鏈條的訓練,特別是開發能力的培養方面存在空白。需求3:訓練結果需要得到外界的認可,激發學生的積極性。目前學生基本都是“95后”,做事的目的性強,需要直接刺激來激發學習動力,缺乏長遠的規劃。例如,想考研的學生通常要等到大三暑假前才下定決心,想就業的學生要等到企業面試時才知道學什么。此時再努力學習也只能彌補書面知識薄弱的缺點,實戰能力方面的培養已來不及。因此,實戰能力的培養應該與外界掛鉤,引入企業、外校的評價。例如,將企業需求(如橫向項目)或學科競賽要求轉換成題目交由學生完成,提高學生的參與度。需求4:訓練過程需要有技術挑戰性,要與教師的科研相結合,探索教學與科研相結合的道路。由于引入企業需求和學科競賽要求,與之前的培養方式相比,難度就有較大提高,需要教師在指導方面花費更多精力。因此,這些需求就必須與教師的科研相結合,做到一事兩用,調動教師在教學方面的積極性。需求5:該模式需要是可擴展的,可覆蓋大部分學生。學校向來鼓勵學生參加學科競賽和企業課題,然而效果卻不盡如人意。原因之一就在于吸引學生加入學科競賽和企業項目都是教師個人的行為,沒有形成教師之間的團隊合作與分工。而教師精力有限,只能照顧最有熱情的少部分學生。因此,少數好學生很忙,大部分學生的實戰能力卻沒有得到提升。這種“兩極分化”局面既不利于總體教學質量的提升,也不利于專業方向的建設,無法形成方向的積累和沉淀。因此,需要基于教師的科研方向,構建教師的教研團隊,引入不同年級的學生,通過團隊合作,發揮教師各自的優勢,形成大兵團作戰。這樣,除了教師自身能指導學生外,高年級學生也可以對低年級學生進行傳幫帶,從而降低了教師指導的成本,實現更有效的人才培養。
四、實施方案
為提高學生在數據工程方面的實施能力,將基于學生團隊化、導師終身制構建本科生團隊,通過對大二、大三、大四學生數據工程復雜項目實戰能力的培養,探索適應高水平應用技術大學定位、面向特定產業需求、支持階段性迭代、具有持續改善特性、可擴展的數據工程人才培養模式。
期望的人才培養模式如上圖所示。自大二分方向后,學生每年都要經過教學、競賽、科研三方面的鍛煉,形成數據工程實戰能力。圓圈大小表示占用時間的比重,從大二到大四,教學方面(課程設計、實踐性課程、畢業設計)占用時間的比重逐步下降,而科研方面所占比重逐步提升,到大四時學生能部分承擔教師橫向項目課題,做到畢業設計與科研項目的融合。學科競賽所占時間是由少變多再變少。大三時最多,是學科競賽的主力,著重鍛煉數據處理和分析過程中的編程和展示能力。大二和大四時作為輔助人員和指導人員,占用時間相對較少。具體措施如下:
(一)針對大二學生專業知識不夠扎實的情況,探索一條以科研團隊合作促進教學的道路
鼓勵大二學生四人為一組,以優劣搭配、性別搭配為原則,組成團隊,通過雙向選擇確定未來三年固定的指導教師。在指導教師和學長的指導下,分別承擔輔助科研報告撰寫、運行實驗、數據平臺維護等工作,提高其數據工程素養,熟悉數據存儲平臺和分析挖掘工具,為進一步獨立擔綱完整的數據工程項目做好技術儲備。為提高團隊之間的互動,擬基于學科競賽題目,開設開放性實驗課程,引入教師講解和問題討論,將教師、老生、新生結合起來,實現團隊的有效互動。
(二)針對大三學生對未來方向不明確、缺乏學習動力的問題,探索以賽促學的培養方式
推動學生參與學科競賽一直為各高校所倡導,目前學科競賽數量眾多、紛繁復雜、難度不一、缺乏整合。本項目將根據大數據技術和區域特色需求,精選與大數據技術相關且具有學術影響力和實戰性考驗的學科競賽(如海峽兩岸信息服務創新大賽、高校云計算應用創新大賽、CCF大數據與計算智能大賽等),構建由易到難的賽事循環,由本科生團隊中的大三學生作為開發主體參與其中。同樣設置四人團隊,分別承擔數據采集、數據融合與分析、數據可視化、總體方案規劃和管理等工作,與大二的團隊對接,進行一幫一的帶動和指導。
(三)針對大四學生缺乏生產實踐、難以獨立承擔項目設計與開發的問題,探索以科研帶動能力提升的培養方式
對不準備考研的學生,擬從教師團隊的橫向科研項目(搜索引擎類、智慧醫療類、智慧交通類)、企業(如阿里巴巴、滴滴等)主辦的競賽中凝練畢業設計題目,讓大四學生參與到方向教師的科研團隊中,將畢業設計題目與工作方向及學弟所參與的競賽相結合,作為學弟團隊的指導者,應積極鍛煉協調能力,為更快適應工作崗位奠定基礎。
(四)針對應用技術型高校教師多承擔應用型研究、研究不夠聚焦的特點,整合教師團隊
通過人員調整和課題凝練,將相關教師集中到統一的教學科研團隊中,形成共同的技術平臺(如基于HDFS的文件存儲平臺,基于Neo4J的圖數據庫,基于SPARK的數據挖掘平臺,基于STORM的數據流處理平臺,基于Python的數據展示平臺),并尋找與平臺技術相適應的企業項目和學科競賽,組建教師團隊,從而更好地促進產學研融合。
綜上所述,為了提高本科生在大數據技術實施方面的綜合能力,我們對構建本科生團隊、構建本科生導師終身制等方面進行了一些探索。目前,通過教師和高年級學生的指導及從淺到深多個項目的歷練,學生的學習積極性有較大提升,學風得到改善。不過,低年級學生自律性較差,其他舍友玩游戲時容易受影響,團隊運行時需要教師掌控進度,下一步擬建議學工部門基于本科生團隊調整宿舍,統一作息時間。