施 達 楊晉浩 張志強 陳 丹 王偉鈞
(成都大學信息科學與工程學院,四川成都 610106)
數據工程類本科人才培養體系的
探索與實踐*
施 達 楊晉浩 張志強 陳 丹 王偉鈞
(成都大學信息科學與工程學院,四川成都 610106)
市場需要大量的具備復合型知識的數據工程類人才,目前此類人才的培養遠遠不能滿足市場的需要。本文基于成都大學數據工程類本科人才培養情況,總結了探索多年的辦學特色和實踐經驗,提出了基于市場需求的數據工程類人才的能力結構。在此基礎上構建了與能力結構相適應的課程體系和教學體系。同時課程體系突出了跨學科交叉融合的復合型特色,教學體系突出了多層次的產學研一體化特色。經過多年的辦學實踐證明,這套人才培養方案,實現了特色辦學,較好地滿足了社會需要,成效顯著。
數據工程類人才;能力結構;課程體系;教學體系
人類的生活、工作和思維方式正因席卷而來的大數據信息風暴而發生前所未有的變革,一場全新的、重大的商業變革、思維變革和管理變革正在悄然進行。國務院在2015年9月發布了《促進大數據發展行動綱要》,明確提出要創新人才培養模式,建立健全多層次、多類型的大數據人才培養體系。鼓勵高校設立數據科學和數據工程相關專業,重點培養專業化數據工程師等大數據專業人才。鼓勵采取跨校聯合培養等方式開展跨學科大數據綜合型人才培養工作,大力培養具有統計分析、計算機技術、經濟管理等多學科知識的跨界復合型人才。
但國內當前的數據工程類人才培養情況還不能滿足市場的需求,特別是在應用領域、大數據技術能力等方面,還遠遠落后于市場的需求。到目前為止,所謂的數據相關專業,也僅僅是部分高校探索性地在傳統的統計學、信息管理之外開設的一兩門大數據相關課程,在培養內容上大都缺乏足夠的實訓課程,學生只能做一般性的數據分析、數理統計、計算運算,分析解決實際問題的能力相對不足,與市場對數據工程類人才的能力需求還有相當一段距離[1]。
成都大學(以下簡稱“我校”)經過近十年的探索與實踐,通過大膽改革人才培養方案,較早地引入了大數據應用領域知識和相關的大數據技術,在數據工程類本科人才的培養方面已經積累了豐富的經驗,取得了較好的辦學效果,在專業辦學定位、課程體系改革和教學體系探索方面逐漸形成了辦學特色。
緊密結合社會對數據工程類人才的能力需求和我校的辦學定位,我們確定了數據工程類本科人才的培養方向,實現了專業定位準確、辦學有特色的目標。
(一)市場對數據工程類人才的能力需求
市場招聘信息能夠及時準確地反映市場對人才的需求。我們從企事業單位崗位招聘信息出發,針對市場對數據工程類人才的能力需求進行了詳細的調研。運用數據挖掘技術,對智聯招聘網站上2015年全年有關大數據崗位招聘信息進行搜集,獲得了基于招聘信息的全國范圍內3萬余條大數據崗位招聘信息。運用數據挖掘的分詞技術和數據分析手段,總結出市場對數據工程類人才的能力需求主要包括以下六方面:數學基礎及應用能力、計算機編程能力、ETL能力、數據統計能力、數據挖掘能力和應用領域知識能力。再參考國外大數據人才培養情況[2],我們建立了數據工程類本科人才的能力需求結構,見表1。

表1 數據工程類本科人才的能力需求結構
高素質的數據工程類人才必須是復合型人才,能夠對數學、統計學、數據分析、機器學習和自然語言處理等多方面知識綜合掌控,能對數據做出預測性的、有價值的分析[3-4]。其中,數學基礎及應用能力,是指具備數據挖掘應用程序算法所需的數學知識;計算機編程能力,是指掌握數據挖掘常用的軟件及其編程能力,才能借助計算機實現海量數據的高效挖掘[5];ETL能力,是指掌握數據挖掘工作的主要環節:數據的抽取、轉換和加載過程所需的能力;數據分析能力,是指具備數據建模并熟悉常用的數據統計分析方法和軟件的能力;應用領域知識能力,是指實踐中,數據挖掘工作都是基于某個具體行業或領域進行挖掘,需要與該行業或領域的從業人員進行充分的溝通和交流,因此需要具備該應用領域的相關知識。
運用數據挖掘技術收集了國內150所高校的數據工程類人才培養信息,從以上六方面分析當前國內數據工程類本科人才能力的培養與市場需求的匹配情況,分析結果見圖1。

圖1 企業對大數據人才的能力需求和高校此類人才培養情況的對比
從圖1可見,數學基礎及應用能力能滿足市場的需求,ETL能力和數據統計能力這兩方面的能力培養基本上能滿足市場的需求,但計算機編程能力、數據挖掘能力和應用領域知識能力的培養還不能滿足市場的需求。這種狀況與當前高校的數據工程類人才培養專業特別是信息與計算科學專業的課程設置密切相關。其課程設置大多偏重數學知識的傳授,而數據挖掘所需的計算機類課程、數據挖掘知識及其應用領域的知識開設得相對較少[6]。
(二)明確的專業目標定位
成都大學是一所致力于成為具有鮮明辦學特色的地方高水平綜合性大學。學校積極探索建立與成都市地位和發展需求相適應的人才培養體系、知識和技術創新體系,努力成為我國地方高素質應用型人才培養、科學研究以及推進高新技術發展和成果轉化的重要基地。
立足成都大學城市型綜合大學的辦學定位與高素質應用型人才的培養目標,并緊密結合市場對數據工程類人才的能力需求,我校的數據工程類本科人才培養堅持以學生發展為中心,突出“抓基礎、重實踐、跟前沿、創特色”的辦學思路,瞄準成都市信息產業大發展,急需大量的大數據人才的廣闊前景,確定了以數據分析和數據挖掘高素質應用型人才培養為目標的數據工程類本科人才培養方向。
為了檢驗培養出來的數據工程類人才對社會需求的適應度,同時緊跟市場動態,及時掌握市場對數據類人才需求的變化,我們進行了畢業生就業信息的跟蹤調查。通過他們的跟蹤反饋信息,一方面收集到市場需求的最新信息,另一方面根據他們的就業情況,為我們的人才培養方案的改革和完善提供可靠的支持。
市場需要的數據工程類人才是能夠對數學、統計學、計算機科學,以及各種商業學科諸如營銷、財務等多方面交叉學科知識綜合掌握,能對數據做出預測性的、有價值分析的復合型人才。因此,教學體系應當滿足復合型人才培養的需要。根據我們的調研結果并結合我校的實際情況,經過探索和實踐,我校的數據工程類人才培養的課程體系體現出以下幾方面的特色。
(一)多學科交叉融合的課程體系助力復合型人才培養
構建由應用數學、數據挖掘與分析技術和金融知識組成的的復合型知識結構體系,既注重學生數學基礎的培養,又加強金融數據挖掘與分析領域所需的計算機能力和應用領域知識的學習,建立起符合專業建設思想的較完備的課程體系,較好地滿足了市場對數據工程類人才的需求。其中數學基礎及應用能力方面的課程占總課時的20.66%,包括數學分析、高等代數、數學建模、數值計算方法等課程;數據統計能力方面的課程占總課時的9.58%,包括概率論與數理統計、應用統計學、數據分析軟件及應用等課程;數據挖掘能力方面的課程占總學時的20.06%,包括數據倉庫與數據挖掘、中文文本數據挖掘項目實訓和Web數據挖掘與電子商務等課程;應用領域知識能力方面的課程占總課時的3.89%,包括大數據概論、企業財務數據分析和證券交易數據分析項目設計等課程。同時構建了豐富的案例與理論課程相結合的課程實驗、課程設計、專業實踐和綜合項目實踐體系。學生既具備數據挖掘與分析能力,又掌握了金融類大數據分析所需的專業知識,并在大量的項目實訓中積累了豐富的數據挖掘和分析經驗,能夠較快地適應工作需要,滿足市場對復合型大數據人才的需求。
(二)強化計算機類課程,提高學生的計算機編程能力
由于大數據挖掘和分析都是基于強大的計算機能力實現的,在實踐中會用到較多的計算機編程及應用,需要學生具備足夠的編程基礎知識和能力,所以在人才培養方案中適當增加了數據挖掘和數據分析方面的計算機課程,提高學生的代碼理解和編程能力。這部分課程占總課時的8.08%,包括數據挖掘實踐中常用的Python、SAS、MATLAB、JAVA程序設計等課程。
(三)強化數據挖掘類課程及實訓項目,使學生具備足夠的數據挖掘能力
大數據應用需要學生熟悉數據挖掘知識,理解并掌握常用的數據挖掘模型,能夠根據實踐需要進行合理的數據挖掘和分析,發現數據規律和價值。因此在人才培養方案中,開設了較多的數據挖掘類實踐課程,占總課時的19.46%,包括綜合項目實訓、中文文本數據挖掘項目實訓和Web數據挖掘等課程,提高學生的數據挖掘知識和軟件掌握能力,并在項目實訓中積累大數據挖掘的經驗。
(四)融入投資、營銷和管理等行業知識,增強應用領域知識能力
結合成都市重點發展電子商務產業以及我校該專業的老師大多具備金融行業從業經歷的師資特點,我校的數據工程類本科人才培養主要面向金融領域的數據挖掘和數據分析,所以,在課程體系中較早地加入了金融類行業知識課程,占總課時的3.89%,包括證券交易數據分析、企業財務數據分析和客戶數據分析等課程,為學生畢業后從事金融領域的數據挖掘和數據分析奠定堅實的應用領域知識基礎。同時開設了占總課時30.24%的人文社會科學課程,增強和提高學生的人文軟實力。我校的數據工程類畢業學生很快就能在電商、電信和物流等行業的數據分析部門站穩腳跟,部分優秀的學生畢業2年內就成為這些部門的負責人。
(五)開設系列數學建模課程,增強大數據分析建模的能力
大數據分析和挖掘需要強大的數據建模能力。通過開設數學建模、數學建模綜合案例及數學建模競賽等課程,強化數學建模能力,使學生熟悉建模知識,能夠熟練運用數學建模思想,快速準確地捕捉到數據挖掘的目標,對任務進行合理的分解與安排,保證項目順利有序地實施。我校把數學建模作為數據工程類人才培養的核心課程,分3學期從數學建模入門到數學建模綜合案例,逐漸強化學生的數學建模與數據建模能力,既提高了學生參加全國大學生數學建模競賽和數據挖掘全國挑戰賽等學科競賽的能力,又鍛煉了數據挖掘能力,為今后的就業打下堅實的基礎。該專業學生作為我校參加全國大學生數學建模競賽的主力軍,保證了我校在每年的數學建模競賽中都能取得較好的成績。

圖2 基于市場能力需求的數據工程類人才培養的教學體系
為了培養市場需要的具有復合型能力的數據工程類人才,我們建立了產學研一體化的多層次的教學體系,將教師的科研、教學與學生的知識學習、科創活動緊密結合,打造出以需求為導向開展科研和教學、以科研促進教學和學生科創、教學科研與校企合作相輔相成的一體化的教學體系。
(一)以需求為導向的教學體系
教師科研團隊始終緊跟市場需求,積極開展數據挖掘和數據分析方面的科研項目與研究。根據這些項目和研究的需要,老師們又不斷進行教學創新與改革的探索,指導學生積極申報數據挖掘與數據分析類科創項目,以及圍繞大數據人才需求開展大量的數據挖掘和數據分析類綜合項目實訓和畢業設計,使得教學體系更加符合市場對人才的需求,培養出滿足社會需求的高素質的數據工程類應用型人才。
(二)產學研一體化的教學體系
經過探索,逐步建立起產學研一體化的轉換機制,將教師的科研資源、專業教學和學生的科創活動緊密結合起來,形成一個相互促進的有機整體,為數據工程類人才的培養構建了良好的教學體系。

圖3 產學研一體化的教學體系
1.與科研緊密結合的教學體系
(1)科研項目資源轉化為教學資源,為人才培養提供支撐
該專業教師團隊在長期的科研活動中已經建立了3個基于云平臺的數據倉庫,集成了大量的數據資料,為教學提供了豐富的教學資源。基于云平臺的證券數據倉庫:擁有證券行情數據、證券基本面信息數據、案例數據庫和證券示范數據倉庫。基于云平臺的電商示范性數據倉庫:集成了海量的電子商務和金融等數據資源。基于大數據的創新創業數據平臺:集成了基于招聘信息的招聘和就業數據以及招投標平臺數據。
預算績效評價會涉及諸多員工,且需要很多數據,只有基于正確的數據和信息,才能進行有效的績效評價,這也顯示了在預算執行監控中融入內部控制的必要性,各部門應完善績效評價機制,對預算執行過程,目標的實現程度,為實現目標制定的制度、采取的措施及其執行情況等進行評價。
基于這些數據倉庫集成的數據資源,建立起產學研一體化的體系。該體系是以數據挖掘為核心的分析研究平臺、以商業應用為目標的原型演示系統、以豐富的真實數據支持為特色的應用數學和計算機科學多門課程教學課件體系和教學示范系統,可以開展大量的數據挖掘和數據分析案例教學、課程設計和數據處理項目實訓,為數據工程類人才培養提供強大的資源支撐。
(2)科研子項目為學生科創提供項目資源和實戰機會
一方面,從教師的科研項目中提煉出大量的科創項目,為學生提供豐富的科學創新鍛煉機會。以這些科創項目為基礎,輔導學生積極開展科創項目的申報和立項,提升學生的數據工程實踐能力和科創能力。比如,從教師科研項目中提煉出來的市場招聘信息的挖掘與分析子項目,學生成功立項學校的科創項目,通過學生的科創研究,獲得了非常有價值的市場信息。基于此研究的畢業論文獲得了我校的優秀畢業論文一等獎。
另一方面,通過產學研一體化的發展,教師和學生的數據工程類能力不斷提升,又能為校企合作創造良好的基礎,促進校企更好更多地合作,為數據工程類人才培養創造更好的環境。比如,基于我們良好的數據挖掘與數據分析人力資源,企業主動和我們教師科研團隊合作,對市場的招投標信息進行挖掘和分析,其中部分數據處理工作就交給學生團隊利用課余時間來完成。通過這些鍛煉,學生在畢業前就熟悉了企業的運作機制,掌握了市場對數據挖掘和數據分析人才的需求,提前儲備好相應的能力。
2.教學與學生科創活動緊密結合的教學體系
為了提高學生的實踐能力,我們在教學過程一直重視學生的科創活動,鼓勵并支持學生積極參加各類學科競賽及科創活動,如全國大學生數學建模競賽、全國數據挖掘挑戰賽、全國仿真大賽及學校的各項課程活動,培養學生的創新意識和創新能力、訓練快速獲取信息的能力、鍛煉快速了解和掌握新知識的技能、培養團隊合作意識和團隊合作精神、訓練學生的邏輯思維和開放性思考方式,有效地提高學生建立數學模型和運用計算機技術解決實際問題的綜合能力。該專業學生參加全國大學生數學建模競賽,先后有181人次獲得省級或國家級獎勵,有3人獲得全國數據挖掘挑戰賽三等獎,校級學生科創立項6項。
依托學生創新工作室不斷夯實數據工程類人才的項目實踐能力。以學生工作室為基礎,大力開展項目實訓。在工作室創新地引入企業項目管理機制,以招投標形式發布并招募項目負責人和參與人,并嚴格按照企業項目運行機制跟蹤和監控項目的實施,培養和鍛煉學生的項目執行能力。將學生科創活動成果進一步集成,并不斷地將其轉換為各類教學資源,豐富教學體系。學生依托創新工作室先后完成了股市交易數據特征分析、移動話費套餐的研究、期刊信息數據分析等項目,并在老師的指導下,先后有17名學生公開發表了學術論文。
3.校企合作助力教學質量的提升
豐富的社會資源不斷充實數據工程類人才培養的資源。借助與中國產學研合作促進會協同創新平臺、科研合作企業以及學生就業企業等機構的合作,形成本專業堅實的社會資源體系。通過校企合作,開展多種形式的數據處理項目實訓,為學生提供豐富的實習實訓鍛煉機會,提高學生理論聯系實踐的能力,促進教學質量的提高。
(三)雙師型、復合型教師團隊為大數據人才培養提供保障
本專業教師團隊多數成員除了具有數學學位外,還分別具有金融投資、企業管理、信息系統、模式識別等領域學習、管理或項目研究與開發經歷,是復合型、雙師型的教師。近3年來,教師團隊已經成功立項數據科學類縱向科研項目8項,其中省科技廳5項、省教育廳1項、成都市科技局4項。他們不僅有豐富的高校教學經驗,還懂得市場規律,熟悉企業項目運行機制,為市場需要的跨學科復合型大數據人才培養提供了堅實的師資保障。
本文總結了成都大學數據工程類人才培養多年的探索和實踐經驗。運用數據挖掘的技術和手段,基于招聘網上的招聘信息建立了數據工程類人才的能力結構體系,并構建了基于能力結構體系的數據工程類本科人才培養的課程體系和教學體系。課程體系和教學體系都具有鮮明的辦學特色,較好地滿足了市場對數據工程類人才的需求。在此分享這些成果,希望能對數據工程類本科人才的培養起到幫助作用。
[1]黃晉.關于大數據人才培養的思考與探索[J].教育教學論壇.2014(45):201-203.
[2]何海地.美國大數據專業碩士研究生教育的背景、現狀、特色與啟示——全美23所知名大學數據分析碩士課程網站及相關信息分析研究[J].圖書與情報,2014(2):48-56.
[3]許高建.基于Web的文本挖掘技術研究[J].計算機技術與發展,2007(6):187-190.
[4]王繼成,潘金貴,張福炎.Web文本挖掘技術研究[J].計算機研究與發展,2000(5):513-520.
[5]程學旗,靳小龍,王元卓,等.大數據系統和分析技術綜述[J].軟件學報,2014(9):1889-1908.
[6]劉一穎.大數據時代高校數據型人才培養探究[J].傳承,2015(12):112-113.
(實習編輯:鄭 舒)
G642.0
A
1004-342(2017)01-112-06
2016-07-13
2015年成都市科技局項目(2015-RK00-00010-ZF);2015年四川省教育廳項目(15ZB0379);2014年成都市科技局項目(2014-RK00-00051-ZF);2015年四川省教育廳理科項目(15ZB0390);2015年成都市科技局項目(2015-RK00-00202-ZF)。
施 達(1974-),男,成都大學信息科學與工程學院講師,理學碩士;楊晉浩(1959-),男,成都大學信息科學與工程學院教授,理學碩士;張志強(1976-),男,成都大學信息科學與工程學院副教授,理學碩士;陳 丹(1984-),女,成都大學信息科學與工程學院講師,理學碩士;王偉鈞(1963-),男,成都大學信息科學與工程學院高級工程師,理學碩士。