孔 超,張麗平,劉 濤
(安徽工程大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 蕪湖 241000)
當(dāng)前,為主動(dòng)應(yīng)對(duì)新一輪科技革命與產(chǎn)業(yè)變革,支撐服務(wù)創(chuàng)新驅(qū)動(dòng)發(fā)展、“中國(guó)制造2025”等一系列國(guó)家戰(zhàn)略,2017年2月以來,教育部積極推進(jìn)了新工科建設(shè)[1]。新工科建設(shè)必須從技術(shù)范式、科學(xué)范式、工程范式走向新工科范式,著重要培養(yǎng)學(xué)生的工程創(chuàng)新能力和適應(yīng)變化能力。對(duì)高校而言,新工科首先是指新興工科專業(yè),如數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)(以下簡(jiǎn)稱大數(shù)據(jù)專業(yè))、人工智能、智能制造、機(jī)器人等原來沒有的專業(yè),也包括傳統(tǒng)工科專業(yè)的升級(jí)改造;對(duì)社會(huì)而言,新工科強(qiáng)調(diào)結(jié)構(gòu)要與產(chǎn)業(yè)發(fā)展相匹配,既面向當(dāng)前急需,又考慮未來發(fā)展[2]。
在此背景下,安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院把握“大數(shù)據(jù)與人工智能”這一重大發(fā)展機(jī)遇,響應(yīng)教育部“高等學(xué)校人工智能創(chuàng)新行動(dòng)計(jì)劃”,積極籌建大數(shù)據(jù)特色實(shí)驗(yàn)室。通過實(shí)驗(yàn)室建設(shè)把大數(shù)據(jù)技術(shù)與學(xué)院專業(yè)改造和新專業(yè)建設(shè)結(jié)合起來,為學(xué)校新工科建設(shè)注入數(shù)據(jù)化、智能化的新動(dòng)力,促成新工科專業(yè)的深度融合發(fā)展,提升學(xué)校在大數(shù)據(jù)領(lǐng)域科技創(chuàng)新、人才培養(yǎng)和服務(wù)國(guó)家需求的能力。面向新工科的大數(shù)據(jù)專業(yè)要求緊密結(jié)合地方特色,注重學(xué)生工程實(shí)踐能力培養(yǎng),以應(yīng)用驅(qū)動(dòng)創(chuàng)新,多學(xué)科交叉融合的方式,加強(qiáng)數(shù)理統(tǒng)計(jì)和矩陣計(jì)算等建模和算法訓(xùn)練,培養(yǎng)“系統(tǒng)架構(gòu)師”和“數(shù)據(jù)科學(xué)家”,而這正是當(dāng)前社會(huì)最需要的兩類人才。
應(yīng)用驅(qū)動(dòng)創(chuàng)新,創(chuàng)新驅(qū)動(dòng)發(fā)展。其落腳點(diǎn)在于如何基于落地的應(yīng)用,培養(yǎng)學(xué)生利用統(tǒng)計(jì)模型和編程技術(shù)解決現(xiàn)實(shí)問題的能力。實(shí)踐教學(xué)正是高校培養(yǎng)學(xué)生工程實(shí)踐能力、科研能力等綜合素質(zhì)的重要環(huán)節(jié),是新工科背景下實(shí)施素質(zhì)教育不可分割的重要內(nèi)容[3]。
隨著我國(guó)大數(shù)據(jù)相關(guān)政策的不斷出臺(tái)和深入實(shí)施,大數(shù)據(jù)產(chǎn)業(yè)應(yīng)用與布局不斷深化,大數(shù)據(jù)產(chǎn)業(yè)特色化集聚發(fā)展格局逐步形成,數(shù)據(jù)時(shí)代的新模式、新業(yè)態(tài)不斷涌現(xiàn)。大數(shù)據(jù)產(chǎn)業(yè)的蓬勃發(fā)展催生出從數(shù)據(jù)科學(xué)家、數(shù)據(jù)建模師、數(shù)據(jù)分析員、數(shù)據(jù)處理員到數(shù)據(jù)運(yùn)維人員的崗位體系,給教育事業(yè)帶來了新的機(jī)遇和挑戰(zhàn)。
1.人才緊缺。近十年來,以BAT(指百度(B),阿里巴巴(A),騰訊(T))為代表的中國(guó)互聯(lián)網(wǎng)企業(yè)在商業(yè)上取得令世界矚目的巨大成就。創(chuàng)新型商業(yè)模式的開發(fā)依賴于“數(shù)據(jù)科學(xué)家”,企業(yè)IT能力的建設(shè)依賴于“系統(tǒng)架構(gòu)師”[4]。不論是拓展大數(shù)據(jù)業(yè)務(wù)的百度、阿里、奇虎360 等互聯(lián)網(wǎng)公司,還是專業(yè)提供數(shù)據(jù)服務(wù)的大數(shù)據(jù)服務(wù)商,以及擁有大量數(shù)據(jù)的傳統(tǒng)行業(yè),對(duì)專業(yè)大數(shù)據(jù)人才都有著迫切的需求。市場(chǎng)上對(duì)IT 人才的需求與高校能夠培養(yǎng)和提供的人才相比還有很大差距,主要表現(xiàn)為企業(yè)所需的合格的“系統(tǒng)架構(gòu)師”和“數(shù)據(jù)科學(xué)家”很難直接從高校畢業(yè)生中招聘到[5]。這一點(diǎn)在高校的人才培養(yǎng)中尤為明顯,課堂和實(shí)驗(yàn)室學(xué)的東西與市場(chǎng)脫節(jié),導(dǎo)致學(xué)生厭學(xué)。
2.工程實(shí)踐教學(xué)體系不夠完善。大數(shù)據(jù)研究的生命周期從數(shù)據(jù)源到基礎(chǔ)設(shè)施,再到模型和算法,支持上層應(yīng)用,如電子商務(wù)、搜索引擎、社會(huì)網(wǎng)絡(luò)分析、智慧城市等,每一個(gè)環(huán)節(jié)都需要實(shí)踐教學(xué)的支撐。學(xué)生需通過實(shí)踐,掌握開放數(shù)據(jù)源的獲取方式,采用廣度優(yōu)先、深度優(yōu)先或二者并重的方式編寫爬蟲,智能、自主地解析HTML 文件,從中抽取文本、圖像、視頻等結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),并能以文件系統(tǒng)或數(shù)據(jù)庫(kù)等工具進(jìn)行有效地?cái)?shù)據(jù)管理;再如模型和算法,需要學(xué)生通過不斷地實(shí)踐理解模型優(yōu)化中的參數(shù)調(diào)節(jié)、性能測(cè)試、魯棒性及可擴(kuò)展性驗(yàn)證等。此外,通過實(shí)驗(yàn)測(cè)試算法的收斂效率與收斂性能,可以輔助學(xué)生理解算法理論層面的優(yōu)化、時(shí)間復(fù)雜度等。然而,眾多高校實(shí)踐環(huán)節(jié)不夠重視,學(xué)生動(dòng)手能力明顯不足,而大數(shù)據(jù)專業(yè)又是交叉綜合的新興學(xué)科,要求線性代數(shù)、概率論與數(shù)理統(tǒng)計(jì)、離散數(shù)學(xué)、高級(jí)程序設(shè)計(jì)、云計(jì)算等理論知識(shí)支撐實(shí)踐教學(xué)。學(xué)生光學(xué)不練,很難掌握枯燥的理論知識(shí),更無法將優(yōu)化的算法落地為現(xiàn)實(shí)的應(yīng)用,無法滿足用人單位的需求。
雖然部分高校針對(duì)大數(shù)據(jù)專業(yè)開設(shè)了專業(yè)基礎(chǔ)教學(xué)、專業(yè)課程教學(xué)、專業(yè)綜合等實(shí)踐環(huán)節(jié),但是工程實(shí)踐教學(xué)體系不完善、實(shí)踐教學(xué)平臺(tái)不足、教學(xué)手段缺乏創(chuàng)新等典型問題也日益凸顯[6]。因此,文章結(jié)合安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院大數(shù)據(jù)專業(yè)建設(shè)的探索,主要從已建立的大數(shù)據(jù)實(shí)驗(yàn)室和教務(wù)處大力推行的“金課”教學(xué)手段,從硬件支撐和創(chuàng)新教學(xué)手段兩個(gè)方面闡述面向新工科的大數(shù)據(jù)專業(yè)工程實(shí)踐教學(xué)體系。
大數(shù)據(jù)專業(yè)工程實(shí)踐教學(xué)體系的主要硬件支撐平臺(tái)是已建立的安徽工程大學(xué)新工科大數(shù)據(jù)特色實(shí)驗(yàn)室。實(shí)驗(yàn)室占地約200 平方米,涵蓋中心機(jī)房和學(xué)生機(jī)房?jī)蓚€(gè)區(qū)域。其中,中心機(jī)房配備25臺(tái)高性能服務(wù)器,涵蓋大數(shù)據(jù)、分布式數(shù)據(jù)庫(kù)和深度學(xué)習(xí),滿足HPDA和深度學(xué)習(xí)教學(xué)及科研需求;現(xiàn)有的集群具備強(qiáng)大的計(jì)算能力:628 個(gè) CPU 核,16 塊P40GPU,GPU單精度浮點(diǎn)運(yùn)算能力達(dá)到192TFlops;Hadoop 提供336TB,共享存儲(chǔ)提供11.52TB 高速固態(tài)盤和48T NLSA;使用業(yè)內(nèi)最主流的管理調(diào)度平臺(tái),管理方便,hadoop 集群使用ambari,深度學(xué)習(xí)調(diào)度使用slurm;采用人工智能技術(shù)的存儲(chǔ)陣列,智能分析數(shù)據(jù)熱度,冷數(shù)據(jù)自動(dòng)流動(dòng)到大容量SAS,熱數(shù)據(jù)保存在固態(tài)盤,提供最高性能和最優(yōu)的性價(jià)比,供整個(gè)集群共享使用。自帶持續(xù)數(shù)據(jù)保護(hù),用于保存關(guān)鍵數(shù)據(jù)。此外,計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)支持彈性擴(kuò)展。實(shí)驗(yàn)室支持大數(shù)據(jù)及相關(guān)專業(yè)的工程實(shí)驗(yàn)、實(shí)訓(xùn)。此外,單獨(dú)裝備的16塊P40GPU,其單精度浮點(diǎn)運(yùn)算能力足可支持主流的圖像處理、特征抽取等深度學(xué)習(xí)任務(wù),供師生學(xué)習(xí)及科研。

圖1 實(shí)驗(yàn)室中心機(jī)房硬件架構(gòu)
如圖1 所示,實(shí)驗(yàn)室中心機(jī)房主要由大數(shù)據(jù)平臺(tái)區(qū)、存儲(chǔ)區(qū)和管理服務(wù)器區(qū)組成。基礎(chǔ)資源包括高性能服務(wù)器、網(wǎng)絡(luò)設(shè)備與存儲(chǔ)等硬件,打造成熟可靠的實(shí)驗(yàn)室硬件環(huán)境。大數(shù)據(jù)平臺(tái)區(qū)主要包含AI 服務(wù)器、大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)資源服務(wù)器、Hadoop 服務(wù)器等組成,構(gòu)成大數(shù)據(jù)實(shí)驗(yàn)室的硬件基礎(chǔ)計(jì)算資源。存儲(chǔ)區(qū)由一臺(tái)高性能存儲(chǔ)陣列組成,通過光纖交換機(jī)組成FC SAN 網(wǎng)絡(luò),為平臺(tái)計(jì)算資源提供高可靠的數(shù)據(jù)存儲(chǔ)。管理服務(wù)器區(qū)包含大數(shù)據(jù)實(shí)驗(yàn)平臺(tái)資源平臺(tái)管理服務(wù)器、AI 管理服務(wù)器等,為平臺(tái)服務(wù)器工作運(yùn)行、處理操作、操作系統(tǒng)及應(yīng)用提供不同層級(jí)的資源管理、性能維護(hù)和監(jiān)控配置。

圖2 大數(shù)據(jù)專業(yè)工程實(shí)踐教育體系總體架構(gòu)
如圖2 所示,安徽工程大學(xué)工程實(shí)踐教育體系主要由大數(shù)據(jù)基礎(chǔ)平臺(tái)和大數(shù)據(jù)實(shí)訓(xùn)教學(xué)平臺(tái)作為支撐。大數(shù)據(jù)基礎(chǔ)平臺(tái)提供從數(shù)據(jù)治理、數(shù)據(jù)查詢和分析處理等不同應(yīng)用場(chǎng)景大數(shù)據(jù)處理的能力,為平臺(tái)構(gòu)建數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理、數(shù)據(jù)應(yīng)用開發(fā)等整個(gè)生命周期管理體系。大數(shù)據(jù)實(shí)訓(xùn)教學(xué)平臺(tái)包含功能豐富的應(yīng)用教學(xué)模板和資源,教師和學(xué)生提供全流程的教學(xué)服務(wù)。采用OpenStack 技術(shù),實(shí)現(xiàn)了硬件資源集中調(diào)度和管理。通過對(duì)硬件設(shè)施進(jìn)行虛擬化處理,形成虛擬層面的資源池系統(tǒng),該資源池系統(tǒng)可按需為每一套應(yīng)用系統(tǒng)提供基礎(chǔ)IT 資源——計(jì)算能力、存儲(chǔ)能力和網(wǎng)絡(luò)功能,快速適應(yīng)不斷變化的業(yè)務(wù)需求,實(shí)現(xiàn)“彈性”資源分配能力。客戶通過統(tǒng)一的Web界面,可實(shí)現(xiàn)對(duì)整個(gè)數(shù)據(jù)中心集中管理,包括虛擬機(jī)、資源池、數(shù)據(jù)中心等,從而為用戶提供可靠、優(yōu)質(zhì)的計(jì)算服務(wù)。
此外,依托此平臺(tái),大數(shù)據(jù)專業(yè)重新規(guī)劃了課程體系,基礎(chǔ)課程、核心課程、實(shí)訓(xùn)實(shí)習(xí)皆可通過此平臺(tái)進(jìn)行實(shí)操實(shí)訓(xùn)。尤其在實(shí)訓(xùn)實(shí)習(xí)階段,要求學(xué)生根據(jù)真實(shí)案例和需求,掌握數(shù)據(jù)采集,數(shù)據(jù)預(yù)處理,數(shù)據(jù)分析,算法設(shè)計(jì)和建模,模型學(xué)習(xí),模型評(píng)價(jià),可視化展示等技能,如圖3所示。

圖3 大數(shù)據(jù)專業(yè)課程體系規(guī)劃
一個(gè)完整的大數(shù)據(jù)專業(yè)工程實(shí)踐教學(xué)體系除了硬件平臺(tái)的支撐,還需采用創(chuàng)新教學(xué)手段,如翻轉(zhuǎn)課堂,打造“金課”。學(xué)科競(jìng)賽作為實(shí)踐教學(xué)中的一個(gè)有效拓展,極大地鍛煉了學(xué)生的思考及動(dòng)手能力。本節(jié)以項(xiàng)目組成員的真實(shí)授課案例為例,闡述翻轉(zhuǎn)課堂創(chuàng)新教學(xué)手段對(duì)工程實(shí)踐教學(xué)體系的支撐作用。
課程以程序設(shè)計(jì)類常見的基礎(chǔ)算法作為主體內(nèi)容,是學(xué)科競(jìng)賽與課堂教學(xué)的有機(jī)契合,明確了課程內(nèi)容組織形式為專題制、課堂學(xué)生組織形式為分組制、授課模式為翻轉(zhuǎn)課堂模式、評(píng)價(jià)機(jī)制為兩級(jí)評(píng)價(jià)體系的基本課程框架。翻轉(zhuǎn)課堂授課模式主要分為課內(nèi)和課外兩部分。學(xué)生課外自學(xué)的學(xué)習(xí)資源,包括教師錄制的授課視頻、微課、教學(xué)資料、網(wǎng)絡(luò)公開課等。課內(nèi)學(xué)生分組進(jìn)行討論和作業(yè)題。討論是令學(xué)生形成觀點(diǎn)的重要方式,由教師指定主題的討論分為基礎(chǔ)、進(jìn)階和巔峰3個(gè)難度級(jí)別,另有他山之石環(huán)節(jié)支持無指定主題的學(xué)生間、師生間的討論。作業(yè)是對(duì)學(xué)生自學(xué)效果的檢驗(yàn)以及學(xué)生進(jìn)行知識(shí)內(nèi)化的重要渠道,由學(xué)生經(jīng)過充分討論共同完成。討論與作業(yè)題結(jié)束后,每組學(xué)生提交1份報(bào)告,記錄討論結(jié)果與作業(yè)題的解題過程,以及互評(píng)組內(nèi)學(xué)生對(duì)報(bào)告的貢獻(xiàn)度。由教師對(duì)每組的報(bào)告進(jìn)行評(píng)價(jià)并結(jié)合組內(nèi)互評(píng)給出每個(gè)學(xué)生的當(dāng)次成績(jī)。整個(gè)專題包括專題引入、預(yù)留基礎(chǔ)討論主題、基礎(chǔ)題目預(yù)測(cè)試、閱讀材料觀看視頻初步交流、討論、作業(yè)題目、評(píng)價(jià)、總結(jié)、擴(kuò)展與歸納等諸多環(huán)節(jié)。以學(xué)生課后閱讀材料觀看視頻初步交流為分割,前一部分環(huán)節(jié)設(shè)置在上一堂課后期,后一部分環(huán)節(jié)設(shè)置在下一堂課的前期,最后的擴(kuò)展與歸納也是由學(xué)生課后完成。專題與課時(shí)進(jìn)行穿插,保證了專題環(huán)節(jié)完整,課堂內(nèi)容連貫。
綜上,構(gòu)建完善的大數(shù)據(jù)專業(yè)工程實(shí)踐教學(xué)體系需從硬件平臺(tái)支撐和創(chuàng)新教學(xué)手段兩個(gè)方面入手,二者相輔相成,缺一不可。此外,安徽工程大學(xué)計(jì)算機(jī)與信息學(xué)院為適應(yīng)新工科建設(shè)需要,將計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、物聯(lián)網(wǎng)專業(yè)結(jié)合一體。以特色實(shí)驗(yàn)室建設(shè)為契機(jī),進(jìn)一步調(diào)整好各個(gè)實(shí)驗(yàn)室功能,打破原來的設(shè)置局限,本著提高計(jì)算資源共享,減少重復(fù)投資,加強(qiáng)整體協(xié)作的宗旨,對(duì)人員、設(shè)備、實(shí)驗(yàn)用房等資源實(shí)現(xiàn)統(tǒng)一管理、統(tǒng)一調(diào)配、重新整合,為面向新工科的大數(shù)據(jù)專業(yè)工程實(shí)踐教學(xué)體系的改革和創(chuàng)新提供保障。
文章總結(jié)了大數(shù)據(jù)專業(yè)建設(shè)現(xiàn)狀,詳細(xì)介紹了大數(shù)據(jù)專業(yè)的工程實(shí)踐教學(xué)體系,以期為新增設(shè)的人工智能專業(yè)提供參照性建設(shè)意見。構(gòu)建完善的面向新工科的大數(shù)據(jù)專業(yè)工程實(shí)踐教學(xué)體系需從硬件支撐平臺(tái)和創(chuàng)新教學(xué)手段兩個(gè)方面入手,二者相輔相成,缺一不可。