施喜平 李家坤
(長江工程職業(yè)技術(shù)學(xué)院 湖北省武漢市 430212)
隨著云計(jì)算、大數(shù)據(jù)在高職院校校園管理過程中的應(yīng)用,高職校園數(shù)字化建設(shè)進(jìn)入到一個(gè)全新的階段。隨著我國高等教育事業(yè)的快速發(fā)展,高職院校招生方式的多樣化,逐漸形成高職院校學(xué)生特點(diǎn)的多樣化。大數(shù)據(jù)的引入使用,必將對高職教育在人才培養(yǎng)模式、課程模式、教學(xué)模式、評價(jià)體系等等方面帶來一系列的變革。
當(dāng)前我國高等職業(yè)教育事業(yè)的快速發(fā)展,高職院校招生方式的多樣化,逐漸形成高職院校學(xué)生特點(diǎn)的多樣化。高職教育主要是培養(yǎng)技術(shù)型、應(yīng)用型的高級專業(yè)人才,同普通高等教育相比,高職教育在人才培養(yǎng)模式、課程模式、教學(xué)模式、評價(jià)體系等等方面進(jìn)行了一系列的變革。隨著云計(jì)算、大數(shù)據(jù)的應(yīng)用,高職教育進(jìn)入的一個(gè)全新的階段,如何應(yīng)用大數(shù)據(jù)來進(jìn)行教學(xué)行為,進(jìn)而指導(dǎo)學(xué)生的學(xué)習(xí)行為。大數(shù)據(jù)背景下傳統(tǒng)的課堂教學(xué)模式、教學(xué)評價(jià)等早已不能滿足當(dāng)前高職課堂教學(xué)的需要,因此各高職院校都加入了智慧校園建設(shè)中。
當(dāng)前智慧校園建設(shè)大數(shù)據(jù)挖掘方法包括:數(shù)據(jù)分類、數(shù)據(jù)聚類分析、數(shù)據(jù)關(guān)聯(lián)分析、挖掘大數(shù)據(jù)算法優(yōu)化、可視化技術(shù)五類。
(1)數(shù)據(jù)分類的目的是分析輸入數(shù)據(jù),通過分析集中的數(shù)據(jù)表現(xiàn)出來的特性,為每一個(gè)類找到一種準(zhǔn)確描述或者模型,這種描述常常用謂詞來表示。由此生成的類描述用來對未來的測試數(shù)據(jù)進(jìn)行分類。盡管這些未來測試數(shù)據(jù)的類標(biāo)簽是未知的,仍可以由此預(yù)測這些新數(shù)據(jù)所屬的類。也可以由此對數(shù)據(jù)中每一個(gè)類有更好的理解。
(2)“物以類聚,人以群分”,數(shù)據(jù)聚類(Clustering)是人類認(rèn)識世界的一種重要方法。所謂聚類就是按照事物的某些屬性,把事物聚集成簇,使簇內(nèi)的對象之間具有較高的相似性,而不同簇的對象之間的相似程度較差。
(3)數(shù)據(jù)關(guān)聯(lián)規(guī)則是一種描述性的而非預(yù)測性的方法,經(jīng)常用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集背后的,項(xiàng)集之間的有趣關(guān)聯(lián)或相互關(guān)系。20 世紀(jì)60年代,Hajek 等人在早期研究中介紹了許多關(guān)聯(lián)規(guī)則學(xué)習(xí)的關(guān)鍵概念和方法,但是主要關(guān)注的是數(shù)學(xué)表達(dá),而不是算法。20 世紀(jì)90年代初,IBM 公司Almaden 研究中心的Agrawal 等人將關(guān)聯(lián)規(guī)則學(xué)習(xí)架構(gòu)引入數(shù)據(jù)庫社區(qū)。
(4)挖掘大數(shù)據(jù)算法優(yōu)化。
1.分類算法:在MapReduce 框架下,一個(gè)任務(wù)通常會被分為兩個(gè)階段:Map 階段和Reduce 階段,且所有的操作都是基于(key,value)鍵值對的。圖1 為MapReduce 任務(wù)工作過程。

圖1: MapReduce 任務(wù)工作過程

圖2:FeedBackSVM 流程圖

圖3:貧困生補(bǔ)助系統(tǒng)數(shù)據(jù)流程圖

圖4:教務(wù)系統(tǒng)教學(xué)過程數(shù)據(jù)流程圖

圖5:某課程的網(wǎng)絡(luò)教學(xué)資源學(xué)生訪問情況統(tǒng)計(jì)餅圖
2.反饋式并行支持向量機(jī)算法實(shí)現(xiàn)。反饋式并行支持向量機(jī)就是將原始訓(xùn)練數(shù)據(jù)集分塊,通過并行訓(xùn)練子樣本集加速全局支持向量的訓(xùn)練速度,通過反饋,將本次迭代的結(jié)果返回初始分類器進(jìn)行調(diào)整和更新,從而進(jìn)一步提高分類準(zhǔn)確率。改善目前高職學(xué)生在課堂中缺乏運(yùn)用解決問題策略所需的復(fù)雜情境;教師課堂以項(xiàng)目教學(xué)式為主,但高職學(xué)生在各環(huán)節(jié)學(xué)習(xí)過程中缺乏主動參與性,更缺乏批判性學(xué)習(xí)思維,造成不少學(xué)生的學(xué)習(xí)情況和效果呈現(xiàn)出低水平認(rèn)知活動。
基于這些原因,我們提出在校園大數(shù)據(jù)的挖掘優(yōu)化算法中,設(shè)計(jì)和實(shí)現(xiàn)基于MapReduce 編程框架的反饋式并行支持向量機(jī)時(shí),加強(qiáng)重視數(shù)據(jù)集的劃分和如何迭代這兩個(gè)問題。圖2 給出了FeedBackSVM 流程圖。
網(wǎng)絡(luò)數(shù)據(jù)中最重要的是安全問題。校園信息安全,首要的是解決校園大數(shù)據(jù)產(chǎn)生的網(wǎng)絡(luò)安全問題,在大數(shù)據(jù)算法優(yōu)化中最著名的當(dāng)屬Apriori 算法。我們的大數(shù)據(jù)已經(jīng)從簡單的處理對象開始轉(zhuǎn)變?yōu)橐环N基礎(chǔ)性資源,確保這一校園基礎(chǔ)性資源的安全,是我們選擇校園大數(shù)據(jù)處理方式首要考慮的問題。Apriori 算法目前廣泛應(yīng)用于網(wǎng)絡(luò)安全領(lǐng)域,比如網(wǎng)絡(luò)入侵檢測技術(shù)中。網(wǎng)絡(luò)系統(tǒng)早期都收集審計(jì)信息來建立跟蹤檔,但是早些年網(wǎng)絡(luò)審計(jì)跟蹤的目的多是為了性能測試或計(jì)費(fèi),因此對網(wǎng)絡(luò)惡意信息攻擊檢測提供的有用信息有限。而Apriori 算法通過模式的學(xué)習(xí)和訓(xùn)練可以發(fā)現(xiàn)網(wǎng)絡(luò)用戶的異常行為模式。
因此,當(dāng)前Apriori 算法廣泛應(yīng)用于高職院校信息管理數(shù)據(jù)庫中。隨著高職院校學(xué)生來源的多樣化,學(xué)校管理部門在教學(xué)工作、學(xué)工工作、學(xué)生資助專項(xiàng)工作難度、學(xué)生學(xué)籍管理工作等各項(xiàng)工作中采集的信息量和處理信息量也劇增。
例一:以學(xué)工系統(tǒng)其中一個(gè)功能為例,Apriori 算法加入在學(xué)工貧困生補(bǔ)助系統(tǒng)中,其運(yùn)行過程如圖3 所示。通過學(xué)生一卡通校園消費(fèi)來精準(zhǔn)及時(shí)后,貧困生補(bǔ)助系統(tǒng)會自動發(fā)放生活補(bǔ)助金幫扶貧困生。
例二:以學(xué)校教務(wù)系統(tǒng)其中一個(gè)功能為例,Apriori 算法加入在課堂教學(xué)師生互動系統(tǒng)動態(tài)數(shù)據(jù)中,其運(yùn)行過程如圖4 所示??梢圆蹲降秸n堂教學(xué)中有效的教與學(xué)的數(shù)據(jù),從而優(yōu)化課堂管理,完善師生評價(jià)體系。
(5)可視化技術(shù)。數(shù)據(jù)可視化是通過借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。
數(shù)據(jù):解決數(shù)據(jù)的采集,清理,預(yù)處理,分析,挖掘。
圖形:對光學(xué)圖像進(jìn)行接收、提取信息、加工變換、模式識別及存儲顯示。
可視化:數(shù)據(jù)與圖形間的交互處理。
數(shù)據(jù)可視化分為以下五個(gè)層面:
①數(shù)據(jù)統(tǒng)計(jì)圖表化階段:表達(dá)收集數(shù)據(jù)結(jié)果。
②數(shù)據(jù)結(jié)果展示:集成了大量的圖形、可視化算法,降低復(fù)雜的圖表的成本。
③數(shù)據(jù)分析過程可視化:對數(shù)據(jù)的分析過程進(jìn)行可視化,更好的探索規(guī)律、查找問題。
④VR/AR 階段的虛擬現(xiàn)實(shí)的可視化:虛擬現(xiàn)實(shí)提升概率思維、多維數(shù)據(jù)的可視化、高密度信息的展示、以及提供情境使人們更全面地理解問題。
⑤人工智能:人和數(shù)據(jù)的連接方式。篩選大數(shù)據(jù)隱含的規(guī)律,產(chǎn)生指導(dǎo)性結(jié)論。
因可視化技術(shù)具有參與感知,群體感知和移動感知計(jì)算,目前被廣泛應(yīng)用于新一代人工智能領(lǐng)域中。
大數(shù)據(jù)可視化工具有很多種,從大部分教育工作者熟知的角度來說,常見的、便于使用的數(shù)據(jù)可視化工具,如Excel、Processing 等。其中Excel 是Microsoft Office 中的一款電子表格軟件。該軟件通過工作簿(電子表格集合)來存儲數(shù)據(jù)和分析數(shù)據(jù)。Excel 可生成諸如規(guī)劃、財(cái)務(wù)等數(shù)據(jù)分析模型,并支持編寫公式來處理數(shù)據(jù)和通過各類圖表來顯示數(shù)據(jù)。在Excel2016 后,更是有內(nèi)置Power Query插件、管理數(shù)據(jù)模型、預(yù)測工作表、Power Privot、Power View 和 Power Map 等數(shù)據(jù)查詢分析工具。使用者對Excel 也比較容易上手操作。
例三:對于校園教務(wù)系統(tǒng)中的教學(xué)資料來說,學(xué)生每天的訪問都會產(chǎn)生非常龐大的數(shù)據(jù),如果能夠?qū)@些數(shù)據(jù)做到合理的利用,就可以針對學(xué)生的訪問形式,制作更有針對性、更易于學(xué)生課余學(xué)習(xí)的教學(xué)資源。可視化技術(shù)在智慧校園教務(wù)系統(tǒng)中一個(gè)應(yīng)用如圖5所示。
智慧校園幫助高職院校教育工作者全面掌握、公平的評價(jià)學(xué)生的各項(xiàng)學(xué)習(xí)行為,從而更好的為學(xué)生服務(wù),使教與學(xué)達(dá)到良好的促進(jìn)關(guān)系。
綜上,智慧校園建設(shè)過程中的大數(shù)據(jù)挖掘過程中,面臨的問題也是顯而易見。由于技術(shù)應(yīng)用限制、數(shù)據(jù)專業(yè)人才缺乏以及倫理道德與隱私安全風(fēng)險(xiǎn)等方面造成的挑戰(zhàn),需要更多技術(shù)層面的應(yīng)對措施,來確保大數(shù)據(jù)時(shí)代高校的智慧校園的,使得校園內(nèi)的各種設(shè)施都和信息技術(shù)建立聯(lián)系,方便學(xué)生的生活和學(xué)習(xí),加強(qiáng)校園的安全保護(hù),更便于對學(xué)生的健康管理。讓高職院校的學(xué)生有自信、有能力的從校園走向各技能型工作崗位,是高職院校智慧校園建設(shè)的最終目的。