趙郁園
摘 要:隨著數(shù)字信息化的快速發(fā)展,利用大數(shù)據(jù)進(jìn)行現(xiàn)狀分析、趨勢(shì)預(yù)測(cè)已經(jīng)成為眾多領(lǐng)域采用的方法和技術(shù)。大數(shù)據(jù)時(shí)代的到來(lái)有效的推動(dòng)了高校教育教學(xué)的體制改革和創(chuàng)新。智慧校園是一個(gè)集云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的綜合平臺(tái),為學(xué)校進(jìn)行教學(xué)管理和領(lǐng)導(dǎo)決策提供數(shù)據(jù)支持和個(gè)性化、智能化服務(wù)。本文從智慧校園的設(shè)計(jì)理念出發(fā),探討了大數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術(shù)在智慧校園系統(tǒng)中的應(yīng)用研究。
關(guān)鍵詞:大數(shù)據(jù) 智慧校園 數(shù)據(jù)挖掘 個(gè)性化推薦
0 引言
在大數(shù)據(jù)背景下建設(shè)智慧校園已受到國(guó)內(nèi)外的廣泛關(guān)注,建設(shè)大數(shù)據(jù)時(shí)代高校智慧校園服務(wù)平臺(tái)已成為必然趨勢(shì)。本文以智慧校園系統(tǒng)中海量數(shù)據(jù)為研究對(duì)象,基于大數(shù)據(jù)的數(shù)據(jù)挖掘技術(shù)在智慧校園系統(tǒng)中的研究應(yīng)用展開(kāi)探討。
1大數(shù)據(jù)環(huán)境下智慧校園概述
1.1大數(shù)據(jù)的信息處理框架
大數(shù)據(jù)的信息處理框架包括:數(shù)據(jù)的收集、數(shù)據(jù)的集成與融合、數(shù)據(jù)分析及數(shù)據(jù)解釋。通過(guò)合理使用大數(shù)據(jù)進(jìn)行分析,能夠提升工作效率和工作的針對(duì)性,改善用戶(hù)的體驗(yàn),大數(shù)據(jù)時(shí)代以前所未有的方式,從大量的數(shù)據(jù)集中提取出有價(jià)值、有用的信息。大數(shù)據(jù)技術(shù)及其應(yīng)用的過(guò)程,是將數(shù)據(jù)信息流轉(zhuǎn)變成特定的、知識(shí)密度高度聚集的數(shù)據(jù)類(lèi)型。
1.2 大數(shù)據(jù)在智慧校園中的應(yīng)用
大數(shù)據(jù)與云計(jì)算在信息化建設(shè)中發(fā)揮著舉足輕重的作用,智慧校園是利用大數(shù)據(jù)與云計(jì)算等技術(shù),以物聯(lián)網(wǎng)為基礎(chǔ)的智慧化校園,智慧校園以各種應(yīng)用服務(wù)系統(tǒng)為載體,將教學(xué)、科研、管理和校園生活一體化,為學(xué)校的教學(xué)管理及決策提供有力支持。
智慧校園在運(yùn)營(yíng)過(guò)程中會(huì)產(chǎn)生海量數(shù)據(jù)信息,包括學(xué)生的基本個(gè)人信息、成績(jī)信息、學(xué)生出勤記錄、教師基本個(gè)人信息、排課信息、課題研究信息等數(shù)據(jù),這些數(shù)據(jù)和學(xué)生的學(xué)習(xí)、老師的教學(xué)、學(xué)校的發(fā)展息息相關(guān)。如何從這些海量數(shù)據(jù)當(dāng)中進(jìn)行分析挖掘提取出有價(jià)值的信息并加以利用是我們關(guān)注的話(huà)題。
2 web數(shù)據(jù)挖掘及其應(yīng)用
2.1 數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘(DM,Data Mining) 又稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge Discover in Database,KDD),是目前人工智能和數(shù)據(jù)庫(kù)領(lǐng)域研究的熱點(diǎn)問(wèn)題,所謂數(shù)據(jù)挖掘是指從信息量龐大、隨機(jī)的、有噪音的數(shù)據(jù)集合里,對(duì)數(shù)據(jù)進(jìn)行逐一分析,從龐大的數(shù)據(jù)集合里挖掘出蘊(yùn)含在里面、事先不清楚、但有價(jià)值的知識(shí)的過(guò)程。數(shù)據(jù)挖掘技術(shù)作為一項(xiàng)綜合性的技術(shù),能構(gòu)有效的組織和管理數(shù)據(jù)信息,其研究領(lǐng)域涉及到電子商務(wù)、信息學(xué)、數(shù)學(xué)、計(jì)算機(jī)語(yǔ)言等多個(gè)學(xué)科。
2.2 web數(shù)據(jù)挖掘的應(yīng)用
Web挖掘?qū)儆跀?shù)據(jù)挖掘的其中一個(gè)研究方向,是將數(shù)據(jù)挖掘技術(shù)應(yīng)用于站點(diǎn)數(shù)據(jù)集中并挖掘出里面潛在的、有價(jià)值的信息的過(guò)程。Web挖掘根據(jù)信息來(lái)源的不同分成Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘、Web日志挖掘三種類(lèi)型。
(1)內(nèi)容挖掘
Web內(nèi)容挖掘是從站點(diǎn)的網(wǎng)頁(yè)信息或者文件里挖掘出有用信息的過(guò)程。實(shí)現(xiàn)內(nèi)容挖掘有兩種方式:第一種方式是對(duì)系統(tǒng)相關(guān)信息直接挖掘。像基于啟發(fā)式規(guī)則的AHOY,查詢(xún)語(yǔ)言WebLOG等都是基于這種方式。第二種方式是通過(guò)網(wǎng)絡(luò)搜索引擎進(jìn)行數(shù)據(jù)查詢(xún),對(duì)查詢(xún)結(jié)果進(jìn)處理提取出潛在的、有價(jià)值的信息。采用第二種方式的有WebSQL等。
(2)結(jié)構(gòu)挖掘
Web結(jié)構(gòu)挖掘是對(duì)網(wǎng)頁(yè)文件與文件之間的結(jié)構(gòu)進(jìn)行分析和研究,發(fā)現(xiàn)網(wǎng)頁(yè)文檔自身的結(jié)構(gòu)和蘊(yùn)含在里面的有用模式,對(duì)網(wǎng)頁(yè)文件及其鏈接進(jìn)行分類(lèi)和聚類(lèi),從中找出用戶(hù)可能有興趣、有價(jià)值的網(wǎng)頁(yè)文件信息。對(duì)網(wǎng)頁(yè)文檔結(jié)構(gòu)挖掘主要是對(duì)網(wǎng)頁(yè)的超鏈接進(jìn)行分析和研究,挖掘出包含于超鏈接結(jié)構(gòu)里面的有價(jià)值的信息。頁(yè)面文件之間的超鏈接結(jié)構(gòu)體現(xiàn)了頁(yè)面文件之間的某種聯(lián)系,應(yīng)該能夠通過(guò)算法從給定的網(wǎng)頁(yè)文檔集中挖掘出它們之間的鏈接結(jié)構(gòu)等有價(jià)值的數(shù)據(jù)信息。
(3)日志挖掘
Web日志挖掘是對(duì)站點(diǎn)服務(wù)器的日志記錄進(jìn)行分析和研究,挖掘出客戶(hù)瀏覽系統(tǒng)的模式以及預(yù)測(cè)客戶(hù)瀏覽站點(diǎn)行為的技術(shù)。日志挖掘通過(guò)對(duì)系統(tǒng)服務(wù)器的日志文件進(jìn)行分析找出其中的特點(diǎn)和規(guī)律,提取出用戶(hù)的偏好、對(duì)產(chǎn)品的滿(mǎn)意度、對(duì)站點(diǎn)的忠實(shí)度。
3.數(shù)據(jù)挖掘在智慧校園系統(tǒng)中的研究應(yīng)用——以mooc在線(xiàn)學(xué)習(xí)平臺(tái)為例
對(duì)于mooc在線(xiàn)學(xué)習(xí)平臺(tái),如何通過(guò)平臺(tái)數(shù)據(jù)獲取我們需要的信息至關(guān)重要。通過(guò)學(xué)生與教師之間的互動(dòng),同學(xué)們之間的互動(dòng),學(xué)生與學(xué)習(xí)資源的交互,會(huì)產(chǎn)生很多結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)信息。這些數(shù)據(jù)信息一部分可以從網(wǎng)頁(yè)日志文件中獲取,一部分直接從數(shù)據(jù)平臺(tái)開(kāi)放的數(shù)據(jù)獲取。
在大數(shù)據(jù)信息網(wǎng)的支持下,學(xué)生可以通過(guò)mooc在線(xiàn)學(xué)習(xí)平臺(tái)隨時(shí)隨地觀(guān)看課程、與老師進(jìn)行交流互動(dòng)。這些行為為學(xué)生學(xué)習(xí)行為的干預(yù)和預(yù)測(cè)、個(gè)性化推薦等提供了重要依據(jù)。例如,我們可以對(duì)學(xué)生在在線(xiàn)學(xué)習(xí)平臺(tái)的瀏覽和觀(guān)看記錄進(jìn)行跟蹤和記錄。通過(guò)持續(xù)的記錄和數(shù)據(jù)關(guān)聯(lián)分析,挖掘出學(xué)生感興趣的課程和方向,為學(xué)生進(jìn)行個(gè)性化的推薦定制服務(wù)。
4 結(jié)束語(yǔ)
基于大數(shù)據(jù)環(huán)境下智慧校園可以為師生提供個(gè)性化和智能化的服務(wù),通過(guò)數(shù)據(jù)挖掘和關(guān)聯(lián)規(guī)則分析對(duì)海量數(shù)據(jù)進(jìn)行清洗、預(yù)處理,篩選出有價(jià)值的信息,并將其應(yīng)用于校園的建設(shè)和管理中,逐步實(shí)現(xiàn)學(xué)校各項(xiàng)資源的整合,為學(xué)校的教育規(guī)劃和決策提供數(shù)據(jù)支持,提高學(xué)校的信息化管理水平。本文著重研究了大數(shù)據(jù)背景下數(shù)據(jù)挖掘技術(shù)在智慧校園的應(yīng)用,對(duì)學(xué)校的教學(xué)管理有一定的幫助和借鑒作用。
參考文獻(xiàn):
[1]陳程,馮正廣.大數(shù)據(jù)理念在高校學(xué)生管理中的應(yīng)用[J].教育觀(guān)察,2016(17)
[2] 單留舉,王曉東,馬英運(yùn).基于大數(shù)據(jù)的用戶(hù)學(xué)習(xí)偏好建模及應(yīng)用 [J] .計(jì)算機(jī)應(yīng)用與軟件,2016(33)
[3] 熊頻, 胡小勇. 面向智慧校園的學(xué)習(xí)環(huán)境建設(shè)研究:案例與策略[J]. 電化教育研究,2015(3)