林勤 陳長輝 賈志偉



摘? 要:隨著教育信息化進程的不斷推進,海量的教育基礎數據應運而生,各高職院校越發關注及重視如何利用這些“數字資產”為師生創建一個更加個性化的校園服務體系。運用基于大數據的教育分析平臺及真實的院校業務數據,構建以學生為對象的多維度行為分析模型,并以廣州某高職院校建設實施為例,從學生概況分析、學生行為分析、學生綜合預警等維度向校方呈現精準、個性特征明顯的學生綜合畫像,為學生的個性化學習生活提供導向依據。
關鍵詞:教育大數據;行為畫像;智慧校園
中圖分類號:TP391;G434? ? ? 文獻標識碼:A 文章編號:2096-4706(2021)05-0019-05
Application Exploration of Behavior Portrait Analysis of Higher Vocational College Students Based on Big Data Modeling
LIN Qin,CHEN Changhui,JIA Zhiwei
(Education Technology and Information Center,Guangzhou Panyu Polytechnic,Guangzhou? 511483,China)
Abstract:With the continuous advancement of the process of education informatization,a large amount of basic educational data has emerged after with it. Higher vocational colleges pay more and more attention to how to use these “digital assets” to create a more personalized campus service system for teachers and students. Using the education analysis platform based on big data and real business data of campus,then constructs a multi-dimensional behavior analysis model with students as the object. And also taking the construction and implementation of a higher vocational college in Guangzhou as an example,from the aspects of student profile analysis,student behavior analysis and student comprehensive warning,this paper presents the school with accurate and obvious personality characteristics of studentscomprehensive portrait,which provides guidance for studentspersonalized learning and life.
Keywords:education big data;behavior portrait;smart campus
0? 引? 言
大數據時代的來臨,對教育行業而言,是一個重要的契機。國務院關于印發《國家教育事業發展“十三五”規劃的通知》明確指出,鼓勵學校利用大數據技術開展對教育教學活動和學生行為數據的收集、分析和反饋,為推動個性化學習和針對性教學提供支持[1]。雖然高校在時代進步與社會發展中充當著推動者的角色,同時在人才培育、知識探索、科技研發及服務社會等方面起著主導及決定性的作用,但在大數據應用方面反而一直滯后于傳統的商務領域,實際上各高職院校已擁有數量龐大的教育基礎數據,如何讓這些“數字資產”進一步為學校辦學及管理提供更好的應用價值,已成為各院校的研究重點。
1? 大數據與行為畫像
大數據是個抽象的概念,它是指社會生產生活中與管理服務過程中形成的無法通過常規工具進行采集、管理、處理的海量數據集合,須借助新型技術進行提取整合,交叉分析,最終具有強精準性、指向性、決策性的信息資產。它具有典型的:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)5V特點(由IBM提出)。行為記錄是指由時間、人物、地點及事件等元素標簽所組成的具體的數據記錄,通過對大量的行為記錄進行分析便可以描繪出該人物的信息全貌,即行為畫像。
2? 教育大數據應用現狀
2.1? 應用的現狀
隨著研究的開展及技術的成熟,大數據應用已漸漸在人們的生活中嶄露頭角,如電商購物平臺利用用戶查閱及購物記錄大數據,分析出用戶的消費喜好而進行產品推送;又如醫院通過大數據可預知區域性流行病的范圍及周期,提前做好應診及進藥措施等,這些正是挖掘、運用大數據的價值體現。事實上,我國的高校也在不斷地嘗試用大數據分析挖掘技術解決在實際辦學中遇到的問題,如上海東華大學利用學校資產信息進行數據分析,從而了解學校的設備使用情況并以此制定采購計劃、預算等,大多數普通高校對大數據技術的應用還停留在理論研究上,但隨著現代高校信息化建設的不斷發展推進,如教務、人事、科研、圖書,特別是一卡通等各類管理應用系統的相繼完善并不斷標準化、體系化,使得有效、穩定、規范的數據來源成為可能,結合信息安全與云計算的支撐,普通高校也已逐步具備大數據技術應用的環境基礎[2]。如果能利用上述這些大數據海量、多維度、準確及高可塑性等優點,加強對這些數據的研究與分析,并通過建立數據模型找出數據間的相互關系及規律,可實現提升教學、辦公、管理、科研等各方面能力的應用分析結論,最終為學校的發展及規劃提供決策導向。
2.2? 面臨的問題
隨著國家教育現代化目標的不斷提高,傳統教育管理方式短板也日益突出,如教育與管理數據的非實時性,導致預測和評估的滯后;數據分析偏宏觀,導致缺乏對個體層面發展的關注等,而這些方面的問題又直接影響著學校的辦學發展及學生的個性化成長,具體表現為:
(1)在當今的信息社會大環境下,高校學生在校園日常生活場景中極易受到不同信息資訊、生活氛圍及思維引導的影響,進而產生潛移默化的變化,迷失正當的學習、生活目標,而且大部分學生及校方很難及時察覺并進行干預,一旦出現不可逆轉的事件時,為時已晚。
(2)相比以往,當代的高校學生展現出了極具特色的個性化發展趨勢,按部就班的傳統教育模式已嚴重地制約了學生的學習成長,特別是在校園信息化高速發展的今天,這種采用單一引導及復印式的教學管理方式更加顯得格格不入。
(3)雖然與大數據應用相結合可以為高校的個性化教學及智慧管理提供可能,但在近些年的教育大數據應用與實踐建設過程中,仍存在著數據標準不統一、信息系統孤島嚴重及實際運用落地難等問題[3]。
3? 智慧校園大數據基礎平臺
為解決上述問題,首先需要搭建大數據基礎平臺,借助各高職院校已具備的良好的計算及存儲資源,利用云計算靈活的部署模式,采用Hadoop+分布式數據庫并行的大數據架構體系[4],參照教育部教育管理信息化標準,對各信息化業務系統的主要結果數據進行整合、清洗、歸管以及質量把控等環節處理,如圖1所示,對全校的數據資源進行管控和運營,充分發揮數據資產的優勢,用于師生管理、教學、科研、資產及相關應用分析模塊,服務于學校辦學管理的各個方面。如對學生學習行為數據的分析,了解學生的學習進度、學習效果以及可能的就業方向等,這些數據展示給學生,讓其可以調整自己的工作學習安排;這些數據展示給教師,將對教學創新提供最為直接的依據;這些數據整合給學校,將可以為學生提供更具個性的智慧校園服務等。
平臺通過擴展和封裝Hadoop來實現對大數據的存儲、分析的支撐,同時實現對于非結構、半結構化數據處理、復雜的ETL流程、復雜的數據挖掘和計算模型處理,在構建統一數據標準的同時完成基礎核心的元數據管理平臺及數據共享交換平臺的建設,在此基礎上將學校教務、一卡通、圖書、學工等系統的主要基礎數據匯聚到平臺里,結合數據建模,從中構建出一個可多維度展示個體學生行為的數據分析模型(即行為畫像分析模型)。
4? 學生行為畫像分析模型
行為畫像的分析其實也是一項數據挖掘工作,該分析從學生的角色出發,基于個性化差異,對相關業務系統元數據通過因子分析、聚類分析、交叉分析以及組合分析等手段進行分析,來挖掘出每位學生的學習、生活、消費、行跡、興趣愛好等具有明顯個體特征性的標簽信息,構建一個多維度、準確且全面的學生綜合行為畫像分析模型,如圖2所示。
模型中所有分析維度的特征指標均由各業務系統提供數據來源,根據各高校主流信息系統相關樣本數據的特征,采用K近鄰算法(k-Nearest Neighbors algorithm,k-NN)擬合模型進行建模分析,實現快速精準的多維度分析結果展示[5],從而解決智慧校園大環境下的學生個性化成長及高學智慧化辦學服務中所遇到的困境與瓶頸。
5? 應用分析的效果呈現
本文以廣州某高職院校為例,通過上述大數據平臺的實踐建設,對該校32個在用業務系統的近7 800萬條信息記錄做作數據處理及數據倉庫建設,由于部分原始數據有可能涉及學生隱私內容,因此,所有數據在清洗入倉時已做脫敏處理,保證數據信息的安全,其中由2 300萬條相關信息記錄構成學生行為畫像分析模型元數據,對這些元數據進行流程化處理后,便可進行學生層面的分析與展示。
5.1? 學生畫像分析
該分析基于數據倉庫數據抽取模型,分析每名在校學生的個人基本屬性、綜合指標表現等個體特征及分項排名,如圖3所示。
所展示的分析結果十分有助于校方及老師對每一位學生有一個準確的了解,知道如何去針對不同的學生或整體學生的學習概況而進行教學方法的調整及學習方法的引導,同時有針對性地為學生提供感興趣的課內課外學習資源,助力學生的個性化學習成長;最重要的是讓學生本人對自己有一個客觀的認識,更清晰地定位在校學習、生活以及就業等工作,并及時了解自己在各個階段所出現的細微變化,通過自我肯定或反思,主動調整至最佳狀態。
5.2? 學生行為分析
該分析分為上網行為分析及行為軌跡分析兩部分:
(1)上網行為分析是通過學生校園網的上網記錄日志數據,對學生的上網進行分析,針對學生的日上網時長、流量、終端類型、接入地點等指標,展開其在年級、學院、時段等不同維度的分析;而對于網絡應用類型及偏好分析則通過網絡行為審計數據來實現。這些分析結果便于學校引導學生合理使用網絡,同時干預沉溺網絡的行為。
(2)行為軌跡分析通過挖掘學生在校的所有含地理位置痕跡的數據(主要有校園Wi-Fi認證接入、時長及漫游記錄,輔以一卡通及門禁記錄等),分析得出學校各個樓宇的各時間段的人流密度情況,以及各類群體和具體個人的行為軌跡規律,如圖4所示。這有助于學校有針對性的加強人流密集區的安保措施,另外,在當前疫情期間,可依此對學生在上、下課以及用餐高峰期時進行錯峰安排。
5.3? 精準助學分析
精準助學的主要對象是家庭經濟貧困學生,根據對全體在校學生一卡通消費數據的統計及聚類分析,得出在校學生整體的消費水平及頻次概況,從中得知貧困學生群體與正常學生群體之間的消費差距及在校消費穩定性上的不同,如圖5所示,從而開展相關工作[6]。精準助學分析不僅可以驗證已列入貧困助學學生的實際經濟情況,也可以發現其他因故而沒有申請或申請不通過的貧困學生,學校可依此主動對這類學生進行心理疏導或助學關注,避免出現其他問題;同時可以作為助學申評結果的有效依據,確保貧困學生有基本的生活質量并能順利完成學業。
5.4? 學生綜合預警
高職院校的生源寬泛,生活行為習慣參差不齊,管理難度較大,潛藏著很多管理盲區隱患,然而傳統的校園管理或信息化手段并未對學生異常行為進行有效的主動式預警,而無法及時掌握學生的各種動態,使學校在學生管理方面處于被動地位。學生綜合預警分析功能是利用學生的學業成績、一卡通消費記錄、門禁考勤記錄等校務管理信息,以及圖書館借閱數據、校園網使用數據等建立聚類及關聯分析模型,并設置預警閾值,針對學生的學業情況、考勤情況、用網情況及可能出現的失聯情況等進行危機預警,告知學生本人可能產生的不良后果并進行提醒或警告,以警代罰,實現對學生的全方位科學化的管理和教育。
5.5? 學生在校分析報告
該分析用于呈現在校學生每個階段時間內及整個大學學習生涯內的表現情況,利用大數據微觀鉆取到學生在校期間各方面的“蛛絲馬跡”,并且和同年校內其他學生進行對比分析,科學宏觀地展示學生學業、綜合素質、日常生活等整體行為全貌。這不僅方便學生有針對性的自我補差提優,更方便家長對孩子在整個大學生涯各個階段的行為表現有一個清楚的認識;同時也可作為畢業時校方就業推薦及綜合評價的優差依據。
6? 結? 論
本文所提出的基于大數據分析平臺的高職院校學生行為畫像模型應用,只是大數據在高職院校中針對學生管理方面的一個應用實例,利用Hadoop+KNN技術可實現快速及準確處理的優點,通過建模,聚類關聯挖掘出數據倉庫中學生相關的多維度畫像數據呈現,便于學校為學生的個性化學習及未來就業提供實質的科學分析以及智慧服務。同理,利用該數據分析平臺強大的數據處理能力以及精準的分析建模構建教師分析、學情分析、科研分析、就業分析、資產分析等模塊功能,全方位為學校的辦學、管理以及發展規劃提供科學的數據依據及決策,助力高職院校在新時代教育大背景下的良性發展。
參考文獻:
[1] 國務院.國務院關于印發國家教育事業發展“十三五”規劃的通知 [J].中華人民共和國國務院公報,2017(5):43-74.
[2] 董瀟瀟,胡延,陳彥萍.基于校園數據的大學生行為畫像研究與分析 [J].計算機與數字工程,2018,46(6):1200-1204+ 1262.
[3] 李有增,曾浩.基于學生行為分析模型的高校智慧校園教育大數據應用研究 [J].中國 電化教育,2018(7):33-38.
[4] 葛蘇慧,萬泉,白成杰.基于Hadoop的高校學生行為預警決策系統研究 [J].計算機應用與軟件,2021,38(1):6-12.
[5] 楊光瑩,杜敏,楊東梅等.基于校園行為數據分析的學生畫像系統初步構建研究 [J].教育教學論壇,2020(41):44-45.
[6] 李豐.大數據技術在高校學生助學金評比中的應用 [J].計算機教育,2017(5):154-157.
作者簡介:林勤(1983—),男,漢族,廣東汕頭人,網絡工程師,學士學位,研究方向:網絡管理與技術;陳長輝(1980—),男,漢族,廣東湛江人,高級實驗師,碩士,研究方向:網絡信息安全、大數據應用及安全;賈志偉(1983—),男,漢族,河南南陽人,網絡工程師,學士學位,研究方向:網絡規劃與管理。