








摘要:高職院校的一體化平臺(tái)集聚了學(xué)生相關(guān)的海量數(shù)據(jù),為構(gòu)建高職學(xué)生畫像提供了數(shù)據(jù)基礎(chǔ)。基于大數(shù)據(jù)技術(shù)構(gòu)建的學(xué)生個(gè)體畫像和群體畫像,可以用來(lái)分析學(xué)生行為、開(kāi)展精準(zhǔn)輔助和學(xué)習(xí)/行為預(yù)警,有助于實(shí)現(xiàn)高職教育教學(xué)的個(gè)性化、精準(zhǔn)化和學(xué)校管理的主動(dòng)化、科學(xué)化,進(jìn)而提升人才培養(yǎng)質(zhì)量。
關(guān)鍵詞:大數(shù)據(jù);高職;學(xué)生畫像;學(xué)生行為分析;精準(zhǔn)輔助;預(yù)警
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2025)04-0099-04 開(kāi)放科學(xué)(資源服務(wù)) 標(biāo)識(shí)碼(OSID) :
0 引言
隨著教育數(shù)字化轉(zhuǎn)型,大數(shù)據(jù)技術(shù)為高職教育帶來(lái)了機(jī)遇與挑戰(zhàn),并逐步應(yīng)用于學(xué)生畫像構(gòu)建。2022 年,國(guó)家層面又啟動(dòng)教育數(shù)字化戰(zhàn)略行動(dòng),黨的二十大也首次將“推進(jìn)教育數(shù)字化”寫入報(bào)告。以“人工智能”“大數(shù)據(jù)”“物聯(lián)網(wǎng)”“云計(jì)算”等為代表的現(xiàn)代信息技術(shù)也不斷融入社會(huì)、融入生活,成為推動(dòng)教育數(shù)字化、現(xiàn)代化的重要手段。當(dāng)前,依托智慧教學(xué)平臺(tái)和學(xué)生管理平臺(tái)的廣泛應(yīng)用,學(xué)生日常學(xué)習(xí)、生活、娛樂(lè)的數(shù)據(jù)得以完整的記錄和保存。
目前來(lái)看,各個(gè)高職院校均已意識(shí)到要充分利用這些校園大數(shù)據(jù),但在使用時(shí)仍然存在數(shù)據(jù)思維淡漠、數(shù)據(jù)維度單一、應(yīng)用場(chǎng)景有限等問(wèn)題。
因此,運(yùn)用數(shù)據(jù)思維和大數(shù)據(jù)技術(shù)全面開(kāi)展高職教育的“依數(shù)治理”,可以不斷提升教學(xué)質(zhì)量、提高管理效率,從而提升人才培養(yǎng)質(zhì)量。
1 大數(shù)據(jù)技術(shù)與學(xué)生畫像
1.1 大數(shù)據(jù)技術(shù)
大數(shù)據(jù)技術(shù)是指綜合運(yùn)用各種現(xiàn)代信息技術(shù)和方法,從具有5V特征(即數(shù)據(jù)量大(Volume) 、處理速度高(Velocity) 、數(shù)據(jù)種類多(Variety) 、價(jià)值密度低(Value) 和具有真實(shí)性(Veracity)) 的數(shù)據(jù)中發(fā)現(xiàn)、提取有價(jià)值規(guī)律的操作總結(jié)和技術(shù)規(guī)范。大數(shù)據(jù)的核心技術(shù)包括數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘與分析、數(shù)據(jù)可視化等。
1.2 用戶畫像
“用戶畫像”的概念最早由Alan Cooper提出。他認(rèn)為,“用戶畫像”是通過(guò)對(duì)真實(shí)用戶的數(shù)據(jù)分析,用數(shù)據(jù)建立的虛擬目標(biāo)用戶模型。用戶畫像側(cè)重從不同維度歸結(jié)同一類用戶,刻畫用戶的廣義特征,并基于這些特征精準(zhǔn)推薦產(chǎn)品或服務(wù),實(shí)現(xiàn)將用戶數(shù)據(jù)轉(zhuǎn)化為產(chǎn)品價(jià)值[1]。
1.3 學(xué)生畫像
高職院校智慧教育平臺(tái)或一體化教育平臺(tái)的建立,為記錄高職學(xué)生學(xué)習(xí)、生活等各種數(shù)據(jù)的采集提供了硬件和軟件基礎(chǔ)。學(xué)生畫像是利用大數(shù)據(jù)技術(shù),對(duì)學(xué)生的學(xué)習(xí)行為、興趣愛(ài)好、心理特征等進(jìn)行多維度分析,構(gòu)建的個(gè)性化學(xué)生模型,用于輔助教育教學(xué)決策。
2 高職學(xué)生畫像構(gòu)建
高職學(xué)生畫像構(gòu)建側(cè)重利用大數(shù)據(jù)技術(shù),采集每一位學(xué)生學(xué)業(yè)評(píng)價(jià)、行為軌跡、社交數(shù)據(jù)等,挖掘出學(xué)生學(xué)習(xí)行為、人文素養(yǎng)、社交屬性、興趣愛(ài)好、心理特征、思想品德等,建立開(kāi)放、完整、動(dòng)態(tài)、可視化標(biāo)簽體系,從而組合出事實(shí)的、具體的、立體的高職學(xué)生個(gè)體畫像和群體,用于分析學(xué)生行為、開(kāi)展精準(zhǔn)輔助和預(yù)警,以實(shí)現(xiàn)個(gè)性化教育和科學(xué)化管理。
本文根據(jù)學(xué)校管理需要,將學(xué)生畫像分為個(gè)人畫像和群體畫像。個(gè)人畫像面向個(gè)體學(xué)生,用于輔助輔導(dǎo)員(班主任) 、授課教師等快速了解學(xué)生個(gè)體的特點(diǎn),以開(kāi)展學(xué)情分析和精準(zhǔn)教學(xué)活動(dòng)。群體畫像是按標(biāo)簽篩選后的個(gè)人畫像集合,用于輔助學(xué)校各級(jí)管理人員分析特定學(xué)生群體特征,以進(jìn)行情況研判、決策輔助等。
2.1 學(xué)生畫像構(gòu)建步驟
構(gòu)建學(xué)生畫像的大數(shù)據(jù)來(lái)源是日益信息化、電子化和數(shù)據(jù)化完善的各類系統(tǒng)。本文使用“數(shù)據(jù)-標(biāo)簽- 畫像”二級(jí)映射的方法構(gòu)建學(xué)生畫像。首先,采集學(xué)生數(shù)據(jù)并進(jìn)行預(yù)處理;其次,根據(jù)數(shù)據(jù)特征建立標(biāo)簽體系,并對(duì)數(shù)據(jù)進(jìn)行打標(biāo)簽;最后,基于標(biāo)簽數(shù)據(jù)構(gòu)建學(xué)生畫像。
高職院校學(xué)生畫像的創(chuàng)建從流程上分為4步:基礎(chǔ)數(shù)據(jù)采集與整理、建立標(biāo)簽體系、構(gòu)建學(xué)生畫像、學(xué)生畫像的展示與應(yīng)用。如圖1所示。
2.2 基礎(chǔ)數(shù)據(jù)采集與處理
2.2.1 數(shù)據(jù)采集
學(xué)生畫像的基礎(chǔ)數(shù)據(jù)主要采集于智慧校園平臺(tái),可以采用網(wǎng)絡(luò)爬蟲、API接口等方式,從智慧校園平臺(tái)、教務(wù)系統(tǒng)、學(xué)生管理系統(tǒng)等多個(gè)數(shù)據(jù)源采集數(shù)據(jù),包括校園網(wǎng)訪問(wèn)記錄(訪問(wèn)模塊類型、評(píng)論數(shù)量、發(fā)布討論數(shù)量等) 、教務(wù)系統(tǒng)中教學(xué)與行為數(shù)據(jù)(學(xué)生的基本信息、學(xué)習(xí)評(píng)價(jià)、作業(yè)評(píng)價(jià)、在線平臺(tái)訪問(wèn)記錄與互動(dòng)記錄等) 、學(xué)生管理系統(tǒng)中的行為數(shù)據(jù)(出入宿舍時(shí)間、獎(jiǎng)懲記錄、校園消費(fèi)記錄、受資助記錄、社會(huì)實(shí)踐記錄等) 、圖書管理系統(tǒng)中的行為數(shù)據(jù)(借閱記錄、在館時(shí)間等) 以及教學(xué)一體化平臺(tái)中日常采集的上課視頻和音頻等信息。
主要數(shù)據(jù)分類如表1所示。
2.2.2 數(shù)據(jù)處理
通過(guò)上述各個(gè)系統(tǒng)采集的高職學(xué)生數(shù)據(jù)既有結(jié)構(gòu)化的,也有非結(jié)構(gòu)化的(特別是課堂音視頻) ,都需要進(jìn)行數(shù)據(jù)預(yù)處理,為后續(xù)的操作做好準(zhǔn)備。數(shù)據(jù)預(yù)處理的第一步是進(jìn)行數(shù)據(jù)清洗,提高數(shù)據(jù)的質(zhì)量。第二步進(jìn)行數(shù)據(jù)變換,將有關(guān)學(xué)生的不同系統(tǒng)采集的數(shù)據(jù),按統(tǒng)一標(biāo)準(zhǔn)轉(zhuǎn)換成合適的結(jié)構(gòu)化數(shù)據(jù)形式。該步驟中,要注意對(duì)數(shù)據(jù)信息進(jìn)行歸一化處理,使每一個(gè)數(shù)據(jù)對(duì)整體的貢獻(xiàn)大體得當(dāng)。例如:學(xué)業(yè)成績(jī)有百分制和等級(jí)制,受資助情況則以百元或千元計(jì),數(shù)量級(jí)的不一致,會(huì)導(dǎo)致后續(xù)相應(yīng)標(biāo)簽對(duì)畫像貢獻(xiàn)度的巨大差異,也就無(wú)法得到最終真實(shí)的學(xué)生畫像。第三步是數(shù)據(jù)集成,將采集于多個(gè)系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)復(fù)制和模式集成,如使用Sqoop 導(dǎo)入HDFS 或編寫Spark語(yǔ)句連接傳統(tǒng)數(shù)據(jù)庫(kù),合并數(shù)據(jù)量,形成統(tǒng)一的數(shù)據(jù)倉(cāng)庫(kù)[2]。
2.3 標(biāo)簽體系構(gòu)建
本文采用基于學(xué)生維度(也就是基于用戶維度) 來(lái)建立標(biāo)簽體系。通過(guò)上述的數(shù)據(jù)采集與處理,可以進(jìn)一步提煉得出對(duì)學(xué)生的高度精煉概括的特征描述,也就是標(biāo)簽。最后綜合所有關(guān)于學(xué)生的標(biāo)簽,便是學(xué)生標(biāo)簽體系[3]。
對(duì)學(xué)生打標(biāo)簽分為基于事實(shí)類的標(biāo)簽、基于統(tǒng)計(jì)類的標(biāo)簽、基于規(guī)則類的標(biāo)簽和基于大數(shù)據(jù)分析的標(biāo)簽。不同標(biāo)簽相互關(guān)系如圖2所示。
2.3.1 標(biāo)簽概述
1) 基于事實(shí)類的標(biāo)簽。基于事實(shí)類的標(biāo)簽主要是一些關(guān)于學(xué)生基本屬性和既成事實(shí)的數(shù)據(jù)或內(nèi)容,如對(duì)于某個(gè)學(xué)生來(lái)說(shuō),他的姓名、身份證號(hào)、性別、年齡、受資助信息等,只需要從學(xué)工系統(tǒng)的學(xué)生基本信息表中直接提取就能獲得。這類標(biāo)簽是學(xué)生畫像的基礎(chǔ)之一。
2) 基于統(tǒng)計(jì)類的標(biāo)簽。基于統(tǒng)計(jì)類的標(biāo)簽主要是以智慧一體化平臺(tái)中的事實(shí)數(shù)據(jù)為來(lái)源,對(duì)指定主題的數(shù)據(jù)進(jìn)行各類統(tǒng)計(jì),經(jīng)過(guò)簡(jiǎn)單計(jì)算后得到的標(biāo)簽。如通過(guò)對(duì)學(xué)生進(jìn)出圖書館的時(shí)間進(jìn)行計(jì)算可得到學(xué)生在館時(shí)長(zhǎng)、對(duì)學(xué)生每個(gè)月一卡通消費(fèi)記錄進(jìn)行計(jì)算可得到學(xué)生的月平均生活費(fèi)金額等。這類標(biāo)簽也是學(xué)生畫像的基礎(chǔ)之一。
3) 基于規(guī)則類的標(biāo)簽。基于規(guī)則類的標(biāo)簽主要是基于基本事實(shí)和數(shù)據(jù)無(wú)法直接得出的標(biāo)簽,需要設(shè)置確定的規(guī)則,結(jié)合學(xué)生行為數(shù)據(jù)而產(chǎn)生。如將“學(xué)業(yè)欠佳”學(xué)生這一說(shuō)法定義為“每學(xué)期掛科門數(shù)gt;5且學(xué)期平均學(xué)分lt;5”。這類規(guī)則在學(xué)生畫像的構(gòu)建過(guò)程中,因一線任課教師和輔導(dǎo)員對(duì)教學(xué)業(yè)務(wù)更加熟悉,所以在規(guī)則類標(biāo)簽的規(guī)則確定過(guò)程中,需要他們的參與,共同協(xié)調(diào)制定。
4) 基于大數(shù)據(jù)分析的標(biāo)簽。基于大數(shù)據(jù)分析的標(biāo)簽,主要通過(guò)各類大數(shù)據(jù)算法對(duì)事實(shí)數(shù)據(jù)和統(tǒng)計(jì)數(shù)據(jù)進(jìn)行計(jì)算、分析后得到的標(biāo)簽,可用于對(duì)學(xué)生的某些行為或?qū)傩赃M(jìn)行預(yù)測(cè)和判斷。如打上“學(xué)業(yè)欠佳”規(guī)則類標(biāo)簽的學(xué)生,可使用關(guān)聯(lián)算法和聚類算法,來(lái)推測(cè)學(xué)生未來(lái)掛科的可能性、掛科的課程名稱以及是否提示學(xué)業(yè)預(yù)警進(jìn)行預(yù)測(cè)。
2.3.2 標(biāo)簽體系的確定
依據(jù)學(xué)生的基礎(chǔ)數(shù)據(jù)和對(duì)學(xué)生全面評(píng)價(jià)的要求,本文以學(xué)生相關(guān)事實(shí)數(shù)據(jù)基礎(chǔ),從5個(gè)維度(基本信息、社交屬性、學(xué)業(yè)水平、人文素養(yǎng)和身心健康) 出發(fā),逐級(jí)抽象、整合為學(xué)生畫像的標(biāo)簽體系[4],具體如圖3 所示。圖
2.4 學(xué)生畫像構(gòu)建與展示
在確定學(xué)生畫像多維度標(biāo)簽體系后,采用基于規(guī)則的推理、協(xié)同過(guò)濾、聚類分析等不同算法,對(duì)高職學(xué)生數(shù)據(jù)進(jìn)行多維度的建模,最終構(gòu)建精準(zhǔn)的學(xué)生畫像。在具體構(gòu)建過(guò)程中,可以分為學(xué)生個(gè)體畫像構(gòu)建和學(xué)生群體畫像兩大類。
2.4.1 學(xué)生個(gè)體畫像
按照一體化平臺(tái)中導(dǎo)出并規(guī)范化相關(guān)數(shù)據(jù),以學(xué)生個(gè)體為中心,基于個(gè)體的差異,對(duì)照標(biāo)簽體系中的內(nèi)容逐一進(jìn)行填充,就可以得到一個(gè)多維度、立體且全面的學(xué)生畫像,如圖4和圖5所示。
2.4.2 學(xué)生群體畫像
學(xué)生群體畫像的構(gòu)建其實(shí)是一項(xiàng)數(shù)據(jù)挖掘工作,該工作以具有相同特點(diǎn)的學(xué)生為中心,基于群體的相似性,對(duì)一體化平臺(tái)中的元數(shù)據(jù)進(jìn)行各種機(jī)器學(xué)習(xí)、關(guān)聯(lián)算法、聚類算法等分析,來(lái)挖掘具有同類特征或潛在同類特征的學(xué)生,進(jìn)而按要求生成多個(gè)學(xué)生群體畫像。
例如,按學(xué)生的年級(jí)(大一) 、所在學(xué)院(動(dòng)物醫(yī)學(xué)院) 和閱讀偏好等標(biāo)簽來(lái)對(duì)學(xué)生進(jìn)行聚類分析,可以得到如6和圖7所示的學(xué)生群體畫像詞云圖。當(dāng)然,標(biāo)簽設(shè)置越細(xì)化,得到的群體越精準(zhǔn)。
2.5 學(xué)生畫像的應(yīng)用
2.5.1 學(xué)生行為分析
通過(guò)大數(shù)據(jù)構(gòu)建的高職學(xué)生個(gè)體畫像,輔導(dǎo)員、任課教師、學(xué)生和學(xué)校其他管理人員都可以直觀而精準(zhǔn)地對(duì)學(xué)生個(gè)體進(jìn)行全面了解。從最基本的上課出勤、學(xué)業(yè)評(píng)價(jià)、作業(yè)完成到一卡通消費(fèi)、歸寢時(shí)間、圖書借閱數(shù)量等,不僅校方人員可分析學(xué)生的學(xué)習(xí)/生活行為軌跡,識(shí)別學(xué)生的學(xué)習(xí)/生活風(fēng)格,為其推薦個(gè)性化學(xué)習(xí)資源,引導(dǎo)學(xué)生心理和生活動(dòng)向。也可以讓學(xué)生更清晰地反觀自己某一階段的學(xué)習(xí)/生活狀態(tài),以主動(dòng)調(diào)整,回歸最佳。
學(xué)生群體畫像則可以按特征標(biāo)簽篩選同類特質(zhì)學(xué)生,有利于校方了解不同學(xué)生群體之間的行為表現(xiàn)差異,設(shè)定差異化的教學(xué)目標(biāo)或培育目標(biāo),開(kāi)展分層分類教育,提升教育管理的精準(zhǔn)性。
2.5.2 綜合精準(zhǔn)輔助
綜合精準(zhǔn)輔助包括精準(zhǔn)助學(xué)和精準(zhǔn)資助。大數(shù)據(jù)支撐下的學(xué)生個(gè)體畫像讓輔導(dǎo)員和任課教師對(duì)每個(gè)學(xué)生都能有精準(zhǔn)的認(rèn)識(shí),從而根據(jù)每個(gè)學(xué)生的特點(diǎn)或者群體學(xué)生的特點(diǎn)采取不同的方法,精準(zhǔn)施策,因材施教,提供精準(zhǔn)的學(xué)業(yè)指導(dǎo)、職業(yè)規(guī)劃和心理咨詢服務(wù)。
精準(zhǔn)資助是指精準(zhǔn)資助家庭經(jīng)濟(jì)有困難的學(xué)生。通過(guò)一卡通消費(fèi)的大數(shù)據(jù)后,學(xué)生在校園內(nèi)消費(fèi)的金額總計(jì)和頻次分布一目了然。與學(xué)校整體情況相比,不用申請(qǐng),也能判定或輔助判定學(xué)生家庭經(jīng)濟(jì)是否困難,避免學(xué)生因各種原因沒(méi)有申請(qǐng)或未能成功申請(qǐng)到助學(xué)金的情況,還可以定向向這部分學(xué)生推送勤工儉學(xué)崗位信息或兼職信息。
2.5.3 學(xué)業(yè)/行為預(yù)警
高職院校的學(xué)生相對(duì)來(lái)源廣泛,個(gè)性突出,素質(zhì)參差不齊,主要依賴輔導(dǎo)員或相關(guān)老師的經(jīng)驗(yàn),預(yù)判或被動(dòng)式處理學(xué)生的異常狀況,不能高可靠性、主動(dòng)地對(duì)學(xué)生可能發(fā)生的異常行為或潛在不良結(jié)果進(jìn)行提前干預(yù)。而有了大數(shù)據(jù)支撐的學(xué)生畫像,就可以及時(shí)利用學(xué)生的學(xué)業(yè)評(píng)價(jià)、出勤記錄、進(jìn)出校園記錄、校園網(wǎng)使用記錄等信息,進(jìn)行聚類分析或關(guān)聯(lián)分析,設(shè)置預(yù)警閾值,及時(shí)、主動(dòng)地針對(duì)學(xué)生的學(xué)業(yè)/行為進(jìn)行預(yù)警提示,提前告知學(xué)生繼續(xù)當(dāng)前狀態(tài)可能會(huì)產(chǎn)生的不良后果及處分提醒,以警代罰,實(shí)現(xiàn)學(xué)生管理的主動(dòng)化和人性化[5]。
3 結(jié)論
構(gòu)建基于大數(shù)據(jù)技術(shù)的高職學(xué)生畫像,是海量學(xué)生數(shù)據(jù)在高職學(xué)校的深入、全面應(yīng)用。學(xué)生畫像不僅以可視化的方式呈現(xiàn)學(xué)生個(gè)體和學(xué)生群體的信息,還能幫助校方人員樹立數(shù)據(jù)思維,看清、理解大數(shù)據(jù)背后的“真相”,及時(shí)調(diào)整教育、教學(xué)、管理活動(dòng),開(kāi)展個(gè)性化、精準(zhǔn)化、主動(dòng)化、提前化的指導(dǎo)和干預(yù),提升高職院校學(xué)生培養(yǎng)的質(zhì)量。
參考文獻(xiàn):
[1] 王旭紅,張彤,申志華.大數(shù)據(jù)環(huán)境下開(kāi)放教育學(xué)習(xí)者畫像的構(gòu)建[J].電腦知識(shí)和技術(shù),2023(5):78-80.
[2] 陳會(huì),余馨,李琳琳,等.基于大數(shù)據(jù)技術(shù)的大學(xué)生學(xué)習(xí)畫像構(gòu)建[J].軟件工程,2021,24(3):36-38.
[3] 茹興旺,王霞,關(guān)金金.基于大數(shù)據(jù)維度視角下高校學(xué)習(xí)者精準(zhǔn)行為畫像的構(gòu)建與應(yīng)用[J].科技視界,2022(31):147-149.
[4] 勵(lì)凌凌,孫澄宇.基于大數(shù)據(jù)的職業(yè)院校學(xué)生畫像系統(tǒng)構(gòu)建[J].職教通訊,2023,38(2):79-86.
[5] 邱春華.大數(shù)據(jù)視域下高職院校學(xué)生群體畫像建構(gòu)及預(yù)警機(jī)制研究[J].湖北開(kāi)放職業(yè)學(xué)院學(xué)報(bào),2022,35(19):48-50.
【通聯(lián)編輯:王力】
基金項(xiàng)目:2022 年江蘇農(nóng)牧科技職業(yè)學(xué)院“課程思政”專項(xiàng)課程建設(shè)立項(xiàng)項(xiàng)目(圖形圖像處理) (KCSZ20220628) ;2020 年度江蘇省教育廳高校哲學(xué)社會(huì)科學(xué)研究項(xiàng)目(2020SJA2158) ;2022 年江蘇農(nóng)牧科技職業(yè)學(xué)院教科研立項(xiàng)課題(JYZX202201) ;2023 年江蘇農(nóng)牧科技職業(yè)學(xué)院學(xué)生創(chuàng)新創(chuàng)業(yè)培育項(xiàng)目(CXCYPY202325)