任遠 朱潤凱
摘要:本文以北京航空航天大學學生為研究對象,運用大數據思維和分析方法,基于“夢拓計劃”搭建信息平臺并采集新生行為數據,根據新生的關注熱點研究大學新生的群體性特征,以探索新生適應性教育的科學規律。
關鍵詞:新生教育;大數據;科學化;夢拓計劃
中圖分類號:G40文獻標志碼:A文章編號:2095-9214(2016)03-0297-01
一、 引言
本文以新生適應性教育為切入點,基于北京航空航天大學“夢拓計劃”,通過平臺研發、數據采集、模型構建和特征提取,將“Mentor”的靜態信息數據與新生“夢拓組隊”的動態行為數據進行集成分析,歸納出新生整體性的心理特征和實際需求,從而為新生適應性教育工作提出科學化建議。
二、 研究內容
(一) “夢拓計劃”及信息平臺。北京航空航天大學基于“朋輩教育”的理念,在新生入學后實行“夢拓計劃”:選拔優秀的二年級本科生作為“Mentor”,通過開展文化體驗課等交流活動幫助一年級新生更好地適應大學生活,以達到開拓視野、提高素養、共同進步的目標。為支撐“夢拓計劃”順利實施,改變傳統的“指派式”的學生工作模式,我們研發了“夢拓”信息平臺,新生可根據自己的興趣點和實際需求在平臺中自由選擇“Mentor”。數據層記錄學生“Mentor組隊”過程中的行為數據,用以分析學生總體特征和每個人的個性特征圖譜。目前該平臺已經應用到北京航空航天大學計算機學院、軟件學院、知行書院、宇航學院四個單位,共采集1039人的靜態信息數據和動態行為數據。
(二) “Mentor”特征向量提取。本文對數據庫中“Mentor”簡介進行特征標簽標注(與后臺日志時間戳一一映射),采用分詞系統進行分詞處理并得到163個代表“Mentor”特征的離散關鍵詞,并利用LDA模型[1]對關鍵詞進行特征分析。
利用LDA模型對163個關鍵詞進行特征分析,通過對比后臺日志時間戳對參數進行調優,最終聚類出最受新生關注的七大“Mentor”特征,構成“Mentor”七維核心特征優勢向量,每個分量代表著“Mentor”可能具備的特征項。本文將“Mentor”特征向量表示如下:
[文藝,體育,學習,工作,專業(技術),休閑,社交]
基于聚類得到的樣本數據,本文進一步統計得到七維核心特征優勢向量占比(即擁有某個分量特征的人占總人數的百分比)分別為[9.71%, 8.01%, 8.98%, 13.83%, 10.68%, 3.40%, 20.87%],占比排序為[4,6,5,2,3,7,1]。
分析分量占比數據,可以看出新生對“Mentor”特征的傾向:新生群體整體偏向選擇外向交友型和工作能力突出型的學長學姐作為自己的“Mentor”,具備較強專業能力特征的“Mentor”占比也比較高;另一方面,本文結合北航實際情況將“Mentor”性別作為一個特殊的影響因子加入到研究中,并發現“女性Mentor”在實際組隊過程中非常受歡迎,這在一定程度上影響了一般情況下的組隊行為,可能與北航男女比例的特殊性有一定關系。
(三) 新生動態行為數據處理模型構建。本文在研究過程中,采用北航“夢拓”信息平臺數據庫中已記錄的用戶操作時間戳、相關操作日志以及網頁訪問日志共計2萬余條操作數據,涵蓋了新生訪問平臺的各類操作以及對于數據庫訪問的慢日志統計下的選擇信息。基于以上行為數據,利用數據掃描處理工具Scanner對大量日志文本數據進行掃描處理,去除噪聲數據(例如管理員操作的數據等)后對有效區間內的數據進行處理。在此基礎上,本文根據降溫原理構建分量熱度模型,利用數據擬合方法進行數據分析,期望得到新生所選“Mentor”的每個特征分量熱度值并排序,以更科學地挖掘學生的行為特性和興趣關注點。
現將分量熱度模型描述如下:
時間刻度:以組隊時間的開始和結束為界,對時間線進行均分后得到若干具有一定粒度的時間段;為每個時間段賦予的時間標識值,即為時間刻度值;
熱度權重:即每個階段的熱度的量化的衡量值。(本文中最高熱度定為100,最低熱度定為0,可以用操作數歸一化到0-100)。
現將采用的公式描述如下:
總體熱度公式:
W=K*(A*T2+B*T+C)
其中,W表示熱度權重,K表示歸一化系數,T表示時間刻度,C為常數。所示時間段(242-258)參數分別為:K=5.46,A=0.0528,B=-27.123,C=3489.90。
某向量分量的熱度值可用該分量在該刻度下被選擇數量與熱度權重之積的累加和表示:
H=∑(N*W)
其中,H表示分量熱度值,N表示分量數目,W表示分量熱度權重。
(四) 綜合量化分析。由于七維核心特征優勢向量的每一個分量所占比重各不不同,因此所具有的熱度值不具有可比性,要得到最終的傾向性排序,需要進行歸一化綜合量化分析。
三、結論與建議
(一)結論。新生入學后的熱點關注問題與傳統的學生工作經驗基本保持一致。研究結果表明,新生對專業的關注度不高,整體呈現出“專業迷茫”的特征。北航作為一所具有理工科優勢的綜合型大學,各學院學科特色明顯、專業性較強,如何順利邁進專業的“門檻”,是新生面臨的挑戰。
(二)建議。“老生帶新生”式的“夢拓計劃”,是新時期新生入學教育模式的創新,是學校優良傳統和優秀文化得以傳承的有效載體。在選拔高年級“Mentor”時,一方面應該選拔新生關注度較高的體育愛好者、學習優秀者和社會工作能力突出者,這符合新生的實際需求和心理期盼;另一方面,要幫助新生開拓視野,引導學生轉變思想觀念,將關注度較低的“文藝氣質類”、“文化體驗類”學生也作為重點“Mentor”候選人,以促進新生素質的全面發展和人文素養的養成。
(作者單位:北京航空航天大學計算機學院)
參考文獻:
[1]張韞. 大數據改變教育 寫在大數據元年來臨之際[J]. 上海教育, 2013 (10): 8-11.