999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據的學生社交網絡心理健康模型研究

2023-04-13 11:39:38王以伍曾滿江
現代計算機 2023年3期
關鍵詞:模型學生

王以伍,舒 暉*,曾滿江

(1. 成都醫學院現代教育技術中心,成都 610050;2. 成都醫學院圖書館,成都 610050)

0 引言

大學生作為一個特殊的社會文化群體,正處于人生發展的重要時期,有孤僻感[1]的大學生往往伴隨各種心理問題,不能與人保持正常的人際交往,是不健康的社會行為模式,需要及時矯正。2011 年,教育部印發了《普通高等學校學生心理健康教育工作基本建設標準(試行)》的通知,強調要加強大學生心理危機預防與干預體系建設。高校一般根據要求建立了心理健康中心,由思政指導教師來負責學生的思想工作,學生助理負責跟蹤學生思想動態,宿舍管理密切關注等多級心理預警機制,采取新生心理健康狀況普查、心理危機[2]定期排查等途徑和方式,及時發現學生存在的心理危機情況。但孤僻人群往往具有不主動交流、逃避問題等特征,人工的篩選、觀察具有時效性差、數據反映不真實等弊端。教務、學工、一卡通、圖書借閱、宿舍管理等系統作為高校的基礎業務管理系統,有效推進了學校管理水平,隨著高校信息化集成、智慧校園工作的普遍開展,這些業務系統積累了海量學生行為數據[3]。通過對學生行為大數據本身的挖掘,能夠更客觀、真實地反映學生的校園生活、學習狀態,更精細化地了解和引導學生,針對不同學生群體采取不同的教學手段,提升學生管理工作水平[4]。

1 研究現狀

國內不少研究通過分析、挖掘校園數據來提取隱藏信息,輔助提升學校管理水平。朱錦龍[5]通過學習數據挖掘構建學生畫像,挖掘出了跨群體的共性問題。楊彩霞[6]構建師生教學行為指標體系,指導學生自主學習,幫助教師完善教學策略。楊光瑩等[7]基于校園行為數據實現學生思想特征畫像,對學生不良情況進行預警,提升學生工作管理水平。龔黎旰等[8]基于校園一卡通數據通過大數據技術分析不同群體的消費組成結構和消費行為特征,輔助學校資助部門開展精準助學工作,構建學生共現網絡,研究學生社交關系并發現學生群體中的孤獨者。可見當前針對高校學生行為數據挖掘,反映學生學習生活狀態、生活規律的研究已經在不同程度上開展起來,但是心理問題的復雜性導致相關研究較少且不夠深入。但這項研究極具研究價值和實際意義,若能結合大數據與人工智能技術,通過教育數據挖掘,及時、準確地知曉學生生活學習狀態,挖掘他們的學習生活規律,對他們的學習和生活風險進行預警,并給予正確的引導,便能極大程度地抑制高校極端事件的發生,進而維系高校正常教學秩序、教學質量和就業質量。

2 模型分析

本文研究數據為某高校2020—2021 年度第二學期全校本科生五百多萬條的行為數據,包括一卡通消費數據、考勤數據、門禁數據、各樓棟人臉識別攝像頭數據、無線AP 接入數據等。為保護學生個人隱私,上述數據均經過脫敏處理。為提升數據質量,將各系統數據通過數據清洗、數據集成、數據轉換、數據規約等環節進行數據預處理,清理數據集中與目標數據無關或關聯較小的數據。

具體方法是先通過行為數據時間按一定間隔鎖定部分同學身份,如以某個宿舍樓出口為采集點,在非出行高峰期,篩選出前5 秒和后5秒都沒有同行人員的學生身份,以此部分同學為研究對象,再專門采集該部分同學在其他場所出入口出現的同行人員身份和出現間隔時間,建立數據分組模型。如圖1所示,A 同學符合鎖定目標,進行鎖定,采集A 同學校內軌跡,出現如圖1的數據組模型。

圖1 疑似孤僻學生鎖定

可以看到,A 同學在不同時間、不同地點、多類型場所出入,身邊沒有一名固定身份的同學伴行。當鎖定A 同學一定時間周期(如連續1個月)的在校軌跡時,如果絕大部分是上述類數據組模型,則可判斷此同學具有孤僻傾向,存在一定程度的孤獨感。再通過線下印證,則可將此模型設置為孤僻度典型業務模型。另外,為增強業務模型價值,可再輔以A 同學的一卡通消費數據、無線AP 接入數據,如是否有消費窗口相同、消費時間相近、伴隨消費同學身份不變、同一AP 接入時間相近的多次現象,如有,也可作為判斷是否孤僻的數據支持。

上述數據組模型在建模過程中還有反向典型模型,如圖2所示。

圖2 反向典型模型

可以看到,當鎖定A 同學為觀察對象時,在不同類型場所出入口、不同時間段絕大部分數據組內,多次出現了B 同學。通過更長時間周期(如連續1個月)的觀察,則可判定A同學與B 同學屬于親密度較高的伙伴。再通過線下印證,則可以將此模型定義為親密數據組模型。另外,還可以通過調整間隔時間,如A 同學前后3秒采集到的人員數據,來更進一步縮小數據采集范圍,進行數據提煉。如圖3所示。

圖3 3秒共現時間窗口驗證

再進一步縮小采集時間范圍,如A 同學出現的前后1秒之內采集到的其他人員數據,如圖4所示。

圖4 1秒共現時間窗口驗證

則可以判定為A 同學和B 同學屬于親密度較高的伙伴關系。如果再通過較長周期的數據采集,此類數據組又多次出現,又占A 同學出行軌跡數據組的較高比例,則可將親密度級別進一步提高。此模型也為親密度典型業務模型。

3 算法說明

3.1 算法描述

算法基于學生在校行為記錄數據[9],抽取所有學生連續N個月的行為記錄進行行為軌跡數據挖掘,假設相似學生/關系相近學生會傾向于在一定時間段內采取相同的行動,通過關聯規則挖掘算法,找出經常在同一時間范圍、同一行為地點的學生組合,以此為基礎進行學生的行為軌跡相似性判斷。統計任兩名學生的共現次數并轉化為學生的關系指數,共同行動/共現次數越多,則學生之間的相似度/關系越相近。根據學生關系指數,對每名學生構建個人社交圖,并通過社交圖的組合,形成全校學生的社交網絡,學生對象為網絡中的節點,關系指數為網絡中的距離。同時,在社交網絡中,任兩個未直接相連的節點,可通過共有節點統計相似度/關系指數。

3.2 參數變量描述與定義

3.2.1 共現

共現,特指在某一地點Li,給定時間窗口[T-t,T+t]內,同時存在學生SA和SB的行為記錄,有關聯規則SA →SB,則表示學生SA和SB在地點Li存在一次共現。

3.2.2 時間窗口

時間窗口為判斷學生行為記錄是否可歸為“共現”的范圍區間,判斷條件可轉化為|TA-TB|≤2*tl,h。其中TA為學生A的某次行為記錄時間,TB為學生B的某次行為記錄時間,2*tl,h為判斷條件可容忍的區間大小。參數tl,h為地點Li在h(h∈[ 1,24 ])小時段的閾值。

3.2.3 關系指數

參照聶敏[10]所描述的親密度概念與計算方式,設定任意兩名學生的親密度為RA(B),即對學生A而言,學生B對其的親密度為RA(B)。計算公式為

其中:L為所有學生行為記錄的地點;CA(i)表示在給定統計時間周期內學生A在地點Li的記錄總次數表示在給定統計時間周期內,學生A和學生B在地點Li的共現次數;|S|表示學校學生總人數;SA(i)表示與學生A在地點Li共現的學生總人數。

3.2.4 相似度特征

參照聶敏[10]所描述的相似度計算方式,對于給定任意兩名學生i和學生j,兩者相似度計算方式為

4 算法實現

4.1 計算時間窗口參數tl,h

對任一地點Li,存在參數集合為確定合適的tl,h,設置參數LBi、UBi和pi分別表示tl,h的下限、上限和增長步長。對于地點Li的h小時段,可選擇的tl,h有候選集合TS=以秒為單位,則對于每種選擇TSi,可將小時段劃分為個區間,則對于地點l在時間周期d的h小時,有:

其中:n為時間周期內對應小時段的行為記錄人數。即有:

其中:oi,l,h,k表示在地點i的h小時段第i個區間內,時間周期的第k天的共現人數。

基于每個地點、每小時段的每個區間,對集合W計算泊松分布的概率,得到Possion(X=2)和Possion(X≥2)的概率。

從公式可以看到,地點l、時間周期d、小時段h可視為已知的參數,因此影響到概率的參數為TSi,通過調整TSi,可以影響到Possion(X= 2)和Possion(X≥2)的結果。TSi的選擇,應控制在泊松分布概率值0.5以下。

4.2 構建學生共現矩陣

對學生m,計算其與其他學生的共現次數,可得到矩陣:

其中:OLn,sm表示學生m與學生s在地點Ln的共現次數。

4.3 計算學生關系指數矩陣

對學生m,通過親密度計算公式可得到矩陣:

4.4 計算學生社交關系最短距離與路徑

基于實際實況考慮,全校學生的關系指數矩陣很大可能會是一個稀疏矩陣,為了更好探究任意兩名學生之間的關系情況,將學生的社交關系構造成網絡,以學生為網絡節點,關系指數的倒數為節點間的距離,通過最短路徑Dijkstra算法,獲取任意兩名學生之間的社交路徑和最短關系距離。

考慮到親密度公式RA(B)為正向指標,為了支持最短路徑算法,采用其倒數作為關系距離,得到矩陣:

通過最短路徑算法計算后,更新距離矩陣D得到距離矩陣D`,其中vms表示學生m和學生s間最短關系距離和路徑矩陣P,Pms即學生m到學生s的社交路徑(社交網絡中通過的節點),根據親密度公式RA( )B,可以知道關系距離是有向的,因此在這之中,Pms≠Psm:

因此,對于社交網絡中的任意學生,存在

Ns=[D`s,Ps]表示學生的社交關系情況。

4.5 生成學生個人社交圖

門禁道閘(人臉識別攝像頭)、食堂消費刷卡等設備流水數據均可用來反映學生的社交行為,用圖G(V,E)表示社交網絡,其中V表示節點集合,E表示連邊集合,其中節點表示學生,連邊表示學生之間的社交關系。任意兩個節點之間存在一條連邊需要同時滿足三個條件:①被同一個設備捕獲(刷卡行為或被同一個人臉識別攝像頭識別);②被同一個設備捕獲的間隔時間小于2分鐘;③觀測周期內同時滿足條件①和②的次數大于閾值T。

通過設置距離閾值H對學生的社交集合Ns中的關系距離D`s進行過濾,獲取D`s

圖5 社交網絡圖

5 結語

本文介紹了基于學生行為數據挖掘學生社交網絡的方法,根據學校積累的消費、門禁、考勤、無線網絡接入等海量數據,通過建模構建出學生社交網絡的關系距離,距離的長短反映學生日常生活的親密度、孤僻度,比傳統的調查問卷、田野調查等調研方式更具客觀性和真實性,模型驗證表明,無明顯孤僻的學生更擅長社交。

猜你喜歡
模型學生
一半模型
快把我哥帶走
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
《李學生》定檔8月28日
電影(2018年9期)2018-11-14 06:57:21
趕不走的學生
學生寫話
3D打印中的模型分割與打包
學生寫的話
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲国产综合精品中文第一 | 91亚洲精选| 乱人伦视频中文字幕在线| 亚洲91在线精品| 亚洲香蕉伊综合在人在线| 理论片一区| 国产h视频在线观看视频| 久久国产精品无码hdav| 精品国产免费观看| 色哟哟国产精品一区二区| 波多野结衣视频一区二区| 四虎成人免费毛片| 久久久久久久蜜桃| 天堂在线视频精品| 久久综合婷婷| 多人乱p欧美在线观看| 亚洲啪啪网| 在线观看国产精品一区| 影音先锋亚洲无码| 国禁国产you女视频网站| 综合社区亚洲熟妇p| 亚洲男人的天堂在线| 全部免费特黄特色大片视频| 热久久这里是精品6免费观看| 日韩资源站| 色婷婷啪啪| 亚洲性视频网站| 成年人福利视频| 亚洲日韩高清在线亚洲专区| 中字无码av在线电影| 免费无码AV片在线观看中文| 中文字幕自拍偷拍| 真实国产精品vr专区| 中文毛片无遮挡播放免费| 国产xx在线观看| 国产永久免费视频m3u8| 综合色天天| 国产精品任我爽爆在线播放6080| 免费无码AV片在线观看国产| 精品欧美日韩国产日漫一区不卡| 国产91小视频在线观看| 亚洲精品国产综合99久久夜夜嗨| 综1合AV在线播放| 欧美日韩在线亚洲国产人| 国产精品免费久久久久影院无码| 天天综合网站| 幺女国产一级毛片| 狠狠躁天天躁夜夜躁婷婷| 亚州AV秘 一区二区三区| 最新国产网站| 欧美在线导航| 国产视频自拍一区| 国产精品yjizz视频网一二区| 成人综合网址| jizz在线免费播放| 国产一区二区三区精品欧美日韩| 国产激爽大片在线播放| 人人爽人人爽人人片| 四虎精品国产AV二区| 黄色成年视频| 日韩 欧美 小说 综合网 另类| AV老司机AV天堂| 欧美精品啪啪一区二区三区| аv天堂最新中文在线| 美女潮喷出白浆在线观看视频| 国产视频一二三区| 亚洲人成影视在线观看| 三上悠亚精品二区在线观看| 在线观看91香蕉国产免费| 国产精品伦视频观看免费| 欧美a在线看| 国产精品成人观看视频国产 | 无码粉嫩虎白一线天在线观看| 精品撒尿视频一区二区三区| 欧美成人影院亚洲综合图| aⅴ免费在线观看| 久久亚洲国产一区二区| 国产亚洲精品资源在线26u| 国产在线精品美女观看| 亚洲国产午夜精华无码福利| 国产91精品调教在线播放| 精品久久久久久久久久久|