999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于校園卡數據的學生行為分析的研究

2021-11-30 09:34:14葛昆武丁杰鄒德龍向琴宋夏芝
現代計算機 2021年29期
關鍵詞:校園學生

葛昆,武丁杰,鄒德龍,向琴,宋夏芝

(中國民用航空飛行學院,廣漢618300)

0 引言

隨著互聯網的發展與成熟,“智慧校園”一詞成為高校未來建設的重要一環。智慧校園需要互聯網校園中心的建立,實現互聯互通和解決計算存儲問題。高校在實現數據存儲情況已經基本完成,由各個學校的校園卡作為載體進行數據的轉載。但是,各個信息作為單獨的個體獨立存儲,距離真正的智慧校園還是有一定的差距。如何拉動各個系統之間的數據實現跨系統的聯動是未來工作的重中之重。目前,以中國民用航空飛行學院的校園卡為例,學生的在校行為是處于被記錄狀態,學生日常在校的消費時間、消費記錄都可以很好地被保存下來,學生眾多的日常行為都可以通過數據反應出來。

本文基于中國民用航空飛行學院的校園卡的數據,對學生在校的日常行為進行分析。每年國家提供給家庭困難的大學生許多經濟援助,但是我們常常發現由于需要判定的條件很多,以及認證環節存在的不規范現象,僅僅通過一紙認定會造成偏差。本文通過對校園數據的挖掘,整理分析基于校園卡的學生在校數據,對學生在校的消費記錄進行整理和分析,從而反應個體或者群體在校的整體情況,為今后校園食堂的整改、貧困學生的認證提供有效的數據支持,為今后貧困學生的認定提供一個有效手段。

1 基于學生個人數據的畫像建立

用戶畫像是一種工具,它可以將用戶的行為數據和用戶屬性結合起來,根據用戶的消費、習慣、社交等給用戶貼上不同的標簽。如圖1所示是構建用戶數字畫像的基本流程。

圖1 構建用戶數字畫像流程

中國民用航空飛行學院的學生卡記錄了學生的校園生活消費的地點,間接記錄了一個學生在校運動的軌跡,包含了餐廳消費的金額、餐廳消費的時間、洗澡時間等等,搜集這些數據抽象化構建學生的虛擬形象,學生在校的行為分析如圖2所示。

圖2 學生在校行為分析

2 數據的預處理

由于學生在校流水數據眾多,這些數據都存儲在數據庫中,本實驗僅僅研究學生在校的消費情況,由于人員操作失誤或者因為機器本身的影響,我們拿到的數據會存在一些錯誤、丟失或者內容重復等問題。為了使后續實驗進展順利,我們需要對數據進行清洗。

2.1 數據清洗

數據清洗就是將我們獲得的雜亂無序、錯誤、重復、不符合規則的“臟數據”修正為可以直接帶入模型的“干凈數據”的過程。數據的預處理主要是去除缺失值,處理異常值,對文本字符串進行簡單處理等。

2.2 數據集成

進行預處理之后的數據為了便于進行數據挖掘我們需要對多種不同類型的數據進行集成操作。由于在實際存儲過程中會面臨著由于數據類型不一致的問題、因此我們需要根據具體情況對不同數據進行集成使得最后輸入的數據符合要求。

2.3 數據變換

數據變換主要是針對不同形式的數據化為統一的形式。本文主要研究學生消費情況,將變換后具有一致性的數據進行聚集、泛化等操作對數據進行離散化操作。離散化的數據具有穩定性強的特點,能夠使得擬合風險減小。

2.4 數據規約

大量數據的挖掘不利于效率的提高,為此我們需要對數據進行壓縮。數據的規約就是通過變換在保證數據原來樣子的情況下對數據進行壓縮處理,常見有維規約、數量規約以及數據壓縮等方式。由于存儲中的數據和本文沒有直接聯系,我們可以使用數據規約減少需要處理的數據量。表1、表2為校園卡消費數據進行刪除數據規約的比較。

表1 原始學生校園卡消費數據

表2 數據規約后學生校園卡消費數據

3 算法介紹

3.1 K-means聚類算法介紹

K-means算法是無監督學習中一個非常典型的例子。可以用一個比較好理解的例子來解釋:大學開學迎來了一大批新生,喜歡音樂的同學加入到了音樂社,喜歡動漫的同學加入到了動漫社,喜歡計算機的同學加入到了計算機社,雖然天南地北不認識的人借著這個機會相互認識形成一個個小團體,小團體在更多同學的加入下逐漸壯大,最終形成規模,也就是社團。歸屬感使得相似的人走到一起,不相關的人漸行漸遠,就形成了物以類聚,人以群分。

機器學習中的數據樣本也是如此。相似的樣本歸為一類,用這幾個樣本的中心位置表示這個類別,方便其他相似樣本的加入,每當類別中有新的相似樣本的加入,就更新類別的中心位置,方便新樣本適應類別,這就是K-means算法的主要邏輯。

在數學上我們使用兩點在歐式空間中的距離定義相似度,即兩個點在歐式空間的距離。距離越近表示兩個點越相似,反之兩個點越不相似。為了表示相似的點屬于一類,我們引入了“clus?ter”概念,即屬于一個cluster的樣本都是相似的,也就是一類。為了表述cluster準確信息,還需要定義cluster坐標位置也就是centroid評估離哪個cluster更相似,每個centroid的坐標就是所有cluster的中心也就是均值。

K-means算法思想:假設存在X1=(0,2),X2=(0,0),X3=(1.5,0),X4=(5,0),X5=(5,2),K=2,即將X1~X5這5個點集分為2類,由于X4與X5距離較近X1,X2,X3距離較近,所以將C1=(X1,X2,X3)分為一類,將C2=(X4,X5)分為另一類,算出兩個分類的重心M1={(0+0+1.5)/3,(2+0+0)/3}={0.5,2/3},M2={(5+5)/2,(2+0)/2}={5,1}。求出幾個點到M1、M2的距離d(Xn,Mn),發現X1,X2,X3到M1距離近,X4、X5到M2距離近,證明分類合理。

3.2 K-means算法流程

(1)給定N個集合;

(2)將不同簇的中心初始化;

(3)計算樣本到各個中心點距離,選擇距離最近的為該點屬于的簇;

(4)知道更新上限,重新計算中心點;

(5)直到不再變化為止。

4 結果分析

由于目前學生申請國家補助存在一紙評定的問題,各項信息停留在主觀評判,材料申請的客觀性難以評判,導致一些學生之間存在著虛假信息的上報,使得有限的資源不能給到需要的同學,造成資源的浪費。根據調查,學生在校消費行為主要分為三個部分,一是主要在各個食堂的刷卡消費,這是主要的:其二是利用校園卡在校園商店購買包括日常生活用品、學習工具、零食、飲料等費用,這兩點是我們可以記錄并保存下來的。其三是學生點外賣,由于疫情期間,學校禁止外賣入內,這部分我們可以忽略不計。在此大環境下,學生的日常活動和消費都集中在校內,也就是說,校園一卡通承載了學生在學校幾乎所有的消費,可以保證我們的研究相對準確,從學生的校園卡消費可以間接反應學生的消費水平,從而看出學生的家庭經濟情況。為了公平,防止有學生存在僥幸心理,我們可以將校園消費作為評判學生是否具有評選資格的重要條件,目前已知有部分高校會每個月在校園卡消費較低的同學卡中給予一定的資金援助,這種行為值得推廣,并且可以優先給予這部分學生校內兼職的機會。所以,我們針對學生在校校園卡的研究,對解決實際問題具有一定的實際意義。

圖3 利用K-means算法對學生在校月消費金額進行聚類分析。根據實際情況,利用K-means算法將學生的月平均消費情況分為三個層次,即高額水平消費、中等水平消費,以及低水平消費。將聚類中心個數K的值設計為3,此時得到的聚類中心為425.6,637.5,821.2,結果如圖3所示。

圖3 月均消費聚類結果

根據K-means聚類得到的結果如圖4所示。

圖4 月均消費人數比例分布

根據分析可得所有的樣本分為3個簇,樣本分別為55%、26%和19%,分別表示有55%的學生月平均消費在637.5元左右,有26%的學生月平均消費在425.6元左右,有19%的學生月平均消費在821.2元左右。如表3所示。

表3 聚簇結果

通過對學生校園卡消費情況進行分析,有26%左右數量的學生在校消費水平處于較低位置。針對這些學生的消費情況,學校負責相關事宜的老師可以主動去進一步了解這些學生目前的生活和學習情況,針對提交家庭困難學生申請報告且處于低水平消費一欄的學生給予勤工助學的幫助,對于申請貧困生報告但是月平均消費水平為高的學生應該再進行走訪調查。在大數據的支持下,獎學金、助學金的發放將更加透明。

5 結語

本文完成了中國民用航空飛行學院部分學生的校園數據卡消費數據的挖掘和探索,首先對初始“臟數據”進行清洗、集成變換和規約等操作,然后利用聚類算法對學生在校消費情況進行分析,得出表面數據下深層次的規律,為學校對家庭困難學生的認定提供了有效的技術手段。

猜你喜歡
校園學生
快把我哥帶走
《李學生》定檔8月28日
電影(2018年9期)2018-11-14 06:57:21
Q爆校園
趕不走的學生
再見,我的校園
南方周末(2018-06-28)2018-06-28 08:11:04
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
學生寫話
學生寫的話
開心校園
主站蜘蛛池模板: 国产91色| 国产成人精彩在线视频50| 国产超碰在线观看| 亚洲swag精品自拍一区| 亚洲A∨无码精品午夜在线观看| 亚洲人成成无码网WWW| 精品人妻系列无码专区久久| 国产极品美女在线播放| 好紧太爽了视频免费无码| 欧美精品一区二区三区中文字幕| 国产精品美女自慰喷水| 亚洲欧美精品在线| 亚洲va在线∨a天堂va欧美va| 国产AV无码专区亚洲A∨毛片| 熟妇人妻无乱码中文字幕真矢织江| 91精品专区| 刘亦菲一区二区在线观看| 亚洲中文无码h在线观看| 国产成人无码播放| 找国产毛片看| 精品无码一区二区三区电影| 亚洲国产精品久久久久秋霞影院| 免费国产高清精品一区在线| 精品国产成人高清在线| 伊人久久青草青青综合| 国产69精品久久久久孕妇大杂乱 | 国产日韩欧美视频| 亚洲Av激情网五月天| 国产夜色视频| 亚洲人成网址| 无码专区在线观看| a天堂视频| 国模极品一区二区三区| 99九九成人免费视频精品| 国产成人综合久久| 日韩午夜福利在线观看| 思思热在线视频精品| 国产AV毛片| 欧美精品一区在线看| 亚洲熟妇AV日韩熟妇在线| 一级毛片免费的| 精品无码国产一区二区三区AV| 亚洲AV一二三区无码AV蜜桃| 国产SUV精品一区二区6| 成年免费在线观看| 99视频在线精品免费观看6| 亚洲欧美色中文字幕| 亚洲欧洲日产无码AV| 国产在线视频福利资源站| 亚洲天堂久久| 一本大道香蕉中文日本不卡高清二区 | 亚洲性日韩精品一区二区| 亚洲午夜天堂| 98超碰在线观看| 久久99国产精品成人欧美| www.国产福利| 丰满的少妇人妻无码区| 欧美午夜视频| 日本高清免费一本在线观看| 亚洲国产精品不卡在线| 内射人妻无码色AV天堂| 亚洲最大情网站在线观看| 欧美成a人片在线观看| 欧美第一页在线| 日本免费a视频| 黄色在线网| 国产免费黄| 美女潮喷出白浆在线观看视频| 欧美一区二区精品久久久| 色丁丁毛片在线观看| 国产人成乱码视频免费观看| 在线国产三级| 无码内射在线| 国产精品午夜福利麻豆| 久热re国产手机在线观看| 欧美精品高清| 国产精品黑色丝袜的老师| 毛片一区二区在线看| 99热这里只有精品在线播放| 日韩国产 在线| 日韩av资源在线| 国产尤物jk自慰制服喷水|