999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則的校園學生關系挖掘研究

2020-05-22 13:21:32王榕盛
科技傳播 2020年4期
關鍵詞:校園學生

王榕盛

1 研究背景

在當今互聯網時代,科技飛速發展的今天,智能化設備與人工智能技術的快速發展,推動了社交網絡的不斷迭代,與此同時,在線下或是線上產生的龐大的數據,造就了大數據時代(Big Data)的研究基石。全球化的信息技術革命,正在以前所未有的速度在各個領域擴散滲透。同時視頻分析技術、分布式存儲技術等相關技術的快速發展,拓寬了數據采集的邊界,從而使得復雜的結構化的、非結構化的數據,都能夠通過一定的技術手段獲取到,為研究分析提供了可靠的支撐[1]。目前大數據挖掘技術已經普遍應用于各類場景如:電商平臺、金融、教育、醫療等。毋庸置疑,數據挖掘技術的發展,推動了社會各個產業的進步。

隨著智能化、信息化的不斷發展,教育領域也逐漸從完全線下的環境向線上發展,與互聯網接軌,教育信息化發展已經列入國家教育十年規劃綱要[2],在校園中,智能化平臺的使用,一卡通平臺、課堂監控網絡、校園輿情中心、學工系統、選課系統、后勤服務系統等的建立,極大的促進了校園數據呈指數增長,這些寶貴的教育數據,是高校乃至整個教育領域的財富。在教學場景下,學生尋求知識的目的是通過其受教育提高自身的質量,增強自身的素質,因此高校應該通過改善教育服務來改善教學過程[3],即通過智能化手段,為學生、教師等個體提供更高質量的教育服務。在教育信息化的時代中,怎樣使用技術手段深入分析校園中學生的行為,以促進教與學有效的發展、提升教學質量、增強學生關聯性、提高課程設計質量等方面,有著重要的戰略意義[4]。

目前在各大高校中,選課系統普及程度已經超過90%[5],學生可以通過在線自助選課系統完成選課,因此在校園中存在大量龐雜的選課記錄數據,其中也蘊藏著豐富的隱性關系,若將學生視為一個個的個體,那么選課在其中就屬于學生的一種與學習相關的行為[6]。同時在高校中,視頻監控網絡的已經從單純的應用于考試監控場景轉移到日常的課程記錄中,利用目前成熟的視頻標注工具能夠對大量的視頻數據進行處理,從而生成大量的結構化標簽數據。在上述兩種系統數據中,對其進行挖掘,能夠反映出學生的學習行為、關系網絡等隱藏信息。

選課系統與視頻監控系統中,存儲著龐大的學生關系網絡,例如很常見的,某幾個學生若關系越好,那么他們頻繁選擇同一堂課的概率就越大;同樣在視頻數據中,若某幾個學生聯系越緊密,那么他們坐在一起的概率也就越大。通過在教學視頻的基礎上,關聯選課系統數據,挖掘其中的關系,能夠分析出學生的社群關系,而這種社群關系不僅僅簡單為朋友關系,一定程度上在學習場景下,可以認為存在學習伙伴關系,存在相互促進學習的可能性。同時這一群學生聚集在一起,即可成為由社交關系而組成的社交網絡[7]。

2 研究方法

2.1 數據預處理

數據挖掘在數據預處理中,不單是簡單的將基礎數據分類,在基礎數據集中挖掘隱性的關系數據需要對原始數據進行大量的分析以及處理工作[8],本研究選用兩個維度的數據,一個是校園學生選課數據,另一個是基于教學視頻利用視頻標注技術標注的視頻分析數據。因此本研究中數據預處理部分分為圖1 所示幾個步驟:

圖1

這里在數據預處理過程當中,需要對共現概念進行定義,本研究中由于存在兩種維度的基礎數據,因此對共現從兩個角度定義:若不同學生在同一時間段內頻繁出現于同一地點,即可認為他們之間存在社交關系[9],這些不同的學生組成的集合即為共現集合;若不同學生頻繁選擇同一節課,即可認為這些同學興趣大致相同,這些學生組成的集合即為另一組共現集合。同時在數據預處理當中,由于后續研究中需要利用頻繁項集挖掘方法對關聯規則進行挖掘,因此采用固定變量切片法,對數據進行處理,對于選課數據集采用固定課程變量切片法,對于視頻采集的時空數據采用固定時間切片法。

固定課程變量切片法中,采取公式1 進行計算:

Z 為課程總數,M 為選課數;

因此h 為如果每兩節課有一次共現,則可以認為他們是存在共現關系的,即寫入共現集合;

固定時間切片法中,采取公式2 進行計算:

公式2 中表示,在區域l 中,任意的位置數據m、n 為一個矩陣,對應到學生i、j,若兩個學生的位置同區域數據在同一時間段內,那么可以認為二者存在一次共現。

數據預處理結果如下所示,選課數據集中采用中國傳媒大學2017 級部分選修課數據,經過脫敏處理后,學生數量:1 168,課程數量:69,數據預處理結果如表1:

表1

另一維度中,基于教學視頻標注獲取的學生時空數據,將教室劃分為一個矩陣網絡,學生為所處不同區域中的點,數據源為課程教學視頻數據,經過脫敏處理后,學生數量:2 250,區域數量9。關于教室中區域的劃分,如圖2 所示:

圖2

經過數據預處理后,結果如表2:

表2

經過數據前期的基礎處理,將選課數據、時空數據結構化,統一為不同固定變量下的學生ID 集合。

“業無高卑志當堅男兒有求安得閑,工程建設雖然苦累,但是我依舊選擇了這一行?!币磺粺嵫借F建參與祖國建設,這也許就是王維振的夢想。

2.2 關聯規則挖掘

關聯規則挖掘是在大數據挖掘領域中基本的算法之一,在商業領域中,關聯規則算法可以為其提供捆綁銷售的決策[10],同時關聯規則算法隨著科技的不斷進步,各行各業逐漸依靠算力對領域本身賦能,因此在醫療、教育、媒體等領域也有著廣泛的應用。

目前常用的關聯規則算法有Apriori 算法、FP-Growth 算法等,在關聯分析中,最常用到的頻繁項集挖掘算法就是Apriori 算法。Apriori 算法是一種先產生候選項集,再檢驗是否頻繁的“產生-測試”方法。這種方法的弊端是當數據量較大時,需要遍歷全部數據導致運算效率較低[11]。而FPGrowth 算法較靈活的解決了這一問題,FP-Growth算法將基礎數據集中的每一個事務映射到一顆FPTree 上,根據這個FP-Tree 尋找頻繁項集,效率較高[12]。

因此由于教育數據較為稀疏,且數據量較大的情況,本研究采用FP-Growth 算法對數據集進行頻繁項集挖掘,進而挖掘學生關系。

2.2.1 FP-Growth 算法

傳統的FP-Growth 算法包含兩部分,一部分為遍歷數據集存儲FP-Tree,另一部分為第二次遍歷數據集挖掘頻繁項集,其中第二部分為FP-Growth算法主體部分。

根節點被標記為根(root),集合中的項(item)按照一定的順序鏈接成為子樹,以及一個頻繁項集頭部表(frequent-item-header),同時每一個子樹上包含項的名稱、計數值(support count)為到達該節點的路徑深度、節點連接情況(nodelink),如圖3 所示:

圖3

在構建出了FP-Tree 之后,進入到FP-Growth算法主體部分,算法中涉及到關聯規則的兩個概念,支持度與置信度,其中支持度為A 與B 同時出現的概率,若A 與B 同時出現的概率小,說明A 與B 的關系較弱;反之即可認為A 與B 的關系較強,A 與B 是頻繁的[13],計算方法如公式3。

整體算法流程如表3 所示:

表3

2.3 學生關系網絡挖掘

2.3.1 網絡結構

利用上述研究方法,可以使用FP-Growth 算法對選課數據集、時空數據集中頻繁項集進行挖掘,再利用社區挖掘算法,挖掘學生關系,通過gephi來對網絡進行分析,可以得到較為清晰的網絡結構圖。經過社區挖掘算法后,本研究中共計挖掘出學生社群51 個,模塊度高達0.955,模塊度作為衡量社群劃分的優劣指標,數值越高標識社群劃分效果越好[14],計算方法如公式5。

模塊度結果如圖4 所示:

圖4

總計節點個數1 168,3 286 條關系邊,其中在學生社群關系網內部關系邊達到2 743 條,占比高達83.4%,而其余關系邊則為跨群關系。因此本研究發現,在校園場景下,學生更有可能在內部形成社交關系,外部橋接的社交關系占比較少,在大學校園中,學生更有可能出現小團體形式的社群關系。

2.3.2 網絡特征向量中心度

在網絡中,特征向量中心度通常用來評價節點重要性,是網絡分析指標中很重要的一項數據,主要反映出無向網絡結構中,那些節點是多次鏈接的,并且只有重要的節點所參與的鏈路鏈接才可以認為是重要的[15]。該項指標可以用來分析網絡鏈路的可靠性以及評價節點。特征向量中心度計算公式如公式6:

其中xi 為節點的重要性度量值,c 為一個常量,當計算經過多次迭代逐漸穩定時,能夠歸為矩陣如公式7:

計算方法流程為近鄰矩陣特征向量分解、篩選特征向量最大特征值、計算特征向量中心度。本研究中,分別以100、500、1 000 迭代次數計算特征向量中心度均值分析網絡整體節點重要性,結果如表4:

表4

從整體角度看,當迭代次數增加時,網絡中節點重要性逐漸下降,說明在校園中,社交關系多為“小團體”形式出現,缺少同時處于多個社群中的學生,學生社交范圍較小。

3 結語

本文通過關聯規則挖掘方法,挖掘頻繁項集,進而從頻繁項集中提取學生關系,可以較好地從顯性的數據關系分析出隱性的關系。同時通過對分析出的網絡結果結構指標的計算,能夠比較清晰的看出學生關系網絡特征。

本文所采用的數據為學生選課數據及視頻時空數據。在后續的研究拓展中,可采用不同維度的數據作為輸入,利用本研究中模型對社群進行挖掘分析,如一卡通數據等。

通過本研究,在教育信息化、教學場景下,能夠發現好友關系或可能存在的社交關系,從而可以有針對性的進行好友推薦、圖書推薦、選課推薦等后續研究,豐富校園信息化手段,提高校園智能化水平。

猜你喜歡
校園學生
快把我哥帶走
《李學生》定檔8月28日
電影(2018年9期)2018-11-14 06:57:21
Q爆校園
趕不走的學生
再見,我的校園
南方周末(2018-06-28)2018-06-28 08:11:04
校園的早晨
琴童(2017年3期)2017-04-05 14:49:04
春滿校園
學生寫話
學生寫的話
開心校園
主站蜘蛛池模板: 国产美女91视频| 在线精品自拍| 欧美亚洲国产日韩电影在线| 色噜噜狠狠狠综合曰曰曰| 91青青草视频在线观看的| av天堂最新版在线| 亚洲资源站av无码网址| 一区二区日韩国产精久久| 日韩在线视频网站| 亚洲欧美天堂网| 久久亚洲国产最新网站| 热这里只有精品国产热门精品| 中文字幕在线观| 亚洲免费三区| 波多野结衣一级毛片| 亚洲一区二区三区国产精华液| 欧美日韩一区二区在线播放 | 亚洲V日韩V无码一区二区| 91精品啪在线观看国产60岁 | 日本人又色又爽的视频| 伊人激情综合网| 免费无码AV片在线观看中文| 再看日本中文字幕在线观看| 无码免费视频| 天堂av综合网| 青青久久91| 特级欧美视频aaaaaa| 中文字幕永久在线看| 欧美三级日韩三级| 国产精品99在线观看| 久久精品aⅴ无码中文字幕| 欧美精品高清| 亚洲国内精品自在自线官| 午夜免费小视频| 久久国产精品嫖妓| 日韩精品欧美国产在线| 一区二区三区高清视频国产女人| 国产美女在线免费观看| 黄色三级毛片网站| 欧美在线视频不卡第一页| 亚洲另类第一页| 国产国产人在线成免费视频狼人色| 国产日韩欧美视频| 99re热精品视频中文字幕不卡| 在线看片国产| 亚洲午夜国产精品无卡| 色综合热无码热国产| 亚洲视频在线青青| 欧美精品综合视频一区二区| 一级片免费网站| 久久狠狠色噜噜狠狠狠狠97视色| 亚洲VA中文字幕| 国产成人精品综合| 5555国产在线观看| 人妻一本久道久久综合久久鬼色| 亚洲色图欧美一区| 亚洲中文字幕久久无码精品A| 在线综合亚洲欧美网站| 5555国产在线观看| 国产91线观看| 国产精品中文免费福利| 99手机在线视频| av在线手机播放| 久久亚洲国产一区二区| 国产美女精品在线| 日本伊人色综合网| 国产h视频免费观看| 国产亚洲视频播放9000| 国产情侣一区二区三区| 视频二区亚洲精品| 国产精品国产三级国产专业不 | 成年人午夜免费视频| 四虎永久在线视频| 亚洲中字无码AV电影在线观看| 亚洲成a人片| 色综合久久88| 国产成人亚洲精品无码电影| 国产免费自拍视频| 国产成人AV综合久久| 极品国产一区二区三区| 熟女视频91| 国产97色在线|