999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的選課推薦系統設計與實現

2020-03-17 03:56:47馮楚生杜曉明
中國教育技術裝備 2020年16期
關鍵詞:數據挖掘

馮楚生 杜曉明

摘? 要 在高校管理系統中,學生信息數據量眾多,但對信息的利用率低,無法為學生提供完善的課程推薦服務。提出利用數據挖掘技術構建學生個性化的選課推薦系統,首先,分析學生行為特征,提取學生的個性特征并構建學生的用戶畫像;其次,根據Apriori算法對課程信息進行關聯分析,挖掘課程之間的關聯性,優化選課推薦集。通過個性化推薦選課服務,促進學生個性化學習,使學生更好地利用學校資源。

關鍵詞 數據挖掘;選課推薦系統;用戶畫像;關聯規則;Apriori算法

中圖分類號:G642? ? 文獻標識碼:B

文章編號:1671-489X(2020)16-0012-03

Design of Course Selection Recommendation System based on Data Mining//FENG Chusheng, DU Xiaoming

Abstract For todays college management systems, there is a lotof student information data, but the interest rate of the school for?information is low, and it cannot provide students with comprehen-sive student course management and course recommendation ser-vices. This paper proposes to use data mining technology to con-struct a personalized recommendation system for students. We ana-lyze the behavioral characteristics of students, extract the personalitycharacteristics of students and construct student portraits of students, recommend courses based on the characteristics of student portraits, and then use the Apriori algorithm to conduct course information. Association analysis, mining the correlation between courses, and optimizing the set of recommended courses. Through personalized recommendation course selection service, students personalized?learning can be improved, students learning dynamics can be under-stood, students can make better use of school resources, further im-prove the schools teaching services, and improve the schools tea-ching quality.

Key words data mining; course selection recommendation system; association rules; Apriori algorithm

1 引言

隨著信息技術的發展,數據產生的渠道也在迅猛增多,隨之而來的數據庫中包含的數據量也在呈指數增加趨勢,從收集到的數據中找到有用信息的方法就變得尤為重要。數據挖掘是其中非常關鍵的技術之一,它能使數學算法與大數據有機地結合起來,并應用于實際工作中[1]。

數據挖掘技術的研究如今已經在生活中的各個領域得到廣泛應用,在國外很早之前就有學者提出要將數據挖掘技術應用到教育領域。隨著現如今高校教育的改革,就選課功能而言,學生培養計劃中的大部分課程由學校制定為必修課,小部分課程為學生自主選擇研究方向后選擇的專業選修課和公共選修課[2]。就必修課程而言,每學期安排的必修課程之間的前后關聯順序安排是學校教學需要討論的重點。對于剛入學的新生,在基礎課程未學習掌握時,一般會對后期成績產生部分影響。每學期的時間是固定的,那么每學期安排多少課程,對學生學習和掌握知識會產生影響。同樣,對于選修課而言,存在公共選修課種類眾多而專業選修課的專業方向不明確等諸如此類的問題,然而學生在面對未知的課程時,只能根據課程名稱來選擇自己選修的課程,往往無法選到真正對自己專業方向有幫助或是自己感興趣的課程。

如今在高校管理信息系統中,存在往年眾多的信息數據,但是學校對于信息的利用大部分停留在簡單的增加、刪除、修改、查找的階段,甚至有些高校為減少內存的占用,定期將部分信息從學生信息系統中刪除。對教學數據進行科學使用并深入挖掘分析,可以幫助教務部門合理安排課程,并對一些不合理的課程進行調整,從而適應學生個性化發展的需要,合理分配教學資源,幫助學生找到學習目標,提高高校的教學水平和學生的整體素質[3]。

2 相關研究

數據挖掘是從隨機的、大量的、模糊的、不完全的、有噪聲的數據中,運用統計學、機器學習、人工智能等科學方法挖掘出隱含在其中的未知的、但有潛在價值的信息和知識的過程[4]。通過對數據的挖掘來獲得未知的模式與規律。本文運用用戶畫像、關聯規則技術對學生基本信息、課程成績信息進行挖掘分析,挖掘出學生與課程之間的規律,并利用規律實現對課程的個性化推薦。

用戶畫像? 在20世紀90年代,Alan Cooper就提出用戶畫像是真實用戶的虛擬表示,是利用一系列真實數據對用戶進行建模表示的產物[5]。用戶畫像是通過搜集和分析用戶個人屬性、行為偏好、心理狀態等數據,將用戶信息行為抽象化展示[6]。通常以可視化的形式進行表示,用一系列的用戶標簽對用戶的行為特征信息進行描述[7]。用戶標簽表示用戶的興趣愛好、行為習慣、心理狀態等,對每個標簽賦予不同的權重來表示標簽特征的需求程度,從而實現量化用戶特征的目的[8]。對于高校信息化教育建設而言,用戶畫像就是指面向高校學生,通過收集學生各種信息數據,如個人信息、消費數據、圖書借閱數據等,進行深度分析,建立起一個以標簽形式為主的學生用戶模型。

關聯規則? R.Agrawal等人在1993年提出關聯規則,現在成為數據挖掘領域的一個重要研究方向[9]。它通常應用在銷售事務數據庫中,通過找到已售商品之間的聯系,挖掘其隱藏的客觀規律,并利用該規律合理安排商品的擺放和搭配,從而獲得更高經濟效益。Agrawal和Srikant(1994)在頻繁的k-項目集中觀察到一個有趣的向下閉包性質,稱為Apriori:只有當k-項目集的所有子項目集都是頻繁的時,它才是頻繁的[10]。本文使用關聯分析的方法分析學生課程之間的關聯,這種關聯分析對教學管理很有幫助,可以了解學生先通過學習哪些公選課獲得知識,而后繼續學習其他的公選課。本文使用經典的Apriori算法對選修的課程進行關聯分析。

3 個性化課程推薦系統設計

推薦系統通常是內嵌于的系統或網站中,在系統或網站運行過程中發揮向用戶提供個性化推薦的功能。它通過統計和分析用戶的行為習慣、用戶特征等,構建用戶畫像,預測用戶興趣偏好,向用戶推薦可能喜歡的物品。最常被使用的推薦算法是協同過濾算法,可以共用他人經驗,避免內容分析的不確定性。當然,它也存在冷啟動、稀疏性的缺點,此時需要根據具體的應用環境,選擇合適的推薦算法。而課程推薦不同于商品推薦,學生選課時往往會受到朋友和同學的影響,課程推薦具有群體性。同時,課程應該是有先后順序的“商品”,前一個課程的學習會對之后的課程產生影響,若只推薦熱門課程容易造成“馬太效應”。

在學生信息中心存在大量數據,包括學生的學籍信息、一卡通消費數據、圖書借閱數據、考勤數據等,這些數據都相對獨立地存在于各個系統中,尚未被有效利用和指導學生學習,本文介紹如何利用這些數據信息指導學生選課服務。各個系統中存在不同類型的學生數據,反映學生不同的特征。首先收集這些信息,對這些信息進行整理建模,構建學生用戶畫像,將學生信息標簽化,尋找學生選課偏好和親密學生興趣偏好;其次,預選課程成績受到眾多因素影響,通過貝葉斯網絡對預選課程進行預測,優化推薦集。對于已選部分課程的學生,對課程進行關聯分析,通過已選課程推薦下一個課程。

構建學生用戶畫像? 構建用戶畫像的基本技術流程是采集原始數據、標準化清洗、建立數據模型、數據運算分析、可視化呈現[11]。在實際操作過程中,根據實際的工作需要,建立相關的數據模型,對學生標簽賦予不同的權重,構建不同的用戶畫像。本文是構建學生用戶畫像,所以從學生的行為習慣、親密關系等方面來構建學生的用戶畫像。收集各個系統的數據,對系統中的數據簡單進行統計分析,建立標簽模型,而后利用這些標簽模型進行個性化推薦服務。具體流程如圖1所示。

1)興趣偏好推薦模型。通過圖書館數據和考勤數據統計學生的閱讀時間和訪問行為,構建學生的行為畫像,反映學生的努力程度。若學生出勤率低,反映學生不愿去教室上課,可優先向其推薦網絡課程,方便學生隨時學習。對學生的早起情況進行分析,可以通過學生的刷卡時間和課程實際情況判斷學生是否有早起習慣,若學生無早起習慣,則優先向其推薦下午或者晚上的選修課程或者無時間要求的網課。按照圖書分類的方法對圖書借閱數據進行分析,對學生借閱情況進行歸類統計分析,找出學生最感興趣的圖書類別,作為推薦的方向。最終通過學生的上課偏好、早起習慣、圖書偏好進行個性化推薦選修課程。

2)親密度推薦模型。在實際選課時,朋友或者同學會影響學生的選課情況,他們傾向于選擇那些與他們關系比較親密的同學的相同或相似的課程。從學生的一卡通刷卡記錄中,統計所有學生與目標學生在兩分鐘內共同參與某件事件的次數,如進出宿舍、吃飯、考勤、進出圖書館等,然后根據相關公式計算學生親密度,尋找出親密度較高的學生,根據這些學生的選課情況,對目標學生進行課程推薦[12]。

3)預選課程成績預測模型。學生成績與多重要素相關,系統中存在大量數據,將其分成直接相關數據和間接相關數據。以往的考試成績、對基礎知識掌握程度等構成直接相關數據,反映學生直接的學習狀態。學生的行為習慣等數據是間接相關數據,學習成績與良好的行為習慣呈正相關。這些行為習慣數據包括就餐規律、打水規律、圖書館進出頻次、圖書借閱記錄、宿舍門禁進出規律、校園購物頻次及金額等。通過貝葉斯網絡,依據直接相關數據和間接相關數據,對預選課程成績進行預測。

關聯推薦模型? 課程之間具有高度關聯性。通過運用Apriori關聯算法對課程關系進行挖掘,生成關聯課程推薦集。對于已選修部分課程的學生,可通過關聯課程推薦集進行推薦,同時結合學業計劃要求和已選課程情況進行調整。若已選修兩學分的自然創新類,而學業計劃中要求選修六學分的人文類課程,四學分的自然創新類課程,則需要減少自然創新類課程的推薦。

4 系統評價

收集某高校2014—2018級所有學生數據,并運用這些數據對本文推薦算法與熱門課程推薦算法、協同過濾算法進行比較分析,主要從推薦課程的精確率、召回率、覆蓋率方面對算法進行比較分析[13],結果表1所示。

從實驗結果可以看出,本文所用的推薦算法準確度達到18%,大幅提高了選課系統的精度;在召回率和覆蓋率上都明顯優于熱門課程推薦算法和協同過濾算法。這說明一些傳統的推薦算法可能適用于其他系統,但不適用于選課推薦系統,不能做到有效的課程推薦。所以需要實事求是,具體問題具體分析,分析學生群體特點,抓住學生的行為特征,并基于這些特征對課程進行推薦。同時,傳統的選課推薦算法無法解決新生選課的冷啟動問題,容易造成課程的“馬太效應”,導致學校資源的浪費,不能真正提供選課的個性化推薦服務。本文提出的算法充分考慮學生的行為習慣和閱讀興趣,從而實現真正的課程個性化推薦。

5 結語

高校選課系統應當從學生角度出發,結合學生興趣、需求、性格、特長等方面因素,擇優推薦相應的課程。而目前高校的選課系統效率低,未能充分利用學生信息,不能提供課程的個性化推薦。本文提出一種新的推薦算法,并利用該算法對課程進行推薦,有助于學生更好地融入學習生活,尋找到適合自己的方向并提高學生的學習效率,幫助學校及時調整學習資源,將學習資源合理化運行,減少學校資源的浪費。后續將對用戶畫像刻畫維度進一步深化,對標簽體系進一步完善,考慮學生的心理因素等,使得課程推薦更為準確,更好地為學校和學生服務。

參考文獻

[1]張建平.數據挖掘技術分析與研究[J].消費電子,2013(4):65.

[2]Agrawal R, Imielinski T, Swami A. Mining associa-tion rules between sets of items in large databases[J].ACM SIGMOD Record,1993,22(2):207-216.

[3]張志友.數據挖掘技術在選課系統中的應用[J].實驗室科學,2007(3):94-96.

[4]Fayyad U M, Piatetsky-Shapiro G, Smyth P, et al. Advances in knowledge discovery and data mining[M].Cambridge: AAAI Press/The MIT Press,1996.

[5]Brickey J, Walczak S, Burgess T. Comparing semi-automated clustering methods for persona development[M].California: IEEE Transactions on Software Engi-neering,2012:38.

[6]亓叢,吳俊.用戶畫像概念溯源與應用場景研究[J].重慶交通大學學報(社會科學版),2017(5):82-87.

[7]何躍,馬麗霞,騰格爾.基于用戶訪問興趣的Web日志挖掘[J].系統工程理論與實踐,2012(6):1353-1361.

[8]關梓驁.基于大數據技術的用戶畫像系統的設計與研究:以“心發現”平臺為例[D].北京:北京郵電大學,2018.

[9]郭曉玉.基于Weka平臺的關聯分析算法研究[D].杭州:浙江工業大學,2015.

[10]Liu H, Guo R, Jiang H. Research and Improvement?of Apriori Algorithm for Mining Association Rules[J].Computer Applications and Software,2009(1):146-149.

[11]葛曉濱.基于畫像技術對學生實現精準分析和服務[J].安徽建筑大學學報,2019(3):99-104.

[12]陳敬洋.基于行為分析的選課推薦系統[D].武漢:華中師范大學,2019.

[13]宋雅婷.基于協同過濾改進算法的個性化選課推薦的研究[D].昆明:云南師范大學,2013.

*資助項目:全國教育科學“十三五”規劃課題(課題編號:ECA180463);江蘇省教育科學“十三五”規劃課題(課題編號:B-b/2018/01/38);江蘇科技大學本科生創新計劃課題。

作者:馮楚生,江蘇科技大學蘇州理工學院,研究方向為信息管理;杜曉明,江蘇科技大學,助理研究員,博士,研究方向為信息管理(215600)。

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 18禁黄无遮挡网站| 国内精品久久人妻无码大片高| 精品国产成人三级在线观看| 国产精品久久精品| 国产另类视频| 国产三级毛片| 久久国产拍爱| 久久99国产乱子伦精品免| 日韩黄色大片免费看| 九九久久精品国产av片囯产区| 国产成人综合网| 日韩精品一区二区三区中文无码 | 亚洲欧美在线看片AI| 国产乱子伦无码精品小说| 国产va视频| 日韩欧美91| 最新加勒比隔壁人妻| 国产午夜不卡| av一区二区三区高清久久| 高潮毛片无遮挡高清视频播放| 91精品专区| 99热这里只有精品国产99| 久久久久久国产精品mv| 美女国产在线| 成年人国产网站| 久久综合丝袜日本网| 麻豆精品久久久久久久99蜜桃| 国产精品成| 亚洲精品男人天堂| 999福利激情视频| 久久天天躁夜夜躁狠狠| 国产白浆一区二区三区视频在线| 性激烈欧美三级在线播放| 四虎永久在线精品影院| 日本午夜三级| 无码人中文字幕| 欧美亚洲综合免费精品高清在线观看 | 国产亚洲一区二区三区在线| 日韩无码视频专区| 国产欧美自拍视频| 欧美国产日韩在线观看| 国产欧美综合在线观看第七页| 欧洲亚洲一区| 成人在线视频一区| 野花国产精品入口| 国产亚洲精品资源在线26u| 免费看美女自慰的网站| V一区无码内射国产| 亚洲最大综合网| 91视频区| 国产精品一区在线观看你懂的| 91网红精品在线观看| 在线观看国产一区二区三区99| 国产小视频在线高清播放| 午夜精品久久久久久久99热下载 | 综合亚洲网| 色哟哟精品无码网站在线播放视频| 亚洲第一精品福利| 亚洲全网成人资源在线观看| 久久美女精品| 免费在线视频a| 2021天堂在线亚洲精品专区| 国产欧美日韩视频一区二区三区| 久久人人97超碰人人澡爱香蕉| 亚洲欧美日韩精品专区| 亚洲swag精品自拍一区| 国产精品人成在线播放| 国产乱人免费视频| 996免费视频国产在线播放| 久久先锋资源| 国产第八页| 亚洲精品无码人妻无码| 欧美日韩北条麻妃一区二区| 欧美中文字幕第一页线路一| 国产精品白浆在线播放| 青草午夜精品视频在线观看| 91啪在线| 精品自拍视频在线观看| 国产乱肥老妇精品视频| 91在线无码精品秘九色APP | 青青操国产| 九九九精品视频|