999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVM算法的學生學習行為聚類分析

2018-10-19 16:09:22楊子恒
科學與財富 2018年25期
關鍵詞:數據挖掘特征分析

摘要:針對數據挖掘算法以及在解決在線學習領域中解決復雜問題的優勢及不足,本文提出一種基于支持向量機SVM算法的學生學習行為聚類算法,并將基于隨機森林模型下的基尼指標特征加權的支持向量機方法應用于學生學習行為分析中。從而改善了SVM算法在分類識別方面性能,并且驗證了采用數據挖掘算法應用到分析學生學習行為是可行的,并且具有較高的準確性。

關鍵詞:SVM;學習行為聚類

1 引言

隨著計算機網絡技術的不斷發展和互聯網應用的普及,信息技術正在不斷地改變我們傳統的教育教學模式。數據挖掘于2003年正式開啟開發和研究工作,美國的七所頂尖院校的研究人員共同提出了“數據挖掘VGrADS和網格虛擬化”的項目,之后Amazon、Giftag、Saleforce.com以及IBM都使用數據挖掘來提高自己在業界的競爭力。例如,Google以企業搜索、應用托管等形式向企業提供Google開放云,而Microsoft推出了Live Mesh這種網絡管理和數據存儲軟件來與Google競爭。在2006年Amazon推出了彈性計算云和簡單存儲服務,是建立在2004年Amazon提出了MechanicalTurk、簡單隊列服務等數據挖掘服務雛形之上的。在2008年,IBM提出了公有云和私有云的定義。而Apple公司近年來也相繼推出iTunes服務以及MobileMe服務等,標志向數據挖掘開始進軍。從而采用數據挖掘技術進行學生學習行為分析將十分有必要,并且會迅速掀起了一場全球范圍的教育技術革命,得到了教育界、高校教師和學生以及社會受眾的普遍歡迎。

2 改進的支持向量機SVM

特征加權支持向量機由核函數經特征加權構造的支持向量機。并且特征加權核函數的定義為:

若Kp是定義在X*X(X∈Rn)上的核函數, p是已知的待輸入集的n階線性變換矩陣,其中n為待輸入集的維數。特征加權核函數Kp定義為

(1)

由于在隨機森林(RandomForest)模型中可以根據Gini指標來確定每個樣本自變量對應變量的影響程度,即確定樣本量中特征屬性的重要性,并且本文將特征加權核函數的 值進行優化,用此Gini指標確定樣本特征的重要性之后,構造了在RandomForest模型下的Gini指標特征加權的支持向量機,即為改進的支持向量機SVM。

改進支持向量機SVM算法的詳細步驟如下:

Step1.確定樣本集S,即為:

其中x(i)為特征變量,y(i)為類別量。

Step2.在隨機森林模型下計算各個特征變量的Gini指標,標準化各個指標參數,并以所得指標參數對其相應的特征屬性加權,構造加權的特征向量: 來優化核函數中的原始特征內積。

Step3.構造待輸入空間的線性變換矩陣 (也可以是一個數據向量或者是一稀疏矩陣),以p建立特征加權的核函數Kp。

Step4.對所建立的核函數Kp進行有效性判定;如果假設K是正定的,則根據定義有:

(2)

Step5.應用所構造的特征加權的核函數 在程序設計中替換傳統的支持向量機SVM模型中的線性核函數,并且輸出核心的SVM構造分類器,與此同時,對構造的改進的支持向量機SVM算法進行性能測試。

3 實驗與結果分析

為了驗證所提出方法的可行性及實用性,本文學生進行了實驗,該數據集的原始樣本共有699行數據,10列特征屬性,在 R語言的R-Studio環境中對其進行數據清洗預處理,消除了其中缺失以及不完整的樣本,得到683行10列數據集。然后在隨機森林模型中用VarImpPlot()函數包對清洗后的數據進行特征分析。本文將以上三種算法在學生數據庫中的多個在線學習學生學習行為分析數據集上進行了實驗,將數據集分別應用前面所提到的SVM, FWSVM, 改進的支持向量機SVM三種算法在MATLAB 2014a環境中進行仿真實驗,其統計結果如圖1所示:

UCI在線學習學生學習行為分析數據集對比實驗結果的分析如圖1所示,在這五個分析數據上,可以看出本文所提出的改進的支持向量機SVM算法算法平均的識別性能相對最高,而經典的SVM算法的識別性能最差,但總體而言,本文所提出的改進的支持向量機SVM算法在在線學習中識別的正確率最高,效果最為明顯。

綜上實驗數據可知,本文提出的基于隨機森林模型下Gini指標的特征加權支持向量機算法的的正確率相對更高,分類性能相對更具優勢。

4總結

本文通過分析數據挖掘算法以及在解決在線學習領域中復雜問題的優勢及不足,提出一種基于支持向量機SVM算法的學生學習行為聚類算法,并將基于隨機森林模型下的基尼指標特征加權的支持向量機方法應用于學生學習行為分析中。從而改善了SVM算法在分類識別方面性能,而且驗證了采用數據挖掘算法應用到分析學生學習行為的可行性以及準確性,實驗結果表明,本文所提出的改進的支持向量機SVM算法在在線學習中識別的正確率最高,效果最為明顯。

參考文獻:

[1] 黃晟. 基于變電站為中心的配電網電壓態勢圖片圖形特征的態勢評估模型及算法[D]. 杭州電子科技大學, 2017.

[2] 許國棟. 半監督學習框架下基于圖的SVM分類算法研究[D]. 北方民族大學, 2017.

楊子恒(1986.9-),男,漢族,原籍湖南常德,香港中文大學信息工程系碩士研究生,現任天津華泰克數碼科技有限公司總經理,主要從事政府和企事業單位信息化建設方面的工作。歷經公安、大型醫院、高職院校等多處的重大信息化建設項目的管理工作,對大數據、虛擬現實、網絡及音視頻、安全防范技術等方向有較深的設計及實施經驗。

猜你喜歡
數據挖掘特征分析
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
抓住特征巧觀察
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 青青热久免费精品视频6| 伊人欧美在线| 91在线一9|永久视频在线| 国产精品密蕾丝视频| 成人欧美在线观看| 一边摸一边做爽的视频17国产| 亚洲v日韩v欧美在线观看| 婷婷中文在线| 伊人久久大线影院首页| 尤物在线观看乱码| 免费人成黄页在线观看国产| 亚洲国产成人自拍| 一级全黄毛片| 精品亚洲国产成人AV| 2022精品国偷自产免费观看| 欧美啪啪精品| 欧美在线精品一区二区三区| 国产美女视频黄a视频全免费网站| 在线看片中文字幕| 精品国产免费观看| 欧美午夜精品| 日本精品一在线观看视频| 国产欧美日韩精品综合在线| 无码'专区第一页| 极品国产一区二区三区| 成人免费午夜视频| 伊人国产无码高清视频| 久久99这里精品8国产| 亚洲三级电影在线播放| 在线a视频免费观看| 97久久人人超碰国产精品| 日韩国产黄色网站| 丁香婷婷综合激情| 亚洲第一区精品日韩在线播放| 免费激情网址| 亚洲人成亚洲精品| 国产一级α片| 亚洲国产AV无码综合原创| 国产美女一级毛片| 欧美亚洲国产精品久久蜜芽| 欧美另类第一页| 国产亚洲精品无码专| 在线观看精品国产入口| 无码精品一区二区久久久| 日韩区欧美国产区在线观看| 欧美天天干| 人妻出轨无码中文一区二区| 精品国产中文一级毛片在线看| 欧美无专区| 国产无吗一区二区三区在线欢| 亚洲天堂成人在线观看| 亚洲中文字幕精品| 新SSS无码手机在线观看| 亚洲国产日韩在线观看| 国产精鲁鲁网在线视频| 2048国产精品原创综合在线| 精品视频福利| a毛片在线| 一本久道久久综合多人| 午夜福利免费视频| 国产亚洲精久久久久久无码AV| 97免费在线观看视频| 亚洲欧美另类日本| 在线免费看片a| 国产成人免费观看在线视频| 国产日本视频91| 亚洲欧美日韩成人在线| 91区国产福利在线观看午夜| 97精品久久久大香线焦| 亚洲an第二区国产精品| 久久精品中文字幕免费| 亚洲国产综合精品中文第一| 凹凸国产熟女精品视频| 亚洲日韩高清无码| 國產尤物AV尤物在線觀看| 国产精品永久在线| swag国产精品| 四虎精品黑人视频| 国产精品视频第一专区| 亚国产欧美在线人成| 欧美伦理一区| 国模私拍一区二区|