999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

研究型案例在Python教學方法中應用

2019-05-22 11:18:06高勇鋼
電腦知識與技術 2019年10期

高勇鋼

摘要:在高校開設python課程時,為了適應大數據時代對數據分析的要求,采用研究型案例教學方法增強學生計算思維能力和解決復雜專業問題的能力,并且初步掌握了研究具體問題的基本方法。

關鍵詞:Python; 協同過濾; 推薦系統;相似度計算;均方根誤差

中圖分類號:G642 文獻標識碼:A

文章編號:1009-3044(2019)10-0097-03

開放科學(資源服務)標識碼(OSID):

Application of Research Case in Python Teaching Method

GAO Yong-gang

(School of Computer and Information, Anhui Normal University, Wuhu 241003, China)

Abstract: In order to adapt to the requirements of data analysis in the era of big data, the research-based case teaching method is used to enhance students' ability to calculate thinking and solve complex professional problems, and to master the basic methods of researching specific problems.

Key words: Python; collaborative filtering; recommendation system; similarity computing; RMSE

1 引言

Python由于其簡單、易學、面向對象、可擴展性、開源等優點成為最受歡迎的程序設計語言之一,眾多科學計算軟件包都提供了Python的調用接口,例如OpenCV、VTK、ITK。而Python專用的科學計算擴展庫如SciPy、NumPy和matplotlib,它們分別為Python提供了數值運算、快速數組處理以及繪圖功能。正是由于Python可擴展性,使得Python有著極其豐富的庫進行圖形處理、數學處理、文本處理、數據庫編程、網絡編程、Web編程多媒體應用等。

現在國內外眾多高校采用Python為非計算機專業與計算機專業教授程序設計課程。Python是一個生態圈,針對具體專業可適當加強第三方庫知識學習與應用。當今已進入大數據時代,數據分析作為一門前沿技術,廣泛應用于物聯網、移動互聯網、云計算等戰略新興產業。Python由于其特點非常適合用于數據分析,因此計算機專業學生在學習Python時都應關注其數據分析的應用。工程教育專業認證標準中要求學生具備能夠應用信息技術對復雜工程問題進行預測、模擬和求解的能力,同時要在教學中貫徹計算思維的理念。為了上述目標,在Python教學中不能僅僅講解基礎知識,需引入適當難度的數據分析技術。本文通過引入一個改進的協同推薦算法的研究型案例來促進計算機專業學生學習Python效果。

2用研究型案例增強學生問題求解能力和激發學生興趣

2.1案例簡介

本案例是關于正流行的協同推薦算法。隨著互聯網技術的快速發展,由此產生的海量信息。為了能從海量信息中找出有價值的信息,信息過濾技術中的推薦技術是其中最重要的手段之一,因此推薦系統由此發展起來[1]。目前主要推薦方法有基于內容推薦,有協同過濾推薦[2]等幾種方法。其中協同過濾推薦方法分為基于用戶[3,4]和基于項目兩種推薦方法[5],這兩種方法都要依賴于用戶-項目評分矩陣來給出項目推薦列表,但由于網絡產生的信息過載,使得用戶數和項目數增長很快,隨之而來出現了數據稀疏[6]、冷啟動[7]和精度上持續下降問題。可采用降維法與缺失值填充[8]等方法能改善和緩解數據稀疏問題。降維法主要包括主成分分析法和矩陣奇異值分解法,降維法計算量大,在實際應用中操作性不高。缺失值填充法對缺失的用戶項目評分矩陣的項目用相關值填充,從而增加評價矩陣的密度。針對填充項的選擇,文中改進的協同過濾算法采用了將屬于目標用戶的近鄰用戶所有評分均值與對該評分項目的所有真實評分均值結合起來最終計算出目標用戶對該項目的預估評分。改進算法相比較其他幾種經典算法在MovieLens 上的實驗結果分析表明能進一步提高推薦效果。

2.2協同過濾算法介紹

(1) 預測評分步驟

基于用戶協同過濾推薦方法可分為如下四個步驟:1) 選擇計算用戶之間相似度的方法; 2)根據用戶評分的數據集計算每個用戶與其他用戶的相似度;3)根據用戶之間的相似度大小排序來確定每個用戶 K 個近鄰用戶;4) 依據某用戶K個最近鄰對某項目評分來預測該用戶對該項目的評分。

(2)用戶相似度的常用計算方法

1) 歐幾里得距離

將兩個用戶對共同項目的評分分別組成一個 n 維特征向量,如果直接求出這兩個向量的歐幾里得距離,則兩個用戶越相似則距離越小,但是算法要求兩用戶越相似則相似度數值越大,因此對初始歐幾里得距離加1再求倒數,這樣最終將用戶相似度距離控制在0到1范圍內,所用公式如(1)所示。

在已知某用戶的近鄰后,則該用戶對某項目的評分值由該用戶的K個近鄰對該項目的評分計算獲得。常用公式有(4)式和(5)式,兩式中N(u)表示用戶u的K個近鄰集合。從以上評分預測方法中可以看出預測用戶對某項目的評分值是由該用戶的近鄰對該項目的評分及近鄰的相似性決定的。由于項目評分數據的稀疏性,一般某用戶的近鄰中會存在著許多的未評分項目,則對未評分項目通常用該近鄰用戶的評分均值填充。

2.3 協同過濾推薦算法的改進

在測試協同過濾算法優劣的實驗中,常用的數據集是MovieLens數據集,在對某用戶對某電影分值預測時,該用戶的近鄰中只有極少數對某電影有評分,絕大多數沒有評分。大多數用戶沒有時間看大多數電影并且給予評分,或者看了某部電影無論喜歡與否都不評分。對于沒有評論的近鄰用戶則用該用戶的評分均值來表示確實可以提高預測的準確度,但沒有考慮到對這部電影真實評分的其他客戶,而這些用戶對該電影的評分對最終該電影的預測是不可或缺的。

[Vu,i=Ru+v∈N(u)sim(u,v)×(xv,i-Rv)v∈N(u)|sim(u,v)|] (6)

采用改進算法的評分預測的公式如(6)所示,xv,i表示如用戶v對i項目評分,如用戶v沒有對i項目評分則xv,i的值為數據集中所有對項目i的評分的均分。

用戶協同過濾推薦算法可分為如下四個步驟:1) 選擇修正余弦距離計算用戶之間相似度;2)根據用戶評分的數據集計算每個用戶與其他用戶的相似度; 3)根據用戶之間的相似度大小排序來確定每個用戶 的K 個近鄰用戶;4) 根據某個用戶K個最近鄰的評分數據用公式(6)計算預測評分。

2.4 改進算法實驗

(1) 選擇與采樣數據集

實驗采用MovieLens數據集,該數據集由美國明尼蘇達 GroupLens 研究組提供的。該數據集總共分為 3個不同大小的版本用來記錄了用戶對電影的評分。其中之一的小版本數據集它包含了943 名用戶對 1682部電影評分信息,共有100000 條評分信息,每名用戶至少有20 條以上的評分信息,用1 到5評分值代表用戶對所看電影的喜好程度。實驗中采用MovieLens小版本數據集,將數據集分為訓練集與測試集,其中訓練集占總數據集的80%,測試集占20%。按照訓練集與測試集的比例,隨機生成了6組實驗數據。由于測試集中可能存在某用戶在訓練集不存在,則將該用戶從測試集中刪除,這樣可提高預測評分的可靠性。實驗中將對每一個算法用6組實驗數據測試6次,取6次實驗結果的均值。在評分預測中,計算預測準確度般可以用均方根誤差( RMSE)和平均絕對誤差( MAE)來衡量,由于RMSE 采用了增加對預測不準的用戶項目評分值 ,因此對推薦算法要求更嚴格,所以文中選用 RMSE 作為評測指標。

(2) 實驗結果及分析

實驗根據三種常用不同相似度計算方法,以及基于均值還是雙重均值的不同共形成6種算法分別進行實驗。表1是采用歐幾里得距離計算用戶之間相似度,基于均值與雙重均值分組實驗數據求均值后RMSE對比所示,圖1是表1的直方圖顯示;表2是采用皮爾遜距離計算用戶之間相似度,基于均值與雙重均值分組實驗數據求均值后RMSE對比所示,圖2是表2的直方圖顯示;表3是采用修正余弦距離計算用戶之間相似度,基于均值與雙重均值分組實驗數據求均值后RMSE對比所示,圖3是表3的直方圖顯示;表4是采用三種不同距離的雙重均值實驗數據求均值后RMSE對比所示,圖4是表4的直方圖顯示。由實驗數據可見,無論采用何種距離計算用戶相似度,采用改進算法都能使RMSE更小,且采用修正余弦的改進算法優于其他兩種距離改進算法。

針對用戶評分數據集中稀疏性,常用近鄰用戶評分均值填充,該方法確實可以有效提高推薦系統的RMSE。但實際某用戶對某個項目的預測評分結果不僅與近鄰用戶對該項目的評分有關,也與近鄰用戶的評分均值有關,并且還和該項目的所有用戶評分均值有關。因此文中采用基于這兩種均值的協同過濾推薦算法,實驗表明可以進一步提高RMSE。

3 結束語

推薦算法是常用的大數據分析,通過改進的協同推薦算法案例,既可以讓學生了解常用的推薦算法,同時又能分析不同推薦算法優點和缺點,并提出一種改進的推薦算法且通過實驗證明更好,所有實驗中涉及的程序都用Python實現。因此該案例可以增強學生用Python分析數據的能力,并且可以增強解決復雜工程能力和計算思維能力。

參考文獻:

[1]許海玲,吳瀟,李曉東,等. 互聯網推薦系統比較研究[J].軟件學報, 2009,20(2):350-362.

[2]Goldberg D, Nichols D, Oki B M, et al. Using Collaborative Filtering to Weave an Information Tapestry[J]. Communications of the ACM,1992,35(12):61-70.

[3] 馬婉貞,錢育蓉. 基于標簽匹配的協同過濾推薦算法研究[J].計算機研究與發展,2017,27(7):25-28.

[4] 蘭艷,曹芳芳.面向電影推薦的時間加權協同過濾算法的研究[J].計算機科學,2017,44(4):295-301.

[5]Deshpande M,Karypis G. Item-based top-n recommendation algorithms[J]. ACM Transactions on Information Systems, 2004,22(1):143-177.

[6] 云祥富.面向稀疏性數據的協同過濾推薦算法的研究[D]. 長春:吉林大學, 2017.

[7] 于洪, 李俊華. 一種解決新項目冷啟動問題的推薦算法[J]. 軟件學報, 2015,26(6):1395-1408.

[8] 蔣宗禮, 王威, 陸晨. 基于均值預估的協同過濾推薦算法改進[J]. 計算機研究與發展,2017,27(5):1-5.

【通聯編輯:王力】

主站蜘蛛池模板: 精品一區二區久久久久久久網站| 日韩毛片免费| 欧美人与性动交a欧美精品| 亚洲精品视频免费| www.91在线播放| 97久久超碰极品视觉盛宴| 老色鬼久久亚洲AV综合| 在线欧美一区| 色爽网免费视频| 久久成人国产精品免费软件 | 亚洲精品天堂在线观看| 亚洲精品中文字幕无乱码| 国产在线欧美| 国产激情第一页| 东京热一区二区三区无码视频| 久久国产精品77777| 国产精品美人久久久久久AV| 无码aaa视频| 97成人在线观看| 亚洲日本一本dvd高清| 色婷婷视频在线| 色婷婷成人| 青青久久91| 国产又爽又黄无遮挡免费观看| 国产区福利小视频在线观看尤物| 国产精品无码久久久久久| 中文字幕中文字字幕码一二区| 欧美日韩va| 亚洲永久视频| 欧美a级完整在线观看| 国产成人精品无码一区二| 精品欧美视频| 亚洲欧美在线综合一区二区三区| 全午夜免费一级毛片| 精品国产中文一级毛片在线看 | 日韩在线播放中文字幕| 亚洲男人的天堂网| 国产精品欧美日本韩免费一区二区三区不卡 | 亚洲中文字幕手机在线第一页| 波多野结衣一级毛片| 114级毛片免费观看| 婷婷激情五月网| 国产在线八区| 亚洲欧洲日产国产无码AV| 国产午夜一级淫片| 亚洲69视频| 青草国产在线视频| 欧美成人免费午夜全| 亚洲av无码人妻| 一本大道视频精品人妻| 色综合中文| 青青操视频在线| 久久久久久午夜精品| 亚洲av无码专区久久蜜芽| 在线欧美a| 婷婷六月综合| 国产精品国产三级国产专业不| 波多野结衣一区二区三视频| 鲁鲁鲁爽爽爽在线视频观看| 国产香蕉在线视频| 456亚洲人成高清在线| 欧美在线视频不卡第一页| 国产理论一区| 国产福利一区视频| 亚洲成网777777国产精品| 色噜噜中文网| 亚洲女同欧美在线| 久久96热在精品国产高清| 狠狠色狠狠色综合久久第一次 | 在线99视频| 中文字幕无码中文字幕有码在线| 91av国产在线| 国产aⅴ无码专区亚洲av综合网| 国产精品免费p区| 国产高清免费午夜在线视频| 日韩成人午夜| 在线视频亚洲色图| 91午夜福利在线观看| 91在线国内在线播放老师| 久热99这里只有精品视频6| 青青青伊人色综合久久| 无码国产偷倩在线播放老年人|