姜喜春
黑河學(xué)院理學(xué)院,黑龍江黑河 164300
隨著科學(xué)技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)時(shí)代的悄然來臨,網(wǎng)絡(luò)已深入千家萬戶。網(wǎng)絡(luò)不僅在醫(yī)療、交通和網(wǎng)絡(luò)產(chǎn)品的銷售方面給予一定程度上的幫助,對(duì)于教育課程的發(fā)展也有著可喜的成就。用戶可以根據(jù)個(gè)人興趣通過不同的在線教育平臺(tái)學(xué)習(xí)網(wǎng)絡(luò)課程,這不僅改變用戶傳統(tǒng)的學(xué)習(xí)形式,而且使用戶的學(xué)習(xí)課程的方式更具個(gè)性化,進(jìn)一步體現(xiàn)了“互聯(lián)網(wǎng)+教育”的具體實(shí)現(xiàn)。
貴州省使用平臺(tái)的用戶最多為18786人,其次是河南省的用戶數(shù)為18550人,使用平臺(tái)用戶最少的是澳門為171人。因此線上課程管理可以針對(duì)貴州省和河南省的用戶發(fā)放更多的課程和優(yōu)質(zhì)資源。
大多數(shù)學(xué)生是在早上八九點(diǎn)鐘登錄次數(shù)最多,此時(shí)正是大多數(shù)學(xué)生開始上課時(shí)間段符合常理;到十一二點(diǎn)時(shí)登錄用戶明顯減少,中午時(shí)間為午休時(shí)間人數(shù)減少也符合常理;到達(dá)下午兩點(diǎn)多時(shí)用戶逐漸增多直到下午五六點(diǎn)鐘人數(shù)開始減少,同樣晚上登陸人數(shù)逐漸減少可知該數(shù)據(jù)基本符合學(xué)生的正常規(guī)律。
同樣的通過繪制非工作日用戶登錄次數(shù)我們可以發(fā)現(xiàn)在白天登錄的人數(shù)較為均勻但并不如工作日登錄次數(shù)多,但是晚上登錄人次較于工作日相對(duì)較多。
1.3.1 流失率定義
用戶對(duì)平臺(tái)的使用存在主觀性,為更準(zhǔn)確的對(duì)平臺(tái)用戶活躍度進(jìn)行分析,需要對(duì)平臺(tái)用戶的流失情況進(jìn)行分析,流失率定義如下:記false為數(shù)據(jù)觀察窗口截止時(shí)間,false表示用戶false的最近訪問時(shí)間,false,若false天,則稱用戶false為流失用戶。
1.3.2 平臺(tái)用戶流失率
將時(shí)間轉(zhuǎn)化為時(shí)間戳,用戶的最近訪問時(shí)間時(shí)間戳與數(shù)據(jù)觀察窗口截止時(shí)間的時(shí)間戳相減,最終將得到的時(shí)間戳轉(zhuǎn)化為天數(shù)。利用Excel高級(jí)篩選,天數(shù)大于90天,將流失用戶篩選出來,根據(jù)定義再次計(jì)算用戶的流失率。可以得出該平臺(tái)的流失用戶數(shù)為13910,由于篩選后的用戶總數(shù)為29397,因此將流失用戶與總用戶數(shù)據(jù)作比,從而得出用戶流失率為47.3%。
根據(jù)用戶在該平臺(tái)學(xué)習(xí)的記錄和每門課程參與學(xué)習(xí)的用戶人數(shù)可以計(jì)算出該平臺(tái)受歡迎的程度,進(jìn)而將受歡迎程度定義為:false其中,false代表第false門課程的受歡迎程度,false表示參與第false門課程學(xué)習(xí)的人數(shù),false和false分別為所有課程中參與人數(shù)最多和最少的課程所對(duì)應(yīng)的人數(shù)。
協(xié)同過濾(Collablrative Filtering,簡稱CF),協(xié)同過濾共包括三種算法,第一種是基于用戶的協(xié)同過濾,主要通過觀測(cè)用戶之間的相似程度,并找到相似用戶之間喜歡的商品,在此基礎(chǔ)上,我們就可以對(duì)第二種是基于項(xiàng)目的協(xié)同過濾,第三種是基于模型的協(xié)同過濾算法,可以通過評(píng)分構(gòu)建學(xué)習(xí)模型。協(xié)同過濾算法的原理應(yīng)用打分矩陣和統(tǒng)計(jì)信息計(jì)算兩個(gè)用戶和兩個(gè)項(xiàng)目之間的相似度,并通過計(jì)算得到的相似度進(jìn)行排序,得到相應(yīng)的推薦結(jié)果。以下公式代表基于物品的協(xié)同過濾,false。
在進(jìn)行用戶關(guān)系評(píng)價(jià)時(shí),歐幾里德距離被認(rèn)為是一種較為簡單的評(píng)價(jià)方法。歐幾里德的原理主要以人們有相同評(píng)價(jià)的商品為坐標(biāo)軸,選取參與評(píng)價(jià)的人數(shù),并將參與評(píng)價(jià)的人繪制到相應(yīng)的坐標(biāo)系上,然后計(jì)算參與評(píng)價(jià)的人兩兩之間的距離,最后通過計(jì)算不同用戶彼此之間在散點(diǎn)圖上的距離大小,進(jìn)而判斷不同用戶是否具有相同的偏好。其中,通過歐幾里德方法方法計(jì)算出的距離是一個(gè)大于0的數(shù),為了使其更能有效的代表用戶之間的相似度,將此距離規(guī)約在false之間,歐幾里德距離的計(jì)算公式如下:false。
在工作日時(shí)間段,上午8點(diǎn)和9點(diǎn)、下午13點(diǎn)和14點(diǎn)及晚上20點(diǎn)和21點(diǎn)平臺(tái)用戶比較活躍,平臺(tái)成員登錄次數(shù)均超過15000次;在非工作日內(nèi),平臺(tái)用戶的活躍度比較均勻,晚上20點(diǎn)時(shí)平臺(tái)用戶登錄次數(shù)最多,但僅超過7000次,與工作日相比,平臺(tái)用戶的登陸次數(shù)大大減少。
該平臺(tái)在線上管理的過程中,在工作日的上午8點(diǎn)和9點(diǎn)、下午13點(diǎn)和14點(diǎn)及晚上20點(diǎn)和21點(diǎn)可以大量的向用戶推薦課程;在非工作日的上午9點(diǎn)和10點(diǎn)、下午14點(diǎn)和15點(diǎn)及晚上20點(diǎn)向用戶增加推薦課程,其余時(shí)間平臺(tái)可以選擇減少推薦量。