強 薇
(蘇州工業園區服務外包職業學院,江蘇 蘇州 215123)
在“信息爆炸”的時代,英語數字資源的可獲得性不斷增強。學習者需要選擇滿足自身學習的特定需求和興趣,但學習者熟練水平提升卻是一個挑戰。為了解決這一問題,英語數字資源個性化推薦的概念應運而生,且有效地改變了學習者發現和使用相關資源的方式。個性化推薦方法利用先進的算法和數據分析技術來解析個體學習者的偏好、學習模式和目標。個性化推薦方法可根據用戶數據(如歷史互動、反饋和表現等)可以準確識別并推薦與學習者獨特需求相匹配的資源。無論是算術、統計還是高級數學概念,個性化推薦方法主要目的在于強化用戶的學習效果和參與度。通過個性化推薦方法,學習者可以更加高效地發現適合自己的英語數字資源。這種定制化的學習體驗不僅能夠滿足個體學習者的需求,還能夠激發他們的學習熱情,使學習過程更加愉快、更加高效。
國內相關專家針對英語數字資源個性化推薦[1]方面的內容展開了大量研究。童小凱等[2]采用“知識圖譜”建立不同域之間的聯系,同時形成全局嵌入,最終通過全局域提高每個目標域推薦結果的準確性。黃禹等[3]將傳統“用戶—項目評分矩陣”轉換為“用戶—項目距離矩陣”,采用距離分解法獲取用戶、項目兩者之間的距離關系,并且利用其替換原始的相似度關系,最終引入深度學習框架有效實現個性化推薦。李偉卿等[4]優先構建“用戶長短偏好模型”,通過用戶評分偏置和評分兩者相結合的方式完成個性化推薦。以上幾種個性化推薦方法在使用過程中存在英語數字資源個性化推薦結果不準確以及個性化推薦耗時長等問題。為此,文章引入改進神經網絡,提出一種基于改進神經網絡算法的英語數字資源個性化推薦方法。試驗測試結果表明,該方法可以有效提升英語數字資源個性化推薦結果準確性,同時能夠加快推薦效率。
在網絡瀏覽過程中,全部用戶的訪問行為都是隨機的,在隨機一個時間序列z內,設定互動尺寸為n,在特殊情況的窗口內,對窗口內的n條數據展開均值計算。在長度為l的時間特性z處于N維空間內,可以將其中的第i個元素表示為
式(1)中,代表第i個向量。
為了更好地實現長度為l的時間特性降維處理,需要將上述時間特性劃分為N個規格完全一致的幀,同時計算每個幀落入幀內的均值,并且將獲取的均值計算結果按照時間軸的方式排序,得到長度為N的向量,通過初始序列的方式描述不同的向量。
將全部用戶劃分為多個規格相同的時間片T1,T2,T3,…,Tn,計算單一任務的平均時間tavg:
式(2)中,k代表任務總數;time(task(i))代表執行任務i的時長。
將各個類型的用戶行為特征進行統計分析,分析各個時間片段Tn下各種行為特征的分布情況,同時通過落在各個Tn中的任務總數,將時間片中用戶的行為狀態展開劃分處理。引入靜態劃分規則,在設定時間范圍內對全部用戶行為特征總數進行統計和整合,經過計算可以得到用戶不同特征行為在系統整體資源所占的比例si如下:
式(3)中,taski,j代表在時間片段i中第j個任務,Call代表英語數字資源的總量。
以用戶在網頁的瀏覽時間和訪問頻率作為衡量標準,通過對用戶在網頁查詢頻率的分析可以得到不同類型用戶的行為特征。將得到的不同類型用戶行為特征模型輸入到支持向量機內[5-6],將給定的英語數字資源對應的訓練數據表示為{xi,yi},xi和yi分別為輸入向量和英語數字資源類型標簽。在支持向量機內[7-8],分類的最優超平面來自距離其最近的部分樣本點。結合上述分析,得到最優分類的超平面表達式:
式(4)中,W代表權重向量,b代表標量。
在利用支持向量機[9-10]對用戶偏好挖掘的過程中,同時還需要分析全部輸出值對應的輸入特征,再將用戶平均查詢頻率作為標準,引入支持向量機觀察不同類型用戶的查詢行為特征,得到用戶行為特征挖掘結果f(x):
式(6)中,代表知識元,ua,i代表知識元組成的元素總數,wa,b代表混合權重因子,主要是由權重因子wa和wb組成。
在式(6)中,除了用戶相似度,剩余各個參數全部可以通過實際統計得到。英語數字資源個性化推薦[13-14]是在神經網絡算法的基礎上實現,通過圖1給出神經網絡算法結構圖。

圖1 神經網絡算法結構圖
式(5)中,K(xi)代表估計函數,β(x)代表映射函數。
以用戶行為挖掘結果為依據進行英語數字資源個性化推薦。在英語數字資源個性化推薦過程中[11-12],引入Linkert量值描述英語數字資源個性化推薦結果rec(a,i),對英語數字資源個性化推薦結果產生影響的主要因素分別為用戶相似度ha,w、用戶評分數量s、用戶評分重疊數量m、用戶評分向量pa,w,進而可以將rec(a,i)表示為:
為了有效避免神經網絡算法[15]在訓練過程中出現震蕩的情況,需要在傳統神經網絡算法中加入動量因子τ,引入動量因子后的權值Δθ(k)計算式如下所示:
式(7)中,r(k)代表學習速率。
通過改進神經網絡算法和元數據概念構建英語數字資源本體ψ,對應的計算式為式(8):
在得到用戶偏好以及英語數字資源本體后,為了提升英語數字資源個性化推薦結果的可靠性,需要對以上二者進行雙重聚類處理,也就是利用雙重聚類算法對用戶偏好以及英語數字資源進行聚類處理,詳細的聚類結果如式(9)和式(10)所示。
式(9)中,L代表用戶偏好集合;式(10)中,P代表英語數字資源集合。
對聚類結果展開匹配,最終實現英語數字資源個性化推薦I:
式(11)中,GL和GP分別代表用戶類和英語數字資源的聚類中心。
為了驗證所提出的基于改進神經網絡算法的英語數字資源個性化推薦方法(以下簡稱所提方法)的有效性,試驗選取來自Kaggle數據網,計算不同英語數字資源個性化推薦方法(文獻[2]方法、文獻[3]方法、文獻[4]方法)的準確率,并在相同的試驗環境下,對不同推薦方法的查準率以及運行時間等評價指標展開測試分析。
試驗在Kaggle數據網選取10種不同類型的英語數字資源作為試驗數據,在Windows 10環境下通過Python(3.5)對試驗數據展開分析。
(1)英語數字資源個性化推薦準確率
在用戶興趣特征詞數量持續增加情況下,不同英語數字資源個性化推薦方法的準確率變化情況,如圖2所示。

圖2 不同英語數字資源個性化推薦方法的準確率比較
分析圖2可知,隨著用戶興趣特征詞數量的持續增加,不同推薦方法的準確率也逐漸增加。當用戶興趣特征詞數量達到55時,不同推薦方法的準確率也達到最高。但是所提方法的準確率明顯更高,證明其更加適用于英語數字資源個性化推薦。
(2)查準率
在設定推薦英語數字資源數量的情況下,不同英語數字資源個性化推薦方法的查準率變化情況,如圖3所示。

圖3 不同推薦英語數字資源數量下不同推薦方法的查準率對比
分析圖3可知,在推薦英語數字資源數量不斷增加的情況下,不同推薦方法對應的查準率呈現下降趨勢。但是經過對比發現,所提方法的查準率優于另外三種推薦方法。
(3)運行時間
在不同推薦英語數字資源數量情況下,不同推薦方法的運行時間變化情況,如表1所示。

表1 不同推薦英語數字資源數量下不同推薦方法的運行時間對比
通過分析表1可知,所提方法的運行時間明顯低于另外三種推薦方法,說明所提方法在現實中具有更高的應用價值,可以有效提升英語數字資源個性化推薦效率。
針對傳統英語數字資源個性化推薦方法存在的推薦結果不準確以及運行時間較長等問題,文章提出一種基于改進神經網絡算法的英語數字資源個性化推薦方法。通過和已有的個性化推薦方法相比較,可證明所提方法在英語數字資源個性化推薦過程中更加高效,同時所獲取的結果也更加精準、查準率也更高,所提方法的研究成果為英語數字資源個性化推薦的后續發展提供了全新的思路。