999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于學習者模型的文本學習資源推薦算法研究

2020-06-16 00:24:30陳鑫宇楊冬黎魯金秋衣存慧左富成張麗偉
計算機技術與發展 2020年6期
關鍵詞:文本資源用戶

陳鑫宇,楊冬黎,魯金秋,衣存慧,左富成,張麗偉

(東北石油大學 計算機與信息技術學院,黑龍江 大慶 163318)

0 引 言

雖然近年來國內在線教育發展速度較快,隨著它的蓬勃發展,網絡上學習資源的數量和種類都得到了空前的豐富。互聯網規模的不斷擴充,技術的突破給人們的生活和工作帶來了便捷,在實現學習資源共享的同時,也提高了工作和學習效率。但是隨著數據的井噴式增長,學習者面對海量的音頻、視頻、文本學習資源很容易出現信息迷航和信息超載,往往需要耗費大量的時間和精力對在線學習資源進行檢索和篩選,找到用戶自己需要的學習資源[1]。

用百度等搜索引擎[2]來檢索是解決信息超載問題的一個辦法,但有一個小缺點——用戶在使用同一個關鍵字搜索信息時,得到的結果是一樣的。另一方面來看,信息及其傳播是多樣化的,而用戶對信息的需求是多元化和個性化的,并且隨著時間的推移,用戶的需求也是實時變化的。那么通過以搜索引擎為代表的信息檢索系統獲得的結果,也不能很好地滿足用戶的個性化需求[3],信息搜索引擎也不能從根本上解決信息超載問題。

因此,個性化推薦系統應運而生,它是解決信息超載問題的一種非常有潛力的方法,在中國文本學習資源個性化、智能化推薦對于學習者提高在線學習效率具有重要意義。和搜索引擎相比,推薦系統通過研究用戶的興趣偏好,進行計算,由系統發現用戶的興趣點,系統將根據用戶的偏好,將需要的各種信息、產品等精準推薦給用戶[4],從而引導用戶發現自己的信息需求。

文中就文本學習資源個性化推薦系統的幾項關鍵技術研究給予闡述。

1 基于學習者模型的文本推薦系統相關理論與研究

1997年Resnick和Uarian給出推薦系統[5]的概念——“它是利用電子商務網站向客戶提供商品信息和建議,幫助用戶決定應該購買什么產品[6],模擬銷售人員幫助客戶完成購買過程”。文本學習資源推薦的主要任務是幫助學習者自動并有效地發現或推送與學習者查詢相關的信息。

面對海量的互聯網文本學習資源數據,能有效解決用戶興趣內容匹配問題,用戶模型的構建是該技術的核心,按照這個思路,設計了“三位一體”的基于學習者模型的文本學習資源推薦系統。該系統主要由3大模型構成,即用戶模型、推薦算法模型和推薦對象模型。基于學習者模型的推薦系統構成如圖1所示。

圖1 基于學習者模型的推薦系統構成

對于登陸在線教育網站的學習者來說,文中把他們都稱為用戶。由圖1可以看出,文中把用戶模型中的用戶劃分為普通用戶和目標用戶兩大類。如果學習者剛打開一個學習的網站,第一次注冊進來,然后在學習資源的網站中漫無目的的瀏覽,隨便點擊查看某一項內容,就把這類用戶識別為普通用戶;如果用戶進入學習資源網站后,直接在網絡上發布一大段內容,詳細闡述了自己的觀點,比如用戶想找什么樣的、什么類型、什么時間段的內容等,就把這類目的明確的用戶定義為目標用戶。

推薦系統把用戶模型中的興趣需求信息和推薦對象模型中的特征信息進行匹配計算,篩選出用戶可能感興趣或者要找的信息,然后把結果推薦給用戶。當然如果用戶用了推薦信息一段時間后,用戶可以再次登錄系統,把反饋結果(比如用戶評價等)返回到推薦算法模型。模型通過反饋結果進行記錄,為系統下一次的準確推薦做儲備。

2 用戶行為分析

在個性化推薦系統中,用戶行為一般可以分為顯式行為和隱式行為兩種。

顯式獲取興趣偏好[7-9]的方法是簡單而直接的做法,能相對準確地反映用戶對某種物品的興趣的行為需求,比如用戶在學習資源網站上看到別人寫的一段文字內容后,他對內容發表了自己的觀點和看法,進行了評論,或者將所看過的內容轉發了。行為是其興趣作用的結果,都在表達著用戶的愛好特征。其中發布和轉發文章是能夠讓其他用戶了解到當前用戶關注的事情,這反映出用戶不僅對當前主題感興趣,更希望別人也能關注當前主題,這是一種典型的用戶喜好的顯式行為。

顯示行為所得的信息比較具體、全面、客觀,結果往往比較可靠。缺點就是很難收到實效,主要原因就是很少用戶愿意花時間或不愿向系統表達自己的喜好,比如有的用戶雖然很喜歡這篇文章,但是就是懶的發評論,不樂意在網上留下自己的言論。

隱式行為是那些沒有明確和直接地表達出用戶興趣的行為,如瀏覽、收藏、評論、點贊等,雖然這些也能體現用戶的興趣,但這幾種方法不會把用戶當前關注的事情推送給其他用戶,這幾種行為可以看作是隱式行為。

舉報和刪除行為表現出用戶對當前主題的反感等,這兩種行為一般情況下是不會被推送給其他用戶的,雖然這兩種行為能從反面反映出用戶的關注點,但無法直接體現用戶的興趣,因此在用戶建模的過程中將不考慮舉報和刪除這兩種行為。

3 推薦算法模型

文中主要根據學習者的興趣偏好提出建議,采用基于向量空間模型的學習者興趣模型表示方法,將該模型實例化為學習者興趣向量模型,并且通過更新算法來實現有效推薦。

3.1 學習者興趣模型的表示方法

學習者興趣模型是對學習者的偏好信息進行形式化描述,因此它的好壞對推薦系統的性能起著至關重要的作用。

目前,比較常用的學習者興趣[10]模型表示方法主要有基于向量空間[11-13]的表示方法、基于用戶-文檔矩陣的表示方法[14-15]、基于貝葉斯網絡的表示方法[16]、基于本體論的表示方法[17-18]、基于神經網絡的表示方法5種。

其中基于向量空間的學習者興趣模型用一個特征向量來描述用戶的興趣或者文本信息模型。當需要對學習者興趣和文本進行計算時,就可以利用向量的各種運算來代替,每一個向量都由若干個(大于零)特征項以及與特征項相對應的權重值組成。比如,學習者S的興趣可以用向量空間模型表示為S{(k1,w1),(k2,w2),…,(kn,wn)},其中n為該學習者的興趣關鍵詞數目,Rij是第i個關鍵詞,wi為Rij對應的權重值。

基于協同過濾的推薦系統多采用基于用戶-文檔矩陣的用戶模型表示方法,即用一個二維的用戶-文檔矩陣來表示學習者興趣模型,假設用一個m×n階矩陣A(m,n)表示,其中m是系統中學習者的數目,n是系統中文檔的個數,矩陣里任意單元格用元素Rij表示,Rij表示內容為學習者對文檔資源的評分。

基于貝葉斯網絡的表示法是一種基于概率的不確定性推理網絡。該方法就是用貝葉斯網絡來表示學習者興趣模型,但是該方法的前提條件是假設學習者興趣的變量值是受概率分布控制的。

基于本體論的表示方法就是用一個語義本體來描述學習者的興趣模型,語義本體可以對知識進行共享和重用,表示出概念之間豐富的語義關系,還可以進行推理。

神經網絡(NNs)或稱作連接模型(connection model),它是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。這種網絡主要是靠系統的復雜程度,調整系統內部大量節點彼此之間的連接關系,從而達到處理信息的目的。神經網絡用到的算法就是向量乘法,并且廣泛采用符號函數及其各種逼近。

通過權衡以上方法的優點與缺點后(具體如表1所示),文中對用戶模型中的普通用戶決定采用引入語義的文本向量模型和學習者興趣向量模型,通過描述中文文本文檔中關鍵字之間的語義關系,使其能更準確地描述學習資源和學習者興趣,達到更好的推薦效果。對于用戶模型中的目標用戶,文中則通過對這兩個模型進行余弦相似度對比,確定用戶之間的相似性,實現中文文本學習資源的個性化推薦。

表1 學習者興趣模型表示方法比較

3.2 學習者興趣向量模型更新算法

在中文文檔推薦部分,文中主要通過學習者對文本資源的評價來進行學習者興趣向量模型的更新。文中評價一種有五種:不感興趣、不太感興趣、一般、比較感興趣、非常感興趣。學習者興趣向量模型的更新過程如下:

令tij表示學習者的第q個興趣節點的關鍵詞kq。因為學習者的興趣可能會隨著時間的推移而發生變化,文中在學習者興趣向量模型的更新過程中,引入了遺忘因子,采用式(1)對關鍵詞kq的權重Φq進行更新。同時,令關鍵詞kq對應的時間Tq=Tnow。

(1)

其中,Φq是特征詞kq的權重;l是學習率,0

當學習資源的特征詞tij并未存在于學習者興趣向量模型中,但是有與它的語義相關度小于等于0.8的詞存在于學習者興趣向量模型中時,將該特征詞合并到學習者興趣向量模型中,令學習者興趣向量模型的維度n=n+1,興趣關鍵詞Kn=Tij,興趣關鍵詞所對應的時間Tnow=Tn,興趣關鍵詞Kn對應的權重計算如下:

Φq=wij×u×l

(2)

最后按照式(3)的興趣權重Φq值的大小對學習者興趣向量模型的n維向量進行由大到小的排序,取排名前20的Φq值并進行歸一化處理,1≤i≤20。

(3)

再重復循環,直到瀏覽過的文集計算完畢。算法的詳細過程的偽代碼如下所示:

算法:學習者興趣向量模型更新算法。

uin {不感興趣,不太感興趣,一般,比較感興趣,非常感興趣}={-2,-1,0,1,2};

Documents=D(d1,d2,…,di,…,dm),其中(i>=1 andi>=m)

inti;

for(i=1;i<=m;i++)/*第i篇文本的特征詞信息和當學習者興趣向量模型進行合并*/

{ if(tijin Student)

/*表示特征詞已經存在于學習者興趣向量模型之中*/

{Tq=Tnow;

l=0.5;h=7;

}

else

{if(Sim(tij,kq)>=0.8)

{Tq=Tnow;

kq進行更新;

}

else

{n=n+1;

kn=tij;

Tq=Tnow;

Φq=wij×u×l;

}

/*從大到小Φq進行排序*/

}

printf(“輸出Φq的值”,Φq);}

3.3 目標用戶的中文文本學習資源的個性化推薦算法

考慮到文本向量模型中的特征詞雖然沒出現在學習者興趣向量模型中,但是與其語義相關度大于某一閾值的詞可能存在于學習者興趣向量模型中,這個學習資源也應該滿足學習者的潛在興趣,應該推薦給學習者。因此,文中對目標用戶采用改進后的相似度計算公式來計算文本向量模型與學習者興趣向量模型的相似程度,從而提高推薦系統的查全率,具體如下:

(4)

其中,wi,d與wi,s分別對應關鍵詞i的學習資源d和學習者s的權重值,wk,d是關鍵詞k在向量模型d中的權重值,wj,S表示關鍵詞j在學習者興趣向量模型S中的權重值。

4 文本學習資源推薦實現部分

隨著社會的發展和人們認知水平的提高,孩子的教育越來越受到人們的重視。家教已經成為中學、小學乃至學前班學生學習、生活中不可或缺的一部分。人們以往一提及家教主要是指傳統的家教模式,就是通常說的線下教育:家教去學生家里授課。在這個過程中,學生和家長希望能找到適合的并且價格低廉的家教教師,同時教師也希望可以找到一份薪酬滿意且位置合適的家教工作。因此,線上教育應運而生。為了能使學生和家長、教師按照自己的需求尋找中文文本學習資源,縮短尋找時間,增強用戶的體驗度和匹配度,文中設計了一個基于學習者模型的家教推薦系統。推薦算法模型是該系統中最重要的組成部分。系統會自動提取當前用戶對應的學習者興趣向量模型,然后利用式(1)計算該模型與文本資源庫中每一個文本資源的文本向量模型余弦相似度,并按照求出來的余弦值排序,將余弦相似度值較大的前8個資源展示到推薦頁面。如果采用表2所示的實驗數據時,中文文本學習資源個性化推薦界面上就會顯示數學、語文、英語、物理、政治、化學、生物、地理這8個學習資源,具體如圖2所示。學習者可以點開進入學習,學習后也可以對學習資源進行評價,進而更新學習者興趣向量模型,使下一次的推薦更加準確,更符合自己個性化的興趣。

表2 學習者興趣向量模型實驗數據

圖2 中文文本學習資源推薦界面

5 結束語

首先闡述了“三位一體”的基于學習者模型推薦系統的理論與研究,然后通過分析用戶行為,對不同類型的用戶,利用公式計算文本向量模型與學習者興趣向量模型的相似程度,并按照求出來的余弦值由大到小排序,將余弦相似度值較大的推薦給用戶。實驗結果表明該推薦算法是有效的。但是在學習資源選擇中并不完善,只針對文本學習資源進行了推薦,由于學習資源還包括視頻、音頻等,因此這些將是未來要研究的方向與重點。

猜你喜歡
文本資源用戶
基礎教育資源展示
一樣的資源,不一樣的收獲
在808DA上文本顯示的改善
資源回收
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
主站蜘蛛池模板: 一级爱做片免费观看久久| 国产一区二区人大臿蕉香蕉| 男人天堂伊人网| 亚洲免费福利视频| 伊在人亚洲香蕉精品播放| 久久中文字幕av不卡一区二区| 国产亚洲欧美日本一二三本道| 国产精品专区第一页在线观看| 日本在线亚洲| 大香伊人久久| 久久亚洲日本不卡一区二区| 亚洲欧美日韩另类在线一| 日韩欧美国产三级| 亚洲婷婷丁香| 91在线无码精品秘九色APP| 日本亚洲欧美在线| 国产欧美专区在线观看| 精品视频在线一区| 国产女人18水真多毛片18精品| 中文字幕亚洲乱码熟女1区2区| h视频在线观看网站| 国产91av在线| 青草视频久久| 欧美亚洲国产精品第一页| 强乱中文字幕在线播放不卡| 99视频在线观看免费| 国产丝袜无码精品| 欧美日韩在线第一页| 国产乱子伦视频三区| 特级毛片8级毛片免费观看| 欧美精品一区在线看| 毛片免费网址| 精品午夜国产福利观看| 2021天堂在线亚洲精品专区 | 国产成人亚洲欧美激情| 久久人人妻人人爽人人卡片av| 中文字幕日韩视频欧美一区| 在线不卡免费视频| 尤物特级无码毛片免费| 国内精品久久久久久久久久影视 | 成人精品午夜福利在线播放| 欧美日韩成人| 中文字幕人成乱码熟女免费| 狠狠做深爱婷婷久久一区| 精品国产Ⅴ无码大片在线观看81| 亚洲成人黄色在线观看| 青草免费在线观看| 一级毛片a女人刺激视频免费| 亚洲综合色区在线播放2019| 91年精品国产福利线观看久久| 欲色天天综合网| 日韩精品资源| 亚洲娇小与黑人巨大交| 乱系列中文字幕在线视频| 在线观看91香蕉国产免费| 精品第一国产综合精品Aⅴ| 亚洲日韩在线满18点击进入| av在线手机播放| 久视频免费精品6| 久热re国产手机在线观看| 一区二区无码在线视频| 一区二区三区成人| 2020亚洲精品无码| 亚洲无码免费黄色网址| 免费大黄网站在线观看| 青青草国产免费国产| 动漫精品中文字幕无码| 欧美日韩另类在线| 91小视频在线| 婷婷综合在线观看丁香| 97人人做人人爽香蕉精品| 国内精品久久九九国产精品| 国产乱人伦精品一区二区| 国产九九精品视频| 国产精品久久久久久搜索| 国产91导航| 国模极品一区二区三区| 在线视频精品一区| 四虎影视国产精品| 国产乱子伦视频三区| 久久99精品国产麻豆宅宅| 丁香五月激情图片|