999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

融合人口統計屬性的藥品推薦算法

2018-11-08 03:09:32周錫玲張莉敏田小路宋強
電子測試 2018年21期
關鍵詞:藥品融合用戶

周錫玲,張莉敏,田小路,宋強

(廣東理工學院,廣東肇慶,526100)

0 引言

基于協同過濾的推薦是個性化推薦系統中使用最廣的技術之一[1]。但協同過濾算法存在數據稀疏性問題。在某種程度上,用戶的人口統計屬性(年齡,收入等)揭示了用戶的喜好。國內外很多學者將用戶的人口統計信息與協同過濾進行融合來改善系統的推薦質量。文獻[2]提出一種挖掘用戶隱含的人口統計信息的方法。該方法能夠更準確的為用戶產生推薦。文獻[3]提出一種基于用戶人口統計與專家信任的協同過濾算法。實驗表明該方法改善了協同過濾算法的預測準確率。文獻[4]提出一種融合人口統計屬性的協同過濾算法,該方法能夠有效提高推薦精度。文獻[5]提出一種混合推薦技術的推薦模型,該方法解決了數據稀疏問題,且提高了系統的推薦質量。

1 融合人口統計屬性的藥品推薦算法

1.1 藥品聚類

根據停用詞表去掉藥品描述中的停用詞將剩下的詞匯當作特征詞。采用向量空間模型(VSM)將藥品映射為多維空間向量。利用K-means算法對藥品進行聚類。根據用戶的疾病癥狀找到它所屬的聚類,從該類中篩選出符合其病情的藥品,然后查找出評價過這些藥品的所有用戶,形成用戶-藥品評分矩陣。

1.2 用戶相似度計算模型

(1)用戶評分相似度計算

本文采用修正的余弦相似性來計算用戶之間的評分相似度。用戶a跟用戶b的評分相似度 s im _ r(a,b)計算公式如(1)所示:

其中,i表示用戶a跟用戶b的共同評分藥品,I(a)和I(b)分別表示用戶a與用戶b的評分藥品集,Ra,i和 Rb,i分別表示用戶a和用戶b對藥品i的評分,和分別表示用戶a和用戶b對所有藥品的平均評分。

(2)人口屬性相似度計算

不同年齡段的人使用同種藥品得到的療效有所不同,因此不同年齡段的人對于同種藥品給出的評分也不同。本文將年齡分為7個年齡段:18歲以下、18-24歲、25-34歲、35-44歲、45-54歲、55-65歲和65歲以上。因此,年齡屬性的向量形式表示為 ( n1,n2, … ,n7)。用戶a與用戶b的人口統計屬性相似度 s im _ a(a,b)計算公式如(2)所示:

(3)用戶相似度計算

本文將評分相似度跟人口屬性相似度進行加權線性融合得到用戶相似度,用戶相似度 s im(a,b)的計算公式如(3)所示:

將用戶相似度按降序排列,采用KNN算法選出排在最前面的K個用戶作為目標用戶a的相似鄰居集 ()Sa。

1.3 預測評分

根據 ()Sa中用戶的評分,目標用戶a在藥品 j上的預測評分計算公式如(4)所示:

其中,Ra和Rk分別表示目標用戶a和用戶k的平均評分,Rk,j表示用戶k對藥品 j的評分。選取目標用戶未評分的且預測評分排在最前的N個藥品推薦給目標用戶。

2 實驗結果及分析

2.1 數據集

本文采用的數據集是從http://www.datatang.com/data/46261上下載。選取580個用戶對615種藥品的21000次評分。實驗中,隨機選取20%當作測試集,剩下的當作訓練集。

2.2 評價指標

采用MAE來評價本文算法的有效性。其計算公式如(5)所示:

其中n為測試數據的數量,ip為算法的預測評分,ir為實際評分。顯然,MAE值越小,推薦質量越好。

2.3 實驗結果分析

(1)α的選取

表1 α對MAE的影響

由表1中數據可知,當 的值從0.1增大到0.3時,MAE的值隨著α值的增大而減小,且當α=0.3時,MAE值最小,M AE= 0 .3940,由此可以說明在計算用戶相似度時將用戶評分相似度與人口屬性相似度進行融合,可以提高推薦系統的推薦質量。當α從0.4增加到1.0時,MAE值隨著α的增大而不斷增大。由分析可知,當α=0.3時,MAE值最小,推薦質量最好。

(2)推薦效果比較

為評價本文提出算法的有效性,將本文算法與傳統基于用戶的協同過濾推薦算法(User-based CF)、采用人口統計屬性來計算相似度的協同過濾推薦算法(DAS-based CF)進行比較。比較結果如表2所示。

表2 MAE值比較

由表2數據可知,三種算法的MAE值隨著鄰居個數的增加而趨于穩定,但本文算法的MAE值明顯比其它兩種算法的MAE值低,說明本文在計算用戶相似度時將用戶評分相似度與用戶人口統計屬性相似度進行融合有效地改善了算法的推薦質量。

3 結束語

傳統協同過濾僅根據用戶-藥品評分矩陣來計算用戶相似度,由于評分矩陣稀疏,用戶相似度計算不準確使得目標用戶的相似鄰居集合選取不準確,從而導致推薦質量低,因此本文提出融合人口統計屬性的藥品推薦算法。該方法將藥品描述中的詞匯去掉停用詞后將所有詞匯作為特征詞,采用VSM將藥品映射為多維空間向量。為了降低時間復雜度,離線使用k-means算法進行藥品聚類。根據目標用戶的疾病癥狀找到其所屬的聚類,從該類中篩選出符合其病情的藥品,然后查找出對這些藥品進行過評分的所有用戶形成用戶-藥品評分矩陣。在用戶評分相似度的基礎上,引入了人口屬性相似度,將用戶評分相似度跟屬性相似度進行加權線性融合來得到用戶相似度,將用戶相似度按降序排列,采用KNN算法選出排在最前面的K個用戶作為目標用戶a的相似鄰居集。仿真結果表明,跟傳統協同過濾推薦算法相比,本文提出算法在推薦精度上有顯著的提高。

猜你喜歡
藥品融合用戶
是不是只有假冒偽劣藥品才會有不良反應?
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
從創新出發,與高考數列相遇、融合
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
藥品采購 在探索中前行
中國衛生(2016年5期)2016-11-12 13:25:28
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
藥品集中帶量采購:誰贏誰輸?
中國衛生(2015年5期)2015-11-08 12:09:48
主站蜘蛛池模板: 日本色综合网| 日韩 欧美 小说 综合网 另类| 71pao成人国产永久免费视频| 2022国产无码在线| 18禁黄无遮挡免费动漫网站 | 手机看片1024久久精品你懂的| 亚洲一区毛片| 青青草原国产免费av观看| 免费亚洲成人| 久久久久夜色精品波多野结衣| 99国产精品一区二区| 国产福利拍拍拍| 曰韩免费无码AV一区二区| 成人91在线| 波多野结衣视频网站| 夜精品a一区二区三区| 第一区免费在线观看| 国产福利观看| 国产免费人成视频网| 国产欧美日韩视频一区二区三区| 91国语视频| 亚洲无码高清一区| 亚洲国产亚洲综合在线尤物| 亚洲欧美一区二区三区蜜芽| 深爱婷婷激情网| 国产成人精品男人的天堂下载| 香蕉视频在线观看www| YW尤物AV无码国产在线观看| 国产免费网址| 日本一区中文字幕最新在线| 五月综合色婷婷| 国产日韩欧美中文| 亚洲成在人线av品善网好看| 国产女人在线视频| 亚洲视频在线网| 美美女高清毛片视频免费观看| 孕妇高潮太爽了在线观看免费| 波多野结衣视频网站| 亚洲欧美另类日本| 丰满人妻久久中文字幕| 天天干伊人| 成年女人18毛片毛片免费| 久久综合亚洲色一区二区三区| 国产成人无码AV在线播放动漫 | 国产一区二区视频在线| 五月婷婷综合色| 美女免费黄网站| 26uuu国产精品视频| 国产免费久久精品44| 第一页亚洲| 欧美精品亚洲精品日韩专区va| 美女高潮全身流白浆福利区| 理论片一区| 亚洲人成色在线观看| 亚洲精品大秀视频| 亚洲日本中文综合在线| av天堂最新版在线| 亚洲欧洲日韩国产综合在线二区| 午夜天堂视频| 国产免费自拍视频| 在线国产毛片| 日本国产在线| 亚洲欧洲美色一区二区三区| 国产99视频免费精品是看6| 18禁不卡免费网站| 亚洲成人免费在线| 亚洲男人天堂2020| 午夜国产大片免费观看| 正在播放久久| 国产真实二区一区在线亚洲| 亚洲va精品中文字幕| 中文字幕波多野不卡一区| 欧美日本在线观看| 国产麻豆精品久久一二三| 福利在线不卡| 亚洲综合一区国产精品| 成年av福利永久免费观看| 国产欧美日韩另类| 久久国产精品影院| 日韩欧美高清视频| 97久久超碰极品视觉盛宴| 国产永久无码观看在线|