楊靜 河南大學軟件學院
基于用戶特征屬性和云模型的協同過濾推薦算法
楊靜 河南大學軟件學院
互聯網迅速發展,用戶之間的互動聯系越來越緊密。但正由于用戶數量的急劇增長,導致互聯網信息呈爆炸性增長,信息泛濫是信息時代的特點之一。有時,這種“信息過載”的問題給用戶帶來了很多干擾,使得他們難以迅速的獲取自身需要的信息。信息檢索技術中的推薦技術由此應運而生并被廣泛的用戶接納認可,因為這種技術能根據用戶的偏好自動推薦與推送相關的所需要的信息,因此,這種技術目前已經成為當前研究的熱點。
用戶特征屬性 云模型 協同過濾推薦算法
協同過濾推薦算法是通過對用戶歷史行為數據的挖掘并建立模型進行分析,發現用戶信息的偏好,并在偏好基礎上對用戶進行群組劃分,推薦與用戶偏好相類似的商品。該算法又細分為兩種算法,一是基于用戶的協同過濾算法,二是基于物品的協同過濾算法。
基于用戶的協同過濾算法是基于相同喜好用戶之間的商品推薦。它通過分析總結用戶歷史的行為數據發現用戶對商品或內容的喜好程度(如內容評論或分享,商品收藏購買等),并用制定好的分數標準將其數據化并度量化。
基于物品的協同過濾算法是將基于用戶的協同過濾算法中的用戶替換成物品,兩種算法基本相類似。它通過度量不同的用戶對不同物品的偏好獲得物品間的關系,然后通過物品間的關系判斷,繼而對用戶推薦相似的物品。
中國工程院院士李德毅最早提出云模型的概念,主要用來處理定性概念與定量描述之間的轉換問題。云模型能通過模擬人類的思維方式來劃分事物的屬性,將低概念層的屬性映射的高概念層的屬性數值,完成定量與定性的相互轉化。并且云模型能兼容相鄰屬性值和語言的重疊性,這樣能使發現的知識更具有穩定性。由于云模型具有較強的隨機不確定數據處理能力,因而能彌補計算機系統行為的隨機性和不確定性,所以將云模型引入入侵檢測系統中,能增強入侵檢測系統的檢測能力和適應能力。
云模型是云計算、云控制、云推理、云聚類等方法的基礎,它是云的具體實現。正向云發生器是一個從定性概念到定量表示的過程。反過來,將定量表示到定性概念的過程稱作為逆向云發生器。不同云的實現方法可擴展到多維云模型,也可構成不同類型的云,諸如半云模型、組合云模型、對稱云模型等。
用戶的消費行為是動態的,不同的人生階段對應不同商品和服務的消費行為。比如,幼年時期,服飾的尺碼購買需求常常變化,針對營養健康食品的需求也是較大;而在成年階段,服飾尺碼基本不再變化,但是受時尚引領,對服飾的追求方向發生變化,而對于食品的要求有較寬松;等到老年階段,服飾的樣式無足輕重,食物也以易消化為主。這就是用戶的特征屬性,要具體的分析,同一用戶不同階段也會有不同的特征屬性。同樣,個人職業對消費行為模式的影響也比較顯著。職業水平的高低一定程度上能反映消費水平,推薦系統必須對適宜人群推薦適宜產品,消費水平低的用戶提供相對較低的消費產品,對于高消費能力的用戶,主打高端產品。在協同過濾的算法中考慮用戶特征對消費行為影響的話,能增強協同過濾算法的推薦效果。
基于用戶特征屬性和云模型的CF算法主體思想:首先通過分析用戶特征屬性,構成用戶的行為矩陣,然后進行云模型計算。將計算的單個評分作為“云”,再將每個用戶的所有“云”構成“云滴”,根據這個關系來計算用戶之間的相似性。算法流程如下:
算法的輸入:用戶的歷史行為分析評分數據集合Data、加權因子以及由用戶屬性信息構成的user文件。
算法的輸出:Ru對Ii的預測分數。
Step1數據預處理
對用戶的行為數據進行預處理。得到源輸入矩陣Ru和i,即:
根據用戶屬性信息描述user文件采集得到用戶特征屬性矩陣
Step2計算用戶評分特征向量
根據所得的源評分矩陣,統計每個用戶所給出的對應等級的評分次數u1-u5。Step3計算用戶相似度
用戶的綜合相似度矩陣sim ,計算公式如下
Step4產生推薦集
通過Step3得出的用戶相似度矩陣找出矩陣的最近鄰居,然后獲得最近鄰居集合Fu={F1,F2,…,FK},以F1與目標用戶的相似度為最大,F2次之,以此類推到FK。然后通過使用以下公式預測得到最終的評分結果。
用戶特征屬性和云模型的協同過濾推薦算法利用了云模型計算用戶間的相似程度,解決了傳統算法因缺少數據對象屬性而無法計算的問題。然后通過使用影響因子解決了新用戶加入造成的影響。協同過濾推薦算法的局限性是無法緩解傳統算法數據的稀疏性問題。
互聯網的發展引發了信息量的爆炸式產生。供應商為了增強互聯網用戶的信息精準獲取的體驗,滿足用戶及時獲取需求信息的要求,從而給自己帶來更多的收益,研究開發出了針對用戶需求的個性化定制系統。通過搜集用戶的互聯網活動的信息數據,分析挖掘用戶的偏好,然后針對不同的互聯網用戶推薦并提供針對性的產品,滿足用戶需求。
[1]趙文濤,成亞飛,王春春.基于Logistic時間函數和用戶特征的協同過濾算法[J].計算機應用與軟件,2017,(02):285-289+312.
[2]張星,劉帥.感知用戶的Item-based協同過濾算法[J].信陽師范學院學報(自然科學版),2017,(01):125-128.
[3]張莉,秦桃,滕丕強.一種改進的基于用戶聚類的協同過濾算法[J].情報科學,2014,(10):24-27+32.
楊靜(1997-),河南開封人,河南大學,本科,研究方向:大數據、計算機算法。