摘 要:目前隨著科技的發展,通過一系列的探索可以發現,用戶的興趣會隨著時間和地理位置的變化而產生一定變化,因而提出具有混合時空和流行度特征興趣點的推薦算法是非常重要的。基于此,本文主要討論了在位置基礎上的社交網絡個性化興趣點推薦算法的探索策略。
關鍵詞:位置;社交網絡;個性化興趣點;推薦算法
隨著互聯網的擴張,數據量也出現了大幅度的增加,人們已經擺脫了數據比較匱乏的時期,進入到一個大數據的時期,并順應這個時代會產生兩種角色,即數據的消費者和數據生產者。這兩種角色目前面臨的挑戰是極大的,而對數據的消費者來說,怎樣才能夠在互聯網當中準確搜索出自身需求的數據是非常困難的,而對于互聯網數據生產者來說,怎樣才能夠讓發布數據更為有效也是一件非常困難的事情。
一、推薦算法的相關技術
(一)協同過濾推薦
一般來說,協同過濾推薦可以分成兩個步驟,首先就是幫助指定的用戶a來發現自己所具備的一些類似喜好的臨近用戶b群體。其次就是向a推薦必選題所偏愛的且a并不了解的東西,協同過濾推薦中主要之處就是要尋找最近的一些b群體,但群體當中的個體和目標用戶的距離主要就是通過個體及目標的相似程度來進行衡量的,相似程度越多,那么二者之間的距離就相對越近,則b群體對物品所有的打分就會更具參考性,用戶對于物品的打分如果更高,那么就證明用戶對于物品的興趣程度也會更高,每一個用戶對物品所進行的打分可以由一些維度向量以表示,而用戶之間的相似程度可以由對應維度向量的相似程度來進行衡量。
協同過濾推薦中的基于物品的協同過濾算法,其主要原理就是向目標用戶推薦之前所感興趣的一些物品以及相似的物品,且物品之間相似度的計算主要通過對用戶的分析和行為記錄來獲得,若a物品和b物品相互之間的相似度高,一般則體現在喜歡a物品的用戶很有可能也會喜歡b物品,比如在亞馬遜當中就是按照統計數據表來表明消費品移動用戶的相關消費概率,在物品基礎上的協同過濾算法,首先就是要按照喜歡物品的用戶數來估算出物品之間的相似程度,之后再結合上一個步驟,讓用戶偏好的行為給予用戶來推薦其較感興趣的物品。
(二)基于內容的推薦
基于內容的推薦主要就是來源于信息檢索的領域,按照用戶所感興趣的一些項目,挑選出類似的項目予以推薦,首先需要提取被推薦的項目,根據其各自的內容特征和用戶的偏好來進行相似度的計算,把一些相似度相對更高的項目推薦給用戶,比如在進行電影推薦的過程當中,推薦系統則會分析出用戶之前所看過的電影共性,之后從其他電影當中選擇出與用戶的偏好比較相似的電影推薦,并計算被推薦項目的特性以及用戶喜好的特性,而相像程度的具體方法一般會使用相似度,且對于文本內容特性的提取方法相對而言也已經趨于成熟,比如新聞推薦。而對于多媒體數據內容的特性提取,仍然也需要大幅度的探索。
二、混合時空以及流行度特征的興趣點推薦算法
(一)融合用戶協同過濾和時間特征的興趣點推薦
首先是預處理數據,其次就是對任意兩個時間點的相似度來進行處理,再次就是平滑技術下的用戶相似度,最后則基于平滑技術與時間感知的用戶協同過濾。
(二)融合流行度和空間特征的興趣點推薦
首先就是最近零候選興趣點,用戶傾向于訪問一些曾經去過的地方,和目前的位置越接近則興趣就會更高,反之,隨著距離不斷地增加,用戶的興趣點也會因此而得到下降。其次就是要基于時間因素興趣點的流行度,每一個興趣點在一天當中的不同時間點,用戶的簽到概率都是不一樣的,也就是興趣點的流行度是不一樣的。不同的興趣點在時間點不同的情況下,用戶的簽到概率也是有所區別的,使用后選興趣點在某一個時間點簽到的數量,以及這個候選興趣點長期簽到的數量,就能夠選擇出一些較為有效的評估方法。
通過深入分析,分析在用戶歷史行為數據基礎上的計算方式,將時間、空間以及流行度的特征融在興趣點推薦當中,而且分別能夠提出一些在不同時間點用戶簽到比較相似的時間平滑技術以及基于時間因素興趣點流行度的評價方法,能夠設計一種有效的算法,這個算法的優點就在于不斷能夠讓推薦系統的計算量降低,同時也可以提高一些系統性能,讓其應用價值達到更高。
三、基于隱含語義分析模型的興趣推薦算法
(一)興趣點推薦流程框架
首先就是數據采集層,每一條用戶的簽到數據都包括用戶的名稱、簽到的時間以及坐標位置和用戶對興趣點的評論信息等,可以選擇公開的數據來避免網絡數據帶來的數據不規范性,并且可以避免后續處理數據所帶來的一些復雜性。但是公開數據集也是具有一定缺點的,可用的有效信息相對比較少,因此如何才能使用有效的信息來進行新人推薦也是非常重要的。
其次就是數據分析層,數據采集層所提到公開數據的有效信息量是比較少的,因此從一些比較有限的信息量當中提取較為有用的信息特征,對設計較為高效的興趣點推薦算法都是非常關鍵的。本文主要可以從用戶的直觀與隱藏這兩個新區方面來分析用戶簽到的數據集,并了解到用戶簽到的行為特征主要包括有時間特征和空間特征,以及用戶過往的喜好行為特征和文本評論的特征,通過統計和分析原理發掘所得到的時間與其差異性、連續性的特征,以及最近聯合興趣點流行度相互之間的特征等,這些特征是推薦算法生成的一個基本條件,也是社交網絡個性化信息點推薦的一個最為實際的依據。
再次就是要按照用戶簽到數據所集中分析得到的信息特征、空間信息特征和用戶的行為偏好特征,以及文本評論的信息特征等。本文主要討論了融合用戶的協同過濾和時間特征在信息點的推薦融合流行度與空間特征,并且在信息點的推薦方面從用戶的直觀興趣與隱藏興趣這兩個方面來進行融合各種不同的推薦,最后能夠得到在位置基礎上社交網絡個性化的興趣點推薦的算法,并給出一定的推薦結果。
最后就是實驗分析層,實驗分析層主要就是從實驗的環境、實驗評估指標與參數的選取,以及對比實驗這幾個方面來展開,首先要選擇配置相對較高的硬件環境以及推薦系統設計比較常用的軟件語言,其次對設計出來的算法要選擇效果最為優質的參數,之后分別從推薦的精確率與召回率這兩個方面,來評估興趣點并推薦算法。挑選目前推薦效果較優質的推薦算法進行相互對比,從而評估設計出算法的可能性。
(二)基于用戶歷史簽到行為偏好興趣點推薦算
用戶的行為歷史偏好是能夠改善推薦的一個最重要因素,這種算法可以有效地把用戶的興趣點映射到一個相對較低的美圖空間當中來進行解決,這種興趣點模型能夠在顯性反饋的信息上更加有效地解決評分和預測問題,而隱性反饋信息其獨特之處就是只有正樣本沒有負樣本,而其次構造損失函數來尋找比較合適的用戶隱含類別與興趣點,之后再優化損失函數,最后就可以得到相關算法。
(三)基于文本信息的興趣點推薦算法
用戶的一些隱藏興趣可以由用戶點評興趣點的文本信息所存呈現出來,和一些具有客觀性文本相互之間的區別就是這些主觀色彩相對較濃厚的評論信息,富含有用戶對于興趣點的根本看法。對用戶來推薦一些比較新穎的興趣點是具有一些參考價值的,本文的中心意思在得到挖掘的過程中,一般來說使用三層貝葉斯概率模型來進行,且其主題模型可以從文檔和詞語之間發現一些比較潛在的關系,從而提高人們對于文本信息的處理能力。
四、結語
綜上所述,目前興趣點推薦算法能夠有效的評估不同用戶在系統當中的興趣點,本文主要討論的一些較為經典的推薦算法,對其在社交網絡當中的一些概念進行相關敘述,并估算用戶在某一個時間當中,有可能會訪問從未去過的位置概率,從而針對用戶的興趣點進行一定的推薦,使系統能夠更加優化并且可以滿足用戶的個性化需求,盡量緩解信息過載的問題,而系統當中的推薦性能也可以獲得全面發展。
參考文獻:
[1]王丹妮,劉穎.基于位置的社交網絡的個性化興趣點推薦算法研究[J].無線互聯科技,2018,15(15):32-33.
[2]劉全飛.基于位置的社交網絡的個性化興趣點推薦算法研究[J].無線互聯科技,2018,15(11):145-146.
[3]季軍.基于位置的社交網絡的個性化興趣點推薦算法研究[J].電腦知識與技術,2018,14(15):14-15+21.
[4]李粉杰.基于位置的社交網絡的個性化興趣點推薦算法研究[J].科學技術創新,2018(11):59-60.
作者簡介:李丹霞,女,陜西延安人。