王棒鈞
摘要:在互聯網發展的大背景下,網絡數據的爆發式增長使得人們越來越依賴推薦技術,而以知識圖譜為基礎的服務推薦近幾年得到了充分的發展,本文通過收集、梳理,分析相關文獻,對學術界近幾年對此課題的研究進行了綜述。
關鍵詞:服務推薦;知識圖譜
一、研究背景與意義
隨著信息社會發展,網絡信息數據增長迅速,讓人們能夠享受便利的同時也帶來了較為嚴重的信息過載問題。信息過載問題指用戶所能接觸到的信息過多,已經超過了能夠全部接受處理的程度,無法從巨量的信息中快速找到自己感興趣的信息。
推薦技術就是為了解決上述問題而被提出。推薦技術的核心思想就是通過特定方式對用戶、物品以及用戶與物品之間的關系進行分析挖掘,找到用戶可能感興趣的信息,將網絡上的大量信息從被動地展示給用戶轉變為主動地為用戶提供信息,從而讓用戶獲得更多的有效信息。
知識圖譜的設計初衷是源于對搜索引擎優化提升需求。該技術通過將數據組織建立連接、定義實體屬性標簽、構建實體間關聯關系等手段來實現搜索引擎的性能提升。
二、基于知識圖譜推薦研究現狀
知識圖譜為處理互聯網上大規模、異構、動態的數據提供了新的解決方案,提高了網絡智能化水平,使得機器的行為能夠符合人類的認知思維方式。大規模通用知識圖譜突破了搜索引擎基于關鍵詞:模糊檢索的局限性,能夠為用戶提供準確的信息檢索結果。目前,領域知識圖譜廣泛應用于領域知識的檢索、推薦和問答。在金融領域,知識圖譜應用相對成熟,例如利用知識圖譜蘊含的語義信息進行分析推理可以實現反欺詐,基于知識圖譜的圖結構可以有效分析稅務中潛在風險,可以通過分析知識圖譜中客戶行為信息實現個性化理財產品推薦。在醫療領域,借助知識圖譜能夠實現輔助診斷和決策。電子商務領域阿里巴巴利用知識圖譜技術分析用戶的購物偏好,實現精準的匹配用戶的購買意愿和候選商品集合。
知識圖譜中涵蓋了大量實體之間的語義關聯信息,從而使得推薦系統能夠利用知識圖譜潛在的關聯信息解決推薦過程中數據稀疏和冷啟動的問題。同時,借助知識圖譜能夠更深層次的挖掘用戶喜好,提高推薦結果的準確性。知識圖譜中關系類型的多樣性,有效地防止了推薦結果的同質性。
知識圖譜能夠為問答系統提供有效且高質量的數據源,問答的結果可以是知識圖譜存儲的知識集合,也可以是基于知識圖譜推理出的內容。基于知識圖譜的問答系統,能夠對用戶提出的自然語言問題做出準確的回答。
陳濤等利用知識圖譜中的語義信息,構建了更加精準的用戶畫像,提高了推薦結果的準確率、召回率等推薦性能的指標。Zuoxi Yang 等,提出了基于知識圖的層次注意力圖卷積網絡的可解釋性推薦方法,從異構知識圖的高階連通性結構中探索用戶的潛在偏好,實驗證明了該方法的最新性能和強大的可解釋性。Dehai Zhang 等提出了一種基于知識圖譜的鄰域聚合協同過濾推薦方法,使用知識圖譜將用戶的潛在興趣點進行提取和利用,以此提高了推薦結果的準確性,并在點擊率方面得到了顯著的提升。湯偉韜等提出將用戶對商品的評論信息與知識圖譜進行結合,將其中蘊含的情感詞進行提取,根據情感詞對商品特征打分,并根據隨機游走機制,獲得商品特征權重。從實驗結果來看,該方法很好的獲取到用戶對商品的偏好程度,使推薦結果準確率有效提高。陳嘉穎等提出利用實體識別與連接技術對實體關系進行抽取,并提出了基于知識圖譜的用戶-項目低維化方法,該方法對于非結構化信息的處理提供了可靠有效的方案,并提高了推薦結果的準確率和召回率。
三、服務推薦研究現狀
目前,Web服務推薦相關研究主要分為兩類,基于用戶歷史行為信息以及基于服務本身的QoS信息,通過協同過濾技術對用戶偏好服務進行預測來進行推薦。同時一些研究中考慮加入外部信息,作為解決數據稀疏以及冷啟動問題的解決方案,以提高推薦性能。基于用戶歷史行為信息的推薦通過對用戶的行為信息進行挖掘,將用戶的隱式行為轉化為用戶的顯示評分,然后通過協同過濾算法進行推薦。文獻通過引入用戶歷史行為,在計算相似度時考慮用戶的個性化影響,從而提高相似度計算的準確性。文獻提出了一個融合基于用戶的預測評分以及基于服務的預測評分的推薦系統,該系統通過用戶、服務相似度分別對服務的評分進行預測,然后將兩個預測值進行線性組合,從而提髙評分預測的精度。這些服務推薦研究的主要問題在于只考慮了歷史行為所包含的隱式或顯式信息,忽視了服務之間豐富的關聯關系,而且數據的稀疏性也是一個無法忽視的問題。
QoS即服務質量,包含服務響應時間、吞吐量、可靠性等服務非功能屬性。基于QoS的推薦首先要獲得用戶在進行服務調甩時所感知到的QoS數據,然后使用協同過濾算法進行相似度計算并預測QoS值,根據QoS預測值進行推薦。文獻提出了一種利用服務質量(QoS)和體驗質量(QoE)進行雙向Web服務推薦的復合模型,該模型分析評價文本的正面或者負面性,更多的考慮了用戶使用服務的情緒反饋,并將用戶的情緒評分與滿意度評分進行結合完成推薦。對于數據稀疏問題,文獻通過矩陣分解技術對矩陣進行降維,來進行QoS預測。
一些文獻為了提高QoS預測的準確率,將一些外部環境因素加入到算法中。文獻提出一個考慮地理位置因素的服務推薦算法,該文獻認為Web服務QoS因素(例如響應時間和吞吐量)受Web服務和用戶的位置影響較大,因此引入用戶和Web服務的位置信息對相似度計算進行優化。文獻將時間信息集成到相似性度量和QoS預測中,為了減輕推薦中普遍面臨的數據稀疏性問題,設計了一種混合的個性化隨機游走算法對用戶、服務相似性進行計算。目前Web服務研究主要存在以下不足:
(1)QoS值受外部影響過大,用戶的網絡情況、當前地理位置都會對QoS產生較大影響,因此對于用戶真實的QoS值往往無法準確獲得,而錯誤的QoS值對推薦結果會有很大影響。而且在用戶使用服務時,QoS往往并不是用戶最關注的屬性。
(2)在真正使用中,服務的數量是及其巨大的,系統中存在大量的服務提供用戶使用,歷史行為信息中的服務維度會大大增加;同時用戶的使用精力以及消費面相比于如此龐大的服務來說又是極小的,因此用戶能夠關注到的服務在系統的全部服務中所占比例極小,協同過濾推薦所使用的用戶服務交互表會極其稀疏。從而影響了相似度的計算與冷門服務的推薦,進而影響了推薦系統的準確性和多樣性。
參考文獻
[1]張焱,肖涵,黃佳杰,朱從飛.基于知識圖譜和微服務的智慧水利一張圖系統實現[J].水利信息化,2021(04):17-21.
[2]陳濤,劉學軍,張伯君.融合知識圖譜語義信息的推薦方法[J].計算機工程與設計,2020,41(11):3047-3052.
[43]Zuoxi Yang,Shoubin Dong.HAGERec:Hierarchical Attention Graph Convolutional Network Incorporating Knowledge Graph for Explainable Recommendation-ScienceDirect[J].Knowledge-Based Systems,2020,204:418-436
[4]Dehai Zhang,Linan Liu,Qi Wei,et al.Neighborhood Aggregation Collaborative Filtering Based on Knowledge Graph[J].Applied Sciences,2020,10(11):3818.
[5]湯偉韜,余敦輝,魏世偉. 融合知識圖譜與用戶評論的商品推薦算法[J].計算機工程,2020,46(08):93-100.
[6]陳嘉穎,于炯,楊興耀.一種融合語義分析特征提取的推薦算法[J].計算機研究與發展,2020,57(03):562-575.
[7]喬星皓.基于知識圖譜的Web服務推薦技術研究[D].大連海事大學,2020.
[8]譚文杰.基于知識圖譜的科技服務推薦方法[D].哈爾濱工業大學,2020.
[9]韓策.基于知識圖譜的志愿服務推薦系統研究與實現[D].北京郵電大學,2020.
[10]李濤.基于排名的云服務推薦的研究與優化[D].北京交通大學,2018.
[11]李永紅,周娜,趙國峰,劉瑞峰,金鵬.模糊TOPSIS時變權重二次量化云服務推薦[J].計算機應用與軟件,2016,33(04):14-17+50.
[12]劉志中,呂克林,宋成,徐秀珍.基于QoS預測與約束層次模型的云服務推薦方法研究[J].計算機工程與應用,2015,51(10):47-52.