陳 鑫,王 斌,曾范清
(1.南京財經大學信息工程學院,江蘇 南京 210023; 2.南京財經大學經濟管理實驗教學中心,江蘇 南京 210023)
互聯網信息技術的快速發展,在給人們的生活和工作帶來極大便利的同時,也帶來了信息超載[1]的問題。雖然以搜索引擎為代表的信息檢索系統如谷歌、百度等可以幫助用戶過濾和篩選信息,但只能滿足大眾的簡單需求,無法滿足個性化的用戶需求。因此,個性化推薦系統應運而生,成為當前解決“信息超載”問題的有效方法[2]。它根據用戶需求、興趣愛好等,通過推薦算法從海量數據中挖掘用戶感興趣的信息、商品等,以個性化列表的形式推薦給用戶。目前,個性化推薦系統廣泛應用于很多領域,其中在電子商務領域的應用最為典型并具有良好的發展前景。隨著電子商務的發展,用戶需求的滿足越發艱巨,傳統個性化推薦系統[3,4]的多樣性差、覆蓋率低等問題日益顯著。但是,大數據時代的到來,使商品數據的表現變得豐富多樣,使搭配推薦成為可能,為大數據環境下的個性化推薦提供了一條有效途徑。
商品搭配推薦是個性化推薦中的一個新方法,它從用戶消費行為中挖掘信息,比相似推薦更具實際意義。例如,用戶網購一件襯衫后,通常會選購一條褲子來搭配,而不會再去瀏覽襯衫。生成這些搭配信息最直接的做法是人工標定:讓眾多搭配專家來手工標定哪些商品是相搭配的。在傳統商業中商品數量少,這一方法具有可行性;而在如今的電商中,用戶和商品的數量巨大,雖然可以通過眾包(Crowdsourcing)[5]等方式實現大規模標注,但成本會非常高。例如阿里眾包需要給每位參與者一定的酬勞。因此,關于如何自動化地生成商品間的搭配信息的研究,對學術界和工業界分別具有較高的學術研究價值和廣闊的應用前景。
在學術界,國內外許多大學和研究機構對商品搭配大數據推薦方法開展了廣泛的研究,涌現出了各具特色的搭配推薦方法。例如將卷積神經網絡引入搭配推薦,自動提取數據特征;對用戶行為和商品信息進行過濾、建模,挖掘商品間的搭配關系等。但是,目前搭配推薦的研究還存在一些挑戰與問題,例如,多源異構數據的融合;商品類目更細粒度的劃分;商品圖像背景復雜,給圖像內容識別帶來了巨大的挑戰等[6]。
在工業界,由于互聯網公司的競爭越來越激烈,而且用戶是最重要的資源,因此只有不斷地提升用戶體驗,才能防止用戶流失。隨著用戶個性化需求的增強,互聯網公司對商品搭配推薦的研究越來越重視。例如,阿里云舉辦了面向全社會開放的淘寶穿衣搭配算法競賽,報名和參賽無時間限制并提供永久排行榜,只為能給用戶提供優質、專業的個性化穿衣搭配推薦。目前,商品搭配推薦方法已在各大電商平臺有了不同程度的應用,有效地提升了電商系統推薦結果的準確度、覆蓋率、新穎性和多樣性。根據搜狐網報道,2017年中國網絡零售總額高達67 100億元,同比增長30.1%。作為亞洲最大的購物網站淘寶網更是在2018年雙十一狂歡節創下了單日交易2 135億元的記錄,表現出了我國電子商務蓬勃發展的活力[7]。對用戶而言,有效的搭配推薦解決了用戶在海量商品中發現自己所需商品耗時長的問題,帶來了更好的購物體驗;同時,對商家而言,搭配推薦可以促進用戶購買或點擊行為的發生,提高商品銷量,增加經濟收入,具有重要的商業意義。
到目前為止,關于傳統推薦方法的研究綜述[1,2,8,9]已有不少,但這些方法只是針對商品的相似推薦,很少提及搭配推薦。本文是第1篇專門對現有搭配推薦方法進行研究的綜述,針對已有的研究成果進行分析比較、綜述總結并對未來提出展望,為從事研究搭配推薦方法的學者和業界人士提供借鑒與參考,以期商品搭配大數據推薦方法在學術界進一步推動推薦技術的發展,在工業界創造出更高的商業價值。
商品搭配推薦是從商品信息、用戶信息及用戶與商品的交互行為等大量數據中挖掘商品之間的搭配關系,根據用戶已經購買的商品向其推薦可搭配商品,或直接向用戶推薦搭配好的商品套裝。商品搭配推薦一直是個備受人們關注的問題,與其相關的工作最早可以追溯到頻繁項集挖掘(Frequent Item-set Mining)[10]。該方法通過分析商品的歷史購買記錄來生成搭配關系,即經常被共同購買的商品可能是相搭配的,最經典的案例便是“啤酒”與“尿布”。
但是,頻繁項集挖掘依賴于商品的歷史購買記錄,所以存在“冷啟動”問題,即無法為那些沒有歷史購買記錄的新商品生成搭配信息[11]。為了解決冷啟動問題,需要引入除歷史記錄以外的其他信息,比如內容信息(Content-based)等。相較歷史記錄信息,內容信息更為稠密,且不會出現老商品有信息而新商品沒有信息的情況,因為所有商品都有自己的類目、標題及圖像等信息,從根本上克服了冷啟動問題。
商品搭配度表示2個商品之間的搭配程度,可以用來產生每個商品對應的搭配商品列表。關于商品搭配度的數學定義,研究者們從不同角度給出了不同的公式,相關內容見文獻[6,12-15]。本文分別選取西南交通大學孫廣路[6]在其博士論文中給出的商品搭配度定義和浙江大學釗魁[14]在其碩士論文中給出的搭配度計算公式詳作介紹。
(1)對于2件商品,如果大量用戶一起購買,說明它們在某些方面是搭配的,搭配度的取值為[0,1],如式(1)所示:
(1)
其中,N是購買的用戶數量;F是閾值,可根據需求自行設置。搭配度的粒度可以劃分得更細,這里劃分了3個等級,對于一般需求也是足夠的。
(2)釗魁[14]提出了基于深度樣式匹配的商品搭配推薦,設計了一個對拍卷積神經網絡(Siamese Convolutional Neural Network)對2個商品標題所組成的短文本對進行建模:首先,通過卷積神經網絡將每個商品的標題表示為1個多維實數向量;然后,將實數向量映射到特定的搭配空間中;最后,在搭配空間中計算2個商品間的搭配度,計算公式如式(2)所示:
(2)

簡單而言,商品搭配推薦就是依據一定的輸入數據遵循特定的搭配算法給出相應的推薦結果。輸入數據有多種多樣的類型,包括商品內容信息、用戶屬性信息、用戶對商品的行為信息、領域知識等。推薦結果則是推薦給用戶的商品列表,按照搭配算法計算的搭配程度的優先級別展現給用戶。
目前,商品搭配大數據推薦方法的研究內容主要包括以下幾個方面:
(1)商品圖像的特征提取。深度卷積神經網絡的層次結構可以對圖像語義特征進行表示,這也使得其在許多圖像分類和識別任務上取得了成功。通過卷積神經網絡對商品圖像進行特征提取,可以計算商品圖像特征的相似度來進行商品搭配推薦。
(2)多源異構數據的融合。由于數據來源多樣、結構復雜,研究者們提出從商品內容、領域知識、用戶交互的角度,分別建立商品搭配度度量模型,表示商品之間的搭配程度。通過將各種數據融合到搭配推薦技術中,可以根據用戶的需求和習慣推薦不同的搭配方案。
(3)挖掘商品間的搭配關系。在搭配推薦中,商品間的關系是重要的基礎信息。通過對商品內容信息、用戶屬性信息和用戶對商品的行為信息進行過濾、建模等處理,可以挖掘商品間的搭配關系,從而應用于搭配推薦方法中。
(4)多種搭配推薦算法的融合。目前,搭配推薦算法各具特色。例如,基于商品內容的搭配推薦反映大部分人的搭配偏好,基于協同過濾的搭配推薦更具個性化。如果將這2種算法融合再綜合推薦,則可以滿足用戶對于推薦結果同時兼備個性化和流行性的推薦需求。
在電子商務的推動下,商品搭配推薦系統一直保持著較高的研究熱度。表1給出了商品搭配推薦系統在國內外商業領域的典型應用,應用領域涉及電商網站、服裝APP和飲食APP。

Table 1 Typical applications of big data recommendation methods of commodity collocation表1 商品搭配大數據推薦方法的典型應用
以淘寶網為例,它的搭配推薦應用在系統中的很多地方,具體包括:
(1)收藏夾頁面。根據用戶收藏的商品給出搭配推薦。在該頁面中,左側一列展示了用戶收藏夾里面的商品,在商品右側有 “找搭配”選項。點擊該選項后便會展示搭配推薦結果。
(2)商品的詳情頁面。例如,瀏覽淘寶網時隨機進入一件商品的詳情頁面,然后向下滑動頁面,在商品的參數、評價等信息下方展示了根據該商品推薦的可搭配商品。目前,淘寶網只有部分商品附帶這個搭配推薦模塊。
(3)加入購物車頁面。用戶將感興趣的商品加入購物車后,向用戶推薦與已經加購的商品相搭配的商品。
目前,學術界和工業界對推薦系統類型并沒有統一的劃分標準,傳統的推薦方法主要包括協同過濾推薦、基于內容的推薦和混合推薦。本文通過充分調研當前商品搭配推薦方法的研究情況,根據推薦方法中使用的文本、圖像數據類型并結合傳統推薦方法的分類,將當前的研究主要分為如下3類。
基于商品內容的搭配推薦關注商品的內在屬性信息,通過內容相關性進行搭配推薦,可以有效地解決冷啟動問題[16]。商品內容一般包括文本信息與圖像信息。文本信息有標題、價格和商品類目等,圖像信息可以通過深度學習技術進行處理,從而生成搭配信息。在具體的搭配場景中,圖像一般聚焦于服飾類商品的搭配推薦,而標題一般用于常規商品的搭配推薦。
(1)基于商品圖像的搭配推薦。
本文從圖像處理技術上分別介紹研究者們提出的基于商品圖像的搭配推薦。
①基于分割理解圖像的搭配推薦。Jagadeesh等人[17]通過圖像分割(Image Segmentation)算法從街頭照片中直接解析出相搭配的衣服,他們假設街頭照片中人們所穿的衣服是相搭配的,因此通過圖像分割算法把不同的衣服從圖像中分割出來后,這些衣服便形成了具有搭配關系的商品。Yamaguchi等人[18]通過計算視覺上的相似來擴展由圖像分割所生成的搭配信息。Di等人[19]則做了更進一步的探索,關注于樣式相關的精細化屬性信息,比如是否有紐扣、帽子等。他們首先以人工方式精細化地標定了若干衣服,形成數據集WFC,然后利用這一數據集建立起基于屬性搭配的服裝搭配模型。
②基于卷積神經網絡處理圖像的搭配推薦。目前深度學習已成為互聯網大數據和人工智能的一個研究熱潮[20],卷積神經網絡作為深度學習中一種重要的應用模型,能較好地解決圖像中出現的復雜多變、低分辨率等問題,在圖像處理領域得到了廣泛的應用[21]。Mcauley等人[22]與Veit等人[23]通過圖像信息為所有類別中的商品生成搭配信息。他們先利用卷積神經網絡處理商品的圖像信息,再利用圖像中所反映的相似性來衡量商品間的搭配程度。文獻[24]提出了基于深度學習的搭配推薦系統,首先根據用戶的歷史購買數據篩選出召回集;其次通過計算商品標題文本信息的余弦相似度,獲得待預測搭配商品的召回集;然后通過搭配類別過濾并根據其各自的命中率加權融合[25];最終,通過卷積神經網絡提取圖像特征,并使用邏輯回歸模型計算召回集同測試集的搭配概率,利用該概率對融合召回集進行修正重排序,從而向用戶提供搭配推薦,進行關聯銷售。實驗表明,使用卷積神經網絡提取的特征在邏輯回歸模型中會產生較好的分類效果,提高了搭配推薦的準確度。
③基于特征融合的搭配推薦。雖然深度學習特征能夠很好地表示商品語義信息和全局信息,但商品搭配還需要更加著重關注商品的顏色、結構等信息[26]。范宇航[27]針對服裝搭配推薦領域提出了基于特征融合的服裝搭配推薦,首先根據搭配圖集用聚類方法構建服裝搭配空間;然后對用戶購買的商品圖像提取其深度學習特征和BoF(Bag of Features)編碼的SIFT(Scale-Invariant Feature Transform)特征[28]并進行融合,再使用去噪自編碼器對融合特征降維生成搭配特征;最后計算該特征所屬的搭配空間類別,進而為用戶提供該類別的服裝搭配列表。該算法與基于卷積神經網絡處理圖像的搭配推薦一樣,都使用了深度學習提取特征。深度學習的最大優勢是能夠從大數據中自動學習特征的表示,其中可以包含成千上萬的參數,并在大量學習數據時有穩定的表現,而不依賴于人工設計特征。
上述基于圖像搭配推薦的方法,實質上大都是以2個商品圖像間視覺上的相似性來衡量2個商品的搭配程度[29]。視覺相似并不完全等同于相搭配,另外,處理圖像所需的計算量大,且圖像經常包含大量噪聲。例如,1幅用于展示連衣裙的圖像,同時還包含了帽子、包包、涼鞋以及非常復雜的背景,這些信息都會對搭配模型造成干擾。
(2)基于商品標題的搭配推薦。
為了使商品更容易被用戶通過搜索引擎訪問,商家會把商品的重要屬性信息放在標題中[30]。文獻[31]的研究發現,商品標題不僅包括商品的外觀信息,還包括商品的類目、適合人群與季節等信息,所以商品的標題相當于是對商品全面而精準的描述。
對于商品內容的描述一般使用向量空間模型VSM(Vector Space Model)[32]。向量空間模型可以將文本內容轉化為便于進行數學運算的向量形式,常用TF-IDF(Term Frequency-Inverse Document Frequency)[33]對文本內容中的詞重要性進行刻畫。TF-IDF分別表示詞頻和反文檔頻率,是一種基于統計的方法。據此,為了克服基于圖像搭配推薦的不足,文獻[12]提出了基于服裝標題內容的搭配推薦算法,通過計算上衣與褲子的標題相似度來進行搭配預測。首先融合預測集合中的所有上衣與褲子的標題,通過TF-IDF計算每個標題的空間向量;然后計算需要預測的那件上衣與所有褲子的相似度,選取相似度較高的前幾名作為搭配候選集。實驗表明,該方法能夠有效地提高搭配推薦的準確度。
因此,基于商品內容的搭配推薦利用商品的內在屬性信息,不僅可以解決冷啟動問題,還可以有效提高推薦結果的準確度。
傳統協同過濾推薦算法在現實推薦情景中取得了很大的成功,主要分為基于用戶的協同過濾算法[34]和基于物品的協同過濾算法[35]2大類。基于用戶的協同過濾算法的思想是當一個用戶a需要個性化推薦時,先找到和他興趣相似的其他用戶,然后把那些用戶喜歡的、而用戶a沒有聽說過的物品推薦給他。基于物品的協同過濾算法的思想是向用戶推薦那些和他們之前喜歡的物品相似的物品,這個相似不是用物品內容屬性的相似來衡量,而是喜歡物品A的用戶大都也喜歡物品B,則A與B相似。
此外,由于需要對大數據進行處理,Salakhutdinov等人[36]提出了概率矩陣分解算法PMF(Probabilistic Matrix Factorization),它利用低維近似矩陣分解模型,假設只有幾個因素會影響各個用戶的興趣,將用戶(商品)映射到低維的特征空間中,然后將評分矩陣重構,并用重構的低維矩陣預測用戶對商品的評分,最后進行相應的推薦。實驗結果表明,基于矩陣分解的協同過濾推薦算法可以有效地對大數據進行處理。
眾多研究者受傳統協同過濾的啟發,將協同過濾思想引入到搭配推薦領域,并提出了多種基于協同過濾的搭配推薦算法。本文從技術使用上將協同過濾搭配推薦分為如下2類:
(1)基于二部圖的協同過濾搭配推薦。
莫紅[37]提出了基于二部圖的個性化搭配推薦。首先,對歷史行為中用戶與商品的交互關系應用基于二部圖的協同過濾推薦技術,通過二部圖中的資源分配等方法間接獲取用戶間的影響權重,以獲取相似用戶群。然后,遍歷相似用戶的購物記錄,將相似用戶購買過的而目標用戶沒有購買過的商品推薦給目標用戶,從而提供搭配推薦。這種基于二部圖的協同過濾搭配推薦,不需要進行用戶間距離的計算,因此能夠解決數據稀疏問題。
(2)基于二元關系的協同過濾搭配推薦。
協同過濾主要解決的是二元關系[38]中的過濾問題,不關心用戶與商品各自的具體內容信息,只要存在用戶對商品間的二元關系就可以通過協同過濾進行推薦。在服裝搭配領域同樣存在這種二元關系,即上衣服裝與下衣服裝的搭配關系。因此,可以將協同過濾算法的用戶與商品的評分關系映射到上衣服裝與下衣服裝搭配關系上,挖掘潛在的上、下服裝搭配模式。趙光明[12]提出了服裝搭配協同推薦算法,主要利用具有相同搭配的服裝之間具有相似性的關系,通過將Jaccard集合相似度度量算法與文本重要性刻畫TF-IDF的思想相結合計算上衣服裝間的相似度,最終通過相似的服裝進行搭配協同推薦。
由以上的介紹與分析可知,基于協同過濾的搭配推薦主要基于用戶與商品的交互數據進行推薦,因此向用戶推薦的結果更具多樣性,從而挖掘用戶潛在的興趣愛好。
隨著信息技術的發展,出現了更多來源的其他類型數據,傳統搭配推薦算法具有一定局限性[39]。據此,研究者們提出了混合搭配推薦方法,將多種搭配推薦算法進行優化組合,從而進行搭配推薦。
姚靜天[15]從商品搭配性考量的角度提出了基于排序學習的混合搭配推薦算法。該算法首先通過挖掘商品的文本內容、領域知識[40]和用戶交互行為中的搭配信息,構建搭配度模型分別生成表示商品間搭配程度的評分矩陣,將該矩陣作為算法的輸入數據,從而生成排序學習所需的訓練集。然后利用基于列表級的排序學習算法ListNet算法[41]進行訓練,得到用于融合子搭配度模型的排序函數,融合過程如下所示:(1)利用容量為K的最大堆獲得每個子搭配度最高的K個項目;(2)根據驗證集評估每個候選子集的召回率,確定混和比例;(3)按確定的比例將候選子集交叉混和。最后將融合后的候選集輸入重排序模塊生成最終的搭配推薦列表。該算法混合了基于文本內容、領域知識、用戶交互反饋3種搭配度模型,可以有效地緩解數據稀疏性和冷啟動帶來的影響。
相似地,張智勃[42]也利用商品的文本信息和用戶行為信息,提出了基于內容及行為過濾的混合搭配推薦算法,不同的是,后者新提出了虛擬子類目的概念。具體實現過程如下:首先利用商品的標題、類目及行為數據對商品的搭配關系進行建模,分別產生虛擬子類目搭配度矩陣、商品文本相似度矩陣、商品主題相似度矩陣和商品購買相似度矩陣。然后把4個矩陣對應的相似度值歸一化、標準化當作分類器的特征,將2個商品的搭配對作為1個樣本,對樣本值進行不同比例的采樣,采用不同的梯度提升決策樹GBDT(Gradient Boosting Decision Tree)[43]模型進行學習;再通過邏輯回歸模型對產出的GBDT模型進行線性擬合,得到最終的排序模型。最后通過該模型對每個樣本產出的值的大小進行排序,獲得與給定商品搭配度最高的商品。實驗表明,該算法有效地提高了搭配推薦的多樣性和新穎性。
在服裝搭配推薦領域,文獻[37]提出了穿衣混合搭配推薦方法。通過暴力融合法,直接將基于關聯規則獲得的流行穿衣搭配和基于協同過濾獲得的個性化穿衣搭配2部分的推薦結果進行結合,然后按照用戶偏好類別對推薦結果進行排序。
由以上介紹與分析可知,混合搭配推薦方法大都包括融合過濾過程,這一過程是為了應對大數據量的情況,用來縮小排序學習的計算范圍,減少后續算法數據量,提高算法整體運行效率。同時,混合搭配推薦方法將多種搭配算法進行優化組合,可以有效利用多種類型的數據,從而既能提高推薦準確率,又能豐富推薦結果,克服單一推薦方法推薦范圍窄的問題。
對于搭配算法而言,我們希望對于每個商品,在生成的可以與其搭配的商品列表中,越排在前面的商品,與該商品的搭配度越高。因此,評估搭配算法的核心是推薦結果是否與專家給出的搭配組合結果相匹配,匹配度越高,則說明搭配算法的預測性能越好。為了實現這樣的評估效果,一般對于每個待測商品采用平滑后的平均準確率MAP(Mean Average Precision)[44]來評測推薦結果。具體如式(3)所示:
(3)
其中,api的計算方法如式(4)所示:
(4)
其中,K表示推薦結果中商品的數量,p(n)表示返回前n個推薦商品的準確率。 如果推薦的第n個商品在用戶購買商品集合中,則Δ(n)=1,否則Δ(n)=0。I表示待預測的商品數量。對于每個推薦商品的api,在待預測商品集合中求平均值得到最終的推薦準確率。MAP的值在0~1,MAP越接近1,說明推薦準確率越高。
一個好的搭配推薦系統需要同時考慮用戶、商品提供者和網站這3方的利益[45],因此本文結合傳統推薦系統常用的評價指標,提出了用戶滿意度、準確度、覆蓋率、多樣性、新穎性和實時性這6個搭配推薦質量的評價指標。
通過對前面介紹的3類搭配推薦方法所涉及的相關論文進行仔細的統計與分析,得出如表2所示的搭配推薦方法對比表。
從表2可以看出,所有的搭配推薦方法都在一定程度上提高了推薦結果的準確度,其中,混合搭配推薦在用戶滿意度、準確度、覆蓋率、多樣性、新穎性和實時性這6個方面均優于其他搭配推薦方法。由此可見,混合搭配推薦比其他2類搭配推薦的效果更好。
隨著信息技術的發展,在線購物已成為日常所需,這促使商品搭配推薦方法的研究取得了長足的進步。但是,現有方法仍存在一些局限性,例如,(1)長尾問題[46];(2)推薦的實時性低;(3)多源異構數據的融合還沒有很好地解決,等等。這些問題的出現與個性化用戶需求的變化都凸顯了技術支撐的局限性,因此催生出了一些新的技術熱點,其中主要包含如下幾個方面。

Table 2 Comparison of matching recommendation methods表2 搭配推薦方法的對比
目前的商品搭配推薦研究主要是在檢索的框架下,對目標商品進行單一商品的推薦[22,17]。這些工作更多的是考慮兩兩商品之間的關系,而不是將包含多個商品的套裝作為一個整體來進行聯合推薦,也就是套裝組合推薦。例如,針對一件襯衫,在推薦可與其搭配的褲子的同時,還可推薦與其搭配的帽子、眼鏡、鞋子等多件商品。
現有的對商品搭配推薦方法的研究大多聚焦于2個商品的搭配推薦,而對更具挑戰性的多個商品的搭配推薦方法的研究還相對較少。Hu等人[47]利用一個功能性的張量分解對套裝進行個性化推薦的估計。他們的工作考慮了用戶的個性化推薦,但由于他們使用的是手動提取的特征,沒有將這些作為一個整體來考慮,使得個性化推薦的性能很低。文獻[48]對商品的用戶向量進行二值化表示,使得推薦系統的效率得到了提升。因此,多個商品的套裝搭配推薦的研究將一方面有助于為用戶提供搭配依據,提高用戶的上網效率和網購體驗;另一方面,通過分析大量的用戶及商品數據,挖掘商品之間的搭配關系,可以提高推薦的準確度和多樣性。
隨著互聯網應用的不斷發展,用戶生成了各種結構類型的數據。研究者們在對搭配知識的理解上,從這些數據中挖掘搭配關系。雖然這些數據是推薦系統中不可或缺的部分,但它們來源多樣,類型各異。并且,每個用戶都有自己獨特的審美和生活習慣,所以將各種類型的數據都融合到面向用戶的商品搭配推薦技術中,將會實現根據用戶各自的需求和習慣推薦不同的搭配方案,從而進一步提高商品搭配的用戶體驗。
因此,如何設計一套有效的算法來統一處理多源異構數據,是未來的發展趨勢。文獻[15]利用表示學習的相關理論和方法,對這些多源異構數據進行統一的特征表示。但是,各個研究方向的專家由于自身研究方向的局限性,無法對其他類型的數據進行聯合挖掘,所以有待進一步研究。另外,這種處理多源異構數據的算法效果還依賴于不同模型生成結果的融合方法,通過融入多種類型的用戶數據信息,可以讓數據集更加豐富,從而為用戶提供更加精準的推薦。因此,未來還需要研究如何更好地將各個子模型的結果進行融合。
隨著大數據的廣泛應用,傳統推薦系統在挖掘數據價值上存在的問題正在限制其性能發揮[49]。知識圖譜的出現則為推薦系統的改進提供了一條新的有效途徑。知識圖譜是一種基于圖的數據結構,由節點和邊組成,它蘊含了豐富的知識,這些知識可以精確地描述商品和用戶的屬性。因此,知識圖譜與推薦技術的融合成為了提升推薦系統性能的發展趨勢。
目前研究者們提出的基于知識圖譜的推薦技術皆是通過計算商品之間的相似度來進行推薦的。由于知識圖譜可以有效地整合多源異構數據,對互聯網上的數據進行知識抽取,獲得更加細粒度的用戶和商品的特征信息。因此,可以將知識圖譜結合搭配推薦技術來解決目前搭配推薦技術中存在的多源異構數據的特征提取問題。如此,搭配推薦技術可以更精準地計算商品與商品、用戶與商品以及用戶與用戶之間的相關性,增強數據的語義信息,以進一步提高推薦準確度,從而提高用戶體驗和系統性能。
隨著大數據時代的到來,電子商務高速發展,用戶對購物平臺提供個性化推薦的體驗要求越來越高。學術界和工業界圍繞這一需求實現了方便、智能和面向用戶的商品搭配推薦技術。該技術不僅能有效地提升電子商務網站的轉化率,還可以增強推薦系統的發現和探索能力,在一定程度上既提高了用戶購物體驗,又促進了商品銷售,增加了商家的經濟收入。因此,商品搭配推薦技術的研究具有很大的商業價值和社會意義。本文分門別類地對商品搭配大數據推薦方法的研究現狀和進展進行了較為全面的考察,通過分析對比,總結得出混合搭配推薦是目前最好的搭配推薦方法。但是,混合搭配推薦的效果很大程度上依賴于多源異構數據的處理與融合,因此本文最后討論了商品搭配推薦未來的發展趨勢,尤其是引入知識圖譜技術來處理多源異構數據,將有效提升搭配推薦效果。通過本文的研究總結,希望給從事個性化推薦領域的研究者和業界人士提供幫助,促進搭配推薦技術更好地應用與發展。