劉福剛

摘?要:建構一個可以挖掘出關聯特質的自動化推薦系統改進ART算法——MART算法.MART算法在推薦系統特性基礎上,實現聚類和判斷用戶屬性的重要性,使推薦系統可以設置每一個屬性節點的權重,實現用戶的分組,進而達到數據挖掘的目的.
關鍵詞:數據挖掘;自動化推薦系統;ART算法
[中圖分類號]TP311.1 ???[文獻標志碼]A
Analysis of Improved ART Algorithm for AutomaticRecommendation System
LIU Fugang
(The Department of Computer,Huainan Union University,Huainan 232001,China)
Abstract:MART algorithm —an improved ART algorithm for automatic recommendation system was put forward for mining related characteristics. Based on the recommendation of system characteristics, clustering and the identification of user property were realized. This enables weight setting for each property node, as well as user grouping, thus achieving data mining.
Key words:data mining; automatic recommendation system; ART algorithm
數據挖掘技術通過分類、回歸和時間序列方法的結合應用,可以實現數據挖掘技術相關功能,對數據進行有針對的相似性度量和量綱分析.ART神經網絡技術能夠預處理用戶的個人信息,提取用戶的個性化屬性信息,獲取不同用戶的類型信息,實現對用戶的分類,在數據挖掘技術的應用下實現數據分析,為用戶提供個性化的推薦信息.自動推薦機制的處理流程包括預處理階段和在線階段.在線自動化推薦機制中,運用ART神經網絡技術實現用戶個人資料的預處理,在網絡上用戶發出服務請求的時候,系統會識別用戶提出的類型信息,并依照客戶的信息類型尋找相應規則,挖掘用戶的興趣度信息,最后展現給用戶個性化的推薦信息.ART網絡結構的組成包括輸出層、輸入層以及網絡連接層.在ART算法處理應用中,第一步要設置好用戶屬性和其對應的輸入向量,其初始向量的范圍在(0,1)間;第二步進行初始化輸出點的個數,假設在ART網絡開始階段初始輸出點有且僅有一個.第二步實施權重矩陣W的初始化,將實驗向量輸入到ART網絡中的輸入層;隨之將輸入向量和第j個輸出集匹配度表示出來,輸入向量采用的是二進制表示值,尋找和輸入向量存在最大匹配度第j個輸出集,計算出兩者之間的相似度.
ART聚類算法也存在著一些不足,主要表現在以下兩個方面:對于屬性向量“同或”狀態的考慮問題,對于典型的相似度比較,沒有能夠全面的考慮,因此需要進行相關的改進優化.通過整合ART和數據挖掘技術,針對自動化推薦系統的特性進行相應的改進,這時MART算法便應運而生.[1]
1?自動化推薦系統中ART網絡聚類算法的改進
對ART相似度分析是實現對最大匹配度節點j*外權向量wj*和輸入向量X對應位子中“1”個數的對比分析,但其存在著明顯的不足,筆者將相似值計算公式做了改進,見式(1).
V[j]=∑pi=1(W[i][j*]·X[i])·M[i]∑pi=1M[i]+
∑pi=1(1-(W[i][j*])·(1-X[i])·M[i]∑pi=1M[i].(1)
改進后MART算法中,M[i]為輸入屬性的權重,即第i個節點重要性.Wj*與x[i]對應位置上同為“0”和同為“1”的值的個數與之權重值的乘積.改進所得MART算法可以實現對兩個向量的準確對比分析,兩者之間沒有輕重之別.MART算法的執行步驟和ART算法類似,都是要先設置每一個節點的重要性,隨之結合用戶屬性在MART算法的應用下,實現用戶的分組,進而達到數據挖掘的目的.[2-4]
MART算法實現聚類,判斷出用戶屬性的重要性,從而自動化推薦系統可以設置每一個屬性節點的權重.計算結果與傳統的ART算法相比,輸出的結果更加合理和靈活.
2?結語
建構了一個可以挖掘出關聯特質的自動化推薦系統改進ART算法——MART算法.MART算法在推薦系統特性基礎上,實現聚類和判斷用戶屬性的重要性,使推薦系統可以設置每一個屬性節點的權重,實現用戶的分組,進而達到數據挖掘的目的.隨著網絡的快速發展,人們對于互聯網的使用越來越依賴,隨之而來的是龐大且分散的數據.繁雜的數據都需要一種好的處理算法或者機制來進行處理,筆者把自適應共振理論和數據挖掘技術兩者結合在一起,形成一個自動化在線推薦系統來進行處理,把用于用戶聚類的ART算法進行改進,使得推薦系統能夠更加合理和靈活.
參考文獻
[1]陳慶章,湯仲喆,王凱, 等.采用數據挖掘的自動化推薦技術的研究[J].中文信息學報,2012,26(4):115-121.
[2]Palmero, Cristina,Esquirol, Jordi,Bayo, Vanessa, et al.Automatic Sleep System Recommendation by Multi-modal RBG-Depth-Pressure Anthropometric Analysis[J].International Journal of Computer Vision,2017,122(2):212-227.
[3]陳小芳,葛曉濱,馬冠駿.基于數據挖掘的網絡購物用戶行為分析[J].牡丹江師范學院學報:自然科學版,2016(01):32-35.
[4]陶慶,葛田.基于THDS的大數據挖掘技術研究[J].牡丹江師范學院學報:自然科學版,2017(1):28-29.
編輯:吳楠