文蒙德欽
互聯網廣泛運用在電子商務、社交領域和音樂、電影制作領域,但推薦系統在發展的過程中仍然存在一些問題,比如缺乏預測的精準性,也容易存在冷啟動和稀疏性的情況。利用大數據技術可以實現更加高強度和精確性的靈活優勢,并且有效的解決推薦系統的各方面問題。本文圍繞著基于大數據技術的推薦系統研究展開論述,希望為有關工作者提供一些參考和建議。
大數據技術的特征是多方面的,首先它具有較為龐大的數據規模,在大數據時代到來的背景之下,大量的數據體在數據庫之中被存儲,如果有需要可以隨時提取,隨拿隨用。大數據的基礎是不同領域的數據和資料,不管是社交數據還是日常數據都可以作為基礎樣本被存儲在空間之中。根據調查不難發現,從2018年開始,我國全球數據量開始暴漲,并且往后日益有增長的趨勢;其次大數據具有多種數據類型,在大數據時代背景之下信息數據不僅僅限于文字信息處理,它的處理介質已經延伸到了圖形、音頻和視頻等范疇,同時大數據技術具有較快的處理速度,在先進科技的引導和支持之下,大數據技術可以在較短的時間之內完成數據對接和數據分析。目前就我國范圍之內而言,網絡信號已經遍布大江南北的每一個角落,在網絡信息的支撐之下,大數據技術可以對各種類型的信息數據展開實時傳遞,有效提高傳輸效率。
大數據推薦系統的最典型代表便是電子商務的個性化推薦,它指的是系統可以針對不同消費者的個性需求、職業特征、喜好偏愛提供針對性的推廣服務,電子商務企業也可以根據消費者的網上購物習慣提供專業化的1對1優質購物平臺。推薦系統極具個性化特征,首先它的內容具有精準性,可以做好相關購物信息的精準投放,電子商務呈現出個性化發展已經不是一朝一夕的趨勢,以此為代表的電子商務推薦系統,能夠滿足不同消費者的廣大需求,還可以展開信息對接,消費者就可以向系統提出自主要求,也可以展開服務評價;其次,電子商務推薦系統的內容呈現出多樣化分布的特征,消費者可以結合自身的不同需求隨意設置信息,獲取的時間、空間和地點內容,電商企業服務商可以根據消費者的個人信息反饋提供更加精準化、更加符合其心意的服務項目,用戶也可以利用 Email音頻和視頻作為接收介質來獲取信息內容。這樣看來,以大數據為代表的推薦系統可以讓用戶的使用過程突破時間和空間的束縛。除此之外,大數據推薦系統還可以體現出智能化的特征,尤其是具有較為突出的交互化智能特點,在使用的過程中可以結合用戶的瀏覽痕跡和瀏覽軌跡展開頻道的刷新和更替,讓用戶掌握更加及時的個性化資料。
大數據推薦系統的主要任務是各種精準的商品信息推薦,從而進行個性化的營銷,其營銷成功的基礎是客戶的資料和數據來源準確,需要針對不同種類的用戶做出不同類型的推薦選擇。比如不同的用戶在注冊初始留下的信息要進行判斷,還要對瀏覽記錄展開記憶,對已經購買訂單的要進行排除,這些抓取原始信息的操作步驟都是展開個性化推薦的基礎和前提。作為大數據推薦系統需要主動對用戶種類進行區別和分辨,在用戶信息中進一步展開數據加工分析。
信息處理和分析功能本身就是大數據的拿手好戲,大數據推薦系統具備主動推薦功能,同時也具備協作推薦功能。主動推薦指的是商務平臺可以主動抓取用戶信息,展開資料分析和處理,對用戶的購買訂單和用戶的需求信息進行分析并處理發布,可以從用戶的搜索引擎中分析用戶的興趣愛好之所在,并且推理出用戶可能的未來需求;協作推薦指的是根據不同用戶之間的橫向對比,找到相似或相同的信息推廣渠道,使這一類的用戶都可以共享信息查詢數據結果。
個性化推薦系統可以在冗余的無規則的商品信息中進行智能化的檢索和篩選,屏蔽或過濾那些確實沒有用的錯誤信息,對那些有價值權重的信息加以高效利用和價值攫取,展開有針對性、有時效性的商品推廣,自動化的、智能化的把大數據變成有規律的數據鏈條,形成內在相關的信息鏈,并且可以選擇較為容易理解的模式推廣給用戶,減少推廣錯誤和無效性。
大數據推薦系統可以針對非注冊用戶、新用戶和老用戶,對于不同種類的用戶可以實現不同種類的營銷策略,展開精準化的數據推薦。目前在大數據推薦系統的設計過程中,可以采用BS模式全面提高系統的安全防護性和用戶隱私信息的保密性,在這種總體邏輯架構背景之下,讓客戶端實現簡單的事務邏輯處理,而較為復雜的事物邏輯處理可以通過服務器端口來進行,起到節約成本的實際效果,還能夠減少維護費用。在非注冊用戶進行平臺瀏覽之后,個性化和精準化的大數據推薦系統可以根據用戶的來源和個人信息資料推薦一些具有誘惑性的熱門商品,比如查找用戶搜索的關鍵詞精準投放該類商品;對于新注冊平臺的用戶來說,大數據推薦系統可以通過用戶的年齡、性別、家庭住址等不同的信息發掘用戶可能會感興趣的潛在商品進行推薦;已經經常使用該平臺的老用戶,個性化推薦系統可以根據歷史瀏覽記錄或歷史下單情況,也可以根據其購買記錄和評價記錄等數據展開個性化精準營銷。
具有個性化的推薦系統重點在于做好數據收集和采納,展開數據分類和處理,可以將其具體劃分為數據源、數據清洗、數據建模和個性化算法等不同的部分。
首先是數據源,不同類型的企業擁有不同的數據源頭,企業擁有滿足實際需求的不同種類數據就可以獨立進行數據營銷,不需要在外界尋求支援,但是反觀現狀,我國大多數中小企業掌握的數據信息流是有限的,甚至是十分狹隘的,需要結合自身的實際要求通過各種類型的數據庫展開類比和對比。數據庫之中,數據網絡盤根錯節,有具有結構化的交易數據網絡和業務數據網絡,同時也有與傳感器相輔相成的半結構化數據網絡。與此同時,數據源頭可以反映用戶的特征屬性,也可以反映用戶的不同操作行為,無論是哪種類型的數據源頭都要符合數據庫的兼容形式。在數據庫的來源被確定之后緊接著要展開數據采納和收集工作。
其次是數據采集。根據不同種類的分類標準可以將數據劃分為各種類型和各種用途,不同的數據具有不同的作用,因此有關企業在展開數據采納和收集之前必須要做好兜底調查工作。在這一基礎和前提之上,在采集數據的過程之中要對不同數據種類的自身需求加以明確,做好數據規模的確定和數據價格的衡量,與數據庫展開端口對接和規范化接收。
再次是數據清洗,在數據采集工作完成之后,有關企業需要展開數據的清洗處理,確保數據質量合格,安全過關,并且發現數據建設過程中可能會隱藏的問題,防止出現錯誤或數據缺失。這一過程可以采取數據格式壓縮或邏輯統一的方式進行清洗,在數據清洗完成之后可以進入到數據建模階段。在建模階段,系統設計者在這一環節可以構筑相應的存放模型,根據存放規則或實際要求展開數據優化或數據整合,對數據之間的關系進行理清,方便后續加工。在數據建模完成之后在此基礎之上可以展開進一步的用戶個性化推薦,具有個性化的核心環節是用戶的興趣建模,這一點非常重要,可以通過模型的建筑了解用戶在不同階段的興趣導向,接下來可以進行具有個性化的推薦算法,設計者可以根據用戶的不同潛在興趣模型展開進一步的個性化處理,讓系統能夠精準判斷出用戶的喜好和偏向。
除此之外還包括用戶交互技術。在數據建模階段完成之后接下來就要展開具有個性化的實際推薦,實際推薦可以通過用戶興趣模型和個性化算法展開相應的數據測算,了解用戶可能會感興趣的信息模板內容并進行精準化的傳送,之后用戶的個性偏好和選擇傾向可以再次作為數據需要數據庫傳輸,未來也可以作為參照的藍本打造新型的數據庫源頭。
過濾和排名模塊的設計非常關鍵,它是由不同的子模塊組成的,每一個不同的子模塊都可以對某些無用的推薦結果進行過濾,并且對其他類型的有價值的推薦結果進行排名。過濾排名模塊包括不同的子模塊,首先是好奇心排名模塊,它的功能是在推薦的商品中對某些用戶已經瀏覽過的信息進行排除,這些信息通常是用戶已經點擊不感興趣或者已經購買過的商品信息,其主要的目的是讓客戶能夠快速發現自己感興趣的潛在商品,提高商品的曝光率,還可以提高用戶的使用頻率,但是好奇心排名模塊不能夠重復使用,也不能夠經常使用,否則效果將不會達到預期的程度;其次是豐富性排名模塊,它指的是在推薦系統中覆蓋用戶所有的興趣愛好,并找到與之相對應的商品屬性。豐富性排名模塊可以極大限度的滿足用戶的興趣,激發全新的購買欲望,比如用戶在購買手表之后,可以推薦和手表相互搭配的運動衣或襯衫等;除此之外還有整體性排名模塊和點擊反饋模塊,整體性模塊指的是對用戶的推薦結果進行重置和管理,對不同類型用戶的推薦頻率和權重進行定義。點擊反饋模塊指的是用戶在看到結果的時候可以利用自己的點擊行為建立反饋模型,并且對反饋模型的推薦結果進行自動調查。
綜上所述,在大數據技術的支持之下推薦系統變得更加游刃有余,可以有效地方便用戶使用。有關工作者需要加強對推薦系統的個性化研究,提高其性能。