楊永瑞
摘? 要:現(xiàn)階段,我國電子商務(wù)平臺的快速發(fā)展為人們的商品選購提供了極大的便利,但在商品種類、總量持續(xù)增加的影響下,消費者如何在最短時間內(nèi)選擇自己心儀的商品,就成為了電商平臺關(guān)注的重點問題。廣告推薦系統(tǒng)的出現(xiàn)恰好滿足了消費者和電商平臺的需求,廣告推薦系統(tǒng)需要在精準(zhǔn)定位的用戶群體的基礎(chǔ)上推薦其感興趣的廣告,數(shù)據(jù)挖掘技術(shù)的引入可以有效解決這一問題。本文基于廣告推薦系統(tǒng)的概述,結(jié)合傳統(tǒng)的廣告分類模型弊端分析,探討了數(shù)據(jù)挖掘下的廣告推薦系統(tǒng)設(shè)計,并深刻研究了今后數(shù)據(jù)挖掘廣告推薦系統(tǒng)面對的問題及研究方向。
關(guān)鍵詞:數(shù)據(jù)挖掘;廣告推薦;系統(tǒng)設(shè)計;問題研究
前言:隨著我國電子商務(wù)網(wǎng)站的持續(xù)發(fā)展,諸如文本、圖片這種非結(jié)構(gòu)化的數(shù)據(jù)占據(jù)了網(wǎng)站數(shù)據(jù)的絕大部分。為了更好的實現(xiàn)針對性的廣告推薦,電商網(wǎng)站必須要針對這種非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行全方位的挖掘。作為數(shù)據(jù)挖掘技術(shù)重要組成部分的文本挖掘,能夠從原始的文本中提取相應(yīng)的知識,并且能夠?qū)τ谝恍┬问讲淮_定的半結(jié)構(gòu)以及非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行有效的處理。本文通過研究、探討以數(shù)據(jù)挖掘作為基礎(chǔ)的廣告推薦系統(tǒng)的設(shè)計,以便為今后網(wǎng)絡(luò)電商網(wǎng)站的精準(zhǔn)化廣告推薦提供借鑒和參考。
1、廣告推薦系統(tǒng)概述
廣告推薦系統(tǒng)作為現(xiàn)階段推薦系統(tǒng)的典型應(yīng)用成果代表之一,也是現(xiàn)階段互聯(lián)網(wǎng)廣告的重要表現(xiàn)形式[1]。各大電子商務(wù)網(wǎng)站都開始借助廣告推薦系統(tǒng)對自己的產(chǎn)品進(jìn)行推廣,諸如阿里巴巴、亞馬遜等國內(nèi)外知名的公司通過合理的應(yīng)用數(shù)據(jù)挖掘以及相關(guān)的程序算法,將用戶的歷史數(shù)據(jù)和用戶的消費偏好進(jìn)行深刻的挖掘以及比較,真正將用戶可能感興趣以及觸發(fā)購買潛行為的商品進(jìn)行了精準(zhǔn)預(yù)測。這里所提到的廣告推薦系統(tǒng)實際上是憑借各種技術(shù)手段實施廣告交易和管理的一種廣告形態(tài),又或者可以將之視為一種利用算法和技術(shù)精準(zhǔn)的確定產(chǎn)品目標(biāo)客戶,并為其提供廣告推薦,有效提供商品信息的一種方法。以數(shù)據(jù)挖掘技術(shù)作為基礎(chǔ)的廣告推進(jìn)系統(tǒng),能夠?qū)τ脩舻挠涗洝Ⅻc擊、評分等信息進(jìn)行科學(xué)有效的記錄,從而對各種產(chǎn)品的需求進(jìn)行預(yù)測,最終為用戶推薦瀏覽可能性最大的廣告,幫助電商網(wǎng)站實現(xiàn)廣告投放效益最大化的目標(biāo)。
2、傳統(tǒng)的廣告分類模型弊端分析
廣告推薦系統(tǒng)應(yīng)用的最終目標(biāo)就是確保能夠在特定情景下預(yù)測用戶對于不同廣告的點擊率,并推送用戶最大可能點擊的商品廣告。但實際上,之前傳統(tǒng)的廣告分類模型無法直接通過模型的建立對于廣告的點擊率進(jìn)行計算。在之前數(shù)據(jù)挖掘的廣告推薦系統(tǒng)中需要優(yōu)先判斷在特定情況,用戶是否會對廣告進(jìn)行點擊,可以憑借二值分類的方法建立一個模型,并從原始的廣告日志數(shù)據(jù)轉(zhuǎn)化為各種屬性的分類數(shù)據(jù)集[2]。
在之前原始的廣告日志數(shù)據(jù)中,點擊數(shù)據(jù)是展示數(shù)據(jù)內(nèi)部的一個子集,點擊數(shù)據(jù)中的實例可以稱為整理,而只在數(shù)據(jù)展示中出現(xiàn)的則可以成為負(fù)例[3]。在具體運用的過程中,可以將所有的正例和負(fù)例分別添加1和0的標(biāo)記。在這種情況下,就能夠得到一個包含0或者1帶有標(biāo)記屬性的轉(zhuǎn)化數(shù)據(jù)結(jié)合,隨后可以將這一標(biāo)記屬性以此為基礎(chǔ)學(xué)習(xí)二值分類器。最終建立廣告推薦系統(tǒng)的目標(biāo)是為了得到廣告的點擊率以及用戶在情景下的具體廣告排序,并以這個排序作為基礎(chǔ)得到最終的推薦結(jié)果。從某種程度上看,分類模型能夠完成這一任務(wù),但因為部分分類算法得到的輸出結(jié)果并非是簡單的0或者1,同時可以得到實例結(jié)果為1的概率,換言之,就是用戶在特定情況下有可能會點擊廣告的具體概率,也就是廣告推薦系統(tǒng)所需要的廣告點擊率數(shù)值。
3、以數(shù)據(jù)挖掘為基礎(chǔ)的廣告推薦系統(tǒng)設(shè)計研究
3.1推薦系統(tǒng)的總體體系結(jié)構(gòu)設(shè)計分析
作為電商平臺重要內(nèi)容的廣告系統(tǒng)推薦,人們在瀏覽電商平臺時,通常都會收到有關(guān)產(chǎn)品介紹的文字和圖片,如何能夠在多種產(chǎn)品的圖片和文字中尋找到用戶想要購買的產(chǎn)品難度相對較大,廣告推薦系統(tǒng)能夠在吸引顧客的同時為其提供感興趣的商品。目前我國的電商平臺系統(tǒng)都是以B/S結(jié)構(gòu)作為基礎(chǔ),通過使用數(shù)據(jù)挖掘中的聚類技術(shù)能夠有效組建廣告推薦系統(tǒng),具體又可以分為離線挖掘和在線推薦兩個組成部分。電商平臺中的廣告推薦系統(tǒng)建立的初衷是為客戶提供各種個性化的廣告服務(wù),由于電商平臺中的客戶訪問數(shù)據(jù)處于認(rèn)知數(shù)據(jù)增加的狀態(tài),如何針對客戶的瀏覽信息使用在線挖掘的模式,這種復(fù)雜的運算過程很有可能會帶來大量的時間成本投入,并且這種大規(guī)模的預(yù)算也有可能會帶來系統(tǒng)癱瘓的問題。在具體數(shù)據(jù)處理的過程中,需要采用離線挖掘的方式。
離線挖掘這一部分具體包括了數(shù)據(jù)的采集、預(yù)處理、挖掘以及存放挖掘數(shù)據(jù)結(jié)果幾部分。以數(shù)據(jù)挖掘作為基礎(chǔ)的廣告推薦系統(tǒng)中,只要用戶登錄電商平臺開始商品信息瀏覽之后,系統(tǒng)便會自覺將商品瀏覽記錄保存在數(shù)據(jù)集中,因為這些數(shù)據(jù)集中的記錄尚未進(jìn)行處理,在系統(tǒng)獲得用戶的商品瀏覽記錄信息之后,需要進(jìn)行全方位的挖掘,并在這一步操作之前對其進(jìn)行預(yù)先處理,具體包括了分詞、去停用詞以及使用特定方式進(jìn)行計算數(shù)據(jù)表示。在經(jīng)過處理之后,數(shù)據(jù)可以進(jìn)行聚類操作并將之儲存到對應(yīng)的用戶記錄數(shù)據(jù)庫中。
在廣告推薦系統(tǒng)的在線推薦環(huán)節(jié)運轉(zhuǎn)中,電商平臺任何一個商品的廣告都會存入到商品的后臺數(shù)據(jù)庫中,并且經(jīng)過離線挖掘處理之后的數(shù)據(jù)結(jié)果集合會分類存儲到用戶信息瀏覽數(shù)據(jù)庫中,只需要系統(tǒng)抓取其中的關(guān)鍵詞在與商品數(shù)據(jù)庫中商品的關(guān)鍵字匹配之后,如果相似度大于設(shè)置的閾值,則意味著用戶對于電商發(fā)布的廣告位置有著較高的興趣,可以將該商品廣告進(jìn)行推送。
3.2推薦系統(tǒng)的設(shè)計分析
結(jié)合我國電商平臺對于廣告推薦系統(tǒng)的個性化需求看來,其總體的模塊可以分為廣告、用戶、管理員三個部分。廣告模塊作為整個數(shù)據(jù)挖掘廣告推進(jìn)系統(tǒng)的核心,電商平臺可以發(fā)布多條廣告讓用戶進(jìn)行瀏覽,或者可以對廣告內(nèi)容進(jìn)行增加刪除和修改[4]。在這一模塊上系統(tǒng)需要有效獲取用戶的商品瀏覽記錄,需要提供用于用戶瀏覽的足夠的廣告。在獲取到用戶記錄并進(jìn)行處理之后,需要發(fā)布與之匹配的廣告內(nèi)容。用戶模塊則是針對系統(tǒng)所訪問到的各種用戶信息瀏覽記錄進(jìn)行分析和處理的模塊,并以此作為基礎(chǔ),發(fā)掘用戶對于電商平臺中感興趣的產(chǎn)品。這一功能模塊需要在運轉(zhuǎn)的過程中,將各個用戶登錄之后的商品瀏覽記錄進(jìn)行保存,并經(jīng)過預(yù)處理之后,使用聚類算法進(jìn)行相似用戶處理。為了保障廣告推薦系統(tǒng)始終處于一種穩(wěn)定的運行狀態(tài),管理員模塊的設(shè)計可以針對網(wǎng)站用戶的管理廣告信息進(jìn)行管理,并同步進(jìn)行廣告內(nèi)容的驗證和刪除等操作。
4、以數(shù)據(jù)挖掘為基礎(chǔ)的廣告推薦系統(tǒng)存在的問題及今后的研究方向分析
4.1廣告推薦面臨的時效性問題
以數(shù)據(jù)挖掘作為技術(shù)所形成的廣告推薦系統(tǒng)必須要考慮到廣告推薦的時效性問題,需要結(jié)合用戶需求的變化以及實踐上下文之間聯(lián)系的全方位考慮,換言之,廣告宣傳的時效性完全是由用戶需求的時效性決定的[5]。在一定時間階段內(nèi)的用戶對于產(chǎn)品需求和偏好會出現(xiàn)一定程度的變化。目前數(shù)據(jù)挖掘算法生成的廣告推薦系統(tǒng)存在著明顯的廣告推薦時效性問題,比如在用戶搜索計算機(jī)商品信息并購買之后,在其產(chǎn)品購買之后的一段時間的電商平臺或網(wǎng)站依舊會為客戶推送有關(guān)計算機(jī)產(chǎn)品的相關(guān)廣告,這會使得用戶對于商品以及電商平臺產(chǎn)生一種抵觸的情緒。
與其他專業(yè)領(lǐng)域的時效性相比,廣告推薦系統(tǒng)的時效性存在著明顯地不同。新聞行業(yè)的新聞信息推薦時效性是以時間作為節(jié)點。最大的特點是與時間上下文之間保持著較為緊密的關(guān)聯(lián),超過一段時間之后的新聞發(fā)布對于用戶來說毫無意義。廣告推薦系統(tǒng)應(yīng)用的最終目標(biāo)是為了激發(fā)用戶對于商品的購買行為,需要立足于用戶和廣告產(chǎn)品的角度來掌握廣告推薦的時效性。從用戶層面看來,廣告推薦系統(tǒng)需要以用戶行為變化作為出發(fā)點,在獲續(xù)商品需求變化的同時即時進(jìn)行,反應(yīng)。從廣告商品角度看來,廣告推薦系統(tǒng)需要結(jié)合產(chǎn)品推出的時間以及廣告發(fā)布的時間等判斷產(chǎn)品是滿足用戶現(xiàn)階段的需求。
在這種情形下,系統(tǒng)是否能夠為用戶提供即時商品廣告推薦結(jié)果,并同時考慮用戶的產(chǎn)品變化是今后數(shù)據(jù)挖掘算法基礎(chǔ)下廣告推進(jìn)系統(tǒng)重要的研究方向。今后的廣告推薦系統(tǒng)不但需要獲取用戶偏好的動態(tài)變化特征,并且也需要在系統(tǒng)設(shè)計層面進(jìn)行轉(zhuǎn)型,可以借助Hadoop建立完善的分布式推進(jìn)系統(tǒng),進(jìn)一步強(qiáng)化用戶相關(guān)偏好以及信息瀏覽數(shù)據(jù)的處理能力和效率,以便提高廣告推薦系統(tǒng)的靈活性和多樣性。
4.2用戶個人隱私的安全問題
在數(shù)據(jù)挖掘算法基礎(chǔ)上形成的廣告推薦系統(tǒng),在應(yīng)用過程中同樣也引發(fā)了有關(guān)消費者個人隱私和數(shù)據(jù)安全方面的問題。結(jié)合近幾年國內(nèi)外電商平臺的發(fā)展看來,用戶在門戶網(wǎng)站和金融公司注冊時的個人信息出現(xiàn)了大量暴露以及濫用的問題。以目前廣告推薦系統(tǒng)中所用的推薦技術(shù)看來,通常都需要對用戶的歷史信息進(jìn)行調(diào)用和分析。即便社會化網(wǎng)絡(luò)這種對于歷史信息依賴度不強(qiáng)的推薦技術(shù)方式,也需要針對用戶的社會關(guān)系、地理位置等信息進(jìn)行訪問,這些信息同樣也屬于用戶的個人隱私。數(shù)據(jù)的隱私處理使得廣告推薦能夠利用的數(shù)據(jù)量有所削減,對于廣告推薦系統(tǒng)的最終效果會產(chǎn)生影響。在今后數(shù)據(jù)挖掘算法下的廣告推薦系統(tǒng)應(yīng)用中,想要更好的提高用戶個人隱私的保護(hù)程度,不但要保證推薦系統(tǒng)能夠有效的保護(hù)用戶的隱私信息不被他人過度訪問,同時也需要緩解因為數(shù)據(jù)隱私處理對最終推薦結(jié)果產(chǎn)生的影響。在今后廣告推薦系統(tǒng)發(fā)展的過程中,相關(guān)專家和學(xué)者需要高度關(guān)注廣告推薦系統(tǒng)隱私保護(hù)機(jī)制的建立。
總結(jié)
廣告推薦系統(tǒng)的建立和應(yīng)用是電商平臺能夠結(jié)合用戶產(chǎn)品信息的瀏覽以及需求偏好等進(jìn)行精準(zhǔn)化購物推薦的有效途徑。現(xiàn)階段,我國電商網(wǎng)站儲存的文本圖片等資料可以憑借數(shù)據(jù)挖掘中的文本挖掘方法進(jìn)行收集、整理、記錄以及分析實現(xiàn)廣告的精準(zhǔn)化投放,但卻面臨著用戶的隱私安全以及廣告推薦的時效性問題,需要相關(guān)專家和學(xué)者在今后廣告推薦系統(tǒng)持續(xù)發(fā)展的過程中,重視系統(tǒng)的全新設(shè)計以及隱私保護(hù)機(jī)制的研究,做到在實現(xiàn)廣告推薦系統(tǒng)精準(zhǔn)化廣告投放的同時,最大程度保障個人隱私安全。
參考文獻(xiàn)
[1]張玉潔,董政,孟祥武.個性化廣告推薦系統(tǒng)及其應(yīng)用研究[J].計算機(jī)學(xué)報,2021,44(03):531-563.
[2]張鑫,李競一,郭宇萱,陳志豪,朱建方.基于數(shù)據(jù)挖掘的模擬經(jīng)營策略分析——以“手環(huán)制造企業(yè)”為例[J].智庫時代,2019(38):67+70.
[3]李雙稀,王強(qiáng),嚴(yán)梓歡,李超.基于人臉識別的商業(yè)大數(shù)據(jù)分析[J].電子世界,2016(22):38.DOI:10.19353/j.cnki.dzsj.2016.22.025.
[4]陳航.大數(shù)據(jù)對商業(yè)營銷變革的影響分析[J].中國統(tǒng)計,2016(06):21-22.
[5]于海平,林曉麗,劉會超.基于數(shù)據(jù)挖掘的移動廣告?zhèn)€性化推薦研究[J].計算機(jī)技術(shù)與發(fā)展,2016,24(08):234-237.