【摘要】針對數據挖掘技術在搜索引擎營銷領域的廣泛應用,本文從關鍵字的生成、排名機制、廣告與網頁內容的匹配、個性化營銷四個角度對這個交叉領域的主要研究成果進行了綜述,并做了展望。
【關鍵詞】搜索引擎營銷 網絡營銷 數據挖掘
在搜索引擎營銷日益成為市場寵兒的同時,搜索質量也成為重中之重。數據挖掘作為一種比信息檢索更高級的技術,已經成功地應用到搜索引擎中,并改善了搜索質量,實現了智能搜索。鑒于數據挖掘在搜索引擎營銷中的廣泛應用,眾多學者也取得了不少研究成果。
一、搜索引擎營銷的概念
搜索引擎營銷是一種新興網絡營銷模式,其含義在于根據用戶使用搜索引擎的方式,利用用戶檢索信息的機會盡可能將營銷信息傳遞給目標用戶。
為了達到精準的營銷效果,分析用戶的搜索過程是十分必要的。用戶首先會鍵入代表需求的關鍵字,進而會瀏覽一系列結果頁面,然后用戶會根據瀏覽經驗、每個鏈接的標題和內容等原則判斷該鏈接是否與需求相關,從而點擊或忽略。通過瀏覽多個網頁內容,用戶會做出進一步搜索或停止搜索的決策。接下來,本文就按照用戶搜索行為的順序來總結搜索引擎營銷的相關研究成果。
二、搜索引擎營銷的研究現狀
(一)關鍵字的生成
一般而言,關鍵字是指用戶在使用搜索引擎時輸入的、能夠最大程度概括用戶所要查找信息內容的字或詞,是信息的概括化和集中化。
Amruta 和Rajeev(2000)提出一個新穎的方法TermsNet。這個方法要求判斷術語之間的相關性,并用直線圖表示彼此的語義關系。Vibhanshu和Kartik(2007)也提出了一個類似方法,即基于核函數去建立術語間的語義關聯。
Carrasco等人(2003)提出采用聚類方法對關鍵字進行歸類。他們利用145,000家廣告商的關鍵字組成的數據集,分別采用自上而下的分裂層次聚類法和自下而上的凝聚聚類法,結果證明前者適用高層次的聚類,后者適用低層次的聚類。
Yih等人(2006)推薦了一種利用監督式學習方法從網頁中提取關鍵字的機制。
Stamatina等人(2011)開發了一個基于語義識別方法的關鍵字自動生成系統,雖然精確性還有待提高,但是也為挑選最優關鍵字做了鋪墊。
(二)排名機制
最能體現搜索引擎設計思想的就是網頁排序系統,因為搜索引擎最關注的是如何將與用戶搜索請求最相關的鏈接放在前一百位。學者們多用數據挖掘技術研究算法,而文本排序技術方法基本包括PageRank算法、Allan Borodin等人的完全貝葉斯統計方法、網站級別模型等。
之后,學術界也出現了后綴排序算法。一是后綴樹排序算法,主要用數據結構中“樹”的結構去產生最終的排序結果。二是后綴數組排序算法,即所有數據都儲存在數組這種數據結構中,處于主流的是 Larrsson和Sadakane的快速后綴排序算法。
除此之外,Lacerda等人(2006)建議在情境式營銷中采用機器學習的方法尋找排序函數。他們采用遺傳編程算法來選擇排序函數,該函數放大了訓練集上的平均精確度。
(三)廣告與網頁內容的匹配
為了充分利用用戶瀏覽網頁的時間達到營銷目的,二者的匹配問題至關重要。Ribeiro-Neto等人(2006)認為利用二者的語義關聯提高匹配度。為此,他們提出一個模型,其思想是擴展網頁中的關鍵字以減少二者的詞匯不匹配度。
Broder等人(2007)認為,在標準的字符串匹配方法中加入主題的相似性這個變量,會提高廣告和網頁的匹配度。他們的方法依賴現成的基于語言的分類標準,試圖捕捉二者的語義關聯。
Murdock等人(2007)認為可利用機器翻譯的方法來克服詞匯的不匹配問題。
(四)個性化營銷
現有的研究一般通過分析用戶訪問行為進而達到個性化目的。數據挖掘在Web訪問行為分析方面應用較廣泛,常用方法包括:統計分析、關聯規則、序列模式、聚類分析、分類分析。對營銷而言,其用途是個性化推薦服務和營銷智能。
鐘生海和邱玉輝(2011)把情感語義引入了推薦系統,設計了基于情感語義的推薦系統模型。通過商品潛在的情感因素對顧客情緒進行識別,提出了由情感匹配程度計算情感支持度的方法,給出了情感與關聯規則挖掘結合的個性化推薦算法。
除此之外,還有些有趣的發現。Dirk等人(2010)嘗試性地利用Web挖掘方法從博客中提取數據來形成新產品設想。因為大多數用戶傾向于在博客上表達出對新產品的渴求,而利用文本挖掘便可從這種口語體語言中發現有用的信息。
三、總結與展望
目前,這個交叉領域的研究還只是冰山一角,尚有很多研究空間,譬如:(1)分析用戶對不同位置推廣鏈接的偏好程度。(2)采用文本挖掘研究不同關鍵字廣告內容對用戶決策的影響。(3)研究該營銷模式下顧客的延遲購買行為。
數據挖掘可以經過一種非平凡過程從巨量數據庫中獲取有效的、新穎的、潛在有用的、最終可理解的模式。而搜索引擎營銷領域的研究離不開大量有價值數據和模式的支持,所以在今后的研究中也會繼續頻繁地使用數據挖掘這種新興工具,相信這個交叉領域會迸發出累累碩果。
參考文獻
[1] Dirk Thorleuchter, Dirk Van den Poel, Anita Prinzie. Extracting Consumers Needs for New Products – A Web Mining Approach. Third International Conference on Knowledge Discovery and Data Mining, 2010.
作者簡介:劉文文(1986-),女,山東德州人,就讀于南京大學商學院,研究方向:電子商務。
(責任編輯:劉晶晶)