劉艷,李一銘,劉子逸
(河海大學企業管理學院,江蘇 常州 213022)
近年來,隨著社交網絡平臺的不斷發展,知識的交融及共享愈加多元化。百度知道、知乎等社會化問答平臺逐漸成為人們尋求知識的重要途徑。據統計,截至2017年9月,知乎個人注冊用戶總數超過1億,日活躍用戶量達2600萬。很多商家看到問答平臺上存在的大量商機,紛紛通過精準廣告投放來達到營銷的目的。以往,由于技術不成熟,投放效果不明顯。但隨著挖掘算法的發展,其用于問答平臺的需求愈加豐富,如何做好對問答平臺精準營銷挖掘算法的需求分析成為一個有待解決的問題。
2005年,著名營銷大師菲利普·科特勒首次明確提出精準營銷(Precision marketing)理論。他認為“精準營銷是采取更精準、可衡量和高投資回報的營銷溝通,制定更注重結果和行動的營銷計劃,并更加重視對直接銷售溝通的投資”。國內學者伍青生、余穎、鄭興山等人認為“精準營銷是企業通過定量和定性相結合的方法對目標市場的不同消費者進行細致分析,根據他們不同的消費心理和行為特征,采用有針對性的現代技術、方法和指向明確的策略,實現對目標市場不同消費者群體強有效性、高投資回報的營銷溝通”。
精準營銷實施的策略和途徑分為三種:①基于數據庫的方法,主要包括郵件直付營銷、呼叫中心(Call Center)、手機短信等;②基于互聯網的方法,主要包括門戶網站廣告,“窄告”,關鍵詞搜索廣告,博客,Email廣告,電子優惠券,來電廣告等;③基于第三方渠道的方法。
數據挖掘有多種定義,其中比較有代表性的是“從數據中汲取出包含著的過往不被知道的有利用價值的潛在信息”。在新世紀信息產業與網絡互聯持續發展、數據激增的背景下,數據挖掘相關技術如今已被各大領域大力應用。如秦文哲等人提出把數據挖掘技術用于醫學研究[1],張亮等人提出把數據挖掘方法用于公司的財務預警[2],連德福提出把數據挖掘用于社交網絡的位置信息分析[3],熊亞軍等人提出把KNN數據挖掘方法用于地區霾等級預報[4]等。常見的數據挖掘算法包括聚類分析、K-Means聚類算法、決策樹、邏輯回歸以及神經網絡算法、遺傳算法以及粗糙集相關的算法等。
在問答平臺中,對于用戶的前端行為習慣的分析關鍵是要結合用戶的行為流程進行分析,用戶的行為流程主要包括用戶的瀏覽點擊過程以及用戶的搜索過程等。其目的是方便用戶快捷地尋找到符合自己查詢需求的結果??蛻舻男袨榱晳T的分析主要包括兩點內容:一,特定用戶群的瀏覽規律及特點。通過對于用戶瀏覽訪問習慣的分析,追蹤出用戶習慣的頻繁訪問路徑并進行抽取,用于平臺前端界面的優化。二,用戶的搜索行為方式和特點。通過對用戶搜索習慣的分析,采集用戶的搜索特征信息,優化用戶的搜索結果以及提供的搜索選項。
用戶后端數據的分析主要通過用戶個人設置的興趣標簽信息和用戶的提問或者回答的文本信息,用戶的收藏信息以及用戶的基本信息等來建立潛在用戶特征模型,為商家提供較為準確的用戶類群信息。其主要內容為:一,用戶的個性興趣愛好特征。通過用戶的興趣標簽進行統計分組,分析得出用戶可能會對于哪些廣告感興趣。二,用戶的互動信息。通過用戶的提問信息以及用戶的回答信息的文本分析,從中得出用戶的情感趨向,最終對用戶進行精準營銷。三,潛在客戶的影響力價值。在得到潛在用戶的類群分組后,對潛在用戶的網絡影響力進行計算分析,抽取出其中影響力較大的某些潛在客戶,通過某些方式使其成為商家的客戶,利用其影響力擴大營銷。
社交網絡平臺對于商家的信息分析主要是完成商家的精準廣告投放,從而謀取利益。在知識問答平臺上商家需要通過平臺找到其對應的潛在客戶,然后通過平臺的某些方式(在用戶瀏覽的信息之間插入廣告、平臺通過快捷欄推送等)進行廣告投放。平臺在這個過程中需要對商家的信息進行分析,明辨商家投放廣告的需求量。如果需求量較大,平臺就需要慎重斟酌,在不影響用戶使用舒適度的保證下向用戶推送。此外,平臺還需要結合用戶群偏愛廣告的程度,向商家說明投放多少廣告和投放頻率能讓其對這些廣告不感到厭煩,保證平臺用戶數量穩定。
目前在問答平臺精準營銷中數據挖掘算法的應用主要為以下幾個方面:①使用關聯規則算法對UGC項集進行信息挖掘和規則提取[5];②使用分類和預測算法對文本信息進行特征提??;③使用文本聚類算法,對按照內容或語義將同一問題下的所有答案進行聚類等。本文將從聚類算法、分類和預測算法以及關聯規則算法的概念,基本原理以及使用范圍進行綜述。
聚類是一種無監督的機器學習方法,可以實現針對目標群體的多指標群體劃分,這些分類往往是精準營銷的基礎和核心。只有正確地對目標群體進行分類,精準營銷的業務才能有效開展。其主要使用的業務范圍包括:一是目標客戶群的分類;二是不同產品的價值組合。該算法有五種分類:基于層次、基于劃分、基于密度、基于網格的方法和基于模型的方法。
分類算法是一種有監督的學習,通過對已知類別訓練集的分析,從中發現分類規則,以此預測新數據的類別。預測方法用于對預測數據對象的連續取值。分類算法主要應用的業務范圍包括:按照既定的標簽或目的對客戶進行分類以便尋找不同種類用戶的特征。常用算法包括決策樹、貝葉斯法、SVM法、粗糙集、遺傳算法、BP神經網絡算法等。預測算法主要應用的業務范圍是預測客戶訪問行為、潛在客戶轉化為使用客戶的可能性等,算法主要包括線性回歸、非線性回歸、多元回歸等。
關聯規則算法主要是發現不同項之間的相關性,利用關聯規則可以發現存在于數據庫中的可被發現的兩個或多個變量取值之間存在的規律性。關聯規則典型的算法是Apriori算法。在問答平臺中關聯規則算法的主要應用的業務范圍包括:UGC項集的規則挖掘,分析用戶的情感趨向。
通過對精準營銷理論,挖掘算法理論、問答平臺挖掘算法的需求分析以及用于問答平臺的數據挖掘算法的介紹,本文總結得出當前用于問答平臺的數據挖掘算法仍然存在許多需要優化的地方。但是,隨著問答平臺和數據挖掘算法的不斷發展,用戶的需求將會不斷得到解決,精準營銷用于問答平臺的理論支撐將更加豐富,問答平臺的營銷模式將不斷得以優化和完善。