[摘 要] 銷售過程中大量的重復性工作是開發系統的前提,但銷售也具有很高的靈活性和技巧,尤其是客戶識別和促銷過程。因此,高性能的銷售系統需要更好的知識源的支持。我們從分析系統的需求開始,結合國際上一些系統的特點,為此設計了四種內容三類形式的知識源:客戶關系管理數據、企業銷售政策、常問問答對和背景知識內容;問答對、自然文本和結構化信息三種形式。并探討了它們之間的關系和實現流程。
[關鍵詞] 問答系統 在線銷售 知識源
一、引言
1.在線銷售問答系統
隨著B2C和C2C類型電子商務的快速發展,針對個人客戶的網上銷售變得日益繁忙。自動在線銷售問答代理系統可以有效的降低交易費用,促進社會進步,因此具有較高的現實價值,是自然語言處理系統的一個有效運用方向(王波, 2009)。統通過自然語言傳遞信息,客戶目標有一定范圍限制,屬于受限范圍內的問答系統。考慮到目前自然語言理解和問答技術的進展,綜合使用TREC QA Track中的factoid 和list類型,構建一個銷售問答系統具有理論上的可行性(Hoa Trang Dang, Diane Kelly, and Jimmy Lin, 2008)。
然而,高水平的銷售系統不止于問答的一般性提取,還包括更多。例如,高性能在線銷售問答系統要求不僅僅只是千人一面的一問一答,還應該包含態度、期望、情感聯系等其他因素,這才符合人類進行更深層次的營銷的特點。這就要求系統能夠識別場景,擁有期望,形成策略(Bruce, B. C., 1975)。
形成這些行為需要一個強有力的知識庫的支持。這個知識庫內容應包括:(1)通用知識:產品、企業、渠道、價格方面的知識;(2)針對性的知識:能夠使用客戶數據針進行有針對性銷售政策回答;(3)創造性的知識:根據客戶信息識別客戶潛在需求,進行新品推薦、缺貨產品替換等創造性的促銷活動。
2.問答系統的知識源構成
1999年開始,TREC設立QA測試,目標是促進各國在問答系統方面的研究。早期的TREC QA測試中,曾經使用過問句相似度計算的方法,例如芝加哥大學的FAQ Finder(Robin D. Burke, 1996)。系統接受自然語言提問,然后去尋找數據庫中的常問問題問答對。如果找到與提問相似的問答對,就提取對應的答案,然后返回給用戶。這種系統多采用統計學和語義學的方法計算句子相似度,知識源是一個盡可能齊全、詳細的常問問答對集合。
隨著QA測試的發展,近年來則更多的使用了文本提取的方式。系統的主要知識來源是一系列的英文新聞材料(newswire)。在factoid類型的提問中,問題被聚合成不同的主題。一般來說,系統先使用通用的檢索工具從新聞報道中檢索出若干文檔,然后進一步提取相關的句子,通過統計學、句法、語義學方法最后選擇得分最高的幾個句子作為回答。
結構化的知識源也被用于支持QA系統。 IBM的PIQUANT系統除了使用文本提取外,構建了KSP代理,這個代理就是從一個結構化的知識源中尋找答案(Jennifer Chu-carroll, 2006)。
從TREC2007開始,QA測試進一步引入了博客(blog)作為基礎的知識來源,相對于新聞來說,博客語言的不規范性和信息的低可靠性引入構成了對問答系統更大的挑戰。要求QA系統不僅能處理不規范的語言,而且要能夠對相互沖突的知識源信息做出判斷和選擇。
二、系統基本結構
1.銷售問答系統的知識需求
通常的在線銷售流程包含售前、售中和售后三個基本過程。一個典型的流程如圖1。
在這個過程中,客戶需要的信息包括:產品信息、價格信息、促銷信息、渠道信息(4P,Product, Price, Promotion, Place)。
那么在企業中,銷售人員如何滿足客戶的信息需求呢?銷售人員的信息來源包括:(1)背景知識的學習,主要是企業的基本情況;(2)企業的銷售政策,如價格、折扣、陪送、服務等;(3)常問問答,即通過觀察其他有經驗的銷售人員的問答,可以彌補銷售政策不能覆蓋到的細節,從而促進銷售。
從分類上看,(1)包含產品信息;(2)包含價格信息、促銷信息和渠道信息;(3)則包含全部4P信息;(4)客戶信息則屬于客戶關系管理范疇。
因此,在線銷售問答系統的知識源涵蓋了以下三種形式:常問問答對、自然文本(背景知識)和結構化信息(銷售政策)。
2.銷售問答系統的知識源流程
系統知識來自多個源。采用常問問答形式快捷,自然,但主要的問題是如果企業銷售政策改變,會導致常問問答對需要不斷的相應修改;另外,針對不同類型的客戶,也需要系統有針對性的回答。因此我們需要分別從銷售政策和常問問答系統中獲得不同的答案,并參照客戶關系數據進行一致性比較,對不符合現在銷售政策的常問問答進行修改。基本的流程如圖2。
三、更好性能的系統結構
1.在線銷售系統的BDI模型
銷售人員往往會根據用戶的特點進行促銷。系統要做到這一點,就需要客戶關系(CRM)知識的支持。系統使用CRM知識,感知用戶,并進行銷售政策選擇。這是達到銷售期望的一個規劃和落實的過程,是具有一定智能行為的表現。網上銷售系統的智能行為包括四個過程和三個狀態,BDI模型如圖3。
使用客戶關系數據進行推理限定在一個有限的領域,這是一個前提和有利條件。這個領域的推理可以使用客戶關系(CRM)管理的框架體系來完成。在CRM體系中,按顧客生命周期客戶關系的發展可分為開發期、考察期、形成期、穩定期、衰退期五個階段,為五階段模型。按照客戶處于不同的生命周期可分為5類:潛在型、夭折型、中途退出型、重新選擇型、完美型。不同類型客戶分別適用于不同的銷售政策(比如折扣、建議等)。這種數據多是結構化的。
2.提高性能的系統體系
綜上,構建如下體系如圖4。
系統包含4種3類知識源。如果是背景知識類的問題,直接分別從常問問答對和背景知識文本中提取答案,然后進行一致性對比,最終生成輸出;對于非背景內容提問,先從常問問答對中,使用基于統計學和語義學的方法計算句子相似度來提取答案;然后從企業銷售政策文本中,使用檢索和命名實體的方法提取答案;再使用判定規則進行一致性比較,篩選出排列前面的答案;最后查詢客戶數據,通過人工智能推理,做最后篩選。
四、結論
隨著電子商務的發展,在線銷售問答系統日益具有價值。這種系統基于問答系統,但卻提出了更高的要求。銷售過程具有大量的重復性工作,這也正是開發系統的前提。但它也具有很高的靈活性和技巧,尤其是客戶識別和促銷,提出了不同于一般問答系統的更高要求。高性能的銷售系統需要更好的知識源的支持。從分析系統的需求開始,分析國際上一些系統的特點,為此設計了4種內容3類形式的知識源,包括:客戶關系管理數據、企業銷售政策、常問問答對和背景知識。他們分別屬于三種形式:問答對、自然文本和結構化信息。針對不同類別和形式的知識源需要使用不同的方式提取備選答案,并對來源不同的答案進行一致性比較和推理,從而得到最終答案。
參考文獻:
[1]Hoa Trang Dang, Diane Kelly, and Jimmy Lin . Overview of the TREC 2007 Question Answering Track[C].In Proceeding of the Sixteenth Text Retrieval Conference(TREC 2007), Gaithersburg, Maryland, USA: NIST, 2008
[2]Robin D. Burke, Kristian J. Hamond, Vladimir A, Kulyukin. Question Answering for Frequently-asked Question Files: Experience with the FAQ Finder Systme[J].AI Magazine ,1996
[3]Jennifer Chu-Carroll, Krzysztof Czuba,Pablo Duboue, John Prager. IBM’s PIQUANT Ⅱin TREC2005, In Proceeding of the Fourthteen Text Retrieval Conference(TREC 2005), Gaithersburg, Maryland, USA: NIST, 2006
[4]Bruce, B. C. Generation as a social action. Proc[C]. Theoretical Issue in Natural Language Processing(ACL), 64~67. Reprinted in RNLP, 1975
[5]Philip Kotler. Marketing Management(Ninth Edition)[M]. Prentice-Hall Internatioal, Inc. 1997
[6]王 波 薛媛媚:網上銷售常問問答系統的構建[J].軟件導刊, 2009,2:112~113
[7]陳明亮:客戶生命周期模式研究[J].浙江大學學報(人文社會科學版),2002,11:66~60
[8]James Allen:自然語言理解(第二版)[M].北京:電子工業出版社,2005
[9]蔡自興:人工智能及其應用(第三版)[M].北京:清華大學出版社,2004