余以勝
(廣東女子職業技術學院,廣東 廣州 511450)
隨著技術的進步,當今移動設備要求提供互聯網服務的需求有不斷增長的趨勢。當服務提供商和產品供應商在互聯網上提供市場和核心業務服務的同時,還提供客戶服務。參考文獻[1]提出了基于人工智能技術(即稱為最優-第一搜索)的構架,討論了能擁有建立其中的搜索技術的代理程序。本文提出有全文搜索能力的獨立應用構架,可以在計算機、移動電話上通過Web瀏覽,或通過固定電話語音交互,該構架稱為交互式客戶服務代理ICSA(Interactive Customer Service Agent)。
WWW運行在HTTP協議上,它是客戶/服務器體系結構,服務器位于一端且給體系結構另一端的客戶提供Web頁服務。圖1所示為集成的體系結構,包含Web、WAP和Voice網絡。PC機對HTTP請求/響應直接解釋;移動設備使用稱為WAP的輕量級協議,以編譯的或二進制格式表現信息。語音交互使用的語音網關可以由電信服務器、ASR服務器、TTS(Text To Speech)服務器和VoiceXML解釋器組成。
在Web體系結構中,瀏覽器位于客戶端且用來解釋由服務器傳送來的HTML代碼。移動設備要訪問互聯網,需要包交換網絡,隨著GPRS(General Packet Radio Service)、EDGE(Enhanced Data for GSM Environment)和很多其他技術的出現,條件現已具備。對這樣一個包交換網絡,則要求通過WAP網關接入現有互聯網。WAP網關也連接到BTS(Base Transceiver Station),它為客戶端的移動設備提供無線連接。
在Voice體系結構中,由自動話語識別器ASR(Automatic Speech Recognition)服務器執行語音識別,由文本-話語 (TTS)服務器執行文本到話語的轉換。一個VoiceXML解釋器根據VoiceXML規格[2]執行應用程序。實現語音交互的常用方法有直接對話和混合交互語音響應(IVR)兩種。其中直接對話較為流行,用戶與給出語音格式指令集的系統或應用進行交互。IVR應用是基于程序設計語言,如VXML(VoiceExtensibleMark-up Language)和 SALT(Speech Application Language Tags)。

圖1 Web、WAP和Voice集成的體系結構
一個多通道應用系統將其內容展示給終端用戶,是基于用戶代理實現的。在多通道訪問中,企業數據和應用系統可通過多個通道進行訪問。與多通道訪問方式不同,多模態訪問將多個通道組合形成同一個交互活動或會話。X+V(XML+VXML)和SALT是開發多模態應用[3]的常用工具。基于單一著作模式(Single Authoring)[4]的多模態應用能夠使用SALT開發,而基于多著作模式(Multiple Authoring)的多模態應用要求使用X+V。
多通道應用也可以是單一著作模式或多著作模式。單一著作模式多通道應用使用程序語言或標注語言開發,該語言能夠為各種接口或設備重新生成具有可讀性的輸出。多著作模式多通道應用將要求不止一種的程序語言或標注語言為各種接口或設備產生可讀性輸出。XML(Extensible Mark-up Language)是一種標注語言,可以使用XSLT(Extensible Stylesheet Language Translation)開發單一著作模式多通道應用。多著作模式多通道應用將共享一個或多個部件,通常是數據庫的Web、WAP和Voice應用的集成。
全文搜索技術在通用企業數據庫引擎中均有很好的支持。 Oracle、MySQL、Sybase、SQL Server和 PostgreSQL等是支持FTS(Full-Text Search)的主要數據庫引擎。FTS是一種索引搜索方法,它對數據庫表中的詞建立了索引,索引創建在由4個或更多個字符組成的詞上[5]。全文搜索的SQL實現隨著選用的數據庫引擎的不同而不同。
開發單一著作模式的多通道應用系統要求語言轉換。轉換最好與過濾代理(即FTS)執行的其他進程相分離,因此在應用設計中,使用五層體系結構的模型。另外,應用系統獨立于數據庫引擎,也是五層模型優于三層模型之處。
XML是元標注語言,是一個為數據描述創建語義標簽的規則集合,而HTML用來指定Web頁的布局。XSL(Extensible Stylesheet Language)是基于XML的語言,用來操作、分類和過濾XML數據。XSLT樣式表定義一個規則或模板的集合。當模板與源文檔中的節點相匹配時,它在新文檔中存儲按模板產生的輸出結構。多通道應用給基于其連接設備的終端用戶表現其內容,并且XSL是一個將內容與表現分離的理想工具。通過取決于連接設備或用戶代理的XSLT處理器將XML/XSL轉換成 HTML、WML和 VXML,如圖 2所示。
N-層模型指全部數據包或應用系統能夠劃分的分類層數,也指層數N≥2的客戶-服務器模型。
如果使用五層模型開發,不用傳統的三層模型,Web應用的執行性能會更好。應用5層模型的重要優勢在于,處理未來流量的伸縮性和性能需求的適應性、良好的結構化設計、靈活的以銷售商為中心的應用及其易維護性。
本文提出的ICSA多通道應用構架基于一個五層模型,如圖3所示。

圖2XML/XSL轉換為HTML、WML和VXML

圖3 ICSA構架
數據層指數據庫服務器的內容。在此情況下,數據庫服務器包含帶索引的關鍵詞,這些關鍵詞來自預設的已知問題和回答、與用戶提出的問題類似的問題以及給出的可能回答。
數據訪問層包括服務器端(SSI)文件或連接到數據庫的腳本。它建立一個連接到數據庫并為提供查詢目的的連接標識符。將完全的數據庫轉換成XML文件的應用程序接口(API)也在該層上操作。
應用層負責系統執行的算術和邏輯操作,包括查找關鍵詞,在沒有回答提供時存儲新的問題集合。用全文搜索技術來查詢數據庫。其XML文件表示數據庫,XPATH可用來定位XML文件中的回答。此外,也可用第三方API來執行查找XML文件。然后,服務器端腳本產生XML文件,并存儲查詢結果。
表現層包含擴展樣式表文件,取決于設備或訪問系統的瀏覽器,它能夠將中間文檔格式化轉成WML、HTML和VXML文件。具體的格式可以由檢查瀏覽器發出的HTTP請求來確定。此處可選的是,如HAWXY等第三程序可以充當代理,檢查用戶的連接設備或瀏覽器,并給其傳遞合適的信息。
用戶接口層以不同的瀏覽器或不同的連接設備為特征。當使用固定電話或移動電話時,應用系統在TTS服務器協助下將消息轉換成語音;當使用電話上網時,瀏覽器傳入WML文件;當使用Web瀏覽時,PC機傳入HTML文件,并可以選擇由CSS將其格式化。
本文提出的ICSA(Interactive Customer Service Agent)構架的處理流程如圖3下方所示。當客戶通過撥電話號碼或鍵入URL連接到應用系統時,Web服務器上索引文件被傳遞。在執行期間,客戶端或連接設備的頭部請求決定使用哪個XSL文件將選擇出的XML文件轉換成HTML表單、WML表單或Voice對話。在提交過程中,腳本查詢數據庫,并產生一個XML中間文檔,該XML文檔由一個XSL文件轉換,在Web瀏覽器下、將響應表現給客戶之前,可選用CSS文件將其格式化。
ICSA構架需要很少量的XML文件,需要與Web、WAP和Voice表現相關的獨立XSL文件,需要求執行轉換用的服務器端腳本或應用文件;并以其內容管理的簡易性提供健壯的Web應用。另外,ICSA使用XSL文件極易操作XML文件。為了增加新特征或擴展功能,該構架在伸縮性方面留有很大的空間。
圖4所示為用例圖,明確地指出回答ICSA查詢涉及的五個步驟。在問題提交過程中,代理程序過濾關鍵詞,查詢數據庫,為客戶列舉類似問題,從而讓客戶選擇出與其問題最為類似的問題,進而提交關鍵詞(稱為水平域排序的過程)。一個確認消息等待客戶發出,這要么通過客戶點擊超鏈接(即最為類似的問題)實現,要么通過語音響應[7]實現。然后再執行一個完全搜索(稱為垂直域排序),最后給出最適合的回答。如果在數據庫中不存在回答,將問題存儲起來需要由人響應。

圖4 應用程序的用例圖
所提出的構架的性能將基于它對使用大量的移動電話和模擬器的可訪問性。對人們而言,它的可用性也應考慮到。可訪問性指的是用戶使用URL從事Web和WAP瀏覽的能力和通過用移動電話、固定電話和軟件撥電話號碼語音上網的能力。它的可用性決定于在代理上是否有信息可獲取,以及它在檢索信息時是否有效。可用性要考慮的因素,包括每一段時間內日志(或向前)查詢和回答查詢的頻度。
本文提出的ICSA是一個以銷售商為中心的、與平臺無關的和基于五層模型的應用構架,有很大的伸縮性。它是使用XML的單一著作模式程序,并能通過支持XSLT服務器端的任何Web語言編寫程序代碼實現。其內容管理變得更容易,能夠像在模擬電話網上的DTMF應用或在基于取決于編碼的IP的電話網上的IVR應用一樣操作。實質上,對要求24/7/365通過前述三種通道提供其重要客戶服務的任何行業或公司,它都將有助于改進客戶關系管理(CRM)。
[1]ADEYEYE O M,ATAYERO A A.A multi-channel application framework for customer care services using bestfirst search technique[C].Proceedings of Third Generation(3G)GSM and Mobile Computing(3GSMc2007)–Intermational Conference and Workshop, Covenant University, Nigeria,2007.
[2]ATAYERO A A, OLUGBARA O O, AYO C K, et al.Design, developmentand deploymentofan automated speech-controlled customer care service system [C].Proceedings of the GSPx 2004-The International Embedded Solutions Event,Santa Clara, CA, 2004.
[3]CHANG S E.The design ofa secure and pervasive multimodal Web system[C].19th International Conference on Advanced Information Networking and Applications,2005,2:683-688.
[4]http://www.metc.pku.edu.cn/keie/courses//ucsweb2004-old/pdf/chapt04-1.pdf,2008-08.
[5] http://dev.mysql.com/doc/refman/5.0/en/fulltextsearch. html,2008-10.
[6]HONG O O.VoiceXML application development life cycle:Building usable voice user interface [EB/OL]. http://devresource.hp.com/drc/resources/vxusability/vx_devlifecycle.pdf,2008-5.
[7]庾錫昌,劉偉平,武晉,等.基于 VoiceXML的語音交互平臺的設計與實現[J].計算機工程與設計,2007,28(8).