王俊東,黃沛杰,林仙茂,徐禹洪,李凱茵
(華南農業大學 數學與信息學院,廣東 廣州 510642)
?
限定領域口語對話系統中超出領域話語的協處理方法
王俊東,黃沛杰,林仙茂,徐禹洪,李凱茵
(華南農業大學 數學與信息學院,廣東 廣州 510642)
領域外話語的開放性、口語化以及表達多樣性,使得現有的限定領域口語對話系統不能很好地處理超出領域話語。該文提出了一種限定領域口語對話系統協處理方案,基于人工智能標記語言AIML,設計一套理解開放語義用戶話語的理解模板,并對未匹配話語基于話語相似度進行理解模板分類,進而采用擴展有限狀態自動機處理模式,結合對話流程上下文的狀態及信息,實現理解模板到應答模板的轉換,改變了單純模板匹配方法在對話流程控制方面的相對缺失。中文手機導購領域的測試表明,該文所提出的協處理方法能有效地輔助口語對話系統完成限定領域完整對話流程,得到更好的用戶滿意度。
超出領域話語;協處理;AIML;有限狀態自動機;口語對話系統
口語對話系統(spoken dialogue system)指的是通過自然語言和人交流的計算機系統,主要研究如何能讓計算機理解并生成人們日常所使用的語言,對人向計算機提出的問題,通過對話的方式,用自然語言進行回答。研究對話系統的目的是讓人同計算機的交流更方便,讓計算機具有類似人類的思維從而幫助人們完成更多的工作,從這個角度看,能勝任某一專業領域工作的面向任務(task-oriented)的限定領域(restricted domain)對話系統[1-8],比開放領域(open domain),如面向聊天(chat-oriented)的對話系統[9-10]更有研究意義和應用價值[11]。然而,當使用自然語言對話時,即使用戶了解某對話系統的限定領域,例如: 醫療信息咨詢、導航或者導購,用戶在對話流程中仍然不可避免會使用一些超出領域(out-of-domain,OOD)話語(utterance),如問候、個人問題、表態等。事實上,OOD話語的現象很常見,如AT&T的“How may I help you”系統[2],以及BTaxeCT和Lucent Bell合作開發的“OASIS call-steering”系統[5],大約有20%的用戶問題是OOD的。盡管這些限定領域對話系統從完成任務角度上看只需要專注于自己預定義的業務功能,但是,如果能較為妥善地處理好OOD話語,而不僅僅是提示用戶話語超出領域,將會有效地提高用戶體驗[12]。
目前已有的限定領域對話系統,如導航系統[4, 8]、導游系統[7]和信息查詢系統[1-3, 5-6]等,基于語義和語法相結合的技術,并結合近年來逐漸成為熱點的意圖追蹤[13]和對話管理[14-16],能有效地理解和處理領域內語義的話語。然而,面對OOD話語的開放性、口語化以及表達多樣性,現有的限定領域口語對話系統在處理OOD話語時仍然存在一定困難。不少研究人員開始進行關于限定領域對話系統OOD話語問題的研究,例如,Lane等人[17]開發的機器輔助對話系統和Tür等人[18]開發的虛擬個人助理系統使用基于SVM(support vector machine)主題分類方法計算源話語在領域內各子領域的分類置信度,再使用置信度向量訓練一個線性判斷模型,并檢測源話語是否超出領域,若超出領域,系統可以提示用戶當前系統無法處理該任務并引導用戶回到領域可處理范圍。Celikyitmaz等人[19]也提出了使用LDA(latent dirichlet allocation)主題模型對多領域問題做主題聚類并檢測OOD情況。Reichel等人研究的汽車導航領域口語對話系統[8],將在多領域內切換過程中出現錯誤且不能被任何子領域接受的話語歸為OOD情況,并返回給用戶做領域選擇。但這些工作主要集中在OOD話語的檢測識別,并根據檢測結果簡單響應用戶,而缺少對OOD話語的有效處理方法。
面向聊天的開放領域對話系統,如國外的ELIZA[20]、PARRY[21]和ALICE[9, 22],國內的清華大學圖書館的“小圖”[23]、機器人小I[24]等,由于設計初衷就是開放領域,在覆蓋多領域的語料庫的支持下,一定程度上滿足了話語開放性、口語化和表達多樣性的要求。這些系統可以與用戶進行基于自然語言話語的交互,并已被廣泛應用到機器助理比如反恐支持平臺[25]、計算機輔助英語學習[26]和健康咨詢[27]等。然而,這些面向聊天的對話系統幾乎都是基于完全精確匹配或者很弱的模糊匹配的模板來搜索回答[28],并沒有真正地“理解”用戶的問題,并且難于掌控對話流程的系統狀態和信息。這類對話系統不能單獨應用到復雜任務的限定領域對話。此外,語料庫的構建是此類系統的瓶頸,盡管有一些關于語料庫自動建設[12, 29]、超出詞匯處理[10]等的研究,如Banchs[29]和Ameixa等人[12]分別采用電影劇本和電影字幕來構建語料庫,但其話語覆蓋程度仍然遠遠不足以應用于限定領域對話系統中OOD話語的處理。此外,單純模板匹配方法由于對話上下文及對話狀態方面的缺失,難以真正提高OOD話語回答的針對性。
本文提出一種限定領域口語對話系統中處理OOD話語的協處理方案,主要貢獻包括:
(1) 根據基于模板匹配方法適合開放語義、口語化話語以及表達多樣性的特點,基于人工智能標記語言AIML(artificial intelligence markup language)[30],設計一套用于理解OOD話語的理解模板,并采用基于話語相似度的分類方法,將未匹配話語分類到相應的理解模板,從某種程度上解決了語料庫一次性完備構建的困難。
(2) 采用擴展有限狀態自動機(extended finite-state machine,EFSM)處理模式,結合對話上下文信息及對話狀態,實現理解模板到應答模板的轉換,并給出不同應答模板相應的處理程序,改變了單純模板匹配方法在對話流程控制方面的相對缺失。
本文的方案被應用到我們開發的手機導購對話系統[31],應用測試結果表明,能有效地輔助系統完成限定領域對話流程,得到更好的用戶滿意度。本文后續部分安排如下:第二節簡要介紹協處理方案的系統框架及處理流程;第三節詳細介紹了協處理方案;第四節給出了測試驗證結果;最后,第五節總結了本文的工作并做了簡要的展望。
圖1是我們開發的限定領域口語對話系統的系統框架,目前應用于手機導購領域,加粗部分是本文提出的協處理方案。
在這個框架里,“主處理器”基于自然語言處理技術,完成攜帶領域語義信息的話語的處理。語義提取、語法分析等技術被應用于口語語言理解。活躍信息表象征著對話系統的“記憶”,目前保持了三種活躍信息,包括商品屬性值、對話的上下文以及已推薦商品列表。其中,商品屬性值是一般對話系統具有的對話語義框(dialogue frame)[32-33]中的槽信息(slot)。
而“協處理器”,顧名思義,就是主處理器的協處理機制,并不單獨完成導購服務,僅在主處理器中的OOD話語檢測模塊識別不到有效領域語義信息時接收主處理器傳來的用戶輸入話語,并協助完成該對話步驟。協處理方案包括一套有三個模塊的協處理機制和三個信息庫,其中,AIML語料庫支持對OOD話語到理解模板的映射,模板類別語料庫支持未匹配話語的理解模板分類,EFSM支持模式轉換。基于AIML和EFSM的協處理流程是:首先加載AIML語料庫到內存并初始化需要的數據,用戶話語進入話語理解模塊后匹配上AIML中的理解模板或者在未匹配時通過模板分類算法得到理解模板;接著通過模式轉換模塊,完成系統模式的轉換和理解模板到應答模板的映射,轉移條件中的上下文信息來自活躍信息表;最后是對應答模板進行分類處理,得到相應的應答并返回主處理。

圖1 限定領域口語對話系統的系統框架
3.1 基于AIML的話語理解模板
AIML[30]是經典聊天機器人ALICE[9, 22]所采用的一種XML的人工智能標記語言,定義了一整套具有特定含義的標簽。由包含
通過對AIML語料庫的回答模板()進行合理的歸類,有效降低語料庫建設的難度。相比于每個話語都有專門的回答,雖然在一定程度上降低了系統對用戶話語的理解的“準確”度,但并不會影響后續處理和應答。同時由于理解模板及后續介紹的模式轉換抓住了多樣化用戶話語的共性,具有一定通用性,也易于擴展到其他限定領域。目前理解模板分為四大類:閑聊、表態、導購和其他,每一大類又分為若干小類,如表1所示。如“閑聊”大類的“問候”小類對應的理解模板為{#閑聊#問候#直接模板},其中的“直接摸板”是可選的附加內容,用于在后續組織應答處理中提供更有針對性的回答。

表1 理解模板的分類與話語示例
值得注意的是,對于模板未覆蓋的話語,單純的AIML機制只能將其歸類為{#其他#其他#直接模板},并采用最模糊的回答,也即是AIML機制中典型的單獨通配符“*”[30],并選用一些通用的回答作為返回內容,例如,“沒聽懂,請換一個說法”。
3.2 基于話語相關度的話語理解模板分類
對于AIML未匹配的用戶話語,也即“其他”大類的“其他”小類,本文提出一種基于話語相關度的話語理解模板分類模型。該模型利用統計方法和VSM (vector space model)模型構造語料庫,然后以類別語料庫作為話語分類的知識庫進行分類。該模型增強了系統對大部分未被單純AIML機制良好處理的OOD用戶話語的理解。
3.2.1 類別語料庫的構建
類別語料庫是主題、主題特征詞及其權重的元組集合。因為構造涵蓋各個領域的通用類別語料庫工作量巨大,尤其在網絡時代,新的詞匯不斷出現,所以我們只對感興趣的領域類別建立類別語料庫,類別語料庫的類別與理解模板的小類一致,如“表態|猶豫”等。
設感興趣的原始話語集為US(c),其中,c為類別數,用傳統的詞袋表示法將話語U表示為VSM形式,由于分詞是整個話語表示的基礎,不同的分詞結果有差異,我們采用效果比較好的中國科學院計算技術研究所的ICTCLAS*http://ictclas.nlpir.org/分詞系統作為分詞標準。經過分詞處理和統計,話語U表示為U={(t1, pos1), (t2,pos2), …,(ti,posi), …, (tn,posn)},其中,ti是分詞后所得的詞元(詞或短語),posi是ti的詞性。類別語料庫特征詞提取算法的偽代碼如圖2所示。

圖2 類別語料庫特征詞提取算法偽代碼
算法第八步中的詞元的權值采用期望交叉熵計算得到式(1)。
(1)
由式(1)可知,當詞ti在類別語料庫中越分散(即出現的類別數越多),權值wi也會相應降低,說明該詞的辨識度不高;如果詞ti越集中,權值wi也會相應升高,表明該詞的辨識度高。
3.2.2 話語理解模板分類
首先根據用戶話語特征詞的語料權值和頻率計算話語的類別相似度矩陣,進而根據相似度矩陣來找出最高相似度的理解模板類別。話語相關度計算算法的偽代碼如圖3所示。

圖3 話語相關度計算算法偽代碼
經測試,本節提出的方法可以解決大部分的OOD話語分類問題。剩余的部分與各個類別的相似度都不高的話語,則繼續歸類為{#其他#其他#直接模板}。
3.3 基于EFSM的模式轉換
在有效識別到相應理解模板的基礎上,本文借鑒基于模式的對話模型[16]在對話狀態及信息控制上的優點,結合對話上下文信息及對話狀態,采用EFSM處理方法得到合適的應答策略,提高OOD話語的處理效果。
3.3.1 形式化模式轉換
我們采用擴展的FSM來描述協處理模式及其轉換,擴展包括狀態和條件兩方面。
(1) 狀態的擴展。在對話系統中,系統狀態通常伴隨著系統動作,因此,在傳統的FSM的狀態的基礎上,我們將系統狀態和動作放到一起并稱之為模式P。
(2) 條件的擴展。本文綜合了理解模板、系統事件和上下文信息作為模式轉換的條件。其中系統事件主要是系統內部的一些機制,指系統掌控對話過程所做的必要監聽事件,例如對用戶相同輸入的回合數計數事件等。系統會不斷監控對話處于協處理的回合數,如果回合數過多,就需要及時引導回主處理程序。上下文包括了上一系統狀態,以及歷史交互中的所有語義信息和用戶意圖追蹤的結果,還包括一些關鍵狀態信息,例如上下文中會記錄當前正談論的是哪款商品、哪個參數等。
協處理的模式轉換的形式化定義如下:
? 模式P
? 理解模板UT
? 系統事件E
? 上下文C
? 應答模板AT
? 輸入集I ∈ (UT ∪ E ∪ C)
? 輸出集O ∈AT
? 轉移函數T:P × I → P' × O
圖4是一個模式轉換圖例,提供執行模型和可理解的圖表達。目前只考慮“一跳”的模式轉移。圖4中陰影模式表示任意模式,也即是任意模式可以進入協處理。

圖4 模式轉換圖例
3.3.2 模式
傳統狀態機的狀態可用于描述系統當前所處階段的相關信息,本文提出的協處理模式提供了更完善的動作信息,下面給出其定義:
? 模式狀態(PS):系統接到用戶動作后所處的狀態。
? 模式動作(PA):系統狀態發生改變時的動作,本文將其定義為應答模板的形式。
表2是分析不同理解模板在不同條件下的可能狀態及動作得到的協處理模式。

表2 協處理模式
3.3.3 模式轉換例子
圖5給出一個在對話初始階段用戶問候進入協處理的例子,模式轉換條件中的上下文信息依據的是交互歷史中系統是否已有問候語義;圖6是用戶猶豫表態后進入協處理的例子,模式轉換條件中的上下文信息依據的是關鍵語義信息中有無談論手機以及談論的商品的數量。系統在任何狀態下接收到圖6中所示的條件后,隨即轉換到相應的協處理模式,在轉換到對應的狀態的同時,執行相應的動作,下一次的模式轉換是未知的,可能重新進入到協處理模式,也可能回到主處理中的模式,這需要看用戶的下一個輸入話語。

圖5 對話開始階段進入協處理的例子

圖6 用戶猶豫表態后進入協處理的例子
3.4 應答模板處理程序
本節以兩個代表例子簡要介紹應答模板的設計思想。
(1) “#主動引導#”的處理
當系統識別到應答模板為{#主動引導#應答句式}時,先在活躍信息表中根據優先級查找先前未提及的參數作為引導提問參數,然后將選出來的參數名稱記錄到活躍信息表中的“當前關聯參數”,同時將該參數填到應答模板中應答句式的相應位置。
(2) “#選擇差異參數#”的處理
差異參數是指多款手機的參數值存在一定程度的差異的參數信息,例如,兩款手機,一款屏幕尺寸4.0寸,另一款4.5寸,因此屏幕尺寸就是差異信息。而對于兩款手機,如果某個屬性只存在細微差異,如價格分別為1990元和2000元,則不認為價格是差異信息。
4.1 應用例子
本文的研究已應用到我們開發的中文手機導購系統。圖7是一個開發人員測試的例子。可以看到本文提出的協處理方案能有效地輔助對話系統完成限定領域完整對話流程,包括對第(2)、(10)、(14)和(18)句用戶話語的處理。其他用戶話語由于都攜帶領域語義信息,由主處理器處理。

圖7 中文手機導購系統的一個運行例子
其中,第(2)句用戶話語對應的理解模板為{#閑聊#問候#直接模板},結合圖5的模式狀態轉移,轉到應答模板{#主動引導#應答句式},進而協處理器根據主動引導處理算法,從活躍信息表中查詢當時用戶未提及且優先級最高的參數進行詢問引導,在這個運行實例中,該參數是“手機品牌”。對第(10)句用戶話語的理解模板為{#表態#猶豫#直接模板},由于上下文記錄系統正在談論的是多款手機,根據圖6的模式轉換,轉到應答模板{#選擇差異參數#應答句式},選擇出差異參數“屏幕尺寸”進行引導。對第(14)句的處理分別對應的是理解模板{#表態#否定#直接模板}和應答模板{#選擇其它手機#應答句式}。對第(18)句的處理分別對應的是理解模板{#閑聊#結束#直接模板}和應答模板{#返回并結束#返回內容}。
4.2 測試報告
我們在實現的中文手機導購對話系統中進行了測試。系統的測試人員是15名學生志愿者,每位測試者測試10段,共150段對話。這些測試人員只知道系統的功能是手機導購,對系統的實現細節并不知情,這樣可確保測試的真實性和自然性。為了提高測試的多樣性,在測試時規定了每人三段自由發揮,七段在給定的10個場景中挑選,例如,“老媽開始眼花了,想給她買個大屏的手機,5寸以上的”。
4.2.1 測試總體情況
測試的總體情況如表3所示。

表3 測試總體情況
150段對話的平均回合數為12.27,進入協處理的平均次數為2.75,占了22.4%,表明了協處理器存在的價值。從最大和最小的協處理次數分別是11和0也可以看出測試者的差異性很大,盡管都知道系統的功能是手機導購,有的測試者還是會說很多OOD話語,而有的則全部都是領域內話語。經過分析發現四大類中,閑聊、表態、導購、其他分別占了40.2%、30.1%、24.3%和5.4%。
4.2.2 評價標準和方案對比
超出領域話語處理不好通常帶來的是用戶體驗的下降,因此本文以用戶滿意率為度量標準。用戶不滿意的回答主要包括:答非所問和回答沒有針對性。主要引起不滿意的原因包括OOD話語檢測出錯、理解模板分類出錯、沒有考慮上下文對話環境、以及系統其它模塊出錯導致的上下文不正確或缺失等。
為了驗證本文提出的協處理方案,也即AIML、理解模板分類、EFSM三者相結合的方案。我們對比了另外兩個方案(baseline methods)。
(1) 方案1:單純AIML,采用該方案的對話系統只使用純AIML機制應對OOD話語。
(2) 方案2:采用AIML機制,并對未匹配話語,采用理解模板分類算法。
4.2.3 測試結果
本文提出的協處理方案以及兩個對比方案的處理滿意率如表4所示。

表4 各方案的處理滿意率對比
從表4可以看到,本文提出的協處理方案比只有理解模板(AIML+模板分類)的方案,以及面向聊天的對話系統常用的純AIML方案分別提高15.7%和32.2%的OOD話語處理滿意率。如果去除由于主處理傳遞過來的64處錯誤(主要包括OOD話語檢測錯誤、對話上下文缺失和候選屬性缺失),協處理的處理滿意度達到87%,表明了協處理器能有效地輔助對話系統完成限定領域完整對話流程。
4.2.4 不滿意OOD話語處理分析
用戶體驗不滿意的109個OOD話語應答的原因分類如表5所示。

表5 OOD話語處理不滿意分類
從表5可以看到,目前用戶不滿意的OOD話語處理有接近一半是由于理解模板分類錯誤造成的,進一步研究和完善未匹配模板分類的模板類別語料庫,可望提高分類算法的分類正確率,降低這類的不滿意處理比例。另外的一半屬于主處理帶來的錯誤,包括OOD話語檢測錯誤、對話上下文缺失和候選屬性缺失三類。其中OOD話語檢測錯誤可望在進一步完善主處理的OOD話語檢測(如進一步完善領域語義信息庫)后有效降低;候選屬性缺失經核查主要是由于部分手機的屬性值缺失造成,解決方法是進一步完善手機商品信息抓取模塊;而對話上下文缺失的錯誤原因相對比較復雜,需要深入分析主處理各模塊,使得某一(類)特定上下文的錯誤逐步改善。
本文基于AIML和EFSM,提出了一種限定領域口語對話系統的協處理方法。在中文手機導購領域的測試表明,本文的方案能有效地輔助對話系統完成限定領域完整對話流程。方案中采用理解模板的方式,實現了多種同類的用戶輸入歸入相同的理解模板,解決開放語義、口語化話語以及表達多樣性的問題;而對未匹配話語進行理解模板分類,則在一定程度上解決了理解模板覆蓋完整性的困難,并且隨著語料庫的增量訓練,分類性能還可以持續提高。另一方面,通過綜合理解模板、系統事件和上下文信息為條件的模式轉換,實現理解模板到應答模板的映射以及狀態的轉換,改變了單純依靠模板匹配方法在對話上下文控制方面的相對缺失。
未來工作一方面通過分析協處理測試出來的主處理錯誤,反饋至主處理器進行有針對性的系統完善,減少主處理帶給協處理的錯誤;另一方面是進行更大范圍的測試,根據測試結果進一步完善語料庫,包括直接匹配的AIML語料庫和模板類別語料庫,提高協處理器的適應性。
[1] Price P J. Evaluation of spoken language systems: the ATIS domain[C]//Proceedings of DARPA Workshop on Speech and Natural Language, Hidden Valley, PA, 1990.
[2] Gorin A, Riccardi G, Wright J. How may I help you?[J]. Speech Communication,1997, 23(1-2): 113-127.
[3] Zue V, Seneff S, Glass J, et al. JUPITER: a telephone-based conversational interface for weather information[J]. IEEE Transactions on Speech and Audio Processing, 2000, 8(1): 85-96.
[4] 黃寅飛, 鄭方, 燕鵬舉等. 校園導航系統EasyNav的設計與實現[J].中文信息學報, 2001, 15(4): 35-40.
[5] Durston P, Farrell M, Attwater D, et al. OASIS natural language call steering trial[C]//Proceedings of 7th European Conference on Speech Communication and Technology (Eurospeech 2011), 2001: 1323-1326.
[6] 張琳, 高峰, 郭榮等. 漢語股票實時行情查詢對話系統[J]. 計算機應用, 2004, 24(7): 61-63.
[7] Pappu A, Rudnicky A. The structure and generality of spoken route instructions[C]//Proceedings of the 13th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL 2012), 2012: 99-107.
[8] Reichel C S, Sohn J, Ehrlich U, et al. Out-of-domain spoken dialogs in the car: a WoZ study[C]//Proceedings of the 15th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL 2014), 2014: 12-21.
[9] Wallace R S. A.L.I.C.E. artificial intelligence foundation[EB/OL]. [2015-08-10]. http://www.alicebot.org.
[10] Banchs R E, Li H. IRIS: a chat-oriented dialogue system based on the vector space model[C]//Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics (ACL 2012), demo session.
[11] Mollá D, González J L V. Question answering in restricted domains: an overview[J]. Computational Linguistics, 2007, 33(1): 41-61
[12] Ameixa D, Coheur L, Fialho P, et al. Luke, I am your father: dealing with out-of-domain requests by using movies subtitles [J]. LNCS (LNAI), (8637): 13-21.
[13] Metallinou A, Bohus D, Williams J D. Discriminative state tracking for spoken dialog systems[C]//Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics (ACL 2013), 2013: 466-475.
[14] Xu W Q, Xu B, Huang T Y, et al. Bridging the gap between dialogue management and dialogue models[C]//Proceedings of the Third SIGdial Workshop on Discourse and Dialogue (SIGDIAL 2002), 2002: 201-210.
[15] 鄔曉鈞, 鄭方, 徐明星. 基于主題森林結構的對話管理模型[J]. 自動化學報, 2003,29(2):275-283.
[16] Peltason J, Wrede B. Pamini: a framework for assembling mixed-initiative human-robot interaction from generic interaction patterns[C]//Proceedings of the 11th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL 2010), 2010: 229-232.
[17] Lane I R, Kawahara T, Matsui T, et al. Out-of-domain utterance detection using classification confidences of multiple topics[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2007, 15(1):150-161.
[18] Tür G, Deoras A, Hakkani-Tür D. Detecting out-of-domain utterances addressed to a virtual personal assistant[C]//Proceedings of the 15th Annual Conference of the International Speech Communication Association (INTERSPEECH 2014), 2014: 283-287.
[19] Celikyitmaz A, Hakkani-Tür D, Tür G. Approximate inference for domain detection in spoken language understanding[C]//Proceedings of the 12th Annual Conference of the International Speech Communication Association (INTERSPEECH 2011), 2011: 1293-1296.
[20] Weizenbaum J. ELIZA-a computer program for the study of natural language communication between man and machine[J]. Communications of the ACM, 1966, 9(1):36-45.
[21] Colby K M, Weber S, Hilf F D. Artificial paranoia[J]. Artificial Intelligence, 1971, 2(1): 1-25.
[22] Schumaker R P, Chen H. Interaction analysis of the ALICE chatterbot: a two-study investigation of dialog and domain questioning[J]. IEEE Transactions on Systems, Man, and Cybernetics, Part A, 2010, 40(1): 40-51.
[23] 清華大學圖書館智能機器人小圖[EB/OL]. [2015-08-10]. http://166.111.120.164:8081/programd/.
[24] 小I機器人[EB/OL]. [2015-08-10]. http://www.xiaoi.com/index.html.
[25] Schumaker R P, Chen H. Leveraging question answer technology to address terrorism inquiry[J]. Decision Support Systems, 2007, 43(4): 1419-1430.
[26] Jia J Y. CSIEC: a computer assisted English learning chatbot based on textual knowledge and reasoning[J]. Knowledge-Based Systems, 2009, 22 (4): 249-255.
[27] Crutzen R, Peters G Y, Portugal S D, et al. An artificially intelligent chat agent that answers adolescents’ questions related to sex, drugs, and alcohol: an exploratory study[J]. Journal of Adolescent Health, 2011, 48(5):514-519.
[28] Huang J Z, Zhou M, Yang D. Extracting chatbot knowledge from online discussion forums[C]//Proceedings of the 20th International Joint Conference on Artificial Intelligence (IJCAI 2007), 2007: 423-428.
[29] Banchs R E. Movie-DiC: a movie dialogue corpus for research and development[C]//Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics (ACL 2012), 2012: 203-207.
[30] Wallace R S. The anatomy of A.L.I.C.E. [EB/OL]. [2015-08-10]. http://www.alicebot.org/anatomy.html.
[31] Huang P J, Lin X M, Lian Z Q, et al. Ch2R: a Chinese chatter robot for online shopping guide[C]//Proceedings of the 3rd CIPS-SIGHAN Joint Conference on Chinese Language Processing (CLP-2014), 2014: 26-34.
[32] 黃民烈, 朱小燕. 對話管理中基于槽特征有限狀態自動機的方法研究[J]. 計算機學報, 2004, 27 (08): 1092-1101.
[33] Chen Y N, Wang W Y, Rudnicky A. Unsupervised induction and filling of semantic slots for spoken dialogue systems using frame-semantic parsing[C]//Proceedings of the 2013 IEEE Workshop on Automatic Speech Recognition and Understanding (ASRU), 2013.
A Coprocessor for Out-of-Domain Utterances in Domain Specific Spoken Dialogue System
WANG Jundong, HUANG Peijie, LIN Xianmao, XU Yuhong, LI Kaiyin
(College of Mathematic and Informatics, South China Agricultural University, Guangzhou, Guangdong 510642, China)
The openness, colloquialism and diversity of out-of-domain (OOD) utterances make them difficult to the domain specific spoken dialogue system. This paper tackles this problem by proposing a coprocessor for domain specific dialogue system. Based on the artificial intelligence markup language(AIML), open semantic understanding templates are designed, and understanding template classification is used to address the unmatched OOD utterances. Then the extended finite state machine (EFSM) is adopted to transform the understanding template into answering template and realize the control of the state and information of the dialogue process. The application in mobile phone shopping guide domain shows that the proposed coprocessor can effectively help the Chinese dialogue system to finish the dialogue process and get better user experience.
out-of-domain utterance; coprocessor; AIML; FSM; spoken dialogue system

王俊東(1992—),碩士研究生,主要研究領域為自然語言處理。E-mail:jdwang@stu.scau.edu.cn黃沛杰(1980—),通信作者,博士,副教授,主要研究領域為人工智能、自然語言處理、口語對話系統。E-mail:pjhuang@scau.edu.cn林仙茂(1990—),本科,主要研究領域為口語對話系統。E-mail:xianmaulin@gmail.com
1003-0077(2015)05-0194-10
2015-08-16 定稿日期: 2015-09-21
國家自然科學基金(71472068);廣東省大學生創新訓練計劃項目(201410564290,201510564281)
TP391
A