孫偉博 張斌
【摘要】 ? ?人與計算機的交互系統是將機器視為認知對象的人與計算機的交互系統。電腦軟件、硬件技術和移動互聯網的高速發展,人類和機器之間的認知對話系統能夠有效地處理不準確的信息互動,并符合人類互動的自然習慣,得到了越來越多的關注。本文提出將人與機器之間的認知對話分為三個層次:物理層、管理層和應用層。相關技術包括通道技術、認知技術和知識管理技術。在其中,認知技術是一種新的交互式中間軟件技術,是由于移動實時交互的新需求而產生的。它的目標是提供人類認知交互的特征,這些認知互動可以與另一方進行深刻的理解、學習、誘導和適應,其中大部分包括信息不準確的理解技術、基于不確定性的推理技術、適應和進化技術,這篇文章詳細介紹了人類機器對話系統中認知技術的定置和具體概念,總結了相關技術領域的進展,并考慮了未來的關鍵研究方向。
【關鍵詞】 ? ?人機交互 ? ?認知技術范疇 ? ?對話系統 ? ?認知控制
引言
人與計算機相互交互(HCI,人機交互)是一種技術,研究自計算機出現以來人類和計算機設備之間的相互作用。它的目標是讓機器幫助人們高效、舒適和安全地完成任務。人類和計算機之間的互動是一種基本技術,它對信息時代的生產和生活產生了巨大的影響。美國在2000年實施的信息技術研究預算中,包括了“人機互動”、“軟件”、“網絡”和“人工計算”在內的四項核心研究[1]。Dialogue(對話)系統是人機交互技術的主要領域之一。, 這是一種計算機軟件和硬件系統,人類和機器之間的相互信息交換可以滿足人類的一些特殊和內在需求。大致來說, 交互系統包括圖形用戶界面(GUI)、虛擬現實交互等,所有人機交互系統。從狹義上講,對話系統尤其適用于執行類似人類的通信任務的計算機系統。它的目的是使人與機器之間的對話像人與人之間的對話一樣有效、快速和自然。這種交互式系統強調機器在執行任務、信息共享和環境感知方面的擬人化特征,并將其視為雙邊信息互動中的“認知對象”, 因此,“認知能力和相關技術”是這些系統的核心功能和特性。這篇文章討論了人類機器狹小對話系統中的認知技術。
一、基于任務型人機對話系統中的認知技術
從本體結構和業務邏輯的角度來看,對話系統可以分為領域任務類型和開放類型的信息互動。領域任務型系統針對特定領域的應用程序,明確定義業務語義單位、本體結構和目標用戶范疇,如查詢航班、視頻搜索、設備管理等。此類交互通常以特定的業務任務的執行為基礎。公開信息的交互不是針對某個領域或一個非常大的領域。交互目的不是商業目標,而是滿足用戶在其他方面的需求,例如,開放的問答解惑、聊天等,即便在某種程度上可以發揮人工智能的作用,但是因為它不致力于幫助人們解決真正的現實問題,它的實際范圍相對較小[2]。近年來移動終端的飛速發展使得人們越來越關注人和機器之間自然對話系統以及由此在學術和商業領域所產生的認知控制理論。這就是文章的重點。
1.1任務型對話系統認知技術范疇
現代的人機交互系統需要“控制層”,它將信道編碼和服務器部分的知識連接起來,起到管理和協調前端和后臺的作用。“控制層”的主要功能包括:從輸入代碼理解用戶的初衷,管理并控制對話框(對話框管理),并將初衷轉換為輸出代碼(信息生成)。是在傳統的人體與電腦的機械系統中,可以忽略控制層,因為用戶的意圖是由輸入工具精確定義的[4]。例如,當與圖形用戶界面交互時,點擊鼠標打開或關閉窗口,內部的知識管理會直接導入。但是,在自然的人與機器的對話系統中,因為機器需要能夠與人有效對話的認知主體,所以控制層是一個獨立的不可缺少的模塊,與此模塊相關的技術:“認知技術”[5]。認知技術的類別主要包括以下類別:
(1)非精確條件下的理解
不確定性(或不精確)是人機對話渠道的重要特征之一。語音識別本身有不可避免的錯誤,因為噪音干擾,對話人的口音說話速度等等。當出現多通道時,每一條通道都會受到干擾和不確定。在IO層中的編碼錯誤被傳送到語義分析級別,導致語義分析的不確定性[3]。另一方面,從認知的角度來看,人們用模糊的信息進行溝通很容易,因為這分發信息的速度大大增加了。信息傳輸和對話意圖不確定性,機器理解用戶的意圖已成為重要的認知技術類別之一[6]。與傳統的“語義理解”和“自然語言處理”不同的根本區別在于,不確定性屬于了研究領域。
(2)基于不確定性的推理及決策控制
人機對話系統的重要功能是有效的多回合互動。根據系統的運行狀態并執行特定的任務,如果理解用戶的意圖,特別是不確定的意圖理解、推理、決策反饋方法和反饋信息的情況下, 選擇反饋方法和反饋內容最有助于完成任務,這是認知技術另一個重要方面。交互戰略的核心是人機對話的閉環控制技術,由此賦予機器“推論和決策”的認知主觀特性。
(3)交互自適應及進化
學習和適應能力是認知對象的另一個重要特征。機器適應用戶輸入和輸出通道和控制層的適用技術是認知技術的第三類。在對話過程中,它不僅包括對用戶輸入和輸出特性的低級別適應,還包括對用戶行為的適應和互動的規律習慣的適應[4]。另一方面,認知控制技術除短期調整外還包括長期“進化”系統、用于研究新知識(語義元素等)和長期人類交互模式
1.2任務型對話系統的認知自然度
“自然交互”是任務型對話系統的目標,也是認知技術合理使用的結果。除了前述的自然語義交互方面的內容之外,任務型對話系統對其它方面的自然度要求也成為新的挑戰。情緒的檢測和傳達是人類自然交互中不可或缺的一環。情感計算已經發展多年,在情感分類和特征建模、情感識別、情感表達等方面都有了較大進展,將情感分析應用于任務型對話系統也得到了產業界的重視,呼叫中心中利用情感分析來獲取用戶滿意度也得到了應用。未來研究中,如何將情緒等非語義的自然交互信息全面引入任務型對話系統,是一個重要方向。這其中需要具體解決的重要問題包括:面向交互任務的情感、情境的量化分析感知及信息融合;情感的表達模型和高表現力的情感合成(主要是語音和圖像);引人情感因素的對話狀態空間定義及強化學習算法等。情感計算中的情感維度空間模型等提供了將情感特征量化的良好手段,將利于將情感信息引入POMDP框架。而在多模態交互條件下,結合文本、視頻、音頻進行聯合的情感分析將是未來實現情感計算與任務型對話系統結合的重要方法。目前在國內外所有任務型對話系統研究中,都有一個最基本的假設:人機交互的一個輪回必須是一個“句子”。但這種一問一答的方式與實際人類自由對話的方式相去甚遠。很多心理學文獻都明確指出人類的交互是漸進性的。而且以整旬為處理單位會使整個人機對話的時間變長,變得不自然,也會影響用戶,使他們對目標的注意力下降。更重要的是,以前的研究全部把輪回檢測看成與對話管理無關的獨立任務,并沒有嘗試去研究輪回檢測對整體任務型對話系統的性能影響。尤其在較大尺度和真實環境的任務型對話系統中,往往不是由于機器聽不懂用戶或者不知道如何反饋導致了對話失敗,而失敗往往來源于機器不知道何時對用戶反饋或者用戶不知道什么時候該對機器說話[5]。
這個現象意味著目前的任務型對話系統研究只關注“反饋什么”,卻缺失了另一個重要的交互研究課題:“何時反饋”,因此,基于自然輪回的任務型對話系統是認知技術未來研究的另一個重要課題。對此,一種可行的思路應是在對話管理器之外,引入新的“輪回管理器”,獨立地對輪回和時序問題進行研究。
1.3大規模真實世界任務型對話系統
雖然任務型對話系統已經在若干真實世界系統中得到過實現,但其系統都還是小規模或非真實的系統.例如卡內基梅隆大學的Spoken Dialogue Challenge中的公交信息查詢系統雖然是在匹茲堡市運行的真實系統,但其處理的任務僅僅是公交車的站點和時間信息,任務規模很小;而歐盟CLASSIC項目中的餐館查詢系統雖然涉及的數據信息較多任務規模較大,但相關系統的運行還是基于招募的測試者而非真實的用戶,這也使得對話策略的訓練和任務型對話系統的評估都受到了影響.認知技術至今仍然還沒有在大數據真實條件下得到完整的實踐驗證[6]。因此,在已有研究的基礎上,面向真實世界的大規模任務搭建并運行完整的任務型對話系統,并與傳統的機械式任務型對話系統對比是認知技術的實驗方向,也是應對前述各種挑戰的必要的實測平臺。
二、總結
任務型人機任務型對話系統是人機對話領域的熱門研究課題之一,鑒于任務型人機任務型對話系統在不同領域都存在著廣泛的應用價值,為了有效降低任務型人機任務型對話系統的開發周期和研發成本,提升任務型人機任務型對話系統開發的便利性,本文目標是認識了解任務型對話系統中的認知技術。
參 ?考 ?文 ?獻
[1]黃寅.任務型人機對話系統開發平臺研究[J].信息與電腦(理論版),2020,32(06):115-117.
[2]趙陽洋,王振宇,王佩,楊添,張睿,尹凱.任務型對話系統研究綜述[J].計算機學報,2020,43(10):1862-1896.
[3]齊玉碧. 任務型人機對話系統開發平臺的設計與實現[D].北京郵電大學,2019.
[4]陳健鵬,馬建輝,王怡君.基于多輪交互的人機對話系統綜述[J].南京信息工程大學學報(自然科學版),2019,11(03):256-268.
[5]孟張圓. 任務型人機對話系統的研究與實現[D].上海交通大學,2019.
[6]姜衡軍. 端到端人機口語對話系統設計與實現[D].北京郵電大學,2018.