于丹 閆曉宇 王艷秋 來關(guān)軍 肖鵬 王宇



摘? 要:基于Agent代理技術(shù)的對(duì)話機(jī)器人技術(shù)已經(jīng)廣泛地應(yīng)用于電子商務(wù)、在線教育和醫(yī)療服務(wù)等領(lǐng)域。不同領(lǐng)域?qū)υ挋C(jī)器人的功能既具有相似性,又具有差異性。本文首先介紹了對(duì)話機(jī)器人和機(jī)器人的區(qū)別與聯(lián)系,重點(diǎn)分析了功能性任務(wù)型對(duì)話機(jī)器人的發(fā)展、應(yīng)用和實(shí)現(xiàn)方式,探討了對(duì)話機(jī)器人功能實(shí)現(xiàn)的理論基礎(chǔ)和關(guān)鍵技術(shù)。在此基礎(chǔ)上系統(tǒng)地探討了教育領(lǐng)域中任務(wù)型機(jī)器人的設(shè)計(jì)思路、具體功能和對(duì)應(yīng)的技術(shù)框架等。
關(guān)鍵詞:任務(wù)型對(duì)話機(jī)器人;在線教育;智能導(dǎo)學(xué)
Abstract: Chatbot technology based on Agent technology has been widely used in many application fields such as e-commerce, online education and medical services. Functions of chatbot used in different fields have both similarities and differences. This paper first introduces the differences and connections between concepts of chatbots and robots, and then, analyzes the development, application and implementation of task-oriented chatbots. The theoretical basis and key technologies of realizing the functions of dialogue robot are discussed. After that, this paper describes the functions and corresponding technical framework of task-oriented chatbots in the field of education.
Keywords: task-oriented chatbots; online education; intelligent tutoring
1? ?引言(Introduction)
機(jī)器人對(duì)人類的發(fā)展起到了巨大的作用,可以幫助人類擺脫很多繁雜瑣碎的工作,將時(shí)間和精力轉(zhuǎn)移到一些更具有價(jià)值的事情上。隨著人工智能的發(fā)展,人與機(jī)器的交互也越來越多,機(jī)器可以通過多種模式的交互過程幫助人們完成一些任務(wù),其中人機(jī)對(duì)話系統(tǒng),也稱為“對(duì)話機(jī)器人”,是產(chǎn)業(yè)界最為關(guān)注的領(lǐng)域之一。這類機(jī)器人本質(zhì)上是Agent代理技術(shù),而不是指?jìng)鹘y(tǒng)意義上的實(shí)物機(jī)器人,如機(jī)器臂、機(jī)器狗或運(yùn)動(dòng)機(jī)器人等[1,2]。
人機(jī)對(duì)話系統(tǒng)主要解決人與機(jī)器的對(duì)話與交流問題,借助自然語言進(jìn)行信息的傳遞。人機(jī)對(duì)話系統(tǒng)的最終目標(biāo)是希望人與機(jī)器之間交流順暢、自然,達(dá)到類似于人與人之間的語言交互[3]。由于人與人之間最重要的交流方式是對(duì)話,因此研究對(duì)話系統(tǒng)意義深遠(yuǎn)。隨著人工智能理論和技術(shù)的飛躍發(fā)展和進(jìn)步,對(duì)話系統(tǒng)將不斷向前發(fā)展,潛力無限。人機(jī)對(duì)話系統(tǒng)的深入研究不僅是科學(xué)進(jìn)步的時(shí)代訴求,也是社會(huì)生產(chǎn)力變革時(shí)期的重要機(jī)遇。
完整的對(duì)話系統(tǒng)涉及豐富的多學(xué)科理論和技術(shù),如計(jì)算機(jī)科學(xué)技術(shù)中的語音技術(shù)、計(jì)算機(jī)視覺技術(shù)、自然語言處理、知識(shí)工程、認(rèn)知與推理,也包括心理科學(xué)和語言學(xué)中的各種理論[4-6]。人機(jī)對(duì)話機(jī)器人的研究與發(fā)展,尤其是對(duì)任務(wù)型對(duì)話機(jī)器人的探索,將有助于提升人機(jī)交互模式下的社會(huì)工作效率。隨著深度學(xué)習(xí)在各個(gè)領(lǐng)域的運(yùn)用,其近期更是表現(xiàn)出對(duì)自然語言處理的顯著效果,讓對(duì)話機(jī)器人的發(fā)展有了新的突破方式。隨著深度學(xué)習(xí)的相關(guān)技術(shù)不斷創(chuàng)新和發(fā)展,對(duì)話機(jī)器人的助力作用將越來越顯著[1,3]。
文章主要圍繞任務(wù)型機(jī)器人功能實(shí)現(xiàn)所涉及的理論基礎(chǔ)、實(shí)現(xiàn)流程和關(guān)鍵技術(shù)展開探討,在此基礎(chǔ)上系統(tǒng)地探討教育領(lǐng)域中任務(wù)型機(jī)器人的設(shè)計(jì)實(shí)現(xiàn)框架、具備的功能和關(guān)鍵技術(shù)方案等。
2? 相關(guān)研究和技術(shù)(Related research and technology)
2.1? ?任務(wù)型對(duì)話機(jī)器人
任務(wù)型對(duì)話機(jī)器人(Task-oriented Chatbot),也稱任務(wù)型對(duì)話系統(tǒng)或多輪對(duì)話系統(tǒng),本質(zhì)是一個(gè)為了滿足用戶某些具體需求(也就是任務(wù))而產(chǎn)生的多輪對(duì)話的人機(jī)交互系統(tǒng)。這個(gè)人機(jī)交互系統(tǒng)通過理解、澄清等方式來確定用戶意圖,繼而通過答復(fù)、調(diào)用API等方式滿足用戶的需求,達(dá)成任務(wù)。為了完成這些任務(wù),對(duì)話系統(tǒng)需要理解上下文信息并做出如澄清等行為,從而完成任務(wù)答復(fù),或調(diào)用其他相關(guān)程序等待下一步的動(dòng)作。系統(tǒng)利用各種各樣的任務(wù)來驅(qū)動(dòng)和實(shí)現(xiàn)多輪對(duì)話。任務(wù)型對(duì)話機(jī)器人通常在相對(duì)獨(dú)立封閉的專業(yè)領(lǐng)域中使用,該類機(jī)器人需要在對(duì)話過程中理解、澄清、生成對(duì)話。
與任務(wù)型對(duì)話機(jī)器人相對(duì),其他兩類機(jī)器人分別是閑聊型對(duì)話機(jī)器人(Chatbot)和問答型對(duì)話機(jī)器人(QAbot)[1,3]。閑聊型對(duì)話機(jī)器人主要與用戶進(jìn)行沒有邊界限定的閑聊,目標(biāo)是與用戶進(jìn)行有意義的、自然的多輪次對(duì)話,通過產(chǎn)生有趣、富有個(gè)性化的答復(fù)內(nèi)容,與用戶進(jìn)行互動(dòng)。相比于任務(wù)導(dǎo)向型對(duì)話機(jī)器人,閑聊型對(duì)話機(jī)器人主要以滿足用戶的情感需求為主,所涉及的問題或?qū)υ掝I(lǐng)域范圍更大,用戶意圖更模糊難識(shí)別,因此技術(shù)要求更高,實(shí)現(xiàn)的困難性更大。問答型對(duì)話機(jī)器人主要實(shí)現(xiàn)一問一答的對(duì)話形式,機(jī)器人對(duì)用戶提出的問題進(jìn)行解析,在知識(shí)庫已有的內(nèi)容中查找并返回正確答案。對(duì)于機(jī)器人而言,每次問答均是獨(dú)立的,與上下文信息無關(guān)。這類機(jī)器人主要是在購物等服務(wù)領(lǐng)域被廣泛使用。
當(dāng)然,一個(gè)對(duì)話機(jī)器人并非只包含一種類型的對(duì)話,通常是多種對(duì)話類型的組合。多輪對(duì)話的本質(zhì)是圍繞用戶意圖進(jìn)行的,對(duì)于任務(wù)型對(duì)話系統(tǒng)的設(shè)計(jì),則需要考慮意圖跳轉(zhuǎn)、多意圖任務(wù)、指代識(shí)別、槽位繼承等多種復(fù)雜的對(duì)話策略。
對(duì)于對(duì)話機(jī)器人來說,最核心的能力就是準(zhǔn)確“感知”與正確“決策”。其中感知就是對(duì)問題的理解和邏輯推理,而決策就是根據(jù)對(duì)問題的感知進(jìn)行的對(duì)話策略。用戶提出的問題主要包括三種類型:事實(shí)型問題、計(jì)算型問題和邏輯推理型問題。任務(wù)型對(duì)話機(jī)器人的評(píng)價(jià)關(guān)鍵是幫助用戶獲取相關(guān)信息和輔助決策的能力,背后的基礎(chǔ)是以知識(shí)庫為基礎(chǔ)資源的問答系統(tǒng)。
2.2? ?任務(wù)型對(duì)話機(jī)器人的實(shí)現(xiàn)方式
構(gòu)建任務(wù)型對(duì)話機(jī)器人有兩種實(shí)現(xiàn)方式,分別為流水線方式Pipeline(也被稱為基于規(guī)則的實(shí)現(xiàn)方式)和端對(duì)端方式End-to-end[4,7-9]。
(1)流水線方式
基于規(guī)則的方式一般采用流程和模塊化的結(jié)構(gòu),核心模塊主要包括四個(gè)模塊,分別為自然語言理解、對(duì)話狀態(tài)追蹤、對(duì)話策略學(xué)習(xí)和自然語言生成。基于規(guī)則的構(gòu)建方式雖然容易實(shí)現(xiàn)、可解釋性強(qiáng),但各模塊之間相互獨(dú)立,不能靈活地進(jìn)行聯(lián)合調(diào)優(yōu),誤差會(huì)逐層積累。隨著選取的交互方式的不同,如僅基于文本自然語言對(duì)話系統(tǒng)、基于語音對(duì)話系統(tǒng),或基于視頻語音融合,模塊和實(shí)現(xiàn)流程會(huì)有所變化或增減,如圖1所示。圖1給出了基于圖像、語音和文字等多模態(tài)數(shù)據(jù)的對(duì)話系統(tǒng)流程樣例。
表1歸納了不同對(duì)話系統(tǒng)的模塊構(gòu)成,基于文本的對(duì)話系統(tǒng)僅包括四個(gè)模塊,隨著互動(dòng)信息類型的增加,即隨著語音或視頻的加入,對(duì)話系統(tǒng)變得更加復(fù)雜和多元化。
(2)端對(duì)端方式
任務(wù)型對(duì)話機(jī)器人的另外一個(gè)實(shí)現(xiàn)方式是“端對(duì)端”的實(shí)現(xiàn)方法,即基于深度學(xué)習(xí)的端到端模式,通過構(gòu)建一個(gè)從用戶端自然語言輸入到機(jī)器端自然語言輸出的整體映射關(guān)系,實(shí)現(xiàn)原始數(shù)據(jù)在輸入端進(jìn)入模型,在輸出端得到結(jié)果的目標(biāo)。這種方法的優(yōu)點(diǎn)是擴(kuò)展性強(qiáng)和靈活性高,缺點(diǎn)是需要高質(zhì)量地標(biāo)注數(shù)據(jù)且對(duì)數(shù)據(jù)的數(shù)量要求很高,可解釋性也較差,因此使用的程度遠(yuǎn)遠(yuǎn)不及流水線方式。現(xiàn)在的方式更多是兩種方式的融合,在流水線模式中融入很多子模塊的“端對(duì)端”模式。
2.3? ?教育領(lǐng)域中的對(duì)話機(jī)器人
由于教育領(lǐng)域中存在大量與學(xué)習(xí)相關(guān)的問答和查詢需求,相比于其他應(yīng)用場(chǎng)景,對(duì)話機(jī)器人在教學(xué)領(lǐng)域的發(fā)展更廣泛,應(yīng)用場(chǎng)景也更多,不僅可以通過語音進(jìn)行交互,也可以僅僅通過文字之間的交互起到輔助教學(xué)、及時(shí)回答問題、引導(dǎo)學(xué)習(xí)的作用。
現(xiàn)階段教育領(lǐng)域的任務(wù)型對(duì)話機(jī)器人最熱門的研究和應(yīng)用就是在線教育的智能導(dǎo)學(xué)系統(tǒng),它的雛形是20世紀(jì)中期出現(xiàn)的計(jì)算機(jī)輔助教學(xué)系統(tǒng)。隨著人工智能技術(shù)的發(fā)展和其在教育領(lǐng)域的深入應(yīng)用,到20世紀(jì)末期發(fā)展成為具有認(rèn)知能力的智能教學(xué)系統(tǒng)。當(dāng)前的智能導(dǎo)學(xué)以實(shí)現(xiàn)個(gè)性化教學(xué)為主要目標(biāo),并在人工智能技術(shù)的推動(dòng)下逐步完善。
國外智能導(dǎo)學(xué)的理論和應(yīng)用研究起步較早。1973年,美國的Hartley和Sleeman教授等人提出了三模型結(jié)構(gòu),核心組件包括領(lǐng)域知識(shí)模型、學(xué)習(xí)者模型和教學(xué)模型。馬薩諸塞大學(xué)安姆斯特分校Woolf教授2018年又拓展出了人機(jī)接口模型,甚至還有專家將其發(fā)展到了五模型結(jié)構(gòu)。與此同時(shí),國外還開發(fā)了很多有影響力的應(yīng)用產(chǎn)品,比如Meta Tutor、Protus、Andes和SimStuden等。
國內(nèi)智能導(dǎo)學(xué)的研究主要集中在學(xué)生模型、知識(shí)表示、人機(jī)交互等方面,即從學(xué)習(xí)中具體問題的解決出發(fā)來探討相關(guān)智能導(dǎo)學(xué)的實(shí)現(xiàn)方案,如對(duì)學(xué)生學(xué)習(xí)狀態(tài)模型構(gòu)建的研究、知識(shí)表示和知識(shí)庫構(gòu)建、基于不同軟硬件下的人機(jī)交互等。有研究者基于深度學(xué)習(xí)技術(shù)、Agent技術(shù)和大數(shù)據(jù)技術(shù),已經(jīng)研發(fā)出了一些智能導(dǎo)學(xué)產(chǎn)品,具有代表性的有基于Web的日語導(dǎo)學(xué)系統(tǒng)、句酷批改網(wǎng)、Z+Z智能教學(xué)系統(tǒng)等。這些模型和系統(tǒng)普遍存在的問題是導(dǎo)學(xué)的個(gè)性化和智能化程度不高。
隨著學(xué)習(xí)理論和科學(xué)技術(shù)的發(fā)展,智能教學(xué)系統(tǒng)的教學(xué)模式從一對(duì)一擴(kuò)展到了一對(duì)多、多對(duì)一,甚至多對(duì)多的形式,其適應(yīng)范圍從學(xué)習(xí)者的認(rèn)知性方面擴(kuò)充到了情緒性和社會(huì)性方面。美國孟菲斯大學(xué)Graesser教授主持研發(fā)了智能導(dǎo)學(xué)系統(tǒng)AutoTutor,并以此為基礎(chǔ)開發(fā)了一系列學(xué)習(xí)領(lǐng)域包括計(jì)算機(jī)素養(yǎng)、科學(xué)推理等應(yīng)用系統(tǒng)。胡祥恩2018年還提出了一種人工智能教育應(yīng)用的新理論框架:學(xué)習(xí)者與教育資源對(duì)稱性假設(shè),即學(xué)習(xí)者能夠在與教育資源(教學(xué)內(nèi)容、學(xué)習(xí)環(huán)境、互動(dòng)機(jī)制和學(xué)習(xí)過程)的互動(dòng)中實(shí)現(xiàn)知識(shí)結(jié)構(gòu)的最優(yōu)化,同時(shí)教育資源也能夠在這一互動(dòng)中得以改進(jìn)。除此之外,美國Boulder語言科技公司Ronald教授正主持開發(fā)Interactive Books和MindStar Book,專門針對(duì)解決非英語母語國家的英語教學(xué)智能導(dǎo)學(xué)問題。美國陸軍實(shí)驗(yàn)室的Sottilare博士研究通用智能輔導(dǎo)框架,它是一個(gè)開源原型,在美歐國家有近30個(gè)機(jī)構(gòu)參與GIFT的研究合作。從事相關(guān)研究的主要機(jī)構(gòu)如表2所示。
3.1? ?教育對(duì)話機(jī)器人系統(tǒng)功能設(shè)計(jì)
在線教育學(xué)習(xí)過程中,學(xué)生會(huì)遇到很多問題,如學(xué)習(xí)環(huán)境沒有互動(dòng)、沒有反饋(難以感知自己的狀態(tài))、不滿足個(gè)性化、趣味性低、沒有競(jìng)爭激勵(lì)等。對(duì)于教師來說,在線教育時(shí)常遇到難以感知學(xué)習(xí)者學(xué)習(xí)狀態(tài)、評(píng)價(jià)學(xué)生困難、資料管理耗時(shí)耗力、在線教學(xué)組織困難、難以發(fā)現(xiàn)教學(xué)存在的盲點(diǎn)、不能因材施教等多類問題。對(duì)于管理者來說,需要實(shí)時(shí)感知在線教育的質(zhì)量,實(shí)施對(duì)在線教學(xué)進(jìn)行綜合評(píng)價(jià)、監(jiān)督教學(xué)效果、發(fā)現(xiàn)教學(xué)管理中存在的問題等操作。
用對(duì)話機(jī)器人的方式,可以非常直接和顯著地幫助學(xué)生、教師和管理者提升在線教育的效率。具體來說,對(duì)于不同用戶,由于需求不同應(yīng)該有對(duì)應(yīng)匹配的機(jī)器人,而不是由同一類機(jī)器人實(shí)現(xiàn)。為了解決學(xué)生、教師和管理者在線學(xué)習(xí)中所遇到問題,本文在表3中歸納了三類教育對(duì)話機(jī)器人需要解決的問題和匹配功能。
這三類對(duì)話系統(tǒng)既相互獨(dú)立,又緊密相關(guān),本質(zhì)上是一種能夠賦能在線教育的輔助教學(xué)對(duì)話系統(tǒng),本文將三類機(jī)器人統(tǒng)稱為“教育對(duì)話機(jī)器人”。教育對(duì)話機(jī)器人可以實(shí)時(shí)感知在線學(xué)習(xí)行為(如學(xué)習(xí)內(nèi)容、學(xué)習(xí)時(shí)長、學(xué)習(xí)頻率、團(tuán)隊(duì)學(xué)習(xí)的參與程度等),并實(shí)時(shí)反饋到大數(shù)據(jù)平臺(tái)進(jìn)行學(xué)習(xí)行為分析和知識(shí)掌握程度分析。這一系統(tǒng)可以被植入任何一個(gè)開發(fā)系統(tǒng)中。
針對(duì)不同的用戶(學(xué)生、教師、教學(xué)管理者),教育對(duì)話機(jī)器人會(huì)扮演不同的身份,不同身份的機(jī)器人具有不同的功能,如圖2所示。
(1)伴讀機(jī)器人的功能
伴讀機(jī)器人為學(xué)生服務(wù),主要提供知識(shí)問答、學(xué)習(xí)方案推薦等服務(wù),實(shí)時(shí)向?qū)W生反饋學(xué)習(xí)過程中存在的問題,并提供個(gè)性化推薦。伴讀機(jī)器人將及時(shí)向?qū)W生反饋課程完成狀態(tài)、成績等信息,也會(huì)將學(xué)生個(gè)人知識(shí)掌握情況與全局知識(shí)圖譜融合,形成個(gè)性化的個(gè)人知識(shí)樹,及時(shí)將學(xué)習(xí)狀態(tài)反饋給學(xué)生。伴讀機(jī)器人為學(xué)生提供學(xué)習(xí)全程的個(gè)性化智能導(dǎo)學(xué)服務(wù),可以發(fā)現(xiàn)學(xué)生自己不知道的學(xué)習(xí)“盲點(diǎn)”,根據(jù)每個(gè)人的學(xué)習(xí)狀態(tài)定制個(gè)性化學(xué)習(xí)路徑,讓學(xué)生看到自己的學(xué)習(xí)路徑,也能看到他人的學(xué)習(xí)路徑。例如,學(xué)生在學(xué)習(xí)完P(guān)CA(主成分分析)算法后,不清楚下一步應(yīng)該再學(xué)習(xí)什么,伴讀機(jī)器人就會(huì)根據(jù)學(xué)生的過去學(xué)習(xí)成績、學(xué)習(xí)內(nèi)容和學(xué)習(xí)狀態(tài),給出幾個(gè)建議的學(xué)習(xí)路徑計(jì)劃,如其他同學(xué)的常用學(xué)習(xí)路徑、適合他的最優(yōu)路徑或最短路徑等,供學(xué)生選擇。
群體學(xué)習(xí)時(shí),伴讀機(jī)器人會(huì)及時(shí)反饋小組學(xué)習(xí)進(jìn)度、個(gè)人學(xué)習(xí)狀態(tài)、對(duì)小組的貢獻(xiàn)率等群體學(xué)習(xí)信息。
學(xué)生可以利用伴讀機(jī)器人及時(shí)查詢學(xué)習(xí)過程中不會(huì)的知識(shí)點(diǎn),通過點(diǎn)擊知識(shí)圖譜中的盲點(diǎn),直接開始學(xué)習(xí)。如學(xué)生在學(xué)習(xí)支持向量機(jī)(Support Vector Machine,SVM)時(shí)遇到一個(gè)不熟悉的概念“損失函數(shù)”,可以直接向伴讀機(jī)器人提問“什么是損失函數(shù)”,伴讀機(jī)器人立即回答出對(duì)應(yīng)的答案;點(diǎn)擊對(duì)應(yīng)的盲點(diǎn)知識(shí),系統(tǒng)就會(huì)展現(xiàn)與盲點(diǎn)相關(guān)的知識(shí)和對(duì)應(yīng)的學(xué)習(xí)資源等。
伴讀機(jī)器人智能化還體現(xiàn)在可以將具有相似問題的學(xué)生自動(dòng)組建“學(xué)習(xí)小組”,并從優(yōu)秀的學(xué)生中選出“助教”,構(gòu)建學(xué)生群體學(xué)習(xí)社區(qū),形成互幫互助的社群,促進(jìn)學(xué)習(xí)氛圍的良性循環(huán)。成績優(yōu)秀的學(xué)生可以直接在社區(qū)里建立學(xué)習(xí)小組,單獨(dú)為學(xué)習(xí)效果不好的學(xué)生補(bǔ)課。
(2)助教機(jī)器人的功能
助教機(jī)器人的服務(wù)對(duì)象是教師,它能夠協(xié)助教師完成教學(xué)資源的構(gòu)建,并在教學(xué)過程中及時(shí)向教師反饋學(xué)生的異常學(xué)習(xí)行為。教師可以通過助教機(jī)器人快速地構(gòu)建和修改知識(shí)圖譜,實(shí)時(shí)了解每個(gè)學(xué)生的學(xué)習(xí)進(jìn)度和知識(shí)掌握情況;可以從數(shù)據(jù)中發(fā)現(xiàn)教學(xué)中可能存在的漏洞,有針對(duì)性地優(yōu)化教學(xué)內(nèi)容。助教機(jī)器人可以自動(dòng)回復(fù)學(xué)生的常見問題,在提高學(xué)生學(xué)習(xí)效率的同時(shí)又減少了教師的工作時(shí)間。
(3)質(zhì)保機(jī)器人的功能
質(zhì)保機(jī)器人主要為教學(xué)管理者服務(wù),能夠提供多維度、多層級(jí)的綜合評(píng)估報(bào)告。質(zhì)保機(jī)器人可以提供實(shí)時(shí)、多維度智慧綜合評(píng)價(jià),能夠同時(shí)向?qū)W生、教師、教務(wù)管理人員提供學(xué)習(xí)行為大數(shù)據(jù)分析服務(wù),反饋學(xué)習(xí)態(tài)度、學(xué)習(xí)進(jìn)度、學(xué)習(xí)排名,從學(xué)校、學(xué)科等多個(gè)維度整體評(píng)價(jià)教師和教學(xué)單位的建設(shè)水平,通過大數(shù)據(jù)挖掘出可能存在的教學(xué)管理問題,輔助教學(xué)管理者制定教學(xué)改革方案。
通過整合為學(xué)生實(shí)時(shí)提供幫助的伴讀機(jī)器人、為教師實(shí)時(shí)提供幫助的助教機(jī)器人和為學(xué)校管理者實(shí)時(shí)提供幫助的質(zhì)保機(jī)器人,可以構(gòu)建完整的智慧在線教育生態(tài)系統(tǒng),極大地提高在線教育的效率。
3.2? ?教育對(duì)話機(jī)器人的算法流程設(shè)計(jì)
以上三類對(duì)話系統(tǒng)都依賴于大量的人工智能算法。對(duì)話機(jī)器人的算法流程(圖3)中,意圖分析、情緒分析等自然語言理解等方法能夠抽取出用戶所提問題的關(guān)鍵信息,基于這些關(guān)鍵信息可以完成對(duì)話狀態(tài)追蹤并選取合適的對(duì)話策略,實(shí)現(xiàn)上下文信息的融合。之后,根據(jù)問題的意圖,機(jī)器人會(huì)從數(shù)據(jù)庫中查詢回答問題所必需的信息,通過自然語言生成方法得到通順的回復(fù)句。此外,當(dāng)用戶向機(jī)器人尋求推薦或想查詢?cè)u(píng)估報(bào)告時(shí),對(duì)話機(jī)器人還可以與推薦系統(tǒng)和學(xué)習(xí)行為大數(shù)據(jù)分析算法聯(lián)動(dòng),給出用戶期望的回答。
3.3? ?跨模態(tài)語義融合理解及對(duì)話機(jī)器人的技術(shù)實(shí)現(xiàn)方案
對(duì)話系統(tǒng)使用最廣泛的方法為BERT(Bidirectional Encoder Representation from Transformers)、Bi-LSTM(Bidirectional Long-Short Term Memory)和注意力機(jī)制。由于在線教學(xué)場(chǎng)景人機(jī)互動(dòng)涉及多種類型的數(shù)據(jù),如文本、語音、表情、動(dòng)作等,對(duì)話系統(tǒng)的實(shí)現(xiàn)必須要完成多模態(tài)語義融合理解后才能制定合理的對(duì)話策略。此外對(duì)話系統(tǒng)的內(nèi)容自動(dòng)生成,常常依賴于各個(gè)學(xué)科的領(lǐng)域知識(shí)圖譜和智能模糊查詢等技術(shù)。
對(duì)話系統(tǒng)的自適應(yīng)性是系統(tǒng)被廣泛使用的前提和基礎(chǔ)。通過構(gòu)建深度網(wǎng)絡(luò)模型,用樣本完成網(wǎng)絡(luò)訓(xùn)練。感知學(xué)習(xí)者的多模態(tài)信息通過技術(shù)模型的嵌入層(Embedding)實(shí)現(xiàn)多模態(tài)數(shù)據(jù)對(duì)齊與融合輸入,再利用設(shè)計(jì)的跨模態(tài)BERT網(wǎng)絡(luò)對(duì)多模態(tài)數(shù)據(jù)進(jìn)行雙向編碼表達(dá),利用Bi-LSTM實(shí)現(xiàn)對(duì)上下文相關(guān)的語義編碼,然后再利用Self-attention網(wǎng)絡(luò)對(duì)多模態(tài)特征進(jìn)行自動(dòng)加強(qiáng)處理,最后通過Softmax處理輸出感知到的學(xué)習(xí)者跨模態(tài)特征。以基于深度網(wǎng)絡(luò)輸出的多模態(tài)融合語義特征為基礎(chǔ),通過一個(gè)預(yù)先訓(xùn)練好的淺層全連接神經(jīng)網(wǎng)絡(luò),來實(shí)現(xiàn)對(duì)學(xué)科知識(shí)圖譜的智能模糊查詢,利用網(wǎng)絡(luò)輸出解決人機(jī)互動(dòng)中應(yīng)答內(nèi)容的自動(dòng)生成技術(shù),如圖4所示。
4? ?結(jié)論(Conclusion)
顯而易見,隨著人工智能技術(shù)的不斷改進(jìn)和提升,人機(jī)互動(dòng)的對(duì)話系統(tǒng)對(duì)人類社會(huì)發(fā)展的推動(dòng)作用會(huì)更加顯著。由于人機(jī)互動(dòng)對(duì)話系統(tǒng)對(duì)在線教育的發(fā)展起到了顯著的助推作用,與其他領(lǐng)域相比,教育領(lǐng)域中的對(duì)話機(jī)器人系統(tǒng)將會(huì)以更加迅猛的速度發(fā)展。
任務(wù)型對(duì)話機(jī)器人的未來發(fā)展將會(huì)與人工智能、大數(shù)據(jù)深度融合,在人工智能+大數(shù)據(jù)的有力推動(dòng)下,向混合智能、個(gè)性化情感關(guān)懷和虛擬化方向發(fā)展。自動(dòng)生成知識(shí)庫、減少知識(shí)庫運(yùn)維的成本、對(duì)話系統(tǒng)的自學(xué)習(xí)性實(shí)現(xiàn)、自適應(yīng)性改進(jìn)、定制復(fù)雜的對(duì)話機(jī)器人將成為對(duì)話系統(tǒng)的研發(fā)重點(diǎn)。
本文提出的教育領(lǐng)域中的任務(wù)型對(duì)話機(jī)器人系統(tǒng)既可以獨(dú)立地作為智慧學(xué)習(xí)平臺(tái),用于在線教育使用,也可以嵌入其他已有的在線教育平臺(tái),用于其他教育平臺(tái)的改造和升級(jí),帶動(dòng)其他在線教育平臺(tái)提升教學(xué)效果。這樣的對(duì)話系統(tǒng)可以讓教師準(zhǔn)備資源、考核學(xué)生和師生互動(dòng)變得簡單實(shí)時(shí),讓管理者評(píng)價(jià)教學(xué)質(zhì)量變得容易,讓學(xué)習(xí)和教育變得智慧化。
參考文獻(xiàn)(References)
[1] 王浩暢,李斌.聊天機(jī)器人系統(tǒng)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用與軟件,2018,35(12):1-6.
[2] 趙陽洋,王振宇,王佩,等.任務(wù)型對(duì)話系統(tǒng)研究綜述[J].計(jì)算機(jī)學(xué)報(bào),2020,43(10):1862-1896.
[3] 楊曉珍.任務(wù)型對(duì)話系統(tǒng)[D].武漢:華中師范大學(xué),2019.
[4] 王堃,林民,李艷玲.端到端對(duì)話系統(tǒng)意圖語義槽聯(lián)合識(shí)別研究綜述[J].計(jì)算機(jī)工程與應(yīng)用,2020,56(14):14-25.
[5] 吳雅婷.基于多任務(wù)學(xué)習(xí)和知識(shí)圖譜的對(duì)話技術(shù)研究[D].廈門:華僑大學(xué),2020.
[6] 侯佳騰,常薇,林冠峰.基于自然語言理解技術(shù)的智能客服機(jī)器人的設(shè)計(jì)與實(shí)現(xiàn)[J].電子技術(shù)與軟件工程,2019(23):238-240.
[7] Hafezi Manshadi, Mohammad. Dealing with quantifier scope ambiguity in natural language understanding[D]. Rochester: University of Rochester, 2014.
[8] 夏艷輝,聶百勝,胡金鳳.中文開放域問答系統(tǒng)的問題分類研究[J].價(jià)值工程,2019,38(016):147-149.
[9] 侯沐瀾.面向自然語言理解的新槽值問題研究與應(yīng)用[D].北京:北京郵電大學(xué),2019.
作者簡介:
于? ?丹(1976-),女,博士,研究員.研究領(lǐng)域:數(shù)據(jù)分析與挖掘,人工智能.
閆曉宇(1995-),女,碩士,初級(jí)研究員.研究領(lǐng)域:自然語言處理,對(duì)話系統(tǒng).
王艷秋(1993-),女,碩士,初級(jí)研究員.研究領(lǐng)域:人工智能,數(shù)據(jù)挖掘.
來關(guān)軍(1984-),男,碩士,中級(jí)研究員.研究領(lǐng)域:大數(shù)據(jù)分析,人工智能.
肖? ?鵬(1993-),男,碩士,初級(jí)研究員.研究領(lǐng)域:計(jì)算機(jī)視覺,自然語言處理.
王? ?宇(1994-),男,碩士,初級(jí)研究員.研究領(lǐng)域:自然語言處理,人工智能.