摘 要:人工智能技術在高校的應用場景越來越多,其中,語音識別和智能問答技術的實現,使得計算機可以與人類通過自然語言的方式進行交流。微信公眾平臺具有大量用戶和信息獲取的便捷性,奠定了微信公眾平臺最佳且可靠的載體地位。文章基于微信公眾號對智能語音問答系統進行研究。
關鍵詞:智能問答;人工智能;語音識別;微信公眾平臺;知識庫
1 高校建設智能語音問答系統的必要性
通過大量的需求調研發現:首先,高校內事務缺乏明確的辦事流程,遇到問題不知道該找誰、需要什么材料、怎么辦理;其次,學校有很多辦事指南,但是不規范,也不知道如何整理維護,辦事指南缺乏高效的觸達通道,如何實現讓師生便捷獲取是需要解決的問題。校園的各類信息不統一,唯一獲取信息的方法是到不同的地方、登錄不同的系統進行相應的操作。即便通過多媒體數字終端查詢,也存在著操作復雜、功能不全、使用率不高等問題。
人工智能技術在高校的應用場景越來越多,其中,語音識別和智能問答技術的實現,使得計算機可以與人類通過自然語言的方式進行交流。不僅如此,微信公眾平臺具有大量用戶和信息獲取的便捷性,奠定了微信公眾平臺最佳且可靠的載體地位。高校建設智能語音問答系統,不但為師生提供方便、快捷的校內資訊和信息咨詢服務,而且從管理者的角度出發,還包含了更深層次的含義:(1)有利于統計和收集師生提出的各類問題,掌握師生目前的需求和所關心的問題,從而為師生提供更優質的服務。同時師生的需求和所關心的問題也能為學校的決策規劃、政策制度的制定提供依據和參考。(2)有利于促進高校信息管理模式的變化,使得信息管理從松散型模式逐步轉向集約型模式。智能語音問答系統必須有豐富的知識庫作為儲備,才能提供快速、精準的查詢。目前知識是松散分布在各個平臺中的,通過建設智能語音問答系統搭建知識倉庫,有助于將松散的知識都集中起來進行高效且統一的管理。
本文依托南京城市職業學院作為實驗環境平臺,將該系統安裝部署在了南京城市職業學院微信公眾號中,目前已正式運行。該系統結合AI,通過大量校園語料及文本積累,建立符合高校的算法模型,幫助用戶通過口語化語言獲取校內事務。通過文獻調查和問卷調查等多種方法,調研了在高校情景中,師生獲取信息的途徑及獲取的內容,從而精準定位師生需求,再有針對性地提供幫助。隨著人工智能在算法上優化和進步,智能語音問答系統不僅能在語言表述上獲取表面信息,還能通過語義獲取更深層次的信息,這種優化所帶來的進步,也恰好給了智能語音問答系統生長的土壤與營養,使其生存下來。在智能語音問答系統的改革與發展下,越來越廣泛地應用在如智能家居、智能客服機器人等方面,逐步取代了人工客服,越發引起了學術界和工業界的廣泛關注。成熟的智能語音問答系統最終將幫助人類從大量重復性的勞動中解放出來,人類生產方式也會逐步改變,對社會的進步是無法預計的。同時,智能問答系統也是構建下一代智能世界不可或缺的一個重要角色[1]。
2 系統服務模式設計
互聯網信息爆炸式產生,深度學習技術快速發展,大量的數據和革新的技術給新一代問答系統提供了發展的客觀條件。與此同時,深層次的神經網絡爆發式發展,用更深層的算法學習來獲得更深層的自然語言特征,賦予了神經網絡更加強大的學習能力,其強大的學習能力,使得問答系統得到了空前的關注。
2.1 智能語音問答系統處理框架
不同類型的智能語音問答系統在數據處理形式上是不一樣的。智能語音問答系統需要解決3個基本問題:如何使計算機理解自然語言準確的語義,并在計算機中表現出來;如何選擇最合適的回復答案;如何再將最合適的答案通過自然語言表現出來。
不同的智能語音問答系統在處理不同的任務時,各自有著不同的架構體系,依據各架構體系處理數據流的方式,可以分成3個模塊:提問分析模塊,檢索模塊、答案抽取模塊[2]。
(1)提問分析模塊,負責處理用戶的問題,生成查詢關鍵詞,確定問題答案的類型以及問題的語義表示。
(2)檢索模塊,依據提問分析模塊所轉換的語句,采用深化理解和結果檢索出備選答案。
(3)答案抽取模塊,執行預先設計好的規則,對備選答案打分,返回出分數最高的答案選項。
2.2 智能語音問答系統的分類與技術
依據智能語音問答系統的任務類別來分,可分為兩種:
(1)面向任務的智能語音問答系統,依據具體任務來安排實施,例如查詢圖書館信息、成績信息等。
(2)面向非任務的智能語音問答系統,主要作用是和人類進行自然語言的交流,例如和機器人對話[3]。
2.3 面向非任務問答系統的3種主要方法
(1)基于檢索的方法,從事先定義好的數據庫中,根據某種規則,選出最合適的答案。優點是通俗易懂、易于解釋;缺點也很明顯,非常依賴事先定義的數據庫和檢索算法,如果數據質量不高,那么很可能效果就很差。
(2)基于生成的方法,是當前研究領域的一個主流熱點,通過理解提出的問題來生成適當的回復,典型的生成模型有seq2seq,transformer等。優點是不依賴定義好的數據庫、可以靈活回復;缺點是容易生成一些無意義的回復和重復的回復等。
(3)基于檢索和生成混合的方法,結合檢索回復較為精確和生成回復較為靈活的優點,可以大大提升問答系統的回復效率和性能,是智能語音問答系統在實際中應用最多的方法[4]。
3 校園智能問答系統的設計思路
在校園環境中,成熟的智能語音問答系統離不開知識庫的建設,校園知識庫是領域信息的模型化表示。相應的技術難點在于如何理解用戶的意圖。需要對關鍵詞進行準確的提取,考慮在校園生活中發生問題的重復、簡單性,和現有的分詞算法,基于字符串匹配的分詞算法是比較合適的。在實際的高校環境應用中,為每個問題提供了至少兩種以上的回復答案。從各個業務系統中收集到的專業性回復信息,再對問答庫中的語句進去斷句處理、語法處理、相似統計等,防止出現錯誤。最后根據微信公眾平臺提供的應用程序編程接口(Application Programming Interface,API)調用,更加準確地劃分業務模塊,減少各個模塊之間的數據交叉,大大提高了模塊的維護性,為知識庫的擴展提供了便捷。
將智能語音問答機器人部署在微信公眾平臺上,用戶在關注公眾號之后,可以在公眾號的對話界面通過語音提出問題,智能語音問答機器人就會開始自動識別問題信息,再通過對比知識庫的數據,對命中的問題答案進行判斷,再把命中的問題答案文字或者圖片等形式發送給用戶。若知識庫中沒有命中到合適的答案,智能語音問答機器人就會自動存檔信息,再通過學習來不斷豐富知識庫。
4 智能語音問答知識庫實現
4.1 校園信息的分類結構及其呈現方式
以南京城市職業學院作為研究對象,通過信息整合和信息分類,分析了校園信息的分類結構以及其呈現形式。
(1)信息的整合。將高校各業務平臺的信息收集、整理到知識庫后臺,通過相應的智能搜索算法,把信息進行處理和篩選分類,再把結果信息顯示到微信公眾平臺的聊天界面。
(2)信息的分類及分類方法。根據以上調研結果,校園信息分為在校教職工和校內學生兩大類,每類又根據信息屬性繼續細分。
4.2 知識庫構建與管理
(1)知識庫構建,是校園信息知識庫的重要設計流程。分類整理整個業務平臺信息,確定橫向線性流作為知識庫的中心流,再有機結合橫向流程和縱向模塊,使其成為存在多種檢索方式的知識庫,并將其作為知識庫建設的重要目標。
(2)知識庫管理,是知識庫的重要模塊。采用模塊化的設計方式,可以提高知識庫的交互性,方便知識庫的日常管理,讓操作維護界面合理、清晰。
4.3 知識庫的維護
提高知識庫操作員的技術水平,可以讓管理員們應對并解決各類知識庫故障,提高運維能力。知識庫不僅包含了知識的更新,還包含了知識庫自身的系統更新。在知識庫設計階段,必須包含知識庫未能檢索問題的記錄功能,后臺運行維護人員會通過新增的記錄更新知識庫,保證了知識庫數據的不斷增長和完善。
4.4 知識庫的評價
知識庫的評價以知識庫的安全、穩定運行為重要保障基礎,以此保障、優化知識庫的構建能力。加強知識庫的運行維護以及日常管理同樣重要,應該加強知識庫日常巡檢,改善知識庫交互能力,構建高效、穩定的知識庫,來保證本系統的安全運行。
5 結語
微信公眾平臺代表的是人類交流的一種方式,也代表了互聯網的發展趨向。以智能移動終端為主的新媒體在未來會有巨大的發展潛力。人工智能作為一種新的載體不斷傳播和繼承著高校文化,也在逐漸滲入師生們的工作、學習和生活中,不僅受到學生的追捧和青睞,還開辟了校園服務交流媒介的新紀元。在科技發展的新時代,智能語言問答是在獲取校園信息方面的一次重要嘗試,具有非常積極的意義。
基金項目:2019年江蘇省高等學校大學生創新創業訓練計劃項目;項目名稱:智能語音問答系統的應用與研究;項目編號:201914001004Y。
作者簡介:陸世堯(1986— ),男,江蘇南京人,工程師,學士;研究方向:軟件技術。
[參考文獻]
[1]胡蕊.大學生微信使用在高校教學中的應用前景分析[J].北京青年政治學院學報,2014(1):76-81.
[2]盛偉芳.校園微信公眾平臺運營策略研究[J].劍南文學,2013(2):326-327.
[3]王磊,鄒鎧同.微信公眾平臺在高校中的應用[J].電子技術與軟件工程,2014(7):42.
[4]朱智強,朱廣賀.基于微信公共平臺的校園信息服務系統的研發[J].電子技術與軟件工程,2015(11):87.
Application and research of intelligent question and answer system based on WeChat public
Lu Shiyao
(Nanjing City Vocational College, Nanjing 211200, China)
Abstract:The application of artificial intelligence in colleges and universities is more and more, among which, the realization of speech recognition and intelligent question and answer technology makes the computer communicate with the human being through natural language. WeChat public platform has a large number of users and information acquisition convenience, which lays the best and reliable carrier position of the WeChat public platform. This paper studies the intelligent question and answer system based on the WeChat public number.
Key words:intelligent question and answer; artificial intelligence; speech recognition; WeChat public platform; knowledge base