基于表格的自動問答研究與展望

2021-07-14 16:21:32楊賦庚奚雪峰

計算機工程與應用 2021年13期

關鍵詞：語義數據庫方法

李智，王震，楊賦庚，奚雪峰

1.蘇州科技大學，江蘇蘇州215009

2.蘇州市公安局，江蘇蘇州215000

自動問答是自然語言處理中重要的研究任務。針對用戶以自然語言形式提出的問題，自動問答系統面向檢索源獲取用戶答案。為了精確獲取答案，通常對問句進行深層次語義挖掘，獲取問句中豐富的潛在信息，從而提取用戶需要的答案。

表格又稱表，是一種可視化的交流模式與組織整理數據的手段，更是一種結構化的知識庫。表格的構建需要挖掘、分析、顯示各個表格實體之間的相互關系，清晰表示知識庫信息。

基于表格的自動問答任務通過挖掘表格實體信息與問句之間的潛在聯系，獲取生成的結構化查詢語句。與傳統的搜索引擎相比較，基于表格知識庫的信息檢索，不再生成非結構化知識庫問答的簡單排序列表，而是通過智能語義分析，獲取查詢語句，通過查詢語句生成用戶需要的問題答案。

本文依次從基于表格的自動問答數據集，問答模型、問答評測方法、問答模型的難點與挑戰開展分析與討論。

1 基于表格的自動問答數據集

自動問答最早可追述到20 世紀50 年代。圖靈在1950 年提出通過觀察機器是否具有正確回答問題的能力，以此驗證機器是否具有智能[1]。1966 年，麻省理工學院的Weizenbaum[2]設計出名為ELIZA的聊天機器，實現了機器與人類的簡單問答。隨后大量的研究成果相繼出現如：Parry[3]、ALICE[4]、Jabberwacky[5]；2011年，IBM公司設計研發的超級機器人“沃森”在美國電視智力節目《危險邊緣》中戰勝兩位頂尖的人類選手，被視為人工智能發展的重要節點。不過，上述成果并不代表著機器對于自然語言真正的理解。2011 年，華盛頓大學的Etzioni 發表文章“Search needs a shake-up”指出：“以直接并且準確的形式回答用戶的自然語言問句的自動問答系統將構成下一代搜索引擎的雛形”[6]。因此自動問答系統被視為未來信息智能服務的關鍵性技術之一。

近年來，伴隨著用戶對于智能應用的迫切需求，許多公司及機構例如谷歌、百度、維基等通過獲取高質量數據，采用自動或者而半自動化方法設計一系列完備的表格知識庫問答系統，例如Weir等人[7]開發了DBPal工具，Google開發了Analyza系統[8]、NLIDBS[9-10]。同時，以深度學習為代表的算法技術以及GPU等硬件計算能力的提升，為自動問答提供了有利的發展條件。

當前大量文獻圍繞自動問答任務展開，同時，問答系統的實現離不開數據集。當前成熟的英文問答數據集有WikiSQL[11]、Spider[12]、WikiTableQuestions[13]、ATIS[14]等等。如表1所示，WiKiSQL數據集是2017年由Salesforce提出的大型標注的NL2SQL數據庫，是目前最大的NL2SQL數據集；它包含24 241張表，80 645條自然問句以及相應的SQL 語句；WiKiSQL 目前的預測準確率達91.8%。Spider數據集是2018年耶魯大學提出的一個大規模、跨領域、復雜的NL2SQL數據集；數據集包含10 181條自然問句，分布在200 個獨立數據庫中的5 693 條SQL，內容覆蓋了138個不同領域；Spider引入SQL的高階用法，更加貼合真實問答場景。WikiTableQuestions數據集是2015年斯坦福大學針對維基百科中半結構化表格問答開發的數據集。該數據含有22 203 條問答句子以及2 108張表格；數據來源于維基百科，因此表格信息沒有經過歸一化處理，一個自然語言問題內包含多個實體或者含義。ATIS（Air Travel Information System）是由德克薩斯儀器公司在1990 年提出的，該數據集源于關系型數據庫Offical-Airline-Guide，包含27張表格以及小于2 000次的Query，Query內容涵蓋航班、費用、城市、地面服務等信息。中文問答數據集有首屆中文NL2SQL挑戰賽數據集[15]、CSpider[16]。首屆中文NL2SQL挑戰賽數據集，由追一科技在2019年舉辦的首屆中文NL2SQL挑戰賽提出，使用金融領域的表格數據作為數據源，提供標注的自然語言問題與SQL語句的匹配對。2019年，Min等人[16]為填補當前中文表格問答的空白，針對目前中文分詞問題、句型、漢語零代詞問題，將Spider數據集轉換為中文，開發出CSpider數據集。

表1 基于表格知識庫的問答數據集

Yu等人[17]在2019年公開第一個基于表格的多輪問答數據集SParC，該數據集覆蓋138 個領域。SParD 有兩大特點：（1）SParC 具有復雜的上下文語義相關性；（2）SParC由于跨領域的性質并且在測試過程中看不到表格信息。目前SParC 的最佳模型的精確匹配度僅為20.2%；Yu 等人[18]在2019 年也公開了基于表格的多輪問答數據集CoSQL。CoSQL 被視為Spider 的多輪對話版本，但是與SParC 相比較，CoSQL 專注于對話雙方的交互問答、場景更加豐富，涵蓋領域更加廣泛。

2 基于語義解析的自動問答方法

基于語義解析的自動問答方法通過構造規則或者模板，對于問題文本進行匹配，形成查詢表達式。規則與模板是語義解析方法的具體顯示。通過預設置查詢模板或者規則，實現查詢語句的生成方法具有簡潔、準確性高的優點，適用于簡單查詢。目前，所有的表格問答模型中均在不同程度上使用語義解析方法。

語義解析方法的關鍵在于對自然語言問句進行成分解析，將查詢問句轉化為邏輯表達式，再利用表格知識庫的語義信息，將邏輯表達式轉換為表格知識庫的查詢結果，最終得到用戶的目標答案。在結構化的知識庫上進行查詢，最高效的方法就是利用結構化查詢語句，類似SQL語句等。然而對于普通用戶而言，設計規范化的查詢語句存在困難。因此基于表格知識庫的語義解析問答系統應運而生，如圖1 所示，系統實現需要兩個關鍵的步驟：（1）使用語義解析器將問題轉化為計算機能夠識別和理解的語義表示；（2）使用語義產生結構化查詢語言，對表格知識庫進行查詢。

圖1 基于語義解析的表格問答過程

常用的語義解析方法有兩類：基于規則的語義解析和基于神經網絡的語義解析。

2.1 基于規則的語義解析方法

基于規則方法由Woods[19]提出，它依靠語法規則，通過增強轉移網絡（ATN）進行語義解析，通過上下文無關文法描述自然語言問句的文法結構與文法中產生式的對應語義動作，執行相應的語義結果，最終生成結構化查詢語句。2008年，Djahantighi等人[20]基于NLIDB系統，通過識別任何語言的同義詞，以此實現專家系統，該系統便于非專業用戶使用查詢語句處理數據庫。2010年，Gauri等人[21]將工作轉向混合方法，將基于經驗語料庫的方法與傳統符號方法相互結合，使得英語問句生成SQL成為可能。

2015 年，Humera Khanam 等人[22]提出基于數據庫的自然語言接口這一概念，考慮作者母語（泰盧固語）的特征，保證用戶提出自然語言問題，問答系統都能給出正確答案并節省問答時間。2016 年，Pasupat 等人[23]面向WikiTableQuestions 數據集，針對語義解析器的核心問題開展研究。這里的核心問題是指有限搜索空間條件下，受限的規則集限制了模型的表達能力。他們的研究工作考慮了最具有表現力的一類邏輯形式，并展示了如何使用動態編程有效地表示一整套統一的邏輯形式。

基于規則的語義解析問答方面，國內的研究人員也取得相應成果，許龍飛等人[24]采用漢語數據庫首先提出自然語言查詢界面NLCQL，運用數據庫E-R 漢語查詢模型，將漢語查詢語句與對應數據庫模型語義以及背景知識相互結合。在語法方面，NLCQL 采用語言模板作為中間語言MQL[25]到SQL的自動轉換規則。其基本思想是通過對輸入的漢語自然語言進行分詞操作等處理，生成對應的漢語句型詞組結構樹，最終變換成中介語言MQL。再實現中介語言向SQL 的映射，從而執行基于數據庫的實際查詢。系統相較于傳統的句型匹配法有更好的理解能力，同時具有更好的實用性。

陶艷瑰等人[26]從簡化語法語義處理過程的角度考慮，設計集合漢語文化背景的數據庫自然語言查詢界面RchiQL，通過對查詢語句進行受限操作以及ER語義特征文法規則[27]，提升接口模型識別詞匯的準確度。其限制系統所識別的詞匯量與句式，進而減少詞匯的二義性，避免出現用戶構造過于復雜的查詢語句；同時為了盡可能處理用戶的查詢，不過分增加系統實現的復雜度，提出了對于查詢問句做預處理的思路。

孟小峰等人[28]針對中文數據庫面臨的可移植性和可用性兩大問題，設計出中文語言查詢系統Nchiql，Nchiql 具有良好的可移植性、高效性和魯棒性。如圖2所示，Nchiql 系統根據中文自然語言查詢的特點，提出基于數據庫語義分詞的方法，通過回溯機制、相關語義確定，有效解決分詞中出現的歧義詞與未知詞的問題；同時提出數據庫語義依存模型和迭代依存分析方法，獲取查詢目標之間的關系以及查詢條件內部的層次關系，便于系統向SQL語句和自然語言的同步轉換。

圖2 Nchiql流程示意圖

綜上所述，基于規則的語義分析法可解釋性強、結構清晰，在限定領域問答方面達到很好的效果；但是重要部分（如產生式、規則集合）需要人工編寫。面對大規模表格知識庫的情況下，該方法存在以下不足：（1）資源標注費時費力，在訓練數據有限的情況下，性能有限；（2）語義表示與知識庫聯系不緊密，無法在解析過程中利用知識庫進行約束；（3）大規模知識庫開放域特性使得文本歧義問題嚴重。

2.2 基于神經網絡的語義解析方法

基于神經網絡的方法將自然語言以及對應生成的語義視為兩種不同的語言，語義分析任務被看作機器翻譯任務，利用端到端模型，實現將問句翻譯成對應語義的結構化表示序列，如圖3所示。

圖3 Encoder-Decoder模型示意圖

LeCun 等人[29]在神經網絡的基礎上提出深度學習的概念，深度學習已經廣泛應用于問答系統中子任務的實現。本文將當前基于神經網絡的問答任務分為四類：基于分塊機制的問答方法、基于類型信息的問答方法、基于草圖的問答方法、基于詞嵌入的問答方法。

2.2.1 基于分塊機制的問答方法

伴隨著神經網絡技術的發展，研究人員認為目標SQL 語句可以通過分塊依次生成。分塊機制目前包含兩種方法：第一種為槽位填充方法。該方法將SQL語句分解為不同子句，將子句預測結果進行拼接成目標SQL。預測方法包含文本分類、實體識別。第二種為分塊解碼器方法。該方法對于不同的子句設置不同的解碼器，每個子句的編碼器由語法規則進行定義。

在槽位填充方法方面，文獻[30]提出基于Attention機制的SEQ2SQL模型[11]，其核心思想是：首先通過將問句文本與表格信息作為輸入，將SEQ2SQL 模型分為聚合分類器、Select Column Pointer、Where條件解碼器三部分，分別預測目標語句的操作符號、選擇列名、Where子句；最終將上述子句拼接形成完整的查詢語句。SEQ2SQL模型如圖4所示。

圖4 SEQ2SQL運行流程圖

上述模型優勢是對于不同的問題可以復用，生成目標靈活，缺點是需要針對于不同的問答數據集制作對應的模板；同時生成模板對于數據集依賴性較大。上述模型將目標SQL 語句劃分為三個子模塊分別預測生成。隨著神經網絡的不斷發展，問答模型將SQL語句分解任務不斷細化。文獻[11]基礎上提出的SQLNet 模型[31]引入Seq2Item（集合到序列）和Column-Attention（列注意力）兩種思想；SQLNet 利用各個槽位預測對象的依賴性，填充預先設置SQL語句中的槽位，通過生成槽位的拼接，提升SQL 生成的準確度，SQLNet 模型如圖5 所示。Shi等人[32]考慮到存在多個具有相同或相似語義的正確SQL查詢語句的情況，使用預定義清單中可行性的操作逐步填充SQL 查詢的插槽；從句法解析技術中汲取了靈感，提出使用非確定性序列到動作的模型；面對Spdier 數據集中復雜的嵌套查詢，Choi 等人[33]提出一種基于遞歸生成思想的新網絡架構RYANSQL，通過基于草圖的槽填充算法來遞歸預測嵌套查詢；該模型在Spider上取得58.2%的準確度，模型效果明顯，更便于生成含有子查詢的SQL語句。

圖5 SQLNet模型圖

在分塊解碼器方法中，Lee等人[34]基于Spider數據集，針對復雜查詢問題，提出SQL 子句解碼結構RCSQL。該結構基于self-attention 機制的數據庫模式編碼器，其編碼器負責語義表示任務；每個子句的解碼器由一組子模塊組成，子模塊由每個子句的語法定義構建形成。該方法在多表情況與問題文本跨域條件下實現了復雜查詢語句的生成。

2.2.2 基于類型信息的問答方法

針對用戶采用自然語言表示的問題，研究人員提出使用類型信息進行目標SQL 語句的生成。2017 年，針對輸入自然語言問句中的類型信息，文章“Pointing out SQL queries from text”提出一種基于注意力和復制兩種機制的新型表格自動問答模型。模型基于簡單類型規則，采用Seq2Seq 架構[35]以控制每個編碼步驟的解碼模式，根據SQL語法專門設置內置詞匯對于操作符號進行標記。在要求生成列名或常數的情況下，模型強制進行Copy操作；其余情況下，模型將隱藏信息投影到一個內置詞匯表，獲取內置詞匯表的運算操作符號。上述模型雖然利用自然問句中的類型信息，提升模型對自然語言問題的理解能力，但是類型信息有限，如何利用標注技術進行問句標注成為新課題。2018年，文獻[36]借助類型信息表示，提出新的問答模型TypeSQL；利用類型信息理解自然語言問題中特殊實體，對輸入問句逐一進行類型標注，將問句中數字和日期分為四個部分（整數、浮點數、日期、年份）。為了識別問題中實體，模型設置五種類型實體（Place、Country、Person、Origination、Sport），將基于表格的問答模型視為填充插槽任務，以此生成高質量的結構化查詢語句，TypeSQL最大限度地融合文本類型，便于自然語言問題的解構。

2.2.3 基于草圖的問答方法

針對問答任務需要生成SQL，研究人員提出基于草圖指導目標SQL生成的想法，草圖為部分生成的結構化語句。2018年，Wang等人[37]基于神經語義解析，提出執行引導（Execution Guidance）思路，即利用SQL的語義，在解碼（Decoder）過程中，通過部分生成SQL 來檢測和排除錯誤的SQL 生成語句；在出現解析錯誤（Parsing Error）和運行錯誤（Runtime Error）兩種情況下，解碼不會得到正確結果；運行錯誤包含運算符類型不一致、空輸出等錯誤情況。在假定所有查詢語句都可以得到結果的情況下，模型生成一部分SQL 語句以后就可以執行，執行的結果反過來又可以指導SQL生成過程，執行指南如圖6 所示。上述模型針對SQL 生成錯誤的情況進行草圖構建。面對當前自然語言問句中存在的高低階信息，研究人員又提出新的草圖生成方法。Wang 等人[38]設計了一種基于結構感知的神經結構，該結構將語義解析分為兩個階段：首先給定輸入文本，生成相應的草圖，草圖省略低級信息（如變量名、數值）；然后考慮輸入文本和草圖本身的缺失細節。該模型與一次性解碼結構相比，生成草圖緊湊且容易生成；在生成草圖后，解碼器理解問句的基本含義，從而將其作為全局上下文信息，進行最終預測SQL的修改。

圖6 執行指南示意圖

草圖本質上屬于問答任務中的中間信息。當前研究者針對于NL2SQL 的中間生成部分提出中間語言的概念。針對于復雜且跨域的NL2SQL 任務，Guo 等人[39]提出了一種稱為IRNet的神經網絡方法。IRNet并非端到端合成SQL查詢，而是將合成過程分解為三個階段：在第一階段，IRNet 執行問題和數據庫架構之間的架構鏈接；其次，IRNet 采用基于語法的神經模型來合成SemQ 查詢，該查詢是設計用來橋接NL 和SQL 的中間表示；最后，IRNet 使用領域知識從綜合的SemQL 查詢中確定性地推斷出SQL 查詢。IRNet 旨在解決兩個問題：（1）自然語言中表達的意圖與SQL 中的實現細節之間的不匹配；（2）大量域外單詞導致的預測列的錯誤。

2.2.4 基于詞嵌入的問答方法

伴隨著深度學習的發展，預訓練模型不斷涌現，例如Glove[40]、BERT（Bidirectional Encoder Representation from Transformers）[41]，推動了文本語義表示效果的不斷提升。由此，越來越多的研究人員認為準確的語義表示是提升當前問答模型效果的關鍵，并將預訓練模型帶入問答任務中。

Hwang 等人[42]在2019 年開發出的SQLOVA 系統[42]引入了BERT 預處理模型。在編碼器（Encoder）上，模型結合槽位機制與草圖方法提出三種結構：第一個結構是Shallow-Layer，基于草圖生成SQL 語句的六部分（選擇列部分、選擇聚合部分、Where 子句數量部分、Where列部分、Where子句操作符號部分、Where子句值部分），每個部分具有獨自的編碼器；第二個結構是基于Poiner Network 的LSTM 模塊[43]來解碼生成SQL；第三個結構將BERT的輸出作為Embedding。模型將自然語言查詢與表格的所有列名進行編碼，采用列注意力機制與Selfattention機制，使得自然語言問句語境化，以此顯示問句與表兩者之間的交互關系，SQLOVA從修正語句的角度考慮，通過對生成的SQL語句進行語法檢查，從而提升模型的準確性。2019年，He等人[44]結合槽位機制，設計出基于Bert 預訓練的模型X-SQL。該模型將任務分解為6個子任務。相較于傳統問答模型，X-SQL模型添加None元素，擴大查找范圍，解決了傳統模型不能有效對于各個目標進行關系建模的問題。X-SQL 采用一種列表示的全局排序，將所有列放在可比較的空間，使用KL 散度的List-Wise Global Ranking[45]作為目標函數。X-SQL不僅有效構建列之間的關系，同時將六個任務相互結合，更便于SQL 語句的生成。但是X-SQL 模型分解為六個子模塊思路仍然存在缺陷，即沒有解決Value抽取混亂，Column特征不顯著的問題。

當前階段，圖網絡表示學習成為自然語言處理的熱門技術，Shaw等人[46]基于Spider數據庫生成復雜邏輯形式問題，提出利用實體之間的關系，將GNN（Graph Neural Networks）[47]融入相關實體以及關系的表示；結合編碼器的復制機制，實現多層嵌套SQL語句的生成，模型考慮數據庫信息的異同對SQL語句生成的影響，通過GNN的編碼表示，提高模型的準確性。

除了上述總結的四種方法，針對于問答模型存在的其他問題，研究人員提出眾多有效的解決方案或新模型。在問答數據方面，Huang 等人[48]針對于問答模型難以適用于所有訓練樣本的問題，提出基于域依賴的相關函數，通過將原始問句簡化為元學習場景，以此加快模型收斂速度；Wang等人[49]基于自動注釋機制，采用分離數據及其模式的方法，將數據模式與數據分開，通過定制序列模型，將帶有注釋的自然問句轉換為SQL語句；在模型改進方面，針對于目前的語義解析器依靠自動回歸編碼，一次發出一個符號的問題，Bogin等人[50]提出語義解析器全局考慮輸出查詢的結構，根據上下文進行更多的數據庫常量的信息選擇；McCann 等人[51]提出新的多任務問答網絡（MQAN），基于多指針生成器的解碼提高問答任務中語義解析的效果；YU 等人[52]提出了語法樹網絡SyntaxSQLNet，使用具有SQL 生成路徑歷史記錄以及基于SQL 特定語法的解碼器；Dong 等人[53]提出基于注意力增強的編解碼器的方法，將輸入的語音編碼進行矢量表示，并通過調節編碼矢量上的輸出序列來生成邏輯形式。

國內也有很多研究者，致力于構建表格知識庫以及設計問答系統。在構建知識庫方面，2019 年，Min 等人[16]為填補當前中文表格問答空白，針對目前中文分詞問題、句型問題、漢語零代詞問題，將Spider數據集轉換為中文形式，開發出CSpider 數據集，并且利用Syntax-SQLNet 作為基線模型進行效果測試。同年，追一科技舉辦首屆中文NL2SQL大賽。在設計問答系統方面，面向NL2SQL數據集，張嘯宇設計一種多任務的表格問答系統，將生成目標進行分解，提高下游子任務的準確性，同時考慮到value 抽取特征不明顯的情況，提出結合信息增強算法以及數據預處理的方法，在2019 年的中文NL2SQL大賽上，取得第一名的成績。

在2018 年，聯想AI 實驗室設計了一種基于合成思想的問答系統[54]，用SQL-Query 的結構、雙向注意力機制[55]、字符級嵌入、卷積神經網絡CNN[56]，將NL2SQL模型分為聚合器選擇模塊、列名選擇模塊、Where 子句模塊；針對每個子模塊設計特定神經網絡；系統中自然語言問題和Column 信息全部經過BiLSTM 模塊，再通過雙向注意力機制進行映射最終獲取預測對象，模型考慮到問答中實體數量對準確度的影響，通過設置子任務提升SQL語句生成時間與精度。模型如圖7所示。

圖7 模型運行流程圖

綜上所述，如表2 所示，基于語義解析的表格知識庫問答方法，核心任務是將自然語言轉化為機器能夠理解和執行的語義表示。在基于規則的語義方法中，語義表示缺乏靈活性，在分析問句語義的過程中，易受到符號之間語義鴻溝的影響；同時從自然語言問句得到結構化語義表示需要進行多步操作，多步之間的誤差傳遞對于問答準確度易造成影響；而基于神經網絡的方法，受限于數據集的匱乏。因此基于語義分析的問答系統在開放域上取得的效果不盡人意。此外，無論是基于規則的方法或者基于神經網絡方法都需要標注語料，耗費大量人工，因此構建低成本的模型也是目前問答任務的研究方向之一。表3 展示了當前主流的問答模型及其性能。

表2 基于規則與基于神經網絡的方法比較

表3 WikiSQL數據集中問答模型的性能對比 %

3 基于表格知識庫的自動問答系統評測

基于表格知識庫的自動問答系統評測與之前的傳統知識庫問答評測相比，既有相同之處，也有特殊之處。由于表格問答系統生成SQL語句的不同，導致其不同數據集設置的評測指標各異。目前評測的指標主要包含兩種評價方式：

（1）邏輯形式準確率（Logical form Accuracy），將模型合成的SQL 查詢與真值進行比較；（2）查詢匹配準確率（Query-Match Accuracy），將合成的SQL 語句與真值轉化為規范表示并進行比較，其中各個子句中的列名的出現順序不影響準確率的計算；（3）執行結果準確率（Execution Accuracy），生成的SQL 語句與真值執行的結果的比較。

其中，N表示數據量，SQL′和SQL分別代表預測和真實的SQL語句，Accif代表邏輯形式匹配準確率。

其中，N表示數據量，SQL′和SQL分別代表規范化預測和規范化的真實SQL語句，Accqm代表查詢匹配準確率。

其中，N表示數據量，Y′ 和Y分別代表預測和真實SQL語句的執行結果，Accex代表執行結果準確率。

邏輯形式匹配度包含各個模塊（聚合函數匹配、選擇列匹配、條件列匹配、值匹配）的匹配精準度。查詢匹配度(Accqm)因需要將生成SQL規范化后進行比較。伴隨現有問答數據集的發展，未來的評測指標將會不斷細化。對于結構化語言生成任務而言，評測指標包含的自動生成答案的可推理性評估、可讀性評估、流暢性評估將會愈加重要。表4 為當前各個數據集下評價指標下的最新效果。

表4 問答數據集中驗證集的指標效果

4 表格自動問答系統的問題與挑戰

當前，基于表格問答任務在WikiSQL等傳統數據集的準確率已達91.8%，然而實際應用中仍然存在很多問題亟待解決和優化。本章結合研究中遇到的問題，分析表格自動問答系統的問題與挑戰。

4.1 單表操作的問題

現有基于表格知識庫的自動問答技術，在單一的表格知識庫上已經取得優異的效果，然而在實際的問答場景下，面對用戶的復雜問題，需要外聯兩個甚至多個數據表才可以得到目標答案。但是，主流數據集WikiSQL中的自然語言問題結構過于簡單并且其中的單表問答不符合現實場景中的需求。

針對單表操作的局限，現有模型采用擴大表格規模的方式來避免單表操作帶來的信息局限。雖然這種方式會增加時間復雜度，不過能夠保證查詢語句的簡易性，提高表格問答任務的精確度。上述方案涉及關系數據庫融合技術以及在數據信息擴充情況下，如何保證問答檢索速度等難點，需要研究人員進行深入探索。

4.2 自然語言問題的信息解析局限

目前自然語言問題的理解是基于表格問答的重點。一個規范化的問答語句將提高生成SQL 語句的準確度。不規范NL2SQL問題語句表現在錯別字、口語化輸入、模糊信息等多方面。錯別字方面，例如將“羋月傳”錯寫成“半月傳”。口語化方面，輸入的問題文本中含有大量口語化的信息，需要人工或深度學習方法進行轉換或剔除。模糊信息方面，例如“今年三月”，問答模型無法判斷今年究竟是哪一年，因此需要問答模型進行泛化操作。另外由于數據庫中通常是以數字形式存儲數據信息，在自然問句中，“三月”這類漢語數字信息應該轉換為“3月”，即阿拉伯數字信息。針對上述情況，研究人員通過預處理操作將原有問題文本的缺失信息添加到相應的位置，從而提升文本的判別效果；同時基于正則表達式，將相應的中文數字信息轉換為數據庫可識別的數字信息，提升模型值預測的準確度。

4.3 多輪對話表格知識庫問答

近年來，關于表格知識庫上的單輪問答任務基本得到解決。從對話角度看，當前學術界更加重視包含多輪對話的問答任務。由于自然問題與表格知識庫的多樣性和復雜性，多輪表格知識庫的問答仍然是一項具有挑戰性的任務。

2019年，Zhang等人[57]專注于跨域文本到SQL生成的任務[57]。基于觀察到相鄰自然語言問題通常在語言上是依賴的，并且它們對應的SQL 查詢趨于重疊的思路，通過編輯先前的預測查詢，利用交互歷史來提高生成質量；同時利用編輯機制將SQL視為序列，并以簡單的方式在令牌級別重用生成結果。此外，為了處理不同域中的復雜表結構，采用表感知解碼器來合并用戶話語和表模式的上下文信息。

2019年，Yu等人[52]提出新的方法。方法分為兩點：一是使用語法樹網絡SyntaxSQLNet[52]，以解決多輪對話中跨域文本到SQL生成的任務。SyntaxSQLNet使用具有SQL 生成路徑歷史記錄和column-attention 編碼器。二是使用數據庫拆分設置，其中在訓練期間看不到測試集中的數據庫。2020 年，Cai 等人[58]針對多輪問答任務只集中于歷史用戶輸入的問題，除了利用編碼器捕捉用戶輸入的歷史信息，模型還提出了基于歷史信息的數據庫模式編碼器。在譯碼階段，通過引入了權衡機制，權衡不同詞匯的重要性，然后制造SQL標記的預測。Hui等人[59]提出了一個動態圖框架，該框架能夠在對話進行時有效地建模上下文話語、令牌、數據庫模式及其復雜的交互。該框架采用了動態記憶衰減機制，結合了歸納偏差來整合豐富的上下文關系表示。

綜上所述，多輪表格問答的問題主要分兩點：一是問句信息問題；二是上下文問題。問句信息問題指的是在多輪問答限定表格知識庫的情況下，問句出現指代模糊、實體信息省略的情況，這類問題的解決需要聯系上下文實體，才能找到實體答案。上下文問題指的是上文問答的結果對于下文問答的結果是否具有影響。在問答過程中，當前模型對于上文依賴不斷增加時，可能導致結尾問答過程出錯的情況。多輪的表格知識問答是當前的研究難點與熱點問題，還需更多探索。

4.4 中文NLSQL數據集的生成與應用

2019 年前，中文表格問答數據集還是相對匱乏的。首屆中文NL2SQL 大賽數據集和Spider 中文版數據集（CSpider）的出現緩解了數據集匱乏的困境。但是這上述數據集僅僅涉及金融、經濟領域，并且CSpider數據集格式復雜（涉及高階操作），研究者較少。當前如何利用各個領域存在的表格知識庫，基于深度學習的大規模、可學習的優點，構建跨領域知識庫是中文自動問答系統迫切需要解決的問題。

基于目前中文表格問答數據集，可以利用已公開的問答模型，基于特定領域問答數據的標注特點，構建空白領域問答數據集，從而實現中文表格問答在特定領域的應用。

4.5 問答模型自然答案的生成

現存許多問答數據集的問答任務實際上是答案抽取模型，通過這種方法獲取的答案十分生硬，未有任何加工修飾，不夠自然。例如，根據用戶的自然語言問句“今年蘋果賣多少錢”，僅僅將答案實體“3”作為答案是不足的，用戶往往更加接受自成一體的答案形式。為解決答案不自然的問題，2016年，Yin等人[60]首先提出自然答案生成這一概念并且提出GenQA模型。He等人[61]在2017 年提出端到端的問答系統COREQA，以生成復雜問句的自然答案。但是上述模型均是基于文本知識庫問答，并未涉及表格知識庫。將自然答案生成視為槽位填充任務，將抽取答案與自然語句進行拼接，是目前表自然答案生成的一種有效的解決思路。自然答案生成示意圖如圖8所示。

圖8 自然答案生成示意圖

5 結束語

伴隨智能時代的來臨，海量數據充斥人類生活的每個角落，用戶對于自動問答需求越來越強烈。然而現有問答系統還處在起步階段，僅僅具備簡單的邏輯推理能力，無法充分滿足用戶應用需求。基于表格知識庫的自動問答系統作為自動問答的重要方向，其技術發展趨勢從限定領域向開放領域發展，從單一數據源向多源數據發展，從淺層語義分析向深度推理發展，不斷提升自動問答各類性能指標，以滿足不同行業的智能問答需求，更好服務于用戶。