張珂,陳奇
(華北電力大學 電子與通信工程系,河北 保定 071003)
基于非受限路徑自然語言處理中的機器人導航
張珂,陳奇
(華北電力大學 電子與通信工程系,河北 保定 071003)
為了實現使用自然語言控制機器人完成自主導航任務,提出一種基于語義角色標注(SRL)的語義提取方法,用于提高機器人對路徑自然語言理解的準確率。首先,收集了一個非受限的路徑自然語言語料庫,在深入研究路徑自然語言語料庫的基礎上,提出了8個語塊對語料進行語塊分析,完成語義角色標注;然后,對語料進行依存句法分析,完成語義角色標注;接著,結合語塊分析和依存句法分析,提出了一種基于語塊分析和依存句法分析的語義角色標注方法,實驗結果得到的準確率、召回率、F1-值分別達到了98.22%、98.48%和98.35%;最后,基于語義提取結果在機器人Nao平臺上完成了機器人問路導航任務。
語義角色標注;路徑自然語言;語塊分析;依存句法分析;機器人問路導航
人工智能正在成為我們日常生活中的一個重要組成部分。語言是人類交流的重要方法內容。如果能用自然語言控制機器人,那么機器人將可以由普通人隨心所欲地操作。通過自然語言控制機器人比其他方法更簡便,也更符合人類的交流習慣,因此通過自然語言進行機器人問路導航是實現機器人導航任務的理想方法之一,對人工智能的發展有重要的意義。
在國外,針對英文的路徑自然語言研究已經達到了較高的水平,Yuan等[1]在柵格地圖的基礎上提出了基于自然語言的路徑提取算法,該算法通過改進的隱馬爾可夫場算法在路徑提取方面取得了較好的結果;Kollar等[2]在Yuan工作的基礎上增加了對動詞和介詞的理解,增強了系統對自然語言的理解能力;Skubic等[3-5]提出了一種利用空間語言驅動機器人在室內環境完成任務的方法,在語塊分析的基礎上,提出了一種參考-方向-目標(RDT)模型,并通過多個RDT模型建立RDT鏈完成導航任務。
在國內相關領域的研究還鮮有人涉及,目前的機器人導航方式主要是基于米制地圖[6-7]、拓撲地圖[8]和混合地圖[9]的導航方式。這些方法在導航之前需要采集大量信息用于繪制地圖,效率較低。張秀龍、李新德等[10-12]提出了一種基于語塊分析的路徑自然語言處理方法,其語塊分析方法建立在少量語料基礎上,且直接采用語塊分析提取導航語義對語料的要求較高,因此該方法一般性較差,不適合非受限環境下的路徑語言導航任務。
本文提出了一種面向漢語的路徑自然語言處理方法,使用基于語塊分析和依存句法分析的語義角色標注方法進行語義角色標注,根據提取出的語義角色獲得導航語義信息,基于導航語義信息按順序生成若干個路徑單元,最后所有路徑單元按順序生成一條完整的導航路徑,指導機器人完成導航任務。本文方法建立在收集的大量非受限語料基礎上,語塊的選取更加合理,基于語塊分析和依存句法分析的語義角色標注方法可以得到更好的標注準確率。從語義角色標注中提取語義是自然語言處理領域最常用的方法之一,對于路徑自然語言語料的語義提取,這種方法也有很好的效果。
語料庫是自然語言處理的基礎,目前自然語言處理的主流方法是在大規模語料庫的基礎上通過機器學習獲得較好的自然語言處理結果,因此收集足夠規模的路徑自然語言語料庫是解決路徑自然語言導航的第一步。然而建立足夠的專業語料庫需要大量人力、物力,由于國內針對路徑自然語言的研究較少,因此沒有專業的漢語路徑自然語言語料庫。
使用Webots for Nao搭建了10個3-D模擬環境,然后根據模擬環境錄制10段視頻并給出每個環境的俯視圖,為機器人在每個環境中給定一個導航任務(即給出機器人的初始位置和目標位置)。在不告知任務細節的情況下,找100個不同年齡、不同職業的志愿者通過觀看視頻和俯視圖,自由選擇一條可以完成導航任務的路徑并給出相應的自然語言路徑描述,為了保證語料的一般性,選擇的100個志愿者年齡分布從12~60歲,受教育程度從小學到碩士,籍貫分布在全國各地。志愿者在非受限環境下自由選擇描述語句,最終收集了1 000條語料。
圖1和圖2分別是一個環境的俯視圖和視頻截圖。該環境中的導航任務為:從臥室走到客廳的燈旁。該任務的一條語料為:“機器人向右走到門,進門后沿墻向右走到墻角附近的燈旁”。
最終收集1 000條路徑自然語言語料,構成了本文所采用的路徑自然語言語料庫。
分詞和詞性標注是中文自然語言處理的基礎,分詞效果將對機器人問路導航任務產生直接影響。因此,本文使用目前國內分詞準確率最高的NLPIR漢語分詞系統對收集到的語料進行分詞和詞性標注處理。

圖1 模擬環境俯視圖Fig.1 Top view of simulated environment

圖2 模擬環境視頻截圖Fig.2 Video capture of simulated environment
例句:機器人向左走到墻,然后直走到墻角,沿墻向右走到門,進門直走到凳子旁。
分詞和詞性標注結果:機器人/n 向/p 左/f 走/v 到/v 墻/n ,/wd 然后/c 直/d 走/v 到/v 墻角/n ,/wd 沿/p 墻/n 向/p 右/f 走/v 到/v 門/n ,/wd 進/vf 門/n 直/d 走/v 到/v 凳子/n 旁/f 。/wj
句法分析技術是自然語言處理中非常重要的一個環節,它可以使計算機像人一樣獲得自然語言句子的完整句法信息,從而對下一步的語義分析和語用分析提供完備而巨大的句法層次的幫助,讓計算機理解人類的語言。
本文將基于句法分析的結果完成語義角色標注從而抽取語義。句法分析的準確率對語義角色標注的結果影響非常大,因此如何提高句法分析的準確率是所面臨的一個重要問題。
本文分別采用語塊分析和依存句法分析完成路徑自然語言語料的句法分析任務。
為了降低句法分析問題的復雜度,Abney[13]首先提出了淺層句法分析(又稱語塊分析)的概念。語塊分析能夠在詞法分析和語義分析中間架起一座橋梁。它并不要求得到完整的句法樹,而只要求識別句子中某些結構相對簡單的獨立成分。
2.1.1 語塊的劃分
關于漢語語塊的劃分,至今沒有一個公認權威的標準,很多專家都給出了自己的劃分標準[14-16]。
由于本文針對路徑自然語言,語言現象相對比較簡單,通過分析路徑自然語言語料,發現路徑自然語言主要內容由參考、方向、目標3個要素組成。
例句1:機器人左轉(方向轉換模塊,只有方向)。
例句2:機器走到桌子(無參考向目標前進模塊,只有目標)。
例句3:機器人走到沙發右邊的花瓶旁邊(根據參考向目標前進模塊,包含參考和目標)。
例句4:機器人拿桌子上的書(根據參考尋找目標模塊)。
以上4種情況是路徑自然語言最常見的語言現象。為了更好地完成語料切分任務,又定義了如下幾個非常見語塊。
例句5:機器人找到筆記本(直接尋找目標模塊,只有目標,且一般來說是最終目標)。
例句6:機器人沿墻直走(介詞參考模塊,只有參考沒有目標,一般來說目標在后面的語句中)。
例句7:機器人繞過沙發(空間轉換模塊)。
最終確定了7個包含語義的語塊和1個邊界語塊。具體情況見表1。
規定的7個語塊有兩個優點:1)語料庫中的路徑自然語言語料都可以由這7個語塊切分,所以不會出現語義丟失的情況;2)語塊的定義很清楚,語塊之間的區別很明顯,各個語塊的特點也很明顯,識別時不易出錯。還有一個特殊的邊界語塊:標點符號語塊,它不包含任何語義,但是它是很多不同語塊的默認邊界,對提高語塊分析的準確率有重要的作用。

表1 語塊定義
根據定義的語塊對原始語料庫進行手動語塊標注,得到語塊分析語料庫。下面給出一個語料的語塊分析結果:[機器人向左]DT[走到墻]MT[,]PT[然后]O[直走到墻角]MT[,]PT[沿墻]PR[向右]DT[走到門]MT[,]PT[進門]SC[直走到凳子旁]MT[。]PT
2.1.2 基于條件隨機場(CRF)的語塊分析
語塊分析問題是一種分類問題,本文采用條件隨機場進行語塊分析。條件隨機場,是一種鑒別式概率模型,是隨機場的一種,它具有表達長距離依賴性和交疊性特征的能力,同時能夠較好地解決標注偏置等問題,而且所有特征可以進行全局歸一化,能夠求得全局的最優解。
CRF是一個在給定輸入節點條件下計算輸出節點條件概率的無向圖模型。對于指定的節點輸入值, 它能計算指定節點輸出值的條件概率, 其訓練目標是使得條件概率最大化。如一個中文詞序列x=(機器人,向,左,走,到,墻),定義y為一個長度與x相等的狀態序列,y=(B-DT,I-DT,I-DT,B-MT,I-MT,I-MT)。對于一個帶有參數Λ=λ1,λ2,…,λn的線性鏈。CRF將給定的輸入序列x得到的狀態序列條件概率定義為
式中:ZΛ(x)是歸一化因子,fk(yt-1,yt,x,t)是整個觀察序列和相應標記序列中位置為t和t-1標記的特征函數,λK是在訓練中得到的并與每個特征fk相關的權重值。
CRF模型的訓練采用 LBFGS方法, 即在給定輸入序列的情況下估計模型參數,把它們對應標注序列構成的集合的條件概率最大化。
CRF模型的關鍵在于選擇 Markov階數和特征集合。通過 CRF特征函數可以指定各種狀態轉換結構, 這些狀態轉換結構具有不同的Markov階數, 即特征函數中出現輸出標記的個數。高階特征能把握更多的長度依賴關系, 但也需要更大的訓練開銷, 并帶來更嚴重的數據稀疏問題。本文選擇二階CRF模型。
所有特征模板由4類模板元素組成,即詞本身(W)、詞性(P)、詞的語塊標注(C)、詞的依存關系標注(D)。模板元素的下標數字即表示該模板元素的相應詞位置,下標為0即表示當前詞,-i則表示當前詞的前數第i個詞,+i則表示當前詞的后數第i個詞。模板元素和下標數字構成單一特征模板,例如:W0表示當前詞,P1表示當前詞的詞性。單一特征只考慮了單個因素,但是單個因素并不能完全表達上下文的語言現象。因此,可通過對單一特征進行組合,構造一些復合特征。例如:C-1/C0表示前數第1個詞的語塊標注與當前詞的語塊標注兩個單一特征的組合。P-1/P0/P+1則表示前數第1個詞的詞性和當前詞性和后數第1個詞的詞性3個單一特征的組合。特征模板由所有的特征組成。
表2是語塊分析的特征模板。其中,W-2,W-1,W0,W+1,W+2表示5個獨立的單一特征。

表2 語塊分析的CRF特征模板
定制好特征模板之后,通過訓練得到相應的CFR模型,使用該模型可以自動得到語塊分析標注結果。
在自然語言處理中,有時需要知道句子中詞與詞之間的依存關系。用詞與詞之間的依存關系來描述語言結構的框架稱為依存語法。利用依存語法進行依存句法分析也是自然語言處理的重要手段之一。
2.2.1 依存句法問題轉化為序列標注問題
依存句法問題可以看作一種分類問題。句子中任意兩個詞都只存在3種依存關系[17]:
1)不存在依存關系;
2)存在向左的依存關系,即支配詞在從屬詞之前;
3)存在向右的依存關系,即支配詞在從屬詞之后。
根據以上定義,任何依存關系都可以由距離和方向兩個因素決定。將每個詞的標簽定義為如下形式:[+/-]dPOS。其中“+”表示支配詞在從屬詞之后,“-”表示支配詞在從屬詞之前,POS表示支配詞的詞性,“d”表示從屬詞和支配詞之間存在和支配詞具有相同詞性的數量。
2.2.2 基于CRF的依存句法分析
類似于語塊分析,依然使用CRF模型完成依存句法分析。
根據本文定義的依存句法標注方式,當前詞的依存標簽取決于位于其左或其右的支配詞,而不是前后多個詞。由于依存句法經常會出現較長距離的依存關系,因此盡可能地將特征模板的范圍定義得更寬。根據上述特點,定義特征模板如下:W-4,W-3,W-2,W-1,W0,W+1,W+2,P-4,P-3,P-2,P-1,P0,P+1,P+2,P-2/P-1,P-1/P0,W-2/W-1。
語義角色標注是一種淺層語義分析,其目標是發現在一個給定的輸入句子的每個謂詞的論元結構。
自動語義角色標注是在句法分析的基礎上進行的,本文分別使用了語塊分析和依存句法分析,因此,語義角色標注方法也分為基于語塊分析的語義角色標注和基于依存句法分析的語義角色標注。
語義角色標注是獲取句子層面語義的重要方法,對于路徑自然語言來說,其關鍵語義都包含在某幾個語義角色中。因此在語義角色標注的基礎上提取語義會比較容易。
語義角色分為核心語義角色和附加語義角色。Arg+數字,表示核心語義角色(core argument),其中Arg0通常表示動作的施事,Arg1通常表示動作的受事,Arg2~Arg4 根據謂語動詞不同具有不同的語義含義。ArgM-*代表附屬成分,這里的“*”表示附屬成分的功能,如表3所示。
根據表3語義角色類型進行手動標注,為語義角色標注提供語料庫。下面給出一個語料的語義角色標注結果:[機器人]A0[向左]AM-DIR[走到]V[墻]A1[,]O[然后]AM-ADV[直]AM-ADV[走到]V[墻角]AO[,]O[沿著墻]AM-LOC[向右] AM-DIR[走到]V[門][,]O[進]V[門]A1[直] AM-ADV [走到]V[凳子旁]A1[。]O
本文將語義角色標注作為一個序列標注問題來解決,因此依然用CRF模型進行語義角色標注。
基于語塊分析的語義角色標注的模板需要有所變化。最主要的是將語塊分析的結果作為特征集添加到語義角色標注的特征模板當中。基于語塊分析的語義角色標注特征模板定義如下:W-2,W-1,W0,W+1,W+2,P-2,P-1,P0,P+1,P+2,C-2,C-1,C0,C+1,C+2,W-1/W-0,W0/W+1,P-1/P0,P0/P+1,C-1/C0,C0/C+1,P-2/P-1/P0。
將依存句法分析的結果作為特征集添加到新的特征模板,基于語塊分析的語義角色標注特征模板定義如下:W-2,W-1,W0,W+1,W+2,P-2,P-1,P0,P+1,P+2,D-2,D-1,D0,D+1,D+2,W-1/W-0,W0/W+1,P-1/P0,P0/P+1,D-1/D0,D0/D+1,P-2/P-1/P0。
定義新的特征模板,使用訓練語料庫訓練模型,基于語塊分析和依存句法分析的語義角色標注的特征模板定義如下:W-1,W0,W+1,P-1,P0,P+1,C-1,C0,C+1,D-1,D0,D+1。
一條完整的路徑可以由多個路徑單元組成。本文將路徑分割為若干個路徑單元,劃分原則為每個路徑單元有且只有一個運動目標并且運動控制一定存在。根據這兩個原則,在獲取路徑單元時可以根據運動目標和運動控制模塊是否都不為空來判斷路徑單元是否完整。
一個路徑單元由4個部分組成:運動主體、運動方向、運動控制、運動目標(可能有運動參考)。這4個部分都可以從不同的語義角色中提取。
1)運動主體:從A0中根據詞性(名詞)直接獲取,默認為“機器人”。
2)運動方向:從AM-DIR中根據詞性提取,方向包括基本方向(方位詞)和角度(量詞),默認為“向前”。
規定8個基本方向(前,后,左,右,左前,右前,左后,右后),相隔為45°。如果語料中沒有出現具體的角度描述,例如:“向左轉”,就默認為“向左轉90°”。
3)運動控制:從V中根據詞性獲取
導航任務謂詞絕大多數都是“走”、“直行”等等動詞,有時候可能會出現“穿過”,“繞過”,“拿”這些詞語。將表示行走的謂詞統一為“走”,因為這些詞對導航的影響相同。
4)運動目標(可能有運動參考)
A1和AM-LOC語義角色就是需要的運動目標,但是對于導航任務來說,名詞是較為復雜的模塊,因為它既可以作為運動目標也可以作為運動參考,僅僅從語義角色和詞性中獲取不到清晰的導航信息。本文提出一種基于依存關系提取路徑自然語言運動目標和運動參考模塊的方法。對于路徑自然語言A1和LOC中的名詞,包含以下幾種情況:
①單個名詞依存于動詞,這種情況最簡單。這個名詞就是運動目標。例如“繞過桌子”,“桌子”依存于動詞“繞過”,“桌子”就是運動目標。
②單個名詞并不依存于動詞。例如“走到沙發旁”,依存關系為“沙發”依存于“旁”,這時“旁”依存于動詞“到”,可以根據這一特點提取到名詞短語“沙發旁”。“沙發旁”就是提取到的運動目標。
③多個名詞(多為兩個名詞)。對于多個名詞,絕大多數是兩個名詞。偶爾出現3個名詞也可以被處理成單個名詞。例如“沙發前面的桌子上的花瓶”,可以將“沙發前面的桌子”看作一個名詞,“花瓶”看作一個名詞,因此可以將多個名詞的處理方法簡化為兩個名詞的處理方法。
對于兩個名詞,可能出現如下兩種情況。
1)名詞之間的依存關系是并列關系。
例如“桌子和椅子”,這時可以將它看作單個名詞,通過下一步的分析得到正確的運動目標。例如“走到桌子和椅子前”,“桌子和椅子”依存于“前”,“前”依存于動詞“走到”,因此“桌子和椅子前”就是運動目標。
2)名詞之間存在依存關系。
例如“拿桌子上的書”,“桌子上的書”被標注為A1,“桌子”依存于“上”,“上”依存于“書”,“書”依存于動詞“拿”。“桌子上”可以看作一個名詞,此時由于名詞“書”依存于動詞“拿”,所以“書”是運動目標,“桌子上”依存于名詞“書”,它作為運動參考。
少量的運動目標存在于AM-LOC語義角色。對于AM-LOC語義角色,首先根據其中的語塊類型確定其是運動參考或者是運動目標。對于“PR”語塊,其中的名詞短語可以直接填充到運動參考模塊。對于“SC”語塊,通過上述名詞的處理方法填充到相應的模塊。
在生成的路徑單元的基礎上,按順序將路徑單元整合在一起,就生成了最終的導航路徑。
將語料庫按照4∶1的比例進行劃分,其中80%為訓練語料,20%為測試語料。然后根據定義的特征模板對訓練語料庫進行訓練,得到相應的訓練模型,再用測試語料庫測試得到的訓練模型的準確率。
本文需要用到以下的實驗指標:


實驗1 語塊分析實驗
表4是各個語塊分析結果。由表4可見,語塊分析的準確率、召回率、F1值都非常高,說明之前確定的分塊類型是合理的,適用于路徑自然語言處理領域。較高的語塊分析準確率也很符合接下來在語塊分析的基礎上進行語義角色標注的要求。

表4 語塊分析結果
實驗2 依存句法分析實驗
表5是依存句法實驗結果。本文直接用依存句法自動標注的平均值表示依存句法分析結果。和語塊分析相比,它的準確率、召回率、F1值都相對較低。其原因有兩點:1)依存句法的依存關系類型較多,而且其劃分邊界并不明顯,導致了識別率下降;2)由于某些從屬詞和支配詞之間的距離過長,導致了依存關系的標注準確率下降。但是對于某些語義角色標注識別,依存句法相比于語塊分析有著更好的效果,下一節將會詳細闡述。

表5 依存句法分析結果
實驗3 基于語塊分析的SRL
表6是基于語塊分析的語義角色標注的結果。從表6的結果中可以看出,基于語塊分析的語義角色標注準確率、召回率、F1值分別達到了96.77%、97.78%、97.27%。

表6 基于語塊分析的SRL結果
實驗4 基于依存句法分析的SRL
表7是基于依存句法分析的語義角色標注結果。通過和表6得到的結果對比發現,雖然基于依存句法分析的SRL的平均值比基于語塊分析的SRL要低。但是對于A0、AM-ADV語義角色,基于依存句法分析的結果明顯較好。
表7基于依存句法分析的SRL結果
Table7TheresultofSRLbasedondependencyparsing%

語義角色PRF1A0100.00100.00100.00A198.1197.6597.88AM?ADV98.0586.3091.88AM?DIR96.1198.7397.40AM?LOC89.1382.0085.42V91.5494.2892.89平均值95.0094.5394.76
實驗5 基于語塊分析和依存句法分析的SRL
通過分析表5和表6發現,對于自然語言處理的語義角色標注任務,語塊分析和依存句法分析都有其優點。
基于語塊分析的語義角色標注的準確率的平均值更高,這是因為在語塊劃分時就已經做了初步的語義切分工作。
例如:“DT”語塊一般就包含AM-DIR語義角色,訓練得到的模型也就更容易識別出AM-DIR語義角色。
基于依存句法分析的語義角色標注雖然平均準確率較低,但是其A0、AM-ADV等語義角色標注準確率非常高,這是因為這些語義角色標注可以很簡單地由依存句法標注得到。
例如:A0語義角色,它一般就代表“機器人”,而“機器人”往往就依存于第1個動詞,其依存關系標注為“+1V/SBV”。在將依存關系特征加入特征集之后,訓練得到模型的語義角色標注準確率就更高。
為了融合依存句法和語塊分析的優點,本文提出一種基于語塊分析和依存句法分析的融合語義角色標注方法。表8是基于語塊分析和依存句法分析的語義角色標注結果。
通過分析準確率發現:
1)基于依存句法分析的SRL的A0和AM-ADV語義角色準確率最高;
2)基于語塊分析的SRL的AM-LOC語義角色準確率最高。
3)基于語塊和句法的SRL的A1、AM-DIR和V的語義角色準確率最高。
綜上所述,基于語塊加依存句法分析的SRL平均準確率最高。而且對于機器人導航任務來說,路徑單元主要由以下4個部分組成:謂詞、方向詞、參考、目標。這4個部分正好分別在V、AM-DIR、A1中。綜合來看,使用第3種方法最合適。
表8基于語塊分析和依存句法分析的SRL結果
Table8TheresultofSRLbasedonchunkinganddependencyparsing%

在簡單的室內環境中使用Nao機器人完成實際導航任務。本文希望將處理好的自然語言輸入給Nao機器人后,Nao機器人可以通過感知周圍環境自主完成導航任務。本次實驗所需要的圖像識別模塊通過使用機器人自帶的landmark識別函數識別特殊符號替代。
圖3是進行機器人導航實驗的實際環境,導航需要識別的物體分別貼上了不同的landmark標簽。

圖3 實際環境Fig.3 Actual environment
實驗1 機器人在簡單無障礙的環境下完成導航
輸入一段自然語言描述的路徑導航任務:“機器人向前走到盆栽,再向左走到電腦主機處右轉找到吉他。”依次提取出路徑單元,將路徑單元中“運動目標”、“運動控制”、“運動目標和參考”信息輸入,控制機器人依次完成每個路徑單元的導航。在行進過程中,機器人通過聲納確定前方是否有物體,再通過圖像識別模塊判斷物體是障礙或者是運動目標。
圖4為實驗1的機器人實際行走路線。

圖4 機器人實際行走路線 1Fig.4 Robot walking route 1
圖4中A代表機器人,B代表盆栽,C代表電腦主機,D代表吉他。從圖的機器人行進路線可以看出,機器人在簡單無障礙的環境下可以很輕松地按照抽取的語義信息向目標前進。
實驗2 機器人在復雜有且障礙環境下完成導航
輸入一段自然語言描述的路徑導航任務:“機器人向前走到床,向左走到椅子旁,再向右轉,向前走到花瓶旁,向左走到沙發前,繞過沙發走到書桌前。”
圖5為實驗2的機器人實際行走路線。

圖5 機器人實際行走路線 2Fig.5 Robot walking route 2
圖5中A代表機器人,B代表床,C代表椅子,D代表花瓶,E代表沙發,F代表書桌。在機器人預計的行進路線上設置兩個障礙:X代表大箱子,Y代表一個站在路線上的行人。從圖中機器人行進路線可以看出,機器人在較復雜有障礙的情況下依然可以避開障礙完成導航。
為了最終實現基于路徑自然語言處理的機器人導航,本文分別提出了基于語塊分析的語義角色標注方法、基于依存句法分析的語義角色標注方法和基于語塊分析和依存句法分析融合的語義角色標注方法。通過實驗發現,基于語塊分析和依存句法分析融合的語義角色標注方法對路徑自然語言有最好的處理結果。最后使用Nao機器人實現了在簡單環境下完成基于路徑自然語言處理的導航任務,驗證了本文提出的方法是可行的。由于本文的數據集語料較為充足且在非受限條件下獲得,保證了本文問路導航方法的適用性。在后續的研究中,擬搭建更多較為復雜的環境,進一步提高方法的適應導航能力。
[1]WEI Y, BRUNSKILL E, KOLLAR T, et al. Where to go: Interpreting natural directions using global inference[C]//IEEE International Conference on Robotics and Automation. Kobe, Japan, 2009: 3761-3767.
[2]KOLLAR T, TELLEX S, ROY D, et al. Toward understanding natural language directions[C]//2010 5th ACM/IEEE International Conference on Human-Robot Interaction(HRI). Osaka, Japan, 2010: 259-266.
[3]SKUBIC M, PERZANOWSKI D, BLISARD S, et al. Spatial language for human-robot dialogs[J]. IEEE transactions on systems, man, and cybernetics, part c: applications and reviews, 2004, 34(2): 154- 167.
[4]SKUBIC M, HUO Z, ALEXENKO T, et al. Testing an assistive fetch robot with spatial language from older and younger adults[C]//RO-MAN, 2013 IEEE. Gyeongju, South Korea, 2013: 697-702.
[5]SKUBIC M, HUO Z, CARLSON L A, et al. Human-driven spatial language for human-robot interaction[C]//AAAI Conference on Human-Robot Interaction in Elder Care. San Francisco, USA, 2011: 32-34.
[6]LI X, HUANG X, DEZERT J, et al. A successful applicat ion of DSmT in sonar grid map building and comparison with DST-based approach[J]. International journal of innovative computing, information and control, 2007, 3(3): 539-549.
[7]LI X, DEZERT J, SMARANDACHE F, et al. Evidence support ing measure of similarity for reducing the complexity in informat ion fusion[J]. Information sciences, 2011, 181(10): 1818-1835.
[8]石朝俠,洪炳镕,周彤,等. 大規模環境下的拓撲地圖創建與導航[J]. 機器人, 2007, 29(5): 433-438.
SHI Chaoxia, HONG Bingrong, ZHOU Tong, et al. Topological map building and navigation in large-scale environment ents[J]. Robot, 2007, 29(5): 433-438.
[9]莊嚴,徐曉東,王偉.移動機器人幾何-拓撲混合地圖的構建及自定位研究[J]. 控制與決策, 2005, 20(7): 815-818.
ZHUANG Yan, XU Xiaodong, WANG Wei. Mobile robot geometric-topological map building and self-localization[J]. Control and decision, 2005, 20(7): 815-818.
[10]張秀龍,李新德,戴先中.基于組塊分析的路徑自然語言語義角色標注方法[J]. 東南大學學報: 自然科學版, 2012, 42(z1): 127-131.
ZHANG Xiulong, LI Xingde, DAI Xianzhong. Semantic role labeling method for route natural language based on chunk parsing[J]. Journal of southeast university: natural science edition, 2012, 42(zl): 127-131.
[11]李新德, 張秀龍, 戴先中.一種基于受限自然語言處理的移動機器人視覺導航方法[J]. 機器人, 2011, 33(6): 742-749.
LI Xingde, ZHANG Xiulong, DAI Xianzhong. A visual navigation method of mobile robot based on constrained natural language processing[J]. Robot, 2011, 33(6): 742-749.
[12]李新德, 張秀龍.一種面向室內智能機器人導航的路徑自然語言處理方法[J]. 自動化學報, 2012, 40(2): 289-305.
LI Xinde, ZHANG Xiulong. A route instruction method using natural language processing for indoor intelligent robot navigation[J]. Acta automatica sinica, 2012, 40(2): 289-305.
[13]ABNEY S P. Parsing by chunks[M]//Principle-Based Parsing. Springer Netherlands, 1991: 257-278.
[14]周強,孫茂松,黃昌寧.漢語句子的組塊分析體系[J]. 計算機學報, 1999, 22(11): 1158-1165.
ZHOU Qiang ,SUN Maosong, HUANG Changning. Chunk parsing scheme for Chinese sentences[J]. Chinese journal of computers, 1999, 22(11): 1158-1165.
[15]李素建,劉群.漢語組塊的定義和獲取[C]//全國計算語言學聯合學術會議. 蘇州,中國, 2003: 110-115.
LI SUJIAN, LIU QUN. Research on definition and acquisition of chunk[C]//CCL 2016. Suzhou, China, 2003: 110-115.
[16]孫宏林, 俞士汶.淺層句法分析方法概述[J]. 當代語言學, 2000, 2(2): 74-83.
SUN HONGLIN, YU SHIWEN. A summary of shallow parsing methods[J]. Contemporary linguistics, 2000, 2(2): 74-83.
[17]計峰, 邱錫鵬. 基于序列標注的中文依存句法分析方法[J]. 計算機應用與軟件, 2009, 26(10): 133-135.
JI FENG, QIU XIPENG. A new Chinese dependence analysis method based on sequence labeling model[J]. Computer applications and software, 2009, 26(10): 133-135.
The18thInternationalConferenceonIntelligentDataEngineeringandAutomatedLearning
The International Conference on Intelligent Data Engineering and Automated Learning (IDEAL) is an annual international conference dedicated to emerging and challenging topics in intelligent data analysis, data mining and their associated learning systems and paradigms. Its core themes include: the Big Data challenges, Machine Learning, Data Mining, Information Retrieval and Management, Bio- and Neuro-Informatics, Bio-Inspired Models (including Neural Networks, Evolutionary Computation and Swarm Intelligence), Agents and Hybrid Intelligent Systems, and Real-world Applications of Intelligent Techniques. Other related and emerging themes and topics are also welcome.
The conference provides a unique opportunity and stimulating forum for presenting and discussing the latest theoretical advances and real-world applications in Computational Intelligence and Intelligent Data Analysis. Authors and researchers are warmly invited to submit their latest findings and research work to the conference.
The International Conference on Intelligent Data Engineering and Automated Learning (IDEAL) is an annual international conference dedicated to emerging and challenging topics in intelligent data analysis, data mining and their associated learning systems and paradigms. Its core themes include: the Big Data challenges, Machine Learning, Data Mining, Information Retrieval and Management, Bio- and Neuro-Informatics, Bio-Inspired Models (including Neural Networks, Evolutionary Computation and Swarm Intelligence), Agents and Hybrid Intelligent Systems, and Real-world Applications of Intelligent Techniques. Other related and emerging themes and topics are also welcome.
Website:http://ideal2017.guet.edu.cn/ideal/
Robotnavigationbasedonnon-restrictedroutenaturallanguageprocessing
ZHANG Ke, CHEN Qi
(Department of Electronic and Communication, North China Electric Power University Code, Baoding 071003, China)
In order to use a natural-language controlled robot to complete autonomous navigation, this paper proposes a semantic extraction method based on semantic role labeling (SRL), which is used to enhance the understanding of route natural language for robots. First, a non-restricted route natural language corpus is constructed. Then, based on thorough study of this corpus, eight chunks are put forward to analyze the data, which lays the foundation for SRL. Finally, an SRL based on chunking and dependency parsing is proposed. The experimental results of precision, recall, andF1-measurements were 98.22%, 98.48%, and 98.35%, respectively. Using the proposed SRL method, the robot Nao was able to accomplish navigation tasks by asking the way.
semantic role labeling; route natural language; chunking;dependency parsing; robot navigation by asking the way
2016-07-18.網絡出版日期
國家自然科學基金項目(61302163,61302105);河北省自然科學基金項目(Ff2015502062);中央高校基本科研經費項目(2016MS99).
張珂. E-mail:zhangke41616@126.com.
10.11992/tis.201607016
http://www.cnki.net/kcms/detail/23.1538.TP.
TP18
A
1673-4785(2017)04-0482-09
中文引用格式:張珂,陳奇.非受限路徑自然語言處理中的機器人導航J.智能系統學報, 2017, 12(4): 482-490.
英文引用格式:ZHANGKe,CHENQi.Robotnavigationbasedonnon-restrictedroutenaturallanguageprocessingJ.CAAItransactionsonintelligentsystems, 2017, 12(4): 482-490.

張珂,男,1980年生,副教授,人工智能學會會員,計算機學會會員。主要研究方向為電力智能信息處理、圖像處理、自然語言處理、機器人認知。

陳奇,男,1992年生,碩士研究生,主要研究方向為自然語言處理。