鐘修皓,王曉虹,劉文壯,張 錫,張 彤
(遼寧石油化工大學 計算機與通信工程學院,遼寧 撫順 113001)
近年來隨著人工智能技術、計算機技術等相關技術的發展,對移動機器人的研究越來越多。智能語音巡檢機器人可有效地應用在石化、油田、核工業等行業中,尤其在管道、罐體塔體等人員不方便到達的區域,智能語音機器人可以發揮其優勢。本系統可以通過語音來指揮現場的巡檢機器人進行圖像采集、準確的測試周圍環境相關參數、全方位查看容器內部的損傷等情況,從而可以減少意外事故的發生。與常規的無損檢測設備相比,系統引入了多傳感器系統的智能語音機器人,在檢測靈活性和可靠性上有不可比擬的優勢。而且,系統檢測的數據的準確性非常高。經過現場實驗表明,該系統智能化程度高,運動穩定可靠,本系統具有很高的推廣價值,有廣闊的應用前景。目前,國內外對環境、設備等的安全監測問題一直是重要的研究方向。
本系統的基本功能是采用智能語音機器人對監測介質的指標數據進行監測,通過USB攝像頭全方位采集對象的重要部位圖像,通過運行客戶端、建立連接,由此不斷獲取服務器傳回的視頻信息,得到直觀的介質實際情況。通過各種傳感器獲得當前介質的重要信息,并且通過這些重要信息對監測對象進行危險系數評估,從而為監測對象的安全運行提供精確和有力的技術支撐。
智能語音機器人主要是通過語音識別進行控制行走。機器人的控制主要是通過語音識別指令,機器人再根據指令執行相應的動作,控制是通過附加在MCU上的語音模塊來實現。客戶端監控為用戶提供遠程視頻監控服務,進一步擴展了視頻監控的使用范圍。將PC機通過IP網絡與服務器相連,可以遠程播放。
系統功能結構圖如圖1所示,系統主要包括視頻采集模塊、指標體系數據采集模塊、機器人控制模塊、中控端控制模塊、移動終端控制模塊、數據處理模塊、語音識別模塊、通信模塊等。
系統的每個模塊都包含一個或多個線程,有些線程在系統運行之初就開始運行(如視頻采集線程);有些線程在一定的條件下才被啟動。系統可以通過多線程函數在一定條件下實現相關線程的阻塞或喚醒,從而只運行那些有用的線程,使系統的效率大大增加。
圖1 系統功能圖Fig.1 System function diagram
智能語音巡檢機器人系統采用的硬件平臺是基于ARM體系結構,采用Samsung S3c6410嵌入式微處理器。系統采用兩層架構,上層以S3C6410為核心,負責圖像采集等工作,并將圖像通過Wi-Fi方式發送給PC機,通過語音模塊來完成語音的采集、識別、命令發送。下層以直流電機驅動板為核心,控制機器人的運動以及傳感器數據處理。系統的硬件框圖如圖2所示,以ARM 6410處理器為核心,外圍連接各種傳感器模塊、語音模塊、直流電機模塊、視頻采集模塊、無線傳輸模塊等。
圖2 系統硬件結構圖Fig.2 Hardware structure of the system
Video4Linux(簡稱V4L),是Linux中關于視頻設備的內核驅動[1-2]。Video4Linux是為市場現在常見的電視捕獲卡、并口及USB口的攝像頭提供統一的編程接口。同時也提供無線電通信和文字電視廣播解碼和垂直消隱的數據接口。攝像頭安裝在云臺上,通過程序可控制攝像頭的位置,進而控制攝像的角度,采集到不同角度的圖片。根據Video4Linux標準接口編程,再對采集的圖像進行閥值比較,判斷圖像是否變化,從而決定是否需要存入圖像緩沖區。
為了進一步提高視頻數據的傳輸速度和實時性,采集視頻時利用視頻設備的雙緩沖達到邊傳輸邊采集的效果。同時設計一個內存緩沖池,視頻采集圖像經過JPEG壓縮后將數據保存到緩沖池中,視頻傳輸的數據從該緩沖中獲取。
系統安裝了各種傳感器(如溫濕度傳感器、氣體傳感器、紅外傳感器、煙霧傳感器等)來采集相應的數據作為監測被控對象的重要指標。如溫濕度傳感器通過IIC總線與MCU相連,采取GPIO靜態驅動方式,全量程校準,全靜態時序控制,測量結果精確。煙霧傳感器使用MCU的外部中斷,在驅動需要預熱,當檢測到有危險氣體的,觸發外部中斷,開始報警。
本系統中的無限傳輸采用的是Wi-Fi技術。相比于其他無線通信技術,Wi-Fi的覆蓋半徑則可達300英尺左右約合100 m,其覆蓋范圍比較廣。數Wi-Fi據傳輸速度快,可以達到11 mbps。這些都很適用于本系統,特別是在報警的時候,可以及時將相關的重要數據傳回到中控端和移動終端[3-4]。
2.4.1 語音模塊設計思路
在此系統中,將語音模塊直接接到ARM6410上,并通過此主板對機器人進行語音控制,這樣,就能更便捷地控制機器人而不會像使用PC控制那么繁瑣。在實現中,會采用一種語音識別平臺,通過該平臺對語音數據進行識別,使用開發板的串口連接并且驅動機器人。
2.4.2 語音模塊架構
語音模塊作為本系統的主要特色,此處主要采用基于ARM11的語音識別技術[5-6]。由于本系統采用S3C6410作為MCU,其主頻達到667 MHz,并且具有豐富的接口。智能語音巡檢機器人主要由開發板的麥克風接口對語音進行采集,通過此處的語音模塊對采集的語音數據進行處理,然后通過內部編程由串口向機器人發送相關的指令來驅動電機,從而實現機器人的前進、后退、左轉、右轉等語音控制。
2.4.3 實現流程
語音識別的過程是將人類的自然語言轉化數據信息的過程,語音識別技術也可以簡單描述為Voice-Instructions的識別。語音識別處理的過程為控制著通過麥克風等輸入設備輸入語音信號,然后語音模塊通過接收器接收語音信號,然后將信號信息傳入語音識別平臺,由該平臺將語音數據信息進行相關的處理,從而實現對機器人的控制。實現流程如圖3所示。
移動機器人上層采用語音控制,下層的硬件采用直流電機控制機器人的動作。硬件驅動板主要采用雙Ha橋直流電機驅動芯片,它具有帶載能力強的特點。LKV-HM3.0雙H橋直流電機驅動板采用ST公司的L298N典型雙H橋直流電機驅動芯片,可用于驅動直流電機或雙極性步進電機,此驅動板的特點是體積小,重量輕,具有強大的驅動能力。
移動機器人下層控制主要由電機的開關控制、電機轉向控制、電機轉速控制組合起來的。通過PWD的調速來控制機器人的左轉、右轉、后退、前進、轉彎等動作。
圖3 語音識別流程Fig.3 Speech recognition process
文中研究設計了智能語音機器人系統。系統在以S3C6410為核心的嵌入式硬件平臺上構建了一個適合本系統開發要求的嵌入式Linux系統軟件平臺。系統使用USB攝像頭進行圖像采集;攝像頭帶云臺,可控制攝像的角度;采用無線數據傳輸方式;主板采用S3C6410處理芯片,可以輕松應對視頻采集,視頻處理,無線傳輸等功能。而且可擴展能力強,多種傳感器模塊,并支持傳感器擴展,Linux操作系統支持。系統的適用性很強,可隨時調整攝像頭的位置,拍攝不同角度的畫面,并且可隨時調節畫面的亮度和對比度,這使系統的使用更靈活。系統采用語音來控制機器人的行動,從而可靈活地顯示當前監測對象的現場情況,尤其是人工不易到達的區域,系統準確性高,適用性強。但是語音識別模塊然目前還存在識別率不夠高的問題,還需要進一步去設計和改進。
[1]張永強,趙永勇,李崇德.嵌入式遠程視頻采集系統的設計與實現[J].現代電子技術,2006(4):75-77.ZHANG Yang-qiang,ZHAO Yong-yong,LI Chong-de.The design and implementation of embedded remote video acquisition system[J].The Modern Electronic Technology,2006(4):75-77.
[2]劉潔瑜,王黎明,錢培賢,等.基于MJPEG2000嵌入式網絡視頻采集壓縮系統的設計與實現[J].微電子學與計算機,2004,21(12):168-173.LIU Jie-yu,WANG Li-ming,QIAN Pei-xian,et al.The design and implementation of embedded network video collection and compression system Based MJPEG2000[J].Microelectronics and Computer,2004,21(12):168-173.
[3]俞輝.嵌入式Linux程序設計案與實驗教程[M].北京:機械工業出版社,2009.
[4]陳卓,王田,梁新元.嵌入式系統開發[M].北京:電子工業出版社,2009.
[5]蔚健,劉志勤.基于ARM11的智能語音識別機器人教學平臺設計[J].軟件導刊,2013,12(5):96-98.WEI Jian,LIU Zhi-qin.The design of intelligent speech recognition robot teaching platform based on ARM11[J].Software Tribune,2013,12(5):96-98.
[6]賈艷麗,楊明剛.景點智能語音導航器設計[J].微型機與應用,2012,31(15):21-23.JIA Yan-li,YANG Ming-gang.The design attractions intelligent voice navigation device[J].Micro Computer and Application,2012,31(15):21-23.