鄭振峰,邱 燕,屈寶鵬,劉沛靜,王古森
(陜西國防工業職業技術學院,陜西 西安 710300)
隨著未來智能機器人的不斷發展,人們對人機交互的要求也越來越高,智能化、流暢化、擬人化,這都深深考驗著我們對各種機器模塊的應用能力。文章將探討機器視覺與人工智能的人機交互問題,并從機器人視覺人工智能和機器人控制三個方面來進行闡述。
機器視覺是一項綜合性技術,包括圖像處理、控制電光源照明、光成像傳感器、數字模擬計算機軟件等一系列的模塊組成,機器視覺的主要應用是提高生產的靈活性和自動化程度,一些不適合人工勞動的場所內,使用機器視覺來代替人工勞力,或者在一些自動化程度比較高的生產線上,機器視覺可以極大地提高生產效率。
機器視覺的設計理念首先就是教會機器如何分辨物體或人臉,在以往的傳統技術下,我們無法做到智能識別這一功能,但是伴隨著科技的不斷發展,識別技術也應運而生,使得機器視覺得到了進一步提升的可能性。機器視覺的目標就是模仿人類的識別能力,所以說就需要機器識別系統具有足夠的運算能力,以及相應的硬件支持,如光傳感器,圖像處理等硬件,并且IT人員需要進行大量的算法優化、標注增加機器世界的識別效率。機器識別的主要方式,就是通過已有的編程,識別出物體的具體特征,在對數據庫的已知物理特征進行對比,進而識別出眼前物體。
機器視覺的主要理念思路先進行圖像處理再進行圖像識別。在圖像處理的過程當中,篩選出識別物體的各項物理特征,對圖像進行預制處理,過濾掉其余的干擾因素,將最真實有效的物體特征保留下來。圖像識別階段就是在圖像處理之后的過程當中,對篩選過的物體特征,進行識別處理,根據初始系統圖像特征的處理范圍,進而對已知數據庫中數據進行匹配分析,從而得出結論。
在日常生活中,機器視覺的處理技術十分常,比如說在圖像審核中,對視頻中的各項圖文信息進行收集分析,在預制篩選結果之后留下疑惑信息,并與已知數據庫信息進行對比參照,進而做出審核判斷。又或者聞名于世的阿爾法狗也是機器視覺的典型應用,在阿爾法狗圍棋人工智能系統的應用過程中,需要擁有圖像矯正修正圖像二極化、圖像格式轉和畫直線方圖分析等識別算法,首先為了實現人機博弈的目的,就必須建立一個直角坐標系在棋盤當中,以此作為后續捕捉棋子位置的基礎,然后根據已做好的模板進行棋子查找,將棋盤上的棋子對應到直角坐標系中,這樣就實現了機器視覺,后續就可以由人工智能進行決定落子,這個就是機器算法的作用所在。
阿法狗智能圍棋系統之所以可以做到如此地步,正是因為當今的世界人工智能技術的飛速發展。人工智能的飛速發展得益于處理器等硬件算法能力的不斷提高,使得人工智能可以進一步地應用于人們日常生活當中,隨著技術的不斷發展,出現了越來越多關于人工智能的應用,如智能識別系統、圍棋軟件、機器人深度學習,或者眾所周知的蘋果語音智能系統SIRI。
普通的圍棋系統大概有三層神經網絡,分別為預測網絡,預測對方可能下的棋子,并在系統中進行算法預測,在局勢的不斷改變中,調整網絡中落子概率的分布列表。第二層網絡為策略網絡,該網絡用于判斷各個不同落子所可能產生的不同結果,并對不同落子進行不同的優劣分析。第三層為戰略網絡,即對整個局勢進行長期分析,并決定落子方位,為整個系統運行確定一個大方向,進行遠期的勝負評估。最后三層網絡互相交融,在最后對數據進行量化分析,以此得出最優的落子點。
要想實現上述操作,就必須有一套運行穩定的硬件系統,以CPU為核心進行浮點運算,基礎硬件的運算能力,決定了多層神經網絡算法處理的運行能力,這就要求系統平臺需要提供運算能力較強的硬件設備,保證人工智能系統擁有足夠的運算能力。算速度不僅有CPU決定也與GPU相關,對于人工智能深度學習功能而言,GPU的內存帶寬起到至關重要的作用。
但是僅僅有這些還不夠,人工智能系統還要進行不斷的AI測試,需要進行海量的自動運算作為預測標準。
在經歷了人工智能和機器視覺的過程之后,就進入機器人控制的環節。世界上第一臺商用工業機器人由美國制造,至今已有六十余年,現如今無論是科技水平和運算能力都遠超那時,但是機器人承擔的主要工作,還是簡單的篩選焊接工程處理等方面,沒有做到智能化無人化,如果我們想讓機器人從事更高級的工程應用方面,就要求機器人擁有更加強大的感知能力和運算能力,做到機器視覺、人工智能、機器人控制三維一體的統一工作。
機器人之間是如何實現人工模塊,機器視覺系統和人工智能的相互配合,從而實現人機交互的目的,就拿智能圍棋系統為例。如果想要達到人機交互,我們就需要選用合適的機器人,在選擇機器人的情況之前需要考慮,應該選擇何種驅動方式的機器人,是液壓還是氣壓,并且還要考慮其負載能力,以保證人機交互工程可以正常運行。如果圍棋系統想實現人機交互,就必須考慮安置視覺攝像頭、吸盤等裝置,側面安置機械臂,保證其活動范圍可以覆蓋到整個棋盤之上。
人機交互指的是人與計算機或機器設備之間應用某種方式或者某種語言進行一定程度上的交流,而人機交互在我們的日常生活中也極為常見,小到收音機按鈕,電腦開關鍵,大至汽車方向盤,核反應堆控制室,都可以理解為人機交互。就如同阿爾法狗圍棋系統一般,就是借助機器視覺、人工智能、深度學習等功能的基礎之上進行圍棋運算,進而實現人機交互的目的。盡管機器視覺和機器人控制廣泛的應用于我們的生活當中,但是兩者往往沒有做到相互統一,傳統的生產工序往往集中于一點,比如說運用機器視覺進行樣品篩選,通過機器視覺篩選出殘次品,進而提高成品率。又或者遙控機器人,使用遙控機器人進行高危工作,由人工遠程操作?,F在的機器人技術往往沒有做到智能化,那么就更談不上人機交互的實習,如今隨著科技水平的不斷提高,人機交互的應用能力也不斷提高,開始出現一些智能機器人,內置視覺傳感器,外置機械骨骼,可以如同吃常人一般具有基本邏輯思維能力,與人溝通,甚至發生動作互動。
現如今人機交互的技術領域逐漸向智能化發展,如我們所用的手機智能語音,無人機,智能家居等技術就是十分典型的人機交互功能的應用,我相信在未來會出現越來越多結合機器視覺人工智能機器控制的機器人出現,為我們帶來更加流暢的人機交互體驗。
如果可以實現機器視覺,機器人控制人工智能三維一體合理整合,那么就可以很好地實現人機交互功能,實現智能機器人的第一步。雖然目前機器人的人機交互能力較弱,智能化屬性較低,但是我相信在未來,這項技術一定可以長足發展,造福大眾。