李凱麗
“現(xiàn)在的機(jī)器人有多智能呢?”“機(jī)器人已經(jīng)可以識(shí)別萬物了嗎?”“機(jī)器人的識(shí)別是怎么做到的呢?”隨著我逐漸走入人工智能的世界,這一層層面紗被慢慢揭開。考入研究生后,我加入了創(chuàng)新基地,首次參加的機(jī)器人競賽是基于深度學(xué)習(xí)的圖像識(shí)別比賽。參賽隊(duì)員需要對(duì)三種水果的數(shù)量與種類進(jìn)行識(shí)別,識(shí)別正確即可得分,分?jǐn)?shù)高者獲勝。整個(gè)過程,被我們戲稱為“讓機(jī)器人認(rèn)出水果”。

我的創(chuàng)新基地

水果識(shí)別的工業(yè)派系統(tǒng)展示圖

水果識(shí)別的結(jié)果展示圖
如果要“讓機(jī)器人認(rèn)出水果”,機(jī)器人應(yīng)當(dāng)首先具備什么條件呢?相信大家不難猜出,要讓機(jī)器人有雙“炯炯有神的大眼睛”。因此我們采用了基于TI技術(shù)的“工業(yè)派”為硬件平臺(tái),搭載攝像頭,拍攝圖片,并用顯示屏進(jìn)行實(shí)時(shí)展示識(shí)別結(jié)果?!肮I(yè)派”硬件平臺(tái)是基于異構(gòu)多核處理器設(shè)計(jì)的開源智能硬件開發(fā)平臺(tái),主要面向工業(yè)互聯(lián)網(wǎng)、人工智能、邊緣計(jì)算和智能人機(jī)交互等應(yīng)用領(lǐng)域。
機(jī)器人有了“眼睛”,就應(yīng)當(dāng)努力地讓他“認(rèn)識(shí)”水果。讓機(jī)器人智能化,無非就是讓他學(xué)習(xí)到人們的思維。想象一下,假如在你面前放了蘋果,橘子和香蕉,你又是如何認(rèn)識(shí)他們并立刻分辨出來的呢?也許你會(huì)說,蘋果是紅色的,橘子是橙色的,而香蕉是黃色的。更詳細(xì)一點(diǎn):香蕉是彎的,蘋果和橘子都是圓的;蘋果表面光滑的,橘子表面褶皺。而這些顏色,形狀以及紋理,在深度學(xué)習(xí)中,我們叫作“特征”。實(shí)際上,對(duì)于物體的認(rèn)知,最主要的也就是對(duì)這些特征的學(xué)習(xí)。在這次比賽中,我們采用的方法就是提取水果的周長、面積、顏色、長度、寬度等7個(gè)特征值。
如何讓機(jī)器人學(xué)習(xí)到這些特征呢?專業(yè)地講,我們首先搭建神經(jīng)網(wǎng)絡(luò),把各種各樣的水果以及他們的各種角度的圖片大量地“喂”給機(jī)器人,通過卷積核(一個(gè)方形的權(quán)重矩陣)按照?qǐng)D片大小逐漸卷積計(jì)算權(quán)重,確定最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu),這就是訓(xùn)練過程。換個(gè)通俗的說法,就是我們把數(shù)千張不同角度和不同狀態(tài)的蘋果展示給機(jī)器人看,然后一遍又一遍地告訴他,“具有這些特征的是蘋果”,一直到我們把他沒見過蘋果的圖片給他看,他幾乎都能認(rèn)出來,這就訓(xùn)練成功了。
既然機(jī)器人已經(jīng)認(rèn)識(shí)了水果,那么我們就要讓他進(jìn)行判別。機(jī)器人通過“眼睛”拍到目前擺放的水果,并將拍到的圖像投映到顯示屏上,對(duì)畫面上出現(xiàn)的水果進(jìn)行識(shí)別并顯示結(jié)果?;谥皩W(xué)到的特征,機(jī)器人會(huì)將拍攝到的圖像中的水果,與自己學(xué)到的水果挨個(gè)進(jìn)行對(duì)比,得出它們之間的差異值,將最小差異值的那個(gè)種類,定為自己最終判別的種類,并給出該水果的名稱,也就是“打標(biāo)簽”。
至此,我們就完成了“讓機(jī)器人認(rèn)出水果”。
責(zé)任編輯:宋明晏