陳新龍
21世紀是一個充滿信息的時代,圖像作是人類獲取信息、表達信息和傳遞信息的重要手段。計算機視覺是人工智能領域最熱門的領域之一,其主旨在于利用計算機模擬生物視覺,讓人工智能能夠看到場景中的三維信息。

今天我們就來了解計算機視覺中最為基礎的技術——圖像識別。對圖像識別我們之前已經介紹過,比如日常生活中的拍照識花、無人貨架等。本次實驗使用Mind+軟件,目的是使用Mind+左下角擴展中的網絡服務模塊-AI圖像識別。利用AI圖像可以識別生活中常見的物體,從代碼塊中我們可以看到圖像識別不僅可以截取畫面、識別對比,還可以通過大數據分析識別獲取人臉年齡,獲取圖像中的圖像主題、圖像文字等。
我們曾經用智能語音識別配合掌控板制作了垃圾分類的小工具,今天我們用視覺學習的方法來進行垃圾分類:開啟攝像頭,識別圖像中截取到的畫面,通過大數據分析,分析出圖像中的物體,然后根據垃圾分類列表中的數據判斷物體屬于什么垃圾,如果圖像未能識別成功,系統會啟動詢問模式,需要用戶手動判斷屬于什么垃圾。
先開啟攝像頭,并且使用舞臺顯示攝像頭的畫面,當按下鍵盤空格鍵時,攝像頭開啟識別,從圖像中獲取畫面,系統會自動分析出畫面中的圖像主題。攝像頭識別成功后便會在圖中顯示文字。
那么如何判斷識別的物體是什么垃圾呢?這里需要編寫垃圾識別模塊,為了容易調試我們設置了五個模塊單獨用來區分,四個模塊識別不同垃圾(干垃圾、濕垃圾、有害垃圾、可回收垃圾),最后一個模塊用于詢問,如果檢測不出是什么垃圾,請用戶自行判斷輸入。
如何判斷垃圾的種類呢?需要創建四個列表用于存放不同種類垃圾的細目,當圖像識別成功后,如果物體名稱存在于列表中,系統就能判斷并說出物體是什么垃圾,并且結束當前程序。
如果系統未能匹配到列表中的數據,無法自動識別垃圾種類,那么便跳轉到詢問模塊,由用戶人工判斷物體屬于什么垃圾,并按下數字鍵輸入垃圾種類(1干垃圾,2濕垃圾,3有害垃圾,4可回收物,5重新識別),輸入成功后,系統根據用戶輸入的內容,學習并且更新列表,這也是這個程序具有的學習功能,這樣通過訓練程序將能更好地作為垃圾分類的小工具。
Mind+和Scratch中已經內置了很多優秀的功能模塊和網絡服務,比如視頻偵測、TinyWebDB數據庫,利用這些功能可以做出很多功能超強的軟件。程序源代碼請關注“壹零社”公眾號下載。