徐詠,黃文海,黃波,王揚棟,黃麗林,楊程鈞
(河池學院 人工智能與制造學院,廣西 河池 546300)
傳統的實驗設備識別和管理只能對特定的標簽進行識別,即在每樣實驗設備上標記條形碼或二維碼,通過掃碼器對設備的條形碼或者二維碼進行出庫入庫操作[1-2],而且沒有一個較為精確的物品定位功能,也沒有容錯機制,若是設備找不到,只能通過實驗室管理員到現場查找。在科技不斷發展的今天,基于深度學習的圖像識別技術為解決實驗室設備管理問題提供了方向,但目前國內將這項技術應用于實驗室設備識別和管理方面的研究和應用還較少。為了解決實驗室設備管理及其圖像識別問題,本文回顧和分析深度學習在圖片識別方面突出的成果及其發展趨勢,并對其在實驗室設備管理方向的未來應用進行展望。
從1924年心理學家McCulloch和Pitts提出MP神經元模型到Rosenblatt將單層感知器網絡模型應用于實踐,再到2006年深度學習之父Hinton教授提出的深度學習這一概念之后[3],深度學習經過十幾年的快速發展,當今最受歡迎的深度學習模型有卷積神經網絡CNN、深度自動編碼器網絡DAN、生成式對抗網絡GAN、循環神經網絡RNN和深度信念網絡DBN等[4-5]。目前,深度學習在圖像進行識別領域已經有了較為廣泛的應用,如人臉識別、車牌識別和手勢識別等。這些領域的實際應用給實驗室設備的管理者提供了許多可以借鑒的經驗,但是將圖像識別技術應用于實驗室設備管理還存在以下難點:
首先,目前深度學習技術大部分采用有監督訓練方式,但是實驗室設備種類多,更新快,導致將所有收集到的圖片都進行標注的工作變得非常繁瑣,這樣使得有監督的訓練模型難以實現。
其次,深度學習的設備圖像識別技術,需要有龐大的訓練集進行訓練,才能精確的分辨外形相似的設備以及定位設備位置,但由于實驗室設備有種類繁多,更新速度快等特點,這使得很難在實驗設備入庫之初就采集到足夠的樣本訓練集,存在訓練樣本數量不足的問題。
無監督學習是指計算機在沒有樣本標簽和標號監督的情況下進行學習的過程,在廣義上分為自由組織學習與強化學習。在實際任務中,標記數據集耗費很高的人力和時間,無監督學習利用大量未標記的數據集來滿足機器學習的訓練量要求,故無監督學習的主要研究方向是如何利用好未標記的數據。其中自由組織學習是利用競爭性學習規則[11],網絡化表達質量的任務度量,對那些正確的行為作出激勵,對那些錯誤的行為進行抑制,讓機器在這個過程中不斷根據這個度量來優化自己的網絡。強化學習的目的是將代價函數最小化,通過一些隨機信息進行學習,做出最佳的行動,以獲得最多的獎勵,但存在機器所做出的反應不僅會對目前的獎勵產生影響,還會對隨后的動作和一系列的獎勵產生影響。
在圖像領域,通過引入了對偶學習,利用任務之間的反饋信息,就能克服模型對數據的依賴問題。例如Van Tulder等人的無監督深度學習模型玻爾茲曼機和Chen等人的對偶TriNet網絡[6-7],但是目前只能應用于樣本較為簡單的模型??梢姡Y合對偶學習等技術采用無監督學習的圖像識別技術可解決實驗室設備圖像識別標注繁瑣的問題。
目前,在深度學習中針對訓練樣本數量不足問題,常采用遷移學習和元學習方法解決。常見的卷積神經網絡樣本學習模式,致力于解決樣本不足而導致模型過擬合等問題,簡單的數據增強與正則化方式可以緩解,但是并無法缺少樣本導致識別率低的問題。通過特征提取技術可以有效提高小樣本下的圖像識別率,利用注意力機制與記憶力機制[7],設計特征提取網路和分類器之間的映射關系,建立適應數據分布的特征提取模型。
遷移學習使卷積神經網絡適應小樣本數據,降低了參數和特征提取的消耗,直接遷移已經尋找到的具有相同特征的基類模型數據到新類模型,目前常用的遷移學習方法包括基于特征的、基于樣本的、基于模型的和基于關系的。
基于特征的遷移學習由Chen等人在2019年提出[8],首先進行數據增強,提取和分類基類數據的特征,通過共同特征訓練實現一個可用在基類數據與新類數據的分類器,最終實現將源域和目標域的特征變換到同一個空間?;跇颖镜倪w移學習,其樣本遷移對象包括源域和目標域,對象中樣本相似度高的權重值給予高,相似度低的權重值給予低?;谀P偷倪w移學習,也叫基于參數共享的遷移學習,由于神經網絡的結構可以直接遷移,因此其應用廣泛,例如最經典的finetune、Oquab等人的微調策略和Qiao等人的激活功能層預測分類參數算法等[9-10]?;陉P系的遷移學習比較關注目標域和源域之間的關系,其方法思路與其他方法截然不同,Hinton的知識蒸餾概念是用小網絡模擬大網絡[11],之后Kimura等人提出不同的提煉方法豐富和發展知識蒸餾[12]。
元學習是一種模仿人類學習模式的機器學習方法,早在1985年John Biggs將元學習定義為“了解并控制自身學習”。一般的元學習就是獲取知識多功能性的能力,利用元學習,可以讓機器通過學習獲得學習經驗,再利用這些經驗來評估最終的目標任務。不同的元學習模型采用不同的技術,目前的常見的元學習類型有:基于度量的元學習、基于循環模型的元學習、基于優化器的元學習和基于小樣本的元學習。
基于度量的元學習是為了實現一個高效學習度量空間,2015年Koch等人提出了一種用于字符識別的深卷積孿生網絡[13],將度量元學習應用于分類問題。2018年,Bartunov等人設計了一種比余弦距離計算復雜度更高的生成性匹配網絡GMN[14],實現了快速從小數據集學習新概念,不僅可以提高圖像特征的表示能力,而且可以提高圖像的多樣性,同時也探討了范疇之間的關系?;谘h模型的元學習適用于RNNs,算法將訓練RNN模型依次處理先前的數據,然后再處理后面的數據,2019年Ren等人提出的將增量學習與元學習相結合的注意吸引網絡AAN就是這種方法的一個例子[15]?;趦灮鞯脑獙W習是一個神經網絡將不同的優化應用于另一個神經網絡,從而優化實現目標,例如Finn等人提出的模型不可知算法MAML[16]。基于小樣本的元學習啟發了記憶增強神經網絡或單樣本生成模型等技術的產生,核心是創建深層神經網絡從簡易數據中學習。
綜上,采用無監督學習的圖像識別技術可解決設備圖像識別標注繁瑣問題;小樣本學習在較為復雜的場景如人臉識別和車輛識別時,其應用效果并不理想,但在模式與背景較為簡單的分類數據集上有較好的表現。針對采用有監督的訓練模型存在標注圖片繁瑣和訓練樣本數量不足的問題,本文分析了無監督學習與小樣本學習的圖像識別技術在其他領域的應用及特點,在目前高校實驗室設備種類多、環境單一和同類型設備較多情況下,采用無監督學習與小樣本學習的圖像識別技術可應用于實驗室設備圖像識別,是實現智能化實驗室設備管理的突破點。