編譯 胡德良
深度學習網絡中一個被忽視的特征可能會成為人工智能領域的重大突破口。
小時候,初步進入數學世界時,我們學會了一個蘋果加另一個蘋果等于兩個蘋果,我們還學會了為真實事物計數。直到后來,我們才接觸到一個奇怪的概念:零,或者說一個空盒子里的蘋果數量。
阿拉伯學者和意大利數學家斐波納契把“零”的概念引入現代數字系統之后,給數學帶來了革命性的變化。當今,盡管我們在所有數學運算中自如地使用零,但是“無(nothing)”或“零”的概念尚未進入人工智能(AI)領域。從某種意義上說,AI和深度學習仍然需要學習如何利用“無”的概念進行識別和推理。
從傳統意義上來講,深度神經網絡(DNN)之類的深度學習算法在監督之下進行訓練,以便識別特定種類的事物。在一項典型的任務中,研究人員可能會訓練DNN以可視方式識別一定數量的類別,例如,識別蘋果和香蕉的圖片。一旦獲得相當多的數據,而且數據具有相當高的質量,深度學習算法實際上非常擅長提供錯誤率低的、可信的精確分類。
當第三個未知對象出現在DNN的面前時,就會出現問題。如果引入了訓練集合中不存在的未知對象,如橘子,那么網絡將被迫“猜測”,把橘子歸類為跟捕獲的未知對象最接近的類別——蘋果!
基本上,用蘋果和香蕉訓練的DNN系統完全由蘋果和香蕉組成,它無法想象整個水果籃里都有什么水果。
在所有應用中,盡管對“無”或者“類別歸零”的用途還不是很清楚,但是在訓練和部署DNN時,其概念在許多方面都是非常有用的。
在訓練過程中,如果DNN能夠將項目分類為“蘋果”“香蕉”或“無”,那么算法的開發人員可以確定它是否學會了有效辨認特定的類別。經過培訓識別了新鮮蘋果和香蕉的DNN,如果出現與已學會識別的水果類型有偏差的水果,那么它就會回應“無”。從這個意義上講,DNN可以充當異常網絡檢測——除了對蘋果和香蕉進行分類之外,不用經過進一步更改,它就可以發出信號,表明它注意到了偏離規范的其他情況。
到目前為止,還沒有簡單的方法來訓練標準DNN,使其能夠提供以上功能。
一種稱為“終身DNN(lifelong DNN)”的新方法會自然而然地將“無”的概念納入架構中。通過過去所學到的東西以及巧妙地利用反饋機制,終身DNN可以確定某種輸入是匹配還是不匹配,以此來辨識符合規范與否。
這種機制類似于人類的學習方式:在潛意識中,我們不斷檢查我們的預測是否符合真實的情況。例如,如果有人對你搞惡作劇,改變了辦公椅的高度,你會立即注意到這一點。那是因為隨著時間的推移,你了解到辦公椅的高度,你對此有了一個“模型”——如果這個模型不規范,你將立即意識到異常。我們人類不斷檢查自己的分類是否符合實際情況,如果不符合,我們的大腦就會注意到,并且發出警報。終身DNN在發揮功能時會充分體現這種機制,因此,在確定已學到的模型不規范時,它會發出“無”的信號。
以蘋果和香蕉為例對“無”的概念有了基本了解之后,現在我們來考慮一下這一概念在水果識別之外的實際應用中該如何發揮作用。
考慮一下制造業,該行業的機器負責生產大量產品。通過對傳統的計算機視覺系統進行培訓來識別產品中各種不同的異常情況(如表面劃痕),這是非常具有挑戰性的。在運行良好的生產線上,看起來沒有多少產品屬于“次品”,且“次品”以多種形式存在,根本沒有可用于培訓系統的大量次品數據。
但是,借助終身DNN,開發人員可以通過訓練計算機視覺系統來識別“優質”產品的各種樣品。然后,當系統檢測到與優質產品的界定不符的產品時,可以將該產品歸類為異常,使其等候適當處理。
對于制造商而言,終身DNN及其發現異常情況的能力可以為其節省時間并提高生產線上的效率。對于其他許多越來越依賴人工智能的行業來說,也會有類似的益處。沒想到“無”的概念竟有如此的重要性!