徐靜(鄭州大學軟件與應用科技學院,河南 鄭州 450003)
深度學習,作為機器學習研究中一個新的范疇,其過程是創建和模擬人腦進行分析學習的神經網絡,從而能夠模仿人腦的機制,來讀取和分析數據。廣義地說,人工神經網絡更貼近大眾生活的名稱是深度學習,深度學習的“深”是指網絡的深度。在過去深度網絡的說法并不存在,但隨著Hinton在《科學》發表文章指出,如果把神經網絡加深而不是加寬,那么這個網絡會取得很好的效果。深度學習就是由這一現象延伸出來的,此后大家也逐漸習慣用深度學習來建立各種模型并用深度一詞來彰顯模型的特性。
大數據+大模型+大平臺,使得深度學習成為人工智能時代的核心驅動力之一。從自動販賣機到汽車無人駕駛再到機器翻譯,它們背后所隱藏的深度學習及其模型也在不斷的被發掘和研究。目前,關于深度學習的研究熱點主要集中在以下方面:
? 深度強化、遷移學習(感知能力與決策能力的有力結合,AlphaGo,無人超市值守);
? 深度對偶學習(對偶框架下的無監督學習)
? 深度遞歸/循環神經網絡(自然語言處理,如機器翻譯);
? 并行化深度學習(如基于TensorFlow,Caffe基于算法設計下的多通路、多分辨深度網絡搭建與平臺設計);
? 深度生成網絡(深度置信網絡,生成式對抗網絡,變分白編碼器,深度貝葉斯網絡);
?基于卷積神經網絡的目標檢測、識別與迫蹤(RCNN,Fast-RCNN,R-FCN,YOLO,SSD等等);
? 傳統模型與深度學習的融合。
實際上,深度學習并不是一個全新的名詞,它可以追溯到上世紀40年代。迄今為止,它已經經歷了三個階段的發展,但是直到2006年,Hinton等人在機器學習中的相關工作使深度學習又重現大眾眼前并逐漸有復興之象。近年來伴隨著人工智能的普及已經在很多領域取得了重大的突破,也由第一代深度學習模型演化成了后深度學習模型。其中深度卷積神經網絡CNN、深度循環/遞歸神經網絡RNN,LSTM、深度強化學習深度等等均已經在一些具體的現實場景中得到了廣泛地應用。
然而,深度學習在理論上的進展卻遠遠不盡人意。比如說沒有統一的理論可以指導在不同模型中網絡分多少層或者在不同場景下初始化參數應該如何正確設置等等。近年來雖然深度學習已經被廣泛應用且取得了不可思議的研究成果,但這些研究成果并不能很好地解釋其中所蘊含的各種理論。
其次,目前深度學習遇到了嚴重的計算瓶頸。在這一方面,很多人都存在一個誤區,研究人員往往執著于關注深度學習的計算本身。實質上,帶寬問題才是在研究深度學習過程中遇到的最大瓶頸。
另外,深度學習具有一定的局限性。某種準則下,淺層網絡不一定比深度學習運用的深層網絡性能差。比如說優化目標函數,訓練深度網絡在計算和調試方面成本代價太高,并且對于許多日常預測問題并沒有任何意義此時運用淺層網絡就足夠了,在滿足需要的同時更節約了成本。再比如說我們在一些特定情況下需要的模型,雖然深度網絡模型預測或者表征能力相對淺層網絡更為強大,但卻存在可解釋性差不易理解等問題。
(1)無人駕駛
目前,無人駕駛必須要具備環境感知、高精度地圖導航和駕駛決策三個部分的能力。首先,環境感知包括車道線、車輛、行人、交通標志等的自動檢測,使用深度學習可以訓練出一個識別率非常高的分類器從而能夠使環境感知部分以高精度完成,為駕駛決策模塊提供正確的環境信息與認知,保證無人駕駛正常的完成。
另外,在高精度地圖的創建與導航方面也會用到深度學習。高精度地圖基于視覺,運用深度學習高識別率的特性,通過識別特定的標志(建筑物等)從而定位車輛的位置或者目的地。
最后,駕駛決策部分,運用深度學習通過試錯與自我修正的方法完成駕駛策略的決策。核心技術。
(2)無人超市值守
目前,無人超市面向“人與商品”之間發生的關系(動作),通過傳感器采集數據,建立起一個關于任何商品間動作關系的大數據(人與商品間動作關系集),進一步使用深度學習技術建立人與商品之間的動作判別模型,提高系統反作弊識別能力的同時,結合超市進出口支付系統,完成購物。其中所包含的數據獲取結構、模型設計原則、核心模塊構建均采用了深度學習模型。核心技術驅動:基于卷積神經網絡的識別系統,例如網絡模型SSD。
(3)機器翻譯
“翻譯”一詞大家都不陌生,其中翻和譯就表明了其包含兩個部分即編碼和譯碼。編碼階段和譯碼階段均采用了深度學習,編碼階段:運用深度學習中的RNN網絡源語言子句被編碼成一固定長度的輸出隱向量;解碼階段:仍使用RNN把編碼階段輸出的固定長度的隱向量解碼成目標語言子句。
(1)首先是要慶幸我們生活在這個大數據的時代。深度學習本就與大數據有著千絲萬縷的聯系,深度學習可以從大數據中挖掘出全新的有價值的數據、知識和規律從而將這些知識運用到新數據上。而我們現有的大數據恰恰為深度學習的發展創造了極有利的條件。
(2)深度學習模型具有強大的擬合能力、高密度的計算能力、并且可以海量的訓練數據,它們是深度學習獲得成功的重要因素。
(3)深度學習的應用范圍非常廣泛,可以滲透應用到很多領域。比如說棋類博弈、復雜函數擬合、機器編譯等等。
(4)人工智能日益普及,大量智能產品已經出現在了人們日常的生活當中且正在便利著我們的生活,人類日益增長的便利需求不斷推動著深度學習的完善和發展。
第一,深度學習可以解決一些不能運用理論完全解釋的問題,也就是說“知其然,不知其所以然”的問題;第二,它能夠針對一些充滿不確定性的問題,不斷的變化,不斷的再學習。第三,深度學習還有一個徹底改變傳統神經網絡的作用,它不單單做函數映射,更主要的是提取那些多層次反復的模式。一個深度學習所推動的智能世界正在到來,我們沒有其他選擇,只能雙倍押注,奔赴這未來。