陳小娟
摘 要:近年來,人工智能發展迅猛,在圖像識別、語音識別、醫療輔助、無人駕駛及無人機、金融決策、物流管理等各個領域取得了突破性進展。為了讓人工智能更好地服務于人類,我們需要進一步認識理解人工智能,文章將著重對基于神經網絡的人工智能系統的應用及算法進行探討。
關鍵詞:人工智能;神經網絡;算法
1概述
人工神經網絡(Artificial Neural Networks,簡寫為 ANNs)也簡稱為神經網絡(NNs),它的生物原型是人腦和構成人腦的神經元。
生理學家告訴我們:人腦包含 800 億個神經元,這些神經元中的每一個都類似一個小的處理單元,它們按照某種方式連接,接受外部刺激,做出響應處理的過程,也就是大腦對信息處理的過程。
人工神經網絡是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。這種網絡依靠系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的。
2神經元與神經網絡
人工神經元與人工神經網絡模仿人腦的神經結構,旨在讓計算機擁有更強大的學習能力。要實現人工神經網絡具有類似于人腦的功能,就需要對人腦進行深入的了解。首先,我們詳細了解生物學中的神經元與神經網絡。
2.1神經元
神經元的輸入通道是樹突,樹突會將來自其他神經元的電信號傳送至細胞本體,進行處理。處理完的信息需要進行相應輸出,神經元響應產生的電信號再通過軸突和突觸傳遞到下一個神經元。
2.2人工神經元
計算機科學家從生物模型出發,衍生抽象出數學模型,即人工神經元。人工神經元功能類似于生物學的神經元:相對于樹突的作用,會有幾個不同的輸入信號;當中有一個處理單元,即相當于神經元細胞本體,它對每一個輸入信號進行加權處理確定其強度,對所有輸入信號求和,確定組合效果,通過激勵函數確定其輸出;該輸出信號再連接到下一個人工神經元的輸入。這樣人工神經元可按照神經網絡連接方式,連接成人工神經網絡。
2.3人工神經網絡
人工神經網絡模仿神經元在人腦中的結構連接,一個人工神經網絡可以由幾個甚至幾百萬個人工神經元構成,這些神經元排列在一系列的層中,每個層之間彼此相連。一個完整的神經網絡由一層輸入層、多層隱藏層、一層輸出層構成。
按照類型分,人工神經網絡可以分為前饋型神經網絡和反饋型神經網絡。前饋型神經網絡,是單向多層結構,即各神經元從輸入層開始,只接收上一
層的輸出,并輸出到下一層,直至輸出層,整個網絡中無反饋。這一類神經網絡經常用于圖像識別、檢測和分割。
反饋型神經網絡,比較復雜一些,也更接近于人腦的構造,它是一種從輸出到輸入具有反饋連接的神經網絡。當前的結果受到先前所有結果的影響。通常用于語音處理、文本處理、問答系統等類似于自然語言處理方面。因為自然語言處理,通常有上下文的語境,則會用到反饋型神經網絡。
2.4神經網絡訓練算法
人工神經網絡是否能成功應用,其模型構建是需要訓練的,對于每一個輸入,如何組合,其權重如何確定,即其參數的獲取,要通過訓練算法與函數來實現。訓練成熟之前,得到的參數可能會與期望的結果存在很大誤差。對于此類問題,解決方式之一是采用以誤差為主導的反向傳播算法。
反向傳播算法,其本質是通過前向傳遞輸入信號直至輸出產生誤差,再將誤差信息反向傳播,去更新網絡權重矩陣。通過這種反饋機制,反饋越多,神經網絡學習的結果將越準確。
目前,基于神經網絡的人工智能系統,對手寫體數字識別正確率可達 99.8%。對于圖像識別和分類,有一個 ImageNet 圖像分類比賽,采用這種神經網絡
訓練算法,通過很多隱藏層,經過多次訓練,最終神經網絡算法的錯誤率低至3.1%,而人類分類錯誤率為 5%,神經網絡人工智能的算法分類結果已經優于人類。
神經網絡的主要學習機制為誤差反向傳播算法,不斷修改網絡參數,使得分類效果越來越好。
3人工智能系統算法運用實例——手寫數字識別
手寫數字識別是一個典型的人工智能算法應用,通過討論手寫數字識別的實例,我們可以看到神經網絡的強大,也可以更好地理解它是如何運行的。
進行手寫數字識別之前,需要準備一個訓練好的帶有標簽的數據集。MNIST就是一個著名的手寫體數字識別數據集,其中包含訓練集和測試集,訓練集包含了 60000 個樣本和標簽,測試集包含 10000 個樣本和標簽。從機器學習和訓練的角度而言,訓練集類似于我們在學習中使用到的各種學習資料,可幫助我們提升學習能力;測試集類似于考試試卷,用于檢測學習成績;標簽則可以認為是習題和考試的標準答案。
通過訓練集的訓練,如果用測試集在進行測試時,手寫數字圖片的輸入都能得到和標簽一致的結果,則考試通過,那么就說明人工智能的程序具備手寫數字識別能力。其中,樣本為代表 0~9 中的一個數字的灰度圖片,對應一個所代表數字的標簽,圖片大小為 28*28,且數字出現在圖片正中間。電腦(算法)“看到”樣本圖像時,其實是得到一些列的像素點的灰度值數據,白的地方是 1,黑的地方是 0,1 和 0 之間的小數代表灰度值。需要構造神經網絡算法:首先要有向量,即多個數字按順序排成一組,其中數字的個數稱為向量的維數;每個樣本圖像的輸入都是一組 784(28*28=784)個數值,稱為一個 784 維向量;每個標簽數據中,把數字 n 將表示成一個只有在第 n 維度數字為 1 的 10 維向量。輸入的 784維向量經過兩層中間計算后,輸出為一個 10 維向量,每個維的值代表是該數字的概率。通過梯度下降法和反向傳播算法,經過一小段時間的訓練,AI 識別手寫數字的準確率便達到了 93.13%。
4結語
當前最先進的人工智能研究以神經生物學的大腦為原型,將大腦想象成一個擁有大量清晰資料的邏輯推理裝置,并以此來構造基于神經網絡的人工智能系統。從變革生活方式角度出發,深入研究神經網絡的構建與優化,從而更好地解決人類社會中遇到的各種問題。
參考文獻:
[1]何靜.具身性與默會表征:人工智能能走多遠?[J]華東師范大學學報(哲學社會科學版),2018,(5):38-43.
[2]陳斌.人工智能與信息社會.學習強國慕課(理工農醫),2018.
[3]邵語千.人工智能的現狀及發展趨勢[J].科技傳播,2018,(10):106-107.
[4]杜 森 . 人 工 智 能 對 人 類 生 活 方 式 的 影 響 及 反 思 [J]. 遼 寧 工 業 大 學 學報,2016,18(3):51-53.
[5]曹峰,石霖.我國人工智能計算和基礎應用服務平臺發展現狀及趨勢研究[J].電信網技術,2018,4(4):7-9.
湖北省教育廳科學研究計劃指導性項目:深度學習在乳腺 MRI 腫瘤分割中的應用研究(B2020340)