陳東焰 陸暢
摘 ? 要:2017年5月,AlphaGo以3:0戰勝世界排名第一的柯潔九段,一時間引起了人們對人工智能的熱議。AlphaGo主要工作原理是深度學習,它屬于機器學習,機器學習又屬于人工智能的范疇。可以說機器學習是近年來人工智能領域最熱門的板塊,吸引著諸多研究者投入了大量的研究,也有著豐富的產出。本文從AlphaGo談起,介紹人工智能的發展,機器學習的概念理解、分類及應用,分析了模型訓練中的常見問題,人工智能與倫理的關系。
關鍵詞:人工智能 ?機器學習 ?模型
中圖分類號:TP181 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2020)05(a)-0146-02
2017年5月,AlphaGo Master以3:0戰勝了世界排名第一的柯潔九段,一時間引起了不小的轟動。
AlphaGo是一款圍棋程序,由Google的DeepMind公司開發。早在2015年10月,AlphaGo就以5:0戰勝樊麾二段;2016年3月,AlphaGo以4:1戰勝擁有18個世界冠軍頭銜的職業九段李世石;2016年12月29日—2017年1月4日,AlphaGo在網絡圍棋平臺上以“Master”為注冊號60:0戰勝數十名中韓日職業圍棋手;2017年10月18日,最終版本AlphaGo Zero問世,它經過3d的訓練以100:0的戰績擊敗了AlphoGo Lee,經過40d的訓練擊敗了AlphoGo Master 。
AlphaGo前期版本,結合了數百萬人類圍棋專家的棋譜, AlphaGo Zero則有了質的提升,它不再需要人類數據和經驗,研發團隊讓它進行自我博弈,3d的訓練時間,自我對弈的棋局數量為490萬盤。
AlphaGo主要工作原理是“深度學習”,深度學習是指多層的人工神經網絡和訓練它的方法。它屬于最近十年一個特別火的技術“機器學習”(ML),機器學習又屬于人工智能(AI)的范疇。
1 ?從機器學習的角度看人工智能的發展史
1956年夏天,美國達特茅斯學院舉行了人工智能研討會,被認為是人工智能誕生的標志。會上約翰·麥卡錫首次提出了“人工智能”這個概念。
1959年,IBM公司的計算機專家阿瑟·塞繆爾創造了“機器學習”一詞。
1958年,機器人之父恩格爾伯格和發明家德沃爾合作創立一家生產機器人的公司,當年就產出了一個可以自動完成搬運的機械手臂。1961年,第一臺工業機器人Unimation在通用汽車試運行,作用非常顯著。
1973年,世界第一個人形機器人Wabot-1在早稻田大學誕生,它可以進行簡單日語對話,測量距離和方向,靠雙腳行走,兩手有觸覺,可搬運物體行動。1980年,WABOT-2問世,可以用手腳靈活地演奏電子琴。
20世紀70年代初,當時的計算機有限的內存和處理速度不足以解決實際的人工智能問題,加上數學模型和數學手段有一定的缺陷,對人工智能研究的資助逐漸停止,人工智能進入第1個低谷。
直到1980年著名的專家系統XCON的研發,1982年霍普菲爾德神經網絡被提出,1986年BP算法出現,使大規模神經網絡的訓練成為可能,將人工智能推向第2個黃金期。
20世紀80年代晚期,美國國防高級研究計劃局對AI的投資再次減少,1987—1993年,人工智能進入第2個低谷。
1997年5月,IBM的“深藍”計算機戰勝國際象棋大師加里·卡斯帕羅夫,它存儲了從18世紀起的200多萬經典對局。
2006年,杰弗里·辛頓提出“深度學習”神經網絡,使得人工智能性能獲得突破性進展。2013年,深度學習算法在語音和視覺識別上取得成功,人工智能進入感知智能時代。
2006年,伊利諾伊大學香檳分校教授李飛飛發現,相對于更好的算法,數據也非常重要,她建立了數據集ImageNet。2017年的圖像識別率提升到97.3%,超過了人類,證明了更龐大的數據可以帶來更好的決策。
2011年IBM的超級計算機Watson在美國著名智力節目《危機邊緣》中戰勝了人類,2015—2017年AlphaGo打敗了人類。
2 ?理解機器學習及應用
機器學習的經典定義:利用經驗來改善計算機系統的性能。
傳統上,如果我們想讓計算機工作,會給它一串指令,一步步執行下去。但機器學習不接受輸入的指令,它只接收數據,也就是說機器學習是一種讓計算機利用數據而不是指令來進行工作的方法,是通過歸納思想得出的相關結論。簡單來講,“機器學習”的原理就是模仿人類學習的過程,通過經驗來強化自己,所以說機器學習超越人類是完全有可能的。
我們可以這樣理解機器學習的過程:
1+2=?機器:10;——太大了;
5+7=?機器:6:——太小了;
2+6=?機器:8;——答對了。
機器知道了2+6=8,它會在不斷的試誤中找到正確的答案,在一步步地調整自己學習的方式方法和路徑的同時,優化計算過程,保證盡可能少出錯,當它能夠完全一次性算出正確結果時,它的模型擬合成功,可以被投入使用了。
機器學習的應用方向:有現存的解決方案,但是需要手寫大量規則的問題;不存在較好的解決方案的復雜問題;不斷發展的問題,機器學習可以適應新的數據;希望通過機器學習,對復雜問題和大量數據得到一些新的見解。
3 ?機器學習的分類
機器學習有不同的分類方法,常見的按是否在人為監督下學習分為:監督學習、無監督學習、半監督學習、增強學習。
監督機器學習:需要提供帶有標簽的數據。例如,要區分男孩和女孩的圖片,那么男孩的照片打上“男孩”、女孩的照片打上“女孩”標簽,訓練模型,直到它能通過測試。
半監督機器學習:只有少數圖像被標記,計算機程序對未標記的圖像進行最佳猜測,然后作為訓練數據反饋給程序。比如,你有一個相片集,拿出部分相片,把自己的相片標識成“我”,把其他人的相片標識成“某人”,訓練模型,直到它能夠做出正確的分辨。
無監督機器學習:這種類型的機器學習不涉及任何標簽,任由機器深入到數據中去發現和體驗,并尋找模式和聯系,然后得出結論。
強化學習:強化學習把學習看作試探評價過程,智能體選擇一個動作用于環境,同時產生一個強化信號(獎或懲),智能體根據強化信號和環境當前狀態再選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。
4 ?訓練模型時的常見問題
為了訓練出更好的機器學習模型,我們會先選擇一個合適的機器學習算法,再準備好不同的參數,訓練模型,得到合適的參數。
例如我們現在要做一個分辨一個物體是否是蘋果的模型,蘋果有很多品種,它要學習蘋果這些特征,把這學到的所有特征整合,也就是模型擬合。
有時存在這樣的問題:如果從一開始就界定蘋果是紅顏色的,那么,給一個青蘋果時,機器會認為不是蘋果,這就是過擬合。一般認為過擬合是由于網絡過深,模型的構建關注到了本不是蘋果的特征,導致學習有誤。過擬合經常表現為訓練時,得分很高,但在測試時正確率卻很低。這時候就需要機器做及時的完善,學習成蘋果是有顏色的即可。
有時也會存在這樣的情況:如果構建的模型,只認為蘋果特征是圓的,那么給一個桔子,它也認為是蘋果,這說明機器對蘋果特征的學習還不夠,這就是欠擬合。一般認為欠擬合是由于網絡過小造成的,因此機器就還需要更多的學習來認識蘋果。
5 ?人工智能與倫理
控制論之父維納在《人有人的用處》中在談到自動化技術和智能機器時,得出了一個危言聳聽的結論:“這些機器的趨勢是要在所有層面上取代人類,而非只是用機器能源和力量取代人類的能源和力量。”雖然維納的話在今天還沒有成為現實,但已經成為諸多文學和影視作品中的題材,人們也在討論人工智能究竟在何時會形成屬于自己的意識,超越人類,讓人類淪為它的奴仆。目前人工智能相關的倫理和法律研究相對滯后,但可喜的是,我們看到有許多有識之士在呼吁大家共同遵循安全的理念和規則。相信機器學習能給人類帶來美好的明天。
參考文獻
[1] 周志華.機器學習[M].北京:清華大學出版社,2016.
[2] 李德毅,于劍.人工智能導論[M].北京:中國科學技術出版社,2018.
[3] Aurélien Géron.Hands-On Machine Learning with Scikit-Learn and Tensor Flow[M].CA:O'Reilly Media,Inc,2017.