檀亞寧 王子浪 趙林健
摘 要 機器學習是人工智能的核心,也是人工智能技術發展的第三階段。本文簡要分析了人工智能機器學習的研究要點,并對機器學習的技術核心——深度學習(多層神經網絡)重點進行探究,旨在從算法層面促進機器學習技術的發展與應用,推動人工智能的健康發展。
關鍵詞 人工智能;機器學習;深度學習
機器學習的初衷是通過學習,AI能夠從數據或歷史經驗中發現規律,自動獲取相關知識。人工智能涉及到的專業領域多而復雜,但最終的目的都是使AI具備與人類相似的獨立思考能力,即“聰明”屬性。因此,有必要通過人工智能算法脈絡解析算法應用基本場景,對AI進行更為理性的理解與思考。
1基于人工智能的機器學習研究要點
1.1與環境相適應
對于環境的適應性不同是機器與人類主要差別,環境因素影響機器學習的質量,因此人工智能技術研究中機器對于環境的適應性也是重點研究課題。此外,建立機器內部體系存放的原則通常遵循環境適應性原則,基于環境復雜性特點,機器學習中需要有大量數據作為支撐,同時適當刪減多余環節,盡量簡化機器學習過程。
1.2擴展機器知識庫
需要為機器學習提供種類豐富且表現形式多樣化的知識庫,包括特征向量、規則化語言以及網絡化關聯等[1]。在此基礎上適當擴展并延伸知識庫內容,提升機器學習能力。需要注意的是:一方面選擇邏輯較為簡單且表意明確的模式,另一方面推理過程容易理解,以此降低機械計算成本。
2機器學習技術中的深度學習技術
在大數據背景下,機器需要處理大量且復雜的數據信息,傳統人工智能的機器學習理論難以勝任,無法有效理解并模擬人類學習過程,在發現新事物的能力以及對不完全信息推理能力方面存在較多缺陷。基于此,需要運用深度學習技術研究新的機器學習算法。以人工智能AlphaGo為例,其采用了最新神經網絡技術構建了策略網絡以及評價網絡兩個“大腦”,在深度學習技術的支持下,顯著提升了大腦對數據處理的準確度和速度。AlphaGo使用了全新算法,其出現為機器學習技術發展帶來全新的前景。
2.1機器學習與 AlphaGo 的適切性
AlphaGo作為人工智能的尖端成果,運用了多種機器學習方法,但最為主要的有如下幾種。(1)預測,即根據自身已知對未知進行估計。在機器學習中,預測可理解為開發一種新的數學模型,并根據收集的數據(預測變量)對未知數據(預測變量)進行推斷。以AlphaGo戰勝國際象棋世界冠軍卡斯帕羅夫為例,正是因為他可以借助對戰分析人類棋手下棋模式,運用預測手段對人類棋手后續走子行為作出較為精準的預測。通常情況下,預測常用的方法為分類和回歸。
2.1.1分類
分類算法包括決策樹、隨機森林、逐步回歸和邏輯回歸等。以AlphaGo與李世石的對局為例,其主要使用了決策樹算法,對其下棋未來幾步甚至幾十步走子數據進行了分析預測。
2.1.2回歸
不同于分類,回歸是以連續數值型作為目標數據,主要包括有線性回歸算法和回歸樹算法,通常情況下多用于研究多個數據之間的潛在聯系,并通過數學方法進行描述。AlphaGo在對局中采用的是邏輯回歸算法,在復雜多變的情況下,判斷對手在棋盤各個位置上可能走子的概率作為自身走子的依據。人類充當導師的角色,通過機器學習技術使得機器學會思考,甚至比人類更會思考。
2.2深度學習算法在人工智能的應用
AlphaGo將深度學習技術運用到登峰造極的地步,促進了人工智能智能化水平的提升,是機器學習技術的價值體現[2]。AlphaGo在對局中,系統主要由Policy Network(策略網絡)、Fastrollout(快速走子)、Value Network(價值網絡)、MonteCarlo Tree Search(蒙特卡洛樹搜索)四部分構成。其中,Policy Network用于分析當前局勢,對下一步走子進行采樣并預測。Fastrollout可顯著提升走子速度。Value Network通過分析數據,可對棋局各方勝率提前作出預判。而MonteCarlo Tree Search是連接上述三部分的紐帶,使其形成完整的系統。
運用深度學習法,AlphaGo通過神經網絡的非監督式學習來指派初始權重,并擁有兩個相對獨立的大腦,即策略網絡與評價網絡。研究人員將大量職業選手棋譜輸入到系統中,通過算法,AlphaGo的準確率已經高達50%以上,同時卷積核對棋盤無用區域的過濾作用使得預測速度提高了千倍以上。
通過深度學習技術,人工智能的學習能力仍在不斷進步中,最新升級的AlphaGoZero將兩個大腦一體化,將快速隨機走子方式進行升級,通過提升神經網絡的質量完成決策與評估。此外,AlphaGoZero的學習能力進一步提升表現在能夠在不提前輸入圍棋規則情況下,依靠自身3天內完成近500次博弈,從中逐漸建立起一套圍棋策略體系。在與AlphaGo的對決中,以100:0的成績完勝。
3結論
在信息革命以及大數據時代背景下,深度學習作為機器學習的子領域具有廣闊的發展前景,利于促進人工智能技術不斷發展并逐漸邁向新高度。未來,人工智能或將從機器學習階段最終發展進入通用智能系統階段,由此我國應重視相關人才的培養,鼓勵并支持機器學習技術的發展與應用,促進人工智能產業發展。
參考文獻:
[1]李康化,姜姍.機器學習與文化生產變革——基于AI技術發展視角[J].湘潭大學學報(哲學社會科學版),2020,44(01):74-79.
[2]余濤,賈如春.基于機器學習算法人工智能技術的發展與應用[J].數學學習與研究,2019(13):149.