余殷博
摘 要 機器學習作為最近三十年新興起的科研學科之一,已經在現代信息生活尤其是互聯網生活中實現了較為廣泛的應用。機器學習是在基于嚴格數學理論經眾多學科交叉而成,包括信息控制理論、邏輯科學、數理統計學、神經科學、計算科學等。目前,機器學習已經衍生出了眾多分支,如數據挖掘、深度學習、語音識別、生物信息學、模式識別、機器人的智能控制、遙感信息安全等。綜上所述,機器學習已經取得了較大發展,并且將在未來的信息社會取得更為矚目的成就。
【關鍵詞】機器學習 多學科交叉 數理統計 人工智能 深度學習
機器學習是人工智能領域發展最快的一個分支之一。機器人學習的本質是通過利用計算機系統強大的運算及數據處理能力,借助大量的數據訓練,使計算機具有自發模擬人類學習行為,通過學習獲取知識和技能,在不斷改善自身性能的同時,實現人工智能的一種思想。在信息時代,特別是隨著互聯網技術的爆發式發展,信息爆炸現象表現的尤為明顯。現代社會互聯網中每天都會產生的海量數字化數據,如數字化的微博數據,數字化的聊天記錄、數字化的網頁瀏覽數據等。針對以上海量數據,大數據(BigData)處理必然成為當今社會研究的一個熱點問題。在這種大的氛圍下,如何對海量數據進行分析并根據嚴格的數學定理提取有價值的規律信息,機器學習在以后的學科發展中必將占有一席之地。
1 機器學習的發展歷史
1.1 機器學習“萌芽”階段
上世紀五、六十年代,機器學習技術研究正處于“萌芽”階段,人們試圖給機器例如大型計算機通過編程手段使其最終具備邏輯推理能力,進而使機器具有一定的智能思考和自我優化的能力。這一階段的代表性工作主要是由A.Newell和H.Simon完成的。所做工作包含各種“邏輯”程序以及之后的“求解”程序等,這些進展在當時令人振奮。A.Newell和H.Simon也因此獲得了1975年圖靈獎。然而,進一步的研究證明只具有邏輯并不能使機器具有智能“”。E.A.Feigenbaum等人認為,智能存在的前提還必須具有先驗“知識”。
1.2 機器學習“發展”階段
上世紀七、八十年代被稱為機器學習的“發展”階段。在這一時期的主流為“專家系統”。“知識工程”之父E.A.Feigenbaum憑此在1994年摘取了圖靈獎章。但是,所謂“專家系統”也要面臨“知識困境”,簡單地說,對近乎無限的信息人類很難通過自身思維提取規則并賦予計算設備。機器自主學習的設想浮出水面。機器學習相關工作在上個世紀五十年代就已經展開,主要進行的基于神經網絡的訓練學習方面的研究。
在二十世紀六七十年代,多種學習技術層出不窮,例如基于決策理論的統計學習技術以及強化學習技術等,代表作品為“跳棋程序”以及“學習機器”等,統計學習理論和符號學習技術開始萌芽。
1980年,人工智能領域TopJournal《策略分析與信息系統》專門以“機器學習”為主題連續開辟三期專欄;1983年,Tioga出版社出版了R.S.Michalski、J.G.Carbonell和T.M.Mitchell等頂尖專家聯合主編的圖書教材《機器學習:一種人工智能途徑》面世,書中匯集了超過20位學者撰寫的16篇高影響因子文章,對當時多年機器學習領域的研究工作進行了系統的總結和闡述,引領了學術方向,有較大影響。
1.3 機器學習“繁榮”階段
從二十世紀八十年代至今,機器學習成為一個獨立的學科領域并開始爆發式發展、各種機器學習技術不斷涌現,機器學習算法呈現多樣化。機器學習研究進入“繁榮”階段,機器學習研究在這一時期也被科學的劃分成“實例學習”、“求解規劃學習”、“觀察發現學習”、“指令學習”等多種范疇;而E.A.Feigenbaum等專家合著的經典圖書《人工智能手冊》中,則把機器學習技術從另一個角度重新劃分為四大范疇,包含“機械學習”、“示教學習”、“類比學習”、“歸納學習”四種。直到今天,機器學習繼續蓬勃發展并演化出了眾多分支,例如數據挖掘、深度學習、語音識別、生物信息學、模式識別等。大量機器學習算法被廣泛應用到信息處理特別是互聯網海量數據的分析處理當中。
2 機器學習的發展趨勢
從當前研究的發展趨勢看,機器學習今后將有如下幾個熱點的研究方向:
(1)從人類自身出發找出大腦本身生物學習機制,通過嚴格數學化應用于機器學習。
(2)在已有的人工智能方法的基礎上不斷優化發展和改良現有學習算法,同時展開新的研究算法的開發工作。
(3)令眾多的機器學習算法走出“象牙塔”,建立實用的機器學習的算法應用系統,特別是在互聯網領域開展多種學習方法集成化的研究。
(4)多種機器學習算法的同步協調使用,利用多種算法是優勢規避其中的不足,改善學習系統性能。
3 結語
現有的計算機系統和人工智能系統從其硬件結構和實現原理上不具備自主學習能力,至多也只是具有非常低級的“被動”學習能力,因而不能滿足科技和生產提出的新要求。對機器學習進行比較系統化的討論和和方向把握,對以后學習機器學習方面的知識和進行相應的科研工作有方向性作用。學習機器學習本質是把控研究機器學習算法的內在數學原理、建立通過數據訓練使現代計算機系統具備不斷學習并自動提高自身水平。近年來機器學習理論在諸多領域例如天氣預報、互聯網、軍事等取得成功,已成為計算機科學的基礎研究熱點之一。
參考文獻
[1]楊樹仁,沈洪遠.基于相關向量機的機器學習算法研究與應用[J].計算技術與自動化,2010,29(01):43-47.
[2] 何清,李寧,羅文娟,等.大數據下的機器學習算法綜述[C]//中國計算機學會人工智能會議.2013.
[3]劉魯,劉志明.基于機器學習的中文微博情感分類實證研究[J].計算機工程與應用,2012,48(01):1-4.
[4]李凡長,錢旭陪,謝琳,等.機器學習理論及應用[J].計算機工程與科學,2012,34(09):F0003-F0003.
[5]王昊,嚴明,蘇新寧.基于機器學習的中文書目自動分類研究[J].中國圖書館學報,2010,36(06):28-39.
作者單位
武漢市外國語中學高二(3)班 湖北省武漢市 430050