在漫長的進化長河中,人類憑借非凡的學習能力脫穎而出,成為地球上的主導者。我們的大腦,這個由數百億神經元構成的復雜網絡,賦予了我們學習、記憶、創新的能力。如果機器能夠像人類一樣學習,這將是多么不可思議的場景?它們將不再僅僅遵循預先設定的指令,而是能夠在實踐中汲取經驗,自主進化,甚至超越人類。
人工智能(AI)的目標就是讓機器具備智能,而機器學習提供了實現這一目標的關鍵方法。通過機器學習,計算機可以從大量數據中自動學習規律,從而具備感知、認知和決策的能力。
如今,這一曾經充滿科幻色彩的設想已經走進了現實。科學家通過模仿人類大腦的結構,創造了人工神經網絡,借此把學習能力賦予機器。2024年的諾貝爾物理學獎也因此花落機器學習領域。
那么,機器學習究竟是如何實現的?人工神經網絡在其中又扮演了怎樣的關鍵角色?讓我們一同走進機器學習的世界,開啟一場關于智能與學習的奇妙之旅。
機器學習與人工神經網絡
“機器學習”一詞中的“機器”,指的可不是工廠車間里的那些鐵疙瘩,而是可以通過算法、數據處理來學習和適應的計算機系統。通俗點兒來講,機器學習就是計算機通過數據分析實現的自我學習。舉個例子,我們讓計算機完成一個新的任務,它自己會從以往的任務數據中尋找規律,然后用這些規律來自我指導并完成新任務。這就是機器學習。
人工神經網絡則是實現機器學習的關鍵,這個名字可能會讓人聯想到生物神經網絡。實際上,人工神經網絡并不是先人工培育生物神經網絡再將其放入機器中,而是模擬人腦處理復雜信息的能力所構建的一些數字化模型。機器學習的過程,本質上就是這些數字化模型的學習過程。
接下來,我們以經典的人工神經網絡模型為例,一起探索它是如何學習的吧!
人工智能學者獲得2024 年諾貝爾物理學獎
2024 年的諾貝爾物理學獎頒給了美國新澤西州普林斯頓大學的約翰·霍普菲爾德和加拿大多倫多大學的杰弗里·辛頓,以表彰他們利用人工神經網絡實現機器學習的基礎發現和發明。概括地講,就是霍普菲爾德模擬人腦神經網絡發明了一個人工神經網絡,辛頓發明了人工神經網絡的訓練算法。
霍普菲爾德網絡的拼圖游戲
霍普菲爾德網絡是模仿我們腦中的神經元和突觸而發明的一種人工神經網絡。人腦中有大量的神經元,它們通過突觸相互溝通。這些突觸負責傳遞信號,信號的傳遞效率正取決于突觸的強度。舉個例子,當你反復記憶一件事情之后,你每次想起它都會快速且清晰,這就是突觸強度高的表現。霍普菲爾德網絡就是由大量節點組合而成,每個節點可以看作一個簡化版的神經元,節點間的連接則類似突觸。節點之間具有可以調整的權重,權重則類似突觸的強度。霍普菲爾德網絡的學習過程就是權重確定的過程。
如果把霍普菲爾德網絡的運作比作玩一場拼圖游戲的話,那么,權重的確定就像是拼圖的拼接制造過程。在拼圖被制造出來之前,通常會有原圖作為參考,然后把原圖分割為拼圖塊,每個拼圖塊代表了網絡中的一個節點,而拼圖塊之間的凹槽和凸起則代表了節點之間連接的權重。當權重確定好之后,霍普菲爾德網絡也就完成了學習,可以開始“玩拼圖游戲”了。
我們在玩拼圖游戲時,往往會從一個邊緣塊開始,逐漸找到與之匹配的拼圖塊,直到整個畫面拼湊完整。霍普菲爾德網絡也是從給定的不完整輸入開始的,這就像是拿到了一個已經拼成一角的拼圖。霍普菲爾德網絡會根據節點間的連接強度確定節點的值,就像尋找拼圖之間的凹槽與凸起是否適配一樣,最終找到能夠重現整個拼圖的最佳配置。
理論上說,只要有足夠多的節點,霍普菲爾德網絡就會擁有完美的記憶能力,且極其擅長模式補全。但是,霍普菲爾德網絡也有一個致命的缺陷,那就是它無法創造出一個新的模式。
創造力的缺失,始終是籠罩在機器學習頭頂的烏云。
霍普菲爾德網絡是這樣“玩拼圖”的
我們玩拼圖游戲時,會嘗試將不同的拼圖塊放在某個位置以驗證是否匹配,霍普菲爾德網絡也會嘗試不同節點的狀態組合。
我們知道,一個系統的能量越低,就越穩定。霍普菲爾德網絡會評估每次嘗試的能量狀態,這里的能量可以類比為拼圖的完成度。能量越低,拼圖越接近完成。霍普菲爾德網絡的目標是達到一個低如今,機器學習已經成為可能 供圖 / 視覺中國神奇的玻爾茲曼機能量狀態,這通常對應一個穩定的解決方案,即最接近原始記憶的完整圖像。
隨著霍普菲爾德網絡不斷更新迭代,它將逐漸鎖定在某個狀態,這個狀態就是網絡對輸入信息的最佳重建。這就好比在拼圖游戲中,盡管一些拼圖塊可能會丟失或錯位,但是通過不斷嘗試和調整,我們最終能夠拼湊出一個完整的畫面。
神奇的玻爾茲曼機
為解決機器學習的創造力問題,玻爾茲曼機誕生了!它為機器學習注入了“創造”的靈魂!如果說霍普菲爾德網絡是對數據的復原,那么,玻爾茲曼機就是在理解數據的底層邏輯之后對其再創造。
那么,玻爾茲曼機是怎么做到這一點的呢?
相較于霍普菲爾德網絡,玻爾茲曼機多了兩樣東西:一是隱藏節點,二是隨機性。
先說說隱藏節點。玻爾茲曼機將一部分節點設為了隱藏節點,這些節點的值不會被顯示,但是會影響自己與其他節點之間連接的權重。我們可以依舊用拼圖游戲來解釋,這部分隱藏節點就像是那些無色拼圖塊,雖然它們本身不會對拼圖最終呈現的圖像有影響,但是它們的凹凸限制了其他拼圖塊拼接的可能性,從而限制了最終拼出的圖像。我們可以把這些隱藏節點看作玻爾茲曼機學習后總結的經驗,這些經驗會影響最終學習結果的呈現。
再來說說隨機性。和霍普菲爾德網絡一樣,玻爾茲曼機每個節點的值也由連接的權重所決定。不同之處在于,霍普菲爾德網絡的權重一旦確定,節點的值也就隨之確定了,而玻爾茲曼機是一個隨機值,決定這個值的概率則由權重以及“溫度”參數決定。這里的“溫度”描述的是玻爾茲曼機的隨機性強弱,“溫度”越高,則隨機性越強,創造性也就越強,反之則越弱。我們繼續用拼圖游戲來打比方,這次的拼圖塊變成了雙面的,拼圖時,它可能是正面,也可能是反面。而它是正面還是反面的概率,由玻爾茲曼機的學習經驗以及創造性強弱來決定。這樣,玻爾茲曼機就可以用一套雙面拼圖創作出一幅與之前完全不同的作品了。
機器學習和物理學的跨學科融合
2024 年,諾貝爾物理學獎的桂冠落在了機器學習先驅者的頭上。為什么諾貝爾物理學獎會花落這一領域呢?
一方面,機器學習源于物理學,是物理學的一種延伸。霍普菲爾德網絡的發明靈感就源于物理學中的自旋系統,其中原子自旋間的相互作用被用來模擬網絡中節點的連接。霍普菲爾德網絡能夠通過能量最小化,從模糊的輸入中重構出清晰的信息,類似自旋系統達到穩定狀態的過程。玻爾茲曼機的發明則基于統計物理學,它模仿玻爾茲曼分布來描述粒子在不同能量狀態下的概率,并通過優化能量函數來學習數據的概率分布。
另一方面,機器學習在物理學中已經有了廣泛的應用,是物理研究的重要工具。機器學習不僅是進行數據分析的工具,也是推動科學發現與創新的引擎。
機器學習源于物理,又反哺物理。它不僅改變了我們分析和處理數據的方式,還為物理學研究帶來了重大變革。在人類科技發展的宏偉藍圖中,機器學習已然成為其中一塊關鍵拼圖。隨著科技的不斷進步,我們看到更多的、適用于不同場景的人工神經網絡相繼誕生,它們如同一把把鑰匙,打開了通往未知世界的大門。
機器學習幫我們課題組干了哪些活兒
在實驗物理中,機器學習可以幫助我們從海量的實驗數據中提取有價值的信息。以我們課題組的一些工作為例,借助機器學習模型,我們能夠精確地監測和分析大氣中的污染物,預測燃燒過程中的碳排放,快速識別和追蹤大氣中的揮發性有機化合物(VOCs)。機器學習還能從復雜的光譜數據中識別出特定的分子特征,從而精確地分析和理解VOCs 的解離機制。這些應用不僅提升了我們團隊的研究效率,還為相關研究者深入理解大氣化學過程和氣候變化提供了新的視角。另外,我們還利用機器學習算法對工業燃燒過程中的燃料消耗和污染物排放進行實時監測、分析。通過激光誘導擊穿光譜技術和機器學習的結合,我們能夠實時測定燃燒過程中的多種元素和化合物,包括那些對環境和人類健康有害的物質。結合機器學習模型,我們不僅提高了對燃燒過程的監控效率,還優化了燃燒效率,指導相關單位減少了污染物的排放。