人工智能破解謎題

2016-08-02 01:10:15

大自然探索 2016年6期

這道謎題是：行刑者下令100個男性囚犯按照身高從高到矮的順序排成一列（高個子在最前面），并且把一頂紅色或藍色的帽子戴到每個囚犯頭上。每個囚犯都能看見自己前面所有囚犯戴的帽子，但看不見自己的帽子或自己后面的囚犯所戴的帽子。行刑者從最后（最矮）那個囚犯開始提問：你戴的帽子是什么顏色？只有答對了，囚犯才能活下來。如果答錯，囚犯就會被“安靜地處死”。也就是說，其他囚犯能聽見這個囚犯說的話，但不可能知道他的回答是否正確。在這場處決的前晚，囚犯們被給予機會討論一種策略來幫助自己存活。那么，究竟有沒有這樣一種策略？如果有，它是怎樣一種策略？

解答或理解上述謎題，有助于開發(fā)智力，啟發(fā)我們從多角度去思考看似復(fù)雜的問題，并找到解決辦法。探索自然世界，尋找科學(xué)途徑，無疑需要獨到的思維。事實上，破解諸如此類的謎題，有助于密碼理論和信息工程學(xué)的進步。據(jù)報道，人工智能網(wǎng)絡(luò)在測試中找到了破解“囚犯帽子謎題”及類似復(fù)雜謎題的策略。實施這種策略不僅要求個體具有解決復(fù)雜問題的能力，而且要求團隊整體保持清醒與合作。科學(xué)家指出，包括機器人在內(nèi)的人工智能有能力破解這樣的謎題，這是在協(xié)作體系方面的又一個進步。

在測試中，為了解決帽子謎題，每個囚犯都被模擬成一個單獨的人工智能因子。它們考慮自己可能看見的帽子顏色，決定告訴他人什么，接著，利用這種集納信息找出答案。在學(xué)習(xí)玩視頻游戲的過程中，人工智能（機器人）已經(jīng)各自掌握了應(yīng)對難題的方法。它們解決這些問題的思路與人類的不同。科學(xué)家仍不清楚人工智能提出的解決方案究竟屬于什么性質(zhì)，但這些方案確實行之有效。

據(jù)報道，這個被稱為“深度分布周期性Q網(wǎng)”的人工神經(jīng)智能網(wǎng)絡(luò)，首次證明了自己能解決這類復(fù)雜問題。科學(xué)家向該網(wǎng)絡(luò)輸入“囚犯與帽子”等兩個謎題，但Q網(wǎng)必須掌握交流協(xié)作，才能破解謎題。這里先賣個關(guān)子，這道謎題的答案并不直白。在“囚犯與帽子謎題”中，找出拯救囚犯的策略需要Q網(wǎng)厘清一系列復(fù)雜程序，并且還得依賴于單個因子之間的通信。在這道謎題的測試中，Q網(wǎng)不僅完成了任務(wù)，而且超越了科學(xué)家所認為的“標(biāo)準(zhǔn)策略”，這證明Q網(wǎng)自身內(nèi)部就能給出通信協(xié)議。

隨著測試的成功，科學(xué)家認為需要進行更多研究，以了解智能網(wǎng)絡(luò)給出的解決方案，提升可擴展性，以適應(yīng)更大的數(shù)字集合。在研發(fā)可通信合作的人工智能方面，這基本上還是第一步。從長期看，經(jīng)過提升的延展性能讓人工智能解決以前不能解決的難題。未來，這類人工智能將被測試一些涉及“現(xiàn)實世界數(shù)據(jù)”的疑難情景。有朝一日，成群的機器人將能通過共享信息片段，合作破解難題。

人工智能大勝九段棋手

2016年3月16～25日，由谷歌公司研發(fā)的“阿爾法狗”計算機程序與韓國九段圍棋手李世石在韓國首都首爾進行了5局比賽，李世石只贏了其中的第4局，其余4局的勝者都是“阿爾法狗”。這次對抗的歷史意義，被認為堪比1997年“深藍”程序（由美國IBM公司研發(fā)）戰(zhàn)勝國際象棋世界冠軍、俄羅斯棋手卡斯帕羅夫。這次比賽后，韓國圍棋協(xié)會授予“阿爾法狗”最高段位——“榮譽九段”，以表彰“阿爾法狗”以“認真的努力”掌握圍棋。

“阿爾法狗”的這場勝利，被認為是人工智能研究領(lǐng)域的一大里程碑。在此之前，圍棋的復(fù)雜程度被認為超出人工智能所能夠掌握的范圍。許多專家認為，像“阿爾法狗”這樣的計算機程序，至少要等5年、10年甚至更長時間才可能挑戰(zhàn)圍棋高手。有評論認為，“阿爾法狗”的這場勝利提醒人類：需要為應(yīng)對未來可能出現(xiàn)的“全能機器人”而做好準(zhǔn)備。

李世石賽后為自己輸給“阿爾法狗”而道歉。他說自己誤判了“阿爾法狗”的能力，并且對此感到“無能為力”。他強調(diào)說，他這次的失敗只是他自己的失敗，而不是人類的失敗。他還說，他最終輸給機器“無可避免”，但“機器人永遠都不可能像人那樣明白圍棋之美”。作為對這場舉世矚目的大賽的回應(yīng)，韓國政府2016年3月17日宣布將在未來5年內(nèi)投資8.63億美元，用于人工智能研究。