這道謎題是:行刑者下令100個男性囚犯按照身高從高到矮的順序排成一列(高個子在最前面),并且把一頂紅色或藍色的帽子戴到每個囚犯頭上。每個囚犯都能看見自己前面所有囚犯戴的帽子,但看不見自己的帽子或自己后面的囚犯所戴的帽子。行刑者從最后(最矮)那個囚犯開始提問:你戴的帽子是什么顏色?只有答對了,囚犯才能活下來。如果答錯,囚犯就會被“安靜地處死”。也就是說,其他囚犯能聽見這個囚犯說的話,但不可能知道他的回答是否正確。在這場處決的前晚,囚犯們被給予機會討論一種策略來幫助自己存活。那么,究竟有沒有這樣一種策略?如果有,它是怎樣一種策略?
解答或理解上述謎題,有助于開發(fā)智力,啟發(fā)我們從多角度去思考看似復(fù)雜的問題,并找到解決辦法。探索自然世界,尋找科學(xué)途徑,無疑需要獨到的思維。事實上,破解諸如此類的謎題,有助于密碼理論和信息工程學(xué)的進步。據(jù)報道,人工智能網(wǎng)絡(luò)在測試中找到了破解“囚犯帽子謎題”及類似復(fù)雜謎題的策略。實施這種策略不僅要求個體具有解決復(fù)雜問題的能力,而且要求團隊整體保持清醒與合作。科學(xué)家指出,包括機器人在內(nèi)的人工智能有能力破解這樣的謎題,這是在協(xié)作體系方面的又一個進步。
在測試中,為了解決帽子謎題,每個囚犯都被模擬成一個單獨的人工智能因子。它們考慮自己可能看見的帽子顏色,決定告訴他人什么,接著,利用這種集納信息找出答案。在學(xué)習(xí)玩視頻游戲的過程中,人工智能(機器人)已經(jīng)各自掌握了應(yīng)對難題的方法。它們解決這些問題的思路與人類的不同。科學(xué)家仍不清楚人工智能提出的解決方案究竟屬于什么性質(zhì),但這些方案確實行之有效。
據(jù)報道,這個被稱為“深度分布周期性Q網(wǎng)”的人工神經(jīng)智能網(wǎng)絡(luò),首次證明了自己能解決這類復(fù)雜問題。科學(xué)家向該網(wǎng)絡(luò)輸入“囚犯與帽子”等兩個謎題,但Q網(wǎng)必須掌握交流協(xié)作,才能破解謎題。這里先賣個關(guān)子,這道謎題的答案并不直白。在“囚犯與帽子謎題”中,找出拯救囚犯的策略需要Q網(wǎng)厘清一系列復(fù)雜程序,并且還得依賴于單個因子之間的通信。在這道謎題的測試中,Q網(wǎng)不僅完成了任務(wù),而且超越了科學(xué)家所認為的“標(biāo)準(zhǔn)策略”,這證明Q網(wǎng)自身內(nèi)部就能給出通信協(xié)議。
隨著測試的成功,科學(xué)家認為需要進行更多研究,以了解智能網(wǎng)絡(luò)給出的解決方案,提升可擴展性,以適應(yīng)更大的數(shù)字集合。在研發(fā)可通信合作的人工智能方面,這基本上還是第一步。從長期看,經(jīng)過提升的延展性能讓人工智能解決以前不能解決的難題。未來,這類人工智能將被測試一些涉及“現(xiàn)實世界數(shù)據(jù)”的疑難情景。有朝一日,成群的機器人將能通過共享信息片段,合作破解難題。

人工智能大勝九段棋手
2016年3月16~25日,由谷歌公司研發(fā)的“阿爾法狗”計算機程序與韓國九段圍棋手李世石在韓國首都首爾進行了5局比賽,李世石只贏了其中的第4局,其余4局的勝者都是“阿爾法狗”。這次對抗的歷史意義,被認為堪比1997年“深藍”程序(由美國IBM公司研發(fā))戰(zhàn)勝國際象棋世界冠軍、俄羅斯棋手卡斯帕羅夫。這次比賽后,韓國圍棋協(xié)會授予“阿爾法狗”最高段位——“榮譽九段”,以表彰“阿爾法狗”以“認真的努力”掌握圍棋。
“阿爾法狗”的這場勝利,被認為是人工智能研究領(lǐng)域的一大里程碑。在此之前,圍棋的復(fù)雜程度被認為超出人工智能所能夠掌握的范圍。許多專家認為,像“阿爾法狗”這樣的計算機程序,至少要等5年、10年甚至更長時間才可能挑戰(zhàn)圍棋高手。有評論認為,“阿爾法狗”的這場勝利提醒人類:需要為應(yīng)對未來可能出現(xiàn)的“全能機器人”而做好準(zhǔn)備。
李世石賽后為自己輸給“阿爾法狗”而道歉。他說自己誤判了“阿爾法狗”的能力,并且對此感到“無能為力”。他強調(diào)說,他這次的失敗只是他自己的失敗,而不是人類的失敗。他還說,他最終輸給機器“無可避免”,但“機器人永遠都不可能像人那樣明白圍棋之美”。作為對這場舉世矚目的大賽的回應(yīng),韓國政府2016年3月17日宣布將在未來5年內(nèi)投資8.63億美元,用于人工智能研究。