麥柯
看過《奇葩說》的朋友,都對馬東、高曉松、蔡康永以及前五季最佳辯手的伶牙俐齒印象頗深。然而,誰知道下一季的最佳辯手會不會就是個AI機器人呢?
1997年,深藍就曾經讓人類世界冠軍卡斯帕羅夫投子認負。2011年,沃森又在著名智力問答競賽節目《危險邊緣》中淘汰人類奪冠。2019年,AI再次與人類展開對決……
這一次,AI輸了
2月11日,人機辯論大戰在舊金山IBM Think會議上正式開打。對戰雙方,分別是首戰擊敗以色列辯論高手的IBM Project Debater,以及2016年世界辯論決賽選手、畢業于牛津大學的Harish Natarajan。辯題為“政府是否應該資助學前教育”。
因為有AlphaGo橫掃圍棋圈、AlphaStar稱雄《星際爭霸2》的先例,因此人們對于AI的辯論表現普遍看好。不過,這一次,AI輸了。
據悉,這次的比賽規則是:雙方開場獲得辯題,各有15分鐘準備。然后辯論,共三回合。前兩回合,每人4分鐘陳述,第三回合各2分鐘結辯陳詞。最后,由現場800位觀眾投票決定冠軍歸屬。跑票數多者勝。
本輪辯論,Project Debater為正方,Natarajan站反方。辯論前,觀眾投票,79%選擇正方,13%選擇了反方,另有8%棄權。
Harish Natarajan是全球辯論優勝紀錄的保持者,三次征戰世錦賽,并在2012年奪得歐洲冠軍。但他從沒有面對機器人辯論的經驗。比賽中,他不能上網,只能依靠一支鋼筆、一個筆記本和他的大腦。辯題公布后,他迅速開始在紙上寫著、思考著。與此同時,Project Debater開始動用數以億計的文檔和100多億條語句進行準備。
辯論開始,Project Debater用了4分鐘邏輯嚴密的案例來證明自己的觀點,主要聚焦在:資助學前教育對社會有益,可以讓窮人受益,幫學生成功,推動全民教育,維護社會公平,以及降低犯罪等。它旁征博引,令人稱奇。不過,在駁辯環節,Project Debater既沒有突破立論,也喪失了有力反擊。
相反,Natarajan卻展現了精湛的辯論技巧。他提出,“補貼可在很多方面幫助窮人”、“補貼實際上會消耗中產家庭的財源”、“資助并不能讓所有孩子都上學”等重要觀點,令人信服。
最終投票結果是,62%的觀眾支持正方,30% 的觀眾支持反方,反方因成功說服正方跑票17%,所以Natarajan拿下了人機大戰第二戰的冠軍。賽后,Nataraji表示,“Project Debater的辯論比起大多數人類,更具文采和邏輯性。它將來會成為人類的幫手。”
其實,早在2018年6月18日,Project Debater在舊金山IBM沃森西部廠已經完成首秀。當時的對手是2016年以色列國家辯論冠軍Noa Ovadia、以色列國際辯論協會主席Dan Zafrir,辯題分別是“政府是否應該資助太空探索”,以及“是否應該增加對遠程醫療的使用”。Project Debater輸掉了第一場,卻在第二場成功說服了20%觀眾跑票,戰勝了人類辯手。Project Debater由此成為人類辯論史上的第一個機器冠軍。
AI辯手的誕生
從2012年開始,IBM 以色列海法實驗室研究員 Noam Slonim博士就帶領團隊開始設計與人類辯論的AI系統,取名Project Debater。所謂辯論,不是沖突和競爭,而是民主和討論。它需要從正反多個方面分析問題作出決策,幫助人們理解和學習他人的觀點。為此,Project Debater需要掌握數據驅動的語音編寫和交付功能;能夠靠聽力理解人類冗長自然語音中的重要觀點并構建有力反駁;通過特有的知識圖譜模擬人類爭議和困境,從而根據實際需要提出有理有據的論點。
其中,強大的語料庫是Project Debater展開辯論的基礎。據悉,訓練Project Debater的語料庫擁有3 億多個可靠信源,包含 2011 年以來涉及全球商業、法律、學術和政府等領域,主流報紙雜志、學術論文等內容。過去的6年里,Noam Slonim團隊對Project Debater進行了反復訓練,使之在與人類的對抗中可以形成自己論點,提出論據,甚至還能開玩笑,據悉,它可以分析數億個文檔、論文和記錄,從而給出明確主題并形成邏輯通順的演講。同樣這件事,換成人類做,即使每天24小時不眠不休,也需要2000年的時間。而Project Debater只需要10分鐘。最近兩年Project Debater成長很快,具備了參與辯論的能力。
Project Debater在諸多方面體現了自然語言程序的進步,譬如通過對話和文章形成了更自然的結構化語言。算法的原理就是將辯論分割為一個個小部分的文本,然后通過對于辯題的多角度理解尋找相應的事實予以支撐。Project Debater還能通過對手的辯論因地制宜地采用事實予以反駁。這也意味著敘述信息向辯論的大幅度進步。
據悉,在CES 2019上,IBM又升級了Project Debater的辯論技術,Project Debater——Speech by Crowd(公眾演講),它在展會的每一天,都會切換辯題進行辯論,甚至還能寫下短句輔助說明。第一天的主題是“賭博應該被禁止”。它列舉了各種觀點并加以分析,然后生成了兩篇演講——一篇支持,另一篇反駁。觀點鮮明,論證精煉。正方332個字的論辯提供了三個主要依據,包括“賭博容易上癮”、“誘導犯罪活動”以及“傷害自己和家人”。反方的論辯同樣給出了三條駁斥,雙手互博,令人耳目一新。
Aya Soffer博士認為,辯論模式是一種方法,而不是終點,它推動技術革新,并最終向著掌握人類語言的戰略前進。
未來Project Debater可以幫助人們消除情緒、偏見等模糊影響,作出有理有據的理智判斷與決策。而對于今后的發展前景,IBM已經有了清晰的規劃。IBM 負責AI的副總裁 Dario Gil認為,未來Project Debater的基礎技術將在 IBM Cloud 和 IBM Watson 中商業化,該技術可應用于從教育到法律、從政府到企業等多種領域。
由此,Project Debater最典型的應用就是利用人工智能技術整合相關信息解決相應問題。辯論僅僅是第一步,該團隊還需要繼續在實踐中探索商用可能性。
第一是有研究、分析、收集信息需要的人士。如金融分析師、律師、記者、科學家等。譬如筆者為了寫這篇文章,搜索了Google的相關內容,而以后這項工作就可以交給AI去完成。
第二是需要做決策的領域,比如政府高層、企業高管等。很多時候,頂層設計都因為信息不對稱面臨很多不確定性,因此他們的決策就需要考慮問題的正反面,并了解相應證據,而AI正是不錯的幫手。
IBM研究院院長Arvind Krishna在計劃中寫道,Project Debater將是下一個IBM Cloud或IBM Watson。
重新規劃的AI之路
伴隨著傳統硬件日漸式微,羅睿蘭治下的IBM正在重新規劃未來,比如從銷售傳統的IT工具,轉向新興市場和數字領域,如云、AI、量子計算和區塊鏈。而以AI為例,其實IBM儲備還是相當雄厚的。特別是近期,Project Debater二度挑戰人類辯手,AI機器人“西蒙”被發射到空間站,獨立書寫十四行詩的AI韻律評分超越人類。甚至,IBM還用AI幫德國香水公司Symrise創造新品種。
以上種種,可以看到希望。但是IBM也必須承認,不可重蹈覆轍。比如2011年,沃森成名后,開始與醫療中心合作。2014年,IBM斥資10億美元建立沃森集團。2015年4月,開設新業務部沃森健康。IBM夸下海口,要讓沃森惠及10億人,解決、診斷和治療80%的癌癥種類中80%的病患。結果2018年,沃森接連爆雷。多位醫學專家表示,沃森宣稱使用真實病例訓練,其實公開數據只是理論值,很多結果是錯誤的,非常不負責任。這直接導致沃森在醫療領域聲譽掃地。2018年5月,沃森健康裁員50%-70%,負責人Deborah DiSanzo也宣布離職。
本來是順勢而為,但沃森的滑鐵盧,對于今天Project Debater不啻為前車之鑒。IBM要發展AI,積淀超過半個世紀,但如何從窄到寬,精心布局,其實很考驗IBM。IBM如何能把AI相關的基礎設施、平臺、應用、算法統合在一起,并與區塊鏈、物聯網等發生化學反應,或許才能真正解決困境,創造更大的商業空間。