編譯 舒愉棉

“凡是過去,皆為序章。” 莎翁遺作《暴風雨》的這句名言斷定,我們可以將已然發生的事視作后續之事的先兆。
這一想法可以說是相當悲觀的:難道我們注定會重蹈覆轍,直到我們改正為止么?當然,不管是在工作、人際關系、財務、健康還是其他領域,人若要成長,的確是需要一而再、再而三地從生活中汲取教訓。
放眼望去,同樣的現象也存在于更宏觀的層面——人類集體歷史之中。我們樂于認為,作為一個物種,人類整體上是在不斷進步的,可對那些曾經禍害過我們祖先的沖突與不公,我們卻連消滅它們的邊兒都沒靠上。
我們再把目光收回來(并且放輕松)一點,關注一下近期的未來,比如,在未來一整年里將會發生些什么,又有哪些信息我們可以用來做出一些有依據的推測?
美國《經濟學人》編輯組采用一種獨特的方式回答了上述問題。在《經濟學人》展望2020的專欄中,他們對政治、經濟的未來形勢以及人工智能等技術的后續發展進行了預測,而在這些預測中最突出的,當屬向人工智能征詢預測意見。人工智能給出的答案既耐人尋味,又有一點點不可思議。
幾乎就是在一年之前,非盈利組織“開放智能”發布聲明稱,他們建成了名為GPT-2的神經網絡以用于自然語言處理。這一聲明引發了爭議,因為其中的警告部分說該工具可能會被濫用,所以不會立即向公眾發布。在隨后幾個月中,該工具才被逐步發布出來。
GPT-2的開發者在訓練神經網絡時提高了質量標準:他們不是拿低質量的文本胡亂地塞給GPT-2,而是拿紅迪網上獲得超過三個贊的文章來訓練它。
訓練用的數據庫由四萬兆字節(40GB)的文本組成。對于純文本而言,1GB的文本相當于90萬頁ASCII編碼頁面,或者是13萬頁雙行距的微軟Word文件頁面。
GPT-2當然是無法理解它所生成的文本的,它利用語言模式和詞語序列來總結出字詞短語之間的統計學聯系,并建立自己的參考指南(這可不像人類學習一門外語時需要掌握的語法規則和詞匯)。隨后,它用這本參考指南來回答問題,或者是預測特定詞語序列后可能會出現的文字。
GPT-2的開發者還注意到,當用針對范圍更窄的運用場景所選取的特定數據庫來訓練模型時,它所生成的回復更具說服力。
盡管在《經濟學人》那篇對GPT-2預測進行詳細報道的文章中用了“未經修改”來形容模型所產生的文字,但這并不完全準確。在Medium平臺上的一篇博客里,副編輯湯姆·斯坦吉奇(Tom Standage)對他用的方法進行了描述,而他的方法是含有一定程度上的調整的。
斯坦吉奇先是寫了一段介紹,緊接著就是開場白提問:“你好,GTP-2,你之前接受過采訪嗎?”他設定GTP-2對每一個后續問題都生成五個回答,然后選擇一個最佳答案,并刪除GPT-2提出的任何問題(盡管這些問題也是GPT-2回答的一部分)。
斯坦吉奇所提出的問題上至政治與經濟(唐納德·特朗普連任、中美貿易戰),下至科技(人工智能的未來、由科技引發的失業問題、技術濫用),下文是他與GPT-2問答的部分摘錄:
問:由人工智能生成的假新聞是否會成為民主的威脅?我們會不會看到這一手段被用在2020美國總統選舉當中?
答:會的,我們很可能會看到,這只是時間問題。假新聞通常是由政治競選團隊制造出來的,并且具有對選舉結果產生巨大影響的潛力。這主要是因為他們傳播假消息,而這些假消息常常沒有事實依據。
問:你如何看待2020年的經濟前景?
答:我認為非常不明了。英國經濟前途未卜,不過美國經濟非常強有力。我想世界經濟會有很多波動。
盡管GPT-2的部分回答顯得很有見地(當問及人工智能的未來時,GPT-2建議我們應該將科技視為工具,然后“盡可能努力發展科技,而不是去擔心科技會傷害我們和毀了我們的生活”),但大部分回答非常模棱兩可,比如,有個答案提到“中國將會有劇烈變化”,指的是政治變化、社會變化、經濟變化還是上述全部呢?
盡管人工智能的回答里沒有特別具有啟發性或者新穎性的內容,人工智能可以對每個問題就正確的回答進行闡述并且行文連貫,已經很讓人印象深刻了。
GPT-2稱自己——人工智能——為2020年最重要的顛覆性技術,這也就是說,作為匯集了百萬已發布文章所生成的成果,如果GPT-2認為人工智能遠比基因編輯或量子計算更重要,那么它可能是對的。或者也可能是因為人工智能正處于炒作的巔峰時期,因此關于人工智能的文章要比關于其他技術的文章更多。
同樣有趣的還包括,當問及唐納德·特朗普是否會連任時,GPT-2回答說:“我想他不會連任了,我認為他會在普選中落選。” 如果有更深入的見地也許會更好,不過,我們也接受這個答案。
由于人工智能可以比我們更快地讀取以及合成海量數據集,人們已經用它來對各式各樣的事物進行預測,上至病毒爆發,下至犯罪活動。但讓人工智能基于(紅迪網過濾后的)過去思考未來就挺新鮮了,仔細想想,還真是一個令人著迷的項目。
隨著GPT-2和與它相似的人工智能不斷發展,我們極有可能看到它們對未來做出更多并且更精準的預測。同時,讓我們期待一下訓練這些人工智能模型所用的新數據——本周、本月、本年度發生的新聞——能夠為已存在的樂觀精神添磚加瓦。
當問及對讀者是否有什么建議時,GPT-2回答說,“實際上,你現在看來是不可能的大項目,在不久的將來會變成可能。”
資料來源singularityhub.com