任敏
訴別離,它說,“離別恨難分,琵琶不忍聞。斷腸空有淚,明月已無魂。”詠春日,它說,“三月初春雪未消,東風吹送柳絲飄。綠楊枝上鶯聲急,紅杏梢頭蝶夢遙。”
它是誰?它是“熟讀”詩歌90萬首,通曉平仄、押韻、對仗等“潛規則”,只需輸入關鍵詞句,即可在數秒之內出口成詩的人工智能機器人,名曰九歌。這位古詩界的“最強大腦”,誕生于清華大學自然語言處理與社會人文計算實驗室,其主要研發者矣曉沅,是清華園里一位輪椅上的博士。九歌,寄托了他的志向,也帶領他抵達詩意的遠方。
輪椅上的人生,能走多遠?
6歲起,矣曉沅身體就被類風濕性關節炎糾纏。無法自由行走的曉沅,多了思考的時間,他是中學里名副其實的學霸。2012年高考,曉沅以云南省理科第16名的成績考入清華計算機系。2016年8月,成績優異的曉沅開始讀研究生。
近年來,隨著深度學習的興起,人工智能與文學藝術碰撞出炫目的火花。那在人類語言高度凝練的詩歌領域,AI表現如何?曉沅與他的導師孫茂松教授二人一拍即合,何不做一個自動作詩機器人?他們鄭重地為機器人取名九歌。曉沅解釋,《九歌》既是自己名字的來源,也是《楚辭》名篇,這一命名意在致敬屈原,同時寄托了九歌的起點,即源于中國數千年的詩詞文化之中;另外,“九”作為虛數意味“多”,“歌”作為“詩歌”的泛稱,是大家對系統未來的期許,希望九歌能“創作”出更多優秀的詩作。
詩歌的世界,有了AI助力,會迎來驚人一變嗎?
當時,人工智能作詩,是比較小眾的研究領域。九歌研發團隊白手起家,他們借鑒詩歌寫作、語言學、心理學等方面的理論,設計出專門的模型結構。
古詩文是篇章結構,講究上下文一致,前后呼應。這是他們要解決的頭號難題。“一夜揚州月,凄涼萬里心。故鄉無限意,惆悵暮云陰。”這首機器生成的五言絕句,看似文從字順,首尾卻露出馬腳,第一句“月”字點明時間為夜晚,第四句卻變成“暮云”,前后矛盾。嘗試不少思路之后,他們設計出了顯著性線索機制模型。在此模型主導下,上文的詩有了改進:“憶昔揚州月,于今又一秋。故人何處是,落葉滿汀洲。”
第二關,扣題。對于自動作詩系統,主題一般以用戶輸入的一個或多個關鍵詞來確定,如“春風”“寒月”“相思”等。現有的系統要么漏詞,要么將用戶給定的關鍵詞直接生搬硬套地嵌入生成的詩歌中。他們從心理語言學角度切入,提出了基于工作記憶模型的詩歌生成方法。該方法使用不同的記憶模塊存儲用戶輸入的不同關鍵詞和生成的詩文內容。模型不斷動態讀取和更新“自我”記憶,以此來提升扣題的緊密度和靈活性。
攻下一個又一個難關后,2017年年底,九歌1.0版正式上線,系統內錄入了從唐代到清代數千名詩人的30多萬首詩,能自動創作出集句詩、絕句和藏頭詩。
一年半之后,九歌2.0版上線。曉沅說,通過改進算法,九歌2.0版既能作律詩,又能生成蕭瑟凄涼、憶舊感喟、孤寂惆悵、思鄉憂老、渺遠孤逸五種風格的絕句。2.0版的系統中,增加了交互功能,如果用戶對生成的詩歌不滿意,可以自定義修改。經自動檢索之后,九歌還可推薦相似意境的經典詩歌。
縱橫古今的九歌,是否會讓人生迎來別樣精彩?
疾病困住了雙腳,卻無法束縛思想,九歌的誕生,讓曉沅迎來更加廣闊的舞臺。
2017年年底,九歌1.0版誕生之后,坐著輪椅的曉沅就登上了央視舞臺。曉沅帶著自己的作品迎戰青年詩人,他的九歌會用“機智過人”四個字作一首藏頭詩,也能以“心有靈犀一點通”打頭作集句詩,且速度遠超人類,他還喊出那句著名的口號,“古有曹植七步成詩,今有九歌七秒成詩。”基于九歌,曉沅連續兩年獲得中國計算語言學大會的“最佳系統展示獎”。
如今,九歌系統的訪問量已超過1000萬人次。九歌3.0新版本正在緊鑼密鼓地開發。曉沅透露,目前系統已錄入從魏晉南北朝到近現代所能找到的90萬首詩歌,未來,他們還計劃讓這個“腹有詩書”的機器人學會看圖作詩、觀視頻作詩,也將嘗試作現代詩。
(摘自《北京日報》)