韓曉喬, 張洪忠, 何 苑, 石韋穎
機器人新聞寫作(Robot Journalism)是機器人基于人工算法自主分析數據并生成文章的方法(Kim & Kim,2017)。機器人新聞寫作(本文也簡稱為“機器寫作”)是一種擬人化的說法,更確切的名稱應當是“自動化新聞”(Automatic Journalism),指的是運用算法,將數據進行加工處理并轉化成敘事體新聞文本的方式(Carlson,2015),即在很少人工輸入的情況下,自動生成新聞文本格式的過程(Zheng et al.,2018)。
近年來,國內外已經有不少關于機器新聞寫作的嘗試。比較具有代表性的有,《洛杉磯時報》2011年推出報道地震情況的機器人Quakebot,2014年美聯社開始使用Wordsmith生產財經新聞,2015年新華社推出自動新聞協作工具“快筆小新”進行財經和體育新聞報道,以及《今日頭條》在2016年里約奧運會期間推出機器寫作工具 xiaomingbot,等等。機器新聞寫作已經成為當前新聞傳媒業的一個新熱點,也引起學術界的關注。從國內學者的研究來看,最近幾年相關論文數量明顯逐年增長,cnki數據顯示,主題為“機器寫作”的論文檢索數量在2013年為1篇,2014年、2015年、2016年分別為4篇、5篇、11篇,到2017年更是達到了27篇。
機器學習、深度學習正在改變包括新聞生產在內的諸多之前依賴人力、腦力密集的產業和行業的生態和業態(金兼斌,2014)。以機器寫作為代表的人工智能技術正在顛覆傳統媒體內容生產流程、提升新聞生產效率,并改變原有的把關人規則(張洪忠等,2018)。
要把握機器寫作對新聞傳媒業的影響,首先需要了解機器寫作的生成原理。目前,學者們對此有一些探討。如有文章將機器寫作的原理概括為五步:讀入大量數據,測量數據“新聞性”,尋找報道角度(框架),尋找支持框架的數據,潤色文字(鄧建國,2016)。還有文章將機器寫作概括為“人工模板”+“自動化數據填充”的模式(彭蘭,2016)。也有研究對10名有獨立使用自動化新聞文本生成工具經驗的記者進行了半結構化訪談,通過分析記者對該技術的使用經驗與想法,揭示了機器寫作存在的諸多局限性(Thurman & Kunert,2017)。
盡管這些文章對機器寫作的基本步驟做了描述,但沒有觸及機器寫作真正生成的技術邏輯,因此還不能幫助人們更好地掌握機器寫作的規律。例如,今天各大新聞客戶端充斥著大量同質化沒有營養沒有內容的水文,這一現象的成因就需要從技術邏輯角度來進行解釋。目前通行的機器寫作的內容,多數都是簡單呈現時效性的短新聞,或者只是將人物或事件的描述性事實報道進行堆積,很少能夠形成有觀點有態度的生成型文章。“態度”和“觀點”是新聞報道的靈魂所在,但目前來看,純粹基于大數據聚類和數據填充的模板式新聞寫作在這點上是無能為力的。
進一步看,當前新聞從業者作為“技術門外漢”對新技術往往處于被動接受的狀態,只有讓接受過新聞專業訓練的從業者和研究人員更了解新聞報道的寫作邏輯和寫作方式,讓他們的角色從使用者轉換為開發者,才能真正讓機器寫作成為新聞生產的一個有用工具。也就是說,只有將人工智能的技術思維和新聞思維相結合,才能更好地開展內容生產。
由此,本文對北京師范大學新聞傳播學院參與微軟小冰項目組開發“小冰白盒寫作輔助工具”的過程進行個案研究,從北師大團隊角度探究以下問題:資訊聚合類新聞文本自動化生成原理及模板生產模式為何;新聞傳播專業經驗如何使得機器新聞寫作文本更接近人類寫作文本;文科思維與技術思維的差異體現在什么方面以及如何進行磨合。
本研究采用個案研究方法探討問題,以北師大新聞傳播學院團隊參與微軟小冰“小冰白盒寫作輔助工具”開發過程的個人經驗為研究對象,并結合前期的11次討論會的會議記錄文本及項目合作期間產生的其他書面資料輔助分析。個案研究是一種全方面收集研究對象資料的質性研究方法,能夠整體、深入地剖析一個樣本(魏峰,2016),通過個案研究可以擴充對經驗事實的認知,提出新的理論見解(王富偉,2012)。此前幾乎沒有關于新聞傳播專業人士參與到機器新聞寫作工具設計開發層面的記錄與研究,希望本研究對后續相關研究能有一些實踐層面的參考價值。
2017年9月16日,北京師范大學、微軟和封面新聞聯合成立了“人工智能與未來媒體實驗室”。在2017年11月16日封面新聞舉辦的“智創未來2017C+移動媒體大會”上,微軟亞洲互聯網工程院小冰團隊的總經理曹文韜和北師大新聞傳播學院張洪忠教授商定,張洪忠教授團隊參與到微軟小冰機器寫作的開發工作之中,作為“人工智能與未來媒體實驗室”的一項實際工作。
2017年12月初,微軟小冰團隊與北師大新聞傳播學院張洪忠教授團隊(后面簡稱“北師大團隊”)正式展開合作,在微軟小冰團隊前期工作基礎之上共同合作探索出一套可行的資訊聚合類新聞機器寫作模板生產模式。北師大團隊人員有:張洪忠教授,講師劉茜博士,博士生何苑,碩士生韓曉喬、劉力銘、石韋穎、丁磊、王小月。項目合作分為兩個階段。前期雙方團隊每周開展1~2次討論會,交流工作進度、探討修正方案和布置工作,先從聚合類娛樂新聞的機器寫作開始。后期北師大團隊的博士生、碩士生以實習生身份進入微軟公司,與微軟開發團隊一起將驗證可行的聚合類娛樂新聞模板生產模式推廣到科技、體育等更廣泛的寫作領域。
整個項目的工作可以分為六個部分,由北師大團隊和微軟小冰團隊分工合作完成:(1)行業內容結構梳理:以娛樂新聞為例,建立文章類目表,設計機器寫作邏輯框架。這一部分主要由北師大團隊完成。(2)對應行業結構,將不同觀點態度的文章寫作手法歸納總結,并形成相應的機器可以理解的模板進行學習訓練。(3)數據補充與模型訓練:工程師給予對應模板模型收集人類寫作文本作為機器學習對象,并進行算法模型訓練。由微軟技術人員負責。(4)效果評估:在討論會上共同閱讀分析測試文本,檢驗模板和算法的可行性,以改進方法。由北師大方面在微信群、微信公眾號、今日頭條發布機器生成完整新聞文本,觀察受眾反應。(5)向科技、體育等領域擴展:在項目后期,北師大團隊部分成員進入微軟公司與小冰團隊一起將驗證可行的模板生產模式推廣到科技、體育等更廣泛的寫作領域。(6)模板編輯工具開發:模板編輯工具的開發與模板架設同時進行。微軟團隊負責產品設計與開發,北師大團隊從用戶角度提供需求。
之前的機器寫作工具主要生成財經、體育類別下的快訊類新聞,以填充描述性數據為主。就是“人”先設計好寫作內容的格式,機器只需要搜索并匹配相關內容到格式中,就可以像做“填空題”一樣完成報道的簡單寫作(何苑、張洪忠,2018)。雖然在大數據和算法技術支持下,機器寫作已經可以實現同一主題下多事實信息的聚合,但也只是對信息的簡單聚合,無法在將碎片式信息串為整體的同時兼顧文章中心思想的呈現,因此生成的文章不符合人類閱讀習慣。
微軟小冰團隊和北師大團隊為了使“機器寫作”向“人類寫作”更靠近,需要將不同觀點寫作手法的規律總結為機器可以理解的形式,然后指導機器去尋找對應觀點態度的數據來成文。同時,機器生成文本需要使用人工編寫的語句銜接,并采用更符合人類寫作邏輯的結構組合。因此,要開發出一套更接近人類寫作的文本生成工具,除了技術開發外,還需要了解傳播規律和新聞寫作技巧的專業人士參與寫作模板的設計。
2018年7月26日,微軟召開第六代微軟小冰發布會,發布會上推出 “小冰白盒寫作輔助工具”。該工具由微軟小冰團隊與北師大團隊合作開發,旨在幫助媒體從業人員快速收集、聚合報道所需要的事實信息并形成新聞初稿。根據用戶的需求,該工具具備對同一事件選取不同觀點態度進行報道的功能。
機器寫作的模板由報道主體、人工銜接語、標簽、段落選取規則組成。模板限定了文章的寫作框架、事實信息的排列順序以及情感傾向。模板的設計和銜接語的編寫都會影響機器生成文章的邏輯和流暢性。
要想實現批量、自動化生成更接近人類寫作風格的文本,就需要找到人類寫作邏輯與機器寫作邏輯的契合點,開發出一套通用的模板生產方法論。北師大團隊和微軟小冰團隊以娛樂新聞為切入點,探索出了一套以情感態度為關鍵的資訊聚合類新聞機器寫作模板生產模式。
從簡單的羅列事實到形成完整的文章,需要有一個主題支撐。主題不同、模板的設計也會有所不同,模板的主題就是文章的主題,在這里也就是自動生成文本的類型。
在進行具體模板框架設計之前,首先要確定模板主題的分類方式。建立新聞的三級類目,如將“娛樂”作為一級類目,對娛樂新聞的主題進一步細分作為二、三級類目。分類既是每個模板生成文章的主題,也是記者使用機器寫作工具時選擇的生成文本類型,設計的好壞將決定媒體工作者能否迅速找到自己想要生成的報道。
北師大團隊在收集并閱讀了近五年娛樂大事件的相關報道后,發現娛樂新聞和娛樂相關的微信公眾號文章往往以最新發生的事件為引,再追溯事件涉及人物的相關歷史新聞,最終形成一篇內容豐富的聚合類娛樂資訊。結合新聞寫作的專業知識,團隊經討論決定從新聞報道事件類型的角度對模板進行分類,也就是在娛樂下首先建立包括緋聞、違法、綜藝、獎項、時尚活動等在內的多個二級類目,再在每個二級類目下建立三級類目。比如“緋聞”下的三級類目是“未婚緋聞情侶”“出軌”等。每個三級類目既代表一個文章主題,同時也是新聞模板引語部分陳述的事實信息。這樣設計文章分類,為的是令記者在遇到突發新聞使用工具生成文章時能迅速根據事件類型找到所需模板生成文章。
記者思維強調以事實的時間性和重要性排列事實信息,改變時間線的敘事結構,這一點也被應用到后面的模板框架設計當中——先報道新近事實,再根據重要性盤點相關歷史事實信息。
“機器沒有情感態度,人類才有,可以通過不同事實組合呈現出差異化的態度。”在第四次的討論會上,為了使機器生成文本從羅列事實到呈現觀點態度,北師大團隊提出在三級類目的基礎上將同一主題的模板根據情感態度再次進行分類。在定下模板主題分類方式后,選取二級類目“緋聞”來設計模板。經過討論,決定以“未婚緋聞情侶”為例,分“批判/祝福”兩種態度來進行模板寫作。由新聞傳播學院的學生編寫銜接語、制定段落標簽(段落主要內容)并設計文章結構。此次寫作的兩個模板主要區別體現在銜接語的表達上,段落標簽選擇和順序上幾乎沒有差別。
微軟團隊工具的開發伴隨著不斷的測試和結果評估,以改進算法和模板設計,直到達到最佳效果。
在第一次情感態度驅動的寫作模板完成后,微軟團隊將“劉雯/崔始源”“吳昕/潘瑋柏”這兩對緋聞情侶的名字輸入到模板中進行測試,生成了四篇機器寫作文本。第五次討論會上,北師大團隊和微軟團隊對結果共同進行了評估。從技術方面來看,抓取的文段與目標信息不夠切合,由于涵蓋的事實信息都是中性的,都是主體過去的互動,即使銜接語的態度分明,說服力仍然不夠強,甚至出現了機器生成文段的事實信息與銜接語觀點相違背的情況。
討論會上決定將同一個三級類目下不同態度的模板架構加以區別,以突出表達情感態度;對事實信息進行正面/負面分類,通過報道對象的正負面新聞事件選擇性呈現,形成文章態度的褒貶。比如,“緋聞情侶”的模板會涉及對報道兩個當事人的褒貶,排列組合形成男正女負(祝福/批判)、兩正(祝福)、兩負(批判)、女正男負(祝福/批判)共六種模板。此外,微軟團隊在技術上優化算法,使生成文本更準確,并嘗試讓機器對文本的態度正負做出判斷選擇。
根據討論結果修改模板后,使用“趙麗穎/吳亦凡”作為測試對象,并將生成的報道在微信群、微信公眾號、頭條號發布。此次機器自動生成的文本語言流暢、邏輯自洽,證明情感態度模板的可行性。
特別有進展的一點是,數據的收集和聚類的訓練模型不再僅僅是基于事件和內容的相關性,而且加入了觀點和態度這兩個全新的標簽,進行數據模型的深度學習。在給予這些新的數據和模板成文進行標定訓練后,再去判斷文章的優劣。
對于數據的聚類成文后,還要進行對應內容的二次改寫。這樣能使得內容更加符合整體文章的效果,并能進一步優化用詞進而使得整體文章的結構更加自然,更像是一個“有態度”的新聞工作者創作出的完整文章,而不是對內容數據的簡單拼湊。
在確定了模板設計的基本思路后,需要考慮同一主題模板的量產問題,即如何在報道同一主題事件時自動化生成大量不重復的文本。“樹”指的是一種文章框架圖,一個三級類目可以形成一張框架圖,包含的不同情感態度的模板架構可以全部在一張框架圖中顯現,框架圖由標簽排列構成。框架確定后只要添加不同的銜接語就可以形成不同的模板。在第八次討論會上,微軟團隊提出使用標簽建構“樹”這種模板框架圖,先搭建文章框架,后期再聘請專門的人員大量生產銜接語。為了驗證“樹”這一方法的可行性,兩個團隊決定進一步開發“出軌”主題模板和“綜藝”主題模板。
在“綜藝”和“出軌”主題模板驗證了流程的可行性之后,北師大團隊里的學生成員進入微軟公司,將方法論推廣到科技和體育領域。具體模板生產流程如下:
(1) 分類。對某一領域的新聞進行主題分類,分類依據是新聞事件的類型。
(2) 搭建“樹”。為需要搭建模板的主題設計模板框架圖,一個模板框架圖包含同一主題下所有情感態度。
(3) 標簽總結與技術優化。框架圖搭建完畢后,根據框架列舉文本生成所需的內容標簽,為標簽制定規則,協助技術部門標注標簽對應內容,技術部門對機器生成標簽內容進行技術優化。
(4) 模板寫作與測試。銜接語編寫,形成完整模板,使用模板寫作工具測試模板的通用性。
(5) 在驗證了娛樂行業后,迅速地對體育、科技類進行試驗,驗證了方法在新聞聚合類文章上的普適性和可擴展性,而且這一階段對于態度模板的擴建是通過專門的工具平臺來完成的,這也極大地降低了對參與人員的技術要求和限制,使得整個生產過程變得更加高效。
寫作是偏文科思維的任務,而機器寫作的工作原理是理科邏輯,這就要求學科交叉共同合作,來達成目的。北師大團隊均為人文社會科學學科背景的師生,而微軟團隊則多為理科背景的技術開發人員,兩種不同學科背景和思維模式的團隊在合作中逐漸顯現出明顯的學科差異。但雙方通過深入溝通促進相互理解,擦出了新的火花。
微軟小冰最初生成的文本基于時間線敘事,預設模板是將事件按照發生順序羅列,在北師大團隊看來,這樣的文本固然敘事清晰,但機器組合的痕跡依然明顯。通常,新聞寫作常用的“倒金字塔結構”會將更重要的內容放在前面,這樣才能吸引讀者繼續讀下去。要完成一篇合格的公眾號文章也需要有故事的起承轉合,戲劇性的文章有起伏才有人看。模板的事件分類和情感態度主導也是基于這種文科思維來設計的。
對技術部門來說,無論是時間線,還是反轉式的故事,只要有清晰的規則就能實現。重要的是規則。
人類寫作的思維是將若干個概念串聯在一起,有了一個概念。概念的含義自然就在腦海中被解讀并檢索出對應的具體信息,實現概念的具象化。但是如果僅僅給出一個概念,對機器來說是無法理解的。在會議上,北師大團隊的成員經常被技術人員追問某個標簽的具體含義,因為只有技術人員將明確的外延和內涵寫成規則,機器才能理解。最初北師大團隊給出的模板中有“互動”“產生社會不良效應”等含義廣泛的概念作為標簽。人與人尚難以給出同一概念界定,機器更難理解。為了解決概念模糊機器無法理解的問題,團隊采取了多種優化措施。比如“互動”這個詞,作為標簽,邊界寬泛,需要更具體的解釋。機器不能理解抽象定義,所以要對標簽進行意義拆分,拆成更具體的子標簽。北師大團隊首先將“互動”拆成了“節目互動”“劇組互動”等子標簽,并且通過舉例讓技術人員知道每個子標簽代表的具體內容,再根據例子寫成規則訓練機器。
技術邏輯是一種規則嵌套,機器無法獨立完成概念的具象化理解,文科思維需要再向前走一步,幫助機器完成概念的具體化,技術思維則將明確的文字規則編成程序,二者共同構成人類思維與算法之間的橋梁。
技術思維講求一個算法解決一類問題,一個模具批量生產大量產品。人類寫作與機器生產不同,常常被認為是個性化的。模板銜接語是機器生成文章當中人工寫作的部分,一套模板銜接語理論上要能夠被用于同一主題(如“單身緋聞情侶”)下同一態度的所有情境,不論“小鮮肉”還是“大叔”作為緋聞對象要都能夠帶入同一模板。在北師大團隊和微軟小冰團隊的討論會上,爭議最多的要數銜接語的通用性問題。微軟方面提出一些詞語無法套用所有藝人身上,造成文章邏輯混亂;北師大團隊中負責寫銜接語的成員則認為完全刪掉有指代性的詞會削弱文章的生動性,文章語言會顯得生硬。
自動化生產必然會犧牲個性化,但個性化正是人類寫作的精髓。在這一問題上,最終雙方也沒有找到完美的解決方法。寫銜接語的成員在用詞上更加小心以避免使用指代對象有限的詞語,但一些模棱兩可的詞語也被允許寫入模板中。由此可見,通用性和個性化之間的權衡仍是需要人類完成,而機器替代不了的。
一是要正確理解機器寫作。那些認為機器寫作可以完全替代人,或者認為機器寫作有價值觀的說法其實都是不準確的。現階段機器新聞寫作的原理是基于大數據驅動,通過數據檢索、數據分析、自然語言處理等算法將所需信息填入人工設計的模板中,不能從真正意義上完成有邏輯、有態度觀點的自動化文本生成。機器擅長處理海量數據,能夠彌補人的大腦在信息儲備、數據處理上的弱勢,更快速、精準地找到完成新聞文本需要的信息,從而減輕人類的工作量。但由于技術的局限,機器不能理解復雜的邏輯關系,甚至無法區別主被動關系,因此僅依靠機器生成文本無法構成一篇邏輯嚴密的新聞報道。此外,機器還不能進行采訪,只能引用網絡上已有的信息。也就是說,機器寫作無法采集到線下事實,只能按照“人”設定的模塊來寫作,只是一個基于算法的依賴互聯網大數據來源的寫作工具(何苑、張洪忠,2018)。
二是機器寫作會很快成為傳媒業內容生產的一個高效的輔助寫作工具。機器寫作在新聞領域更適合被當作一款寫作輔助工具,來幫助人類處理海量復雜的信息,將人從反復枯燥的勞動中解放出來,但人的工作仍然具有不可替代性。媒體從業者在自動化文本生成工具的開發中擔任著設計師的角色。專業的新聞編輯可以為機器新聞寫作工具制定寫作框架,根據不同新聞資訊的題材設計出更符合人類閱讀習慣和信息需求的寫作規則。機器寫作還不可避免地需要人工寫作的內容來進行完善——所有的模板銜接語均由人類完成。
三是在當前人工智能技術被廣泛應用于傳媒業的背景下,文科思維與技術思維的碰撞與合作將成為常態,學科如何交叉合作成為日益凸顯的問題。在“小冰白盒寫作輔助工具”開發的案例中,北師大團隊經歷了從完全的文科思維到理解技術邏輯并可以靈活運用的轉變。理解技術邏輯使文科從業者能夠更好地運用它。在機器寫作項目中,寫作功能需要文科思維,但功能由技術實現,新聞傳播學院的師生在開發過程中擔當了技術與功能實現之間的橋梁。越接近需求,越要使用文科思維;越接近底層技術實現,越靠近技術思維。比如,文科思維判斷生成文本需要有情感態度,理解機器的技術邏輯是聚合包含事實信息的文本后,決定通過事實的選擇和順序來使文章具有價值判斷,這就實現了文科思維和技術思維的轉換。文科從業者沒必要完全掌握代碼編寫的技能,只需要掌握技術邏輯和原理,將純文科思維用技術思維進行解構分析,就能促成兩者的合作。
四是目前新聞傳播學術界有一個流行觀點,即夸大機器寫作的功能,擔心機器寫作會取代人的思想而變得不可掌控,甚至走偏。其實,了解機器寫作的原理后,就知道機器寫作只是一個寫作的高效輔助工具而已,本身并不能形成觀點,其生成的文章背后體現的是人的觀點。
感謝微軟亞洲互聯網工程院小冰團隊總經理曹文韜先生對文章提出的修改意見,以及感謝小冰團隊的各位工程師和參與人員的合作。