白 貴, 王太隆
(河北大學 新聞傳播學院,河北 保定 071000)
隨著云計算、大數據等概念的興起、升溫,人工智能成為世界矚目的焦點;關于媒介實踐與人工智能結合的學術討論也被推上新的高度。縱觀傳媒業的發展進程,技術一直是驅動變革的重要力量,每一次重要技術的引進都會對整個媒體格局產生顛覆性的影響。在技術革新的時代,了解、應用、改造甚至引領技術發展對媒體行業具有重要意義。作為人工智能技術在新聞實踐領域運用的代表性產物,“機器新聞寫作”是指運用機器算法對數據進行抓取、分析、整理和呈現的新聞寫作模式,它使新聞生產開始走上了工業化、自動化和智能化的道路[1]。
Statsheet成立于2007年,是美國第一家致力于自動化新聞生產的公司。2014年3月18日,《洛杉磯時報》推出的地震預報機器人Quakebot成為最先報道南加州地震的“記者”,這一事實震驚了新聞界。2015年9月,騰訊開發出新聞寫作機器人“Dreamwriter”,成為中國第一家正式運用機器自動撰寫稿件的公司。同年11月,新華社推出新聞寫作機器人“快筆小新”,它主要撰寫體育賽事新聞稿件和財經信息稿件。2016年里約奧運會期間,“今日頭條”寫稿機器人“張小明”大放異彩。從此,體育賽事機器新聞寫作在國內拉開了序幕。
1.1必要性隨著社會對體育賽事關注度的不斷提升,個性化、高品質化體育賽事報道成為時代之需。大型體育賽事通常具有籌辦周期及比賽時間長,比賽項目及參賽人數多等特點[2],相關信息又為受眾所喜歡,從而給體育賽事的報道帶來了巨大壓力。
體育賽事種類繁多,受眾廣泛,不同受眾對不同體育賽事有著不同的興趣。傳統體育新聞報道受經濟、人力、資源等方面的限制,只能致力于滿足多數人的信息需求,主要針對熱門賽事、關鍵比賽進行報道,無法滿足所有受眾的信息需求。隨著互聯網的普及,體育賽事報道需求的長尾效應被放大,冷門比賽報道占據一席之地。事實證明,在里約奧運會期間,那些看似很冷門、關注度不高的體育報道,卻得到了相當可觀的閱讀量[3]。這就需要一種不僅能夠報道熱門比賽,還能對冷門比賽進行報道的工具,為用戶提供私人訂制的報道,滿足受眾的個性化需求,從而吸引讀者,留住讀者。
體育賽事往往具有海量信息。無論是綜合性運動會,還是單項體育賽事,媒體記者很難對每一個項目、每一場比賽、每一名運動員的賽況進行面面俱到的報道。同時,體育賽事之外的明星公益活動、比賽花邊新聞等也成為體育新聞報道的重要內容。疲于應付、分身乏術的媒體記者和編輯急需一種“新生”工具將他們從大量簡單重復性的報道工作中解放出來,使他們在減小工作壓力的同時,能夠集中精力搜集生動鮮活的素材,完成更多具有創造性和趣味性的高品質報道。因此,發明并推廣一種能夠完成制式的、新聞要素齊全的常規報道的寫作工具,被提到了議事日程。
可見,無論是從受眾角度,還是從媒體角度考慮,均需要發展體育賽事機器新聞寫作以應對海量數據,提高生產效率,緩解供需矛盾。
1.2可行性適逢人工智能第3次浪潮到來,機器新聞寫作所需的技術條件逐漸完備。體育賽事規程規則明確,賽事報道新聞要素齊備完整,這些使得機器新聞寫作能夠在體育賽事報道中率先被應用。
20世紀90年代,計算機集群技術為第3代人工智能的發展提供了硬件基礎,并一步發展出云計算技術。與此同時,互聯網的出現和發展促進了網絡數據的積累,推動了大數據的發展。大數據和云計算為深度學習算法提供的海量數據和近乎無限的計算能力,打破了限制人工智能發展的2個主要瓶頸[4]——數據量不足和計算能力有限,為機器新聞寫作提供了硬件保證。2010年,Narrative Science開發出一款名為Quill的自動寫作軟件,實現了自行生成新聞標題、編寫體育賽事新聞、撰寫基金業績報告等功能[5],為機器新聞寫作提供了軟件支持。
就新聞實踐而言,機器新聞寫作特別適合整合最基本新聞要素的模板式的體育賽事報道。首先,體育賽事的比賽過程會包含比賽雙方甚至多方的結構化數據信息(如球隊名稱、球員姓名、所屬國家、比賽得分等),這些信息易于被機器抓取、分析和整理。其次,每場比賽的大量結構化數據可以根據時間或空間進行排列擬合形成數據函數曲線,這些函數曲線的變化規則可以作為機器判斷的依據,幫助機器對比賽進行“理解”和處理。再次,大量常規性的、模板式的體育賽事報道往往具有相似性和重復性,易于機器學習掌握程式化寫作模板。因此,采用機器新聞寫作的方式對體育賽事進行報道具有明顯的可操作性。
綜上可知,數據量的擴充、運算能力的提高、智能算法的優化,為機器新聞寫作的發展提供了技術保障,運用機器新聞寫作完成部分體育賽事報道的可行性成為行業共識。
2015年8月,騰訊體育購買了美國職業籃球聯賽(NBA)的轉播權和全套數據;同年9月,騰訊推出了新聞寫作機器人Dreamwriter。既有數據支持,又有技術力量,騰訊體育對2016—2017賽季NBA的報道取得了成功,但在成功的背后依然可以看出體育賽事機器新聞寫作面臨的現實困境。筆者通過整理2016年12月9日—2017年6月13日騰訊體育平臺上由Dreamwriter完成的953篇“機器人NBA戰報”,對體育賽事機器新聞寫作的文本特征進行整體分析,進一步總結其現存困境。
筆者對“機器人NBA戰報”文本的分析主要從標題和正文兩部分進行。
對于標題的分析,筆者首先將標題按語法結構進行劃分,再將每部分用數字代替,對應的規則為:球員姓名用“1”代表,球員動作用“2”代表,球員數據、球隊名稱、球隊數據、球隊動詞、空格及標點、其他成分分別用“3”“4”“5”“6”“7”“8”代表。例如“119-114!詹姆斯三雙助騎士險勝步行者”就可以用數字表示為“57132464”。通過對全部標題的整理,可知標題語句制作結構大致有5種模式。
對于正文部分,筆者運用抽樣方法對人工戰報與機器人戰報進行對比分析。該賽季“機器人NBA戰報”的時間跨度約為6個月,采用間隔抽樣方法最終合成月的方式,將31天分為6段,分別在不同的月份進行抽樣,即在2016年12月13—17日、2017年1月3—7日、2月8—12日、3月18—22日、4月23—27日、5月28日—6月2日各抽取1場比賽,每場比賽選出人工戰報1篇、機器人戰報1篇,共計12篇報道進行對比,時間段內的抽樣均采取簡單隨機抽樣方式。
通過對標題和正文的分析,可以總結出體育賽事機器新聞寫作面臨如下3點現實困境。
2.1邏輯運算難以實現語義理解通過對機器人戰報標題進行全面分析后可知,標題結構基本可以分為5種組合(表1)。

表1 “機器人NBA戰報”標題結構組合與舉例Table 1 A combination of robot NBA report headlines and examples
由表1可見,機器人NBA戰報的標題結構較為固定,只是根據不同比賽的數據選擇詞語進行替換。如:有12個表示勝利的高頻詞,分別為“戰勝”“擊敗”“擊落”“加時勝”“險勝”“力克”“力挫”“輕取”“狂虐”“狂屠”“完虐”“大勝”;有4個表示失敗的高頻詞,分別為“不敵(包括‘加時不敵’)”“惜敗”“小負”“憾負(包括‘加時憾負’)”。這些詞語的運用并未與比賽結果緊密貼合:如“維金斯31分唐斯兩雙 森林狼主場17分大勝雄鹿”(2016-12-31)和“112-95!庫里27分助勇士戰勝籃網”(2017-02-26)這2個戰報標題中,雖然2場比賽的分差都為17分,卻使用了“戰勝”和“大勝”2個不同含義的動詞;再如“117-101!杜蘭特26分助勇士擊敗籃網”(2016-12-23)和“95-89!麥科勒姆43分助開拓者擊敗森林狼”(2017-01-02)這2個戰報的標題中,雖然都使用了“擊敗”,但分差為16分和6分。分差相同(17分)的2場比賽,戰報標題中卻使用了感情色彩不同的2個詞語(“戰勝”與“大勝”),分差不同(16分和6分)的2場比賽卻使用了同樣的詞語(“擊敗”)。可見,標題中詞語的選擇顯示出機器新聞寫作未能對比賽結果有深入的理解,只是邏輯運算的結果。
機器人戰報的“4部分結構模式”組成了正文的基本框架,即“導語”“雙方球員技術統計”“比賽回顧”“雙方首發”。每一部分又有幾種固定的結構和搭配。以“比賽回顧”為例,通過使用如“開場后”“次節回來”“異地再戰”“第四節”或“首節開打”“次節回來”“下半場易邊再戰”“第四節”等詞語組合作為段落的開頭將報道分為4段;每段分別描寫一節比賽,具體形式為在段首句后添加3句按時間順序描述本節中的3個精彩瞬間,之后對比賽雙方的表現根據新聞要素的數量加1~4句評論,最后以比賽雙方比分情況作為本段的結束語。人工戰報則相對靈活,如:2017年5月8日騎士以4∶0橫掃猛龍的比賽戰報中,機器人延續了以往的報道方式;而人工報道則以“東部決賽賽程已敲定!騎士至少獲1周休息時間”為標題進行了報道,沒有選擇常規性的報道結構,而是從季后賽的賽程入手,未拘泥于本次比賽,體現了報道者對整個賽事的宏觀理解。這一點是機器邏輯運算無法達到的。
究其原因,是“當代計算機系統只具有形式邏輯運算功能,而不具備人類智能系統的情感功能和意識功能”[6]。因此,它不能像人一樣將對比賽的感受與自身的知識相結合,并從語義的角度完成寫作,而是通過將比賽過程中的數據與預設數據點進行對比挑選新聞要素,并調用對應的語料庫數據完成寫作。
進而言之,雖然機器背后的邏輯推算與語義中的語法邏輯具有相似之處,但后者比前者多經歷了一次對含義的處理過程,由此必然使得機器寫作和人工寫作之間出現了結構和含義、框架和內容上的區別。正視這個問題,首先要了解語言與思維發展的關系,語言是在人類思維發展過程中隨著生產勞動的需要而逐漸形成的,卻并非思維的全貌;語言是思維的一種分享手段,卻因生理、經歷、社會等諸多因素的不同而存在差異。“實驗測量(機器人寫作)與人文思辨(人工寫作)的界限會越來越模糊,但是這兩類變量仍是不可以化約的,其根本原因是人有自由意志,即人的主體性,他不可能被還原為因果性”[7]。因此,即使機器的邏輯推算能夠通過語法在形式上高度模仿人類的表達,但不能理解語義的機器還是很難達到人類智能的高度,很難在這一高度上從事寫作等高智能工作。
2.2數據處理復雜難以被機器理解數據處理復雜主要表現為部分數據難以進行量化處理以及機器對于可量化數據的錯誤判斷。
在2017年6月2日騎士對陣勇士的比賽中,相較于機器人戰報的“4部分結構模式”,人工戰報增加了“本場之星:杜蘭特統治全場”和“比賽花絮:杜蘭特半場6暴扣”2個環節。“本場之星”是一個很難通過量化標準確定的概念,評判的依據往往不是單純的數據統計,還會包括球員在比賽中發揮的關鍵性作用。一旦出現發揮最大作用的球員不是數據最好的球員時,機器將難以做出具有感情色彩的判斷。再如“杜蘭特半場6暴扣”這類人工戰報中時常出現的描述,在機器戰報中卻少有出現。可見“暴扣”、普通扣籃和其他得分方式這類人工較易判別的動態數據,對于機器人來說區分時困難重重。究其因,在于文本、語音以及視頻等隱藏著大量關鍵信息的非結構化數據的量化難度較大,不易轉變為機器新聞寫作中機器可以識別的信息[8]。
對于2017年4月23日灰熊對陣馬刺的比賽,機器人戰報中有這樣的陳述:“灰熊對籃板發起瘋狂進攻,本節共搶下17個籃板,包括4個前場籃板,其中康利一人就貢獻5個籃板球。馬刺3分如雨,全隊本節投10個3分球,但命中率僅為30.00%。灰熊本節狀態欠佳,失誤多達6次”。其中“灰熊”同一節的“異常”表現有2個方面,不僅沒有合并敘述,而且中間還被“馬刺”的表現岔開。這就是為了滿足設定程序而出現的一種“錯誤”信息,即預設的信息判斷法則與信息、信息呈現之間存在不符合人類正常表述習慣的潛在錯誤。具體而言就是機器人測量到本節比賽中雙方出現了3個與以往不同的數據,并認定應為報道要素。由于機器在預設時的規則為按照報道要素的先后順序描述,而不是先將同一主體的新聞要素予以整合,再進行陳述,所以機器人戰報描述的順序為“籃板—3分—球隊狀態”,這不符合讀者的信息接受規律,說明體育賽事機器新聞寫作未能對本場比賽中可量化數據進行正確判斷和優化組合。究其因,在于機器的判斷是基于“數字”和“公式”的比較:一方面,當出現程序中未設定的情況時,在沒有人工介入的情況下,機器往往會陷入死循環或執行跳出指令;另一方面,如果出現滿足設定程序的錯誤信息時,機器便會被“誤導”。
綜上可見,目前體育賽事機器新聞寫作的報道多停留在對比賽進程和比賽結果的簡單報道和總結概括上,未能實現深入挖掘和綜合分析,這與數據處理本身困難且復雜有很大關系。隨著人工對數據挖掘技術的開發,相信更多的數據能夠通過邏輯運算被機器“理解”。
2.3比賽數據難以轉化為趣味表達體育賽事新聞有一個明確的價值取向,即要遵循“重要而有趣”的原則。通過機器人NBA戰報與人工報道的對比可以看出,機器人戰報的報道要素呈現方式單一且固定,無法像人工報道那樣能從多個維度進行分析,更不能跟隨事件的進展創造寫作方式來突出新聞點和趣味性。
從機器人戰報和人工戰報標題的對比中可以看出,機器人戰報的標題雖然具有重點突出、結果一目了然、簡單易懂的特點,但不如人工戰報標題具有更豐富的細節、更靈動的畫面和更具沖擊力的情感表達(表2)。

表2 “機器人NBA戰報”與人工戰報標題對比Table 2 Title comparison of the robot NBA report and the artificial report
在表2中,序號5和序號6提到的2場比賽——“灰熊對陣馬刺”和“勇士對陣馬刺”,均已進入季后賽階段,人工戰報用“2∶2”和“1∶0”對賽程進行描述,而機器人戰報完全忽略了這一細節。對比序號1和序號4的標題可以看出,人工戰報中的“擒”和“壓哨絕殺”以動態的方式分別對比賽結果與比賽瞬間進行描述,增加了標題的畫面感,而機器人戰報的標題只使用了“不敵”和“險勝”這2個較為中性的動詞,少了一份靈動感。此外,人工報道標題中還大量使用球隊和球員的昵稱,如:在序號3中將凱爾特人稱為“綠軍”,將托馬斯稱為“小刺客”;在序號5中將萊昂納德稱為“卡哇伊”。這些稱呼帶有明顯的情感色彩,而機器人戰報并未使用昵稱的表述方式,過于冷靜客觀,缺少必要的感染力。
不僅在標題中,在正文中“機器人NBA戰報”的表達方式依然缺少必要的趣味性。在2017年1月6日開拓者對陣湖人的比賽中,人工戰報的第一段為“波特蘭開拓者今日在主場以118-109擊敗洛杉磯湖人……湖人常規賽面對開拓者已經遭遇9連敗”,而機器人戰報的第一段則為“湖人客場對陣開拓者。最終開拓者以118-109戰勝湖人”,二者形成了鮮明的對比:人工戰報開始便埋下了湖人隊常規賽對開拓者已遭遇9連敗的伏筆,勾起了讀者對以往比賽的回憶,豐富了觀看此次比賽的情感體驗;而機器人戰報無法從雙方對陣歷史入手,突出本次比賽的特殊意義,喪失了趣味性表達的機會。
再如,2016年12月13日小牛對陣掘金的第4節,比賽早早進入“垃圾”時間,趣味性全無。人工報道為“末節,雙方的分差再沒能縮小到20分以內,比賽也早早進入垃圾時間。兩隊派上大量替補球員進行練兵,最終,小牛主場以112-92大勝掘金”。機器人戰報為“第4節,第5分43 s,梅杰里在約基奇投籃時犯規,送給掘金2次罰球機會。第6分59 s,德隆出現傳球失誤,被埃爾南戈麥斯搶斷。第11分39 s,穆雷妙傳,穆迪埃3分遠投命中。比賽結束,小牛以112-92戰勝掘金,鎖定勝局”。人工戰報體現出了對賽況的主觀判斷,能夠有效引發球迷的情感共鳴;而機器人戰報依然執著于賽況的平鋪直敘和數據的順序呈現,比賽數據未能轉換為趣味表達。
由此可見,體育新聞機器人寫作的“思考”與“表達”多是基于框架的推演,而非內容的考量。機器人戰報雖然沒有錯過由數據突顯出來的各種重要性人物與比賽結果,但對于趣味性的把握顯然不如人工新聞到位。
就目前騰訊體育“機器人NBA戰報”而言,機器人可以“復制”出滿足人們信息需要的報道,卻無法主動創造出滿足讀者不同需求和愛好的文章。在強人工智能還是未來目標的今天,處于弱人工智能階段的機器需要向人類學習,在被人類改造后才能發生變化和進步。雖然它可以通過豐富模板和語料庫實現寫作水平的提升,但若要實現對人工報道的完全取代,仍然需要新技術、新方法的出現。
由于人的自由意志即人的主體性不可能被還原為因果性,所以人工創作的報道是無法被目前只擁有形式邏輯運算功能的計算機直接通過語義理解實現的,需要通過模仿人工寫作的文本寫作方式和新聞點描寫方式實現報道水平的提升。換言之,在技術出現革命性突破前,仍然需要對現有技術進行更好地總結歸納,并實現升級換代;即使無法同人工報道完全等同,也依然可以逐步在呈現的結果上逼近人工寫作水平,從而減輕人工寫作的負擔,最后通過人機合作的形式實現媒體行業效率的提升。
有人將國外的機器新聞寫作流程歸納為5個步驟:①讀入大量結構化和標準化數據;②測量數據中的“新聞性”;③找出合適的報道角度,如有多個角度,則按報道的重要性排序;④將報道角度與數據中的具體事實進行匹配;⑤生成報道文本[9]。國內的實踐將流程歸納為以下幾個階段:首先根據文字直播的特點構建球隊的分差函數,并提出基于分差函數的數據分片算法和數據合成算法;然后對數據片進行分類,構建模板庫,從而構建NBA賽事新聞自動生成的模型[10]。
2種方法雖然有所不同,但基本原理都是將“數據”“知識”“智能”3者進行有效結合,即將外部具有自然屬性的數據轉換為機械可獲取的數據,根據輸入機械可獲取的數據和數據間的關系提煉出共同本質,形成“知識”,進而向“智能”提供判斷的依據,讓“智能”在預設和“知識”的支持下對輸入數據進行處理,實現輸出的過程。新獲得的數據和數據間的關系又將作為新的“數據”納入知識庫,并與之前的數據合成新的“知識”(圖1)。

圖1 機器新聞寫作的框架分析Figure 1 Frame analysis of the machine news writing
下面圍繞“數據”“知識”“智能”3個環節著重討論如何提升體育賽事機器新聞寫作水平,實現新聞點的挖掘。
3.1數據積累與知識構建:從邏輯推算到語義模仿數據作為深度學習的依據、處理問題的根本,其作用不容忽視。對于數據的完善至少包括2個方面:數據量的不斷積累和知識的不斷構建。
只有數據量不斷積累,才能讓“機器人NBA戰報”等體育賽事機器新聞寫作有章可依、有據可循。要實現這個目標:一方面要對原有數據進行整理,并實時更新數據;另一方面要逐步通過語言表達形式的復雜化模仿人工寫作。欲解決文章框架單一、句子雷同的問題,應通過讀入大量文本數據以獲取新的框架和句子。當比賽數據擬合成的曲線發生變化時,根據曲線的特征和變化趨勢使用不同的預設框架、句子進行報道,甚至同一類數據曲線可以預設多種報道框架和句子。除文本數據外,在賽事實時數據方面,還可以將機器人的數據終端與大型體育賽事的新聞服務(如INFO信息系統等)[11]進行連接,將官方提供的即時引語、新聞發布會摘要等信息及時匯入以賽后消息為主的機器人新聞中,提供更加全面、準確的數據來源。
同時應不斷構建知識,進一步建立有效的統一標準,升級文本生成機制。如對機器人設置情感參數,對于國內球迷好感度高的球星,在文章中可以使用更多的形容詞、動詞,并添加報道環節,以滿足受眾需要。這就要求完善語料庫、詞匯知識庫,實現數據由單一用途向多元轉變,充分挖掘數據價值,加強情感分析,編寫泛化算法。這些目標的實現有賴于專業記者、編輯的介入,將他們的意見與建議同技術人員分享,從而整合出合理的方法對現有程序進行調整,逐漸使體育賽事機器新聞寫作不斷接近人工報道的水平。
3.2數據升級與知識優化:從信息推送到深度報道目前機器對數據的分析和運用還處于初級階段,其深度和廣度仍有待挖掘,以進一步實現知識結構的優化。
在深度上要解決自然數據到機械可獲取數據轉化的問題。可以通過網絡眾包標記的方式,將文本、語音以及視頻等隱藏著大量關鍵信息的非結構化數據上傳至網絡,“雇傭”網民對其進行分類標注,從而實現量化,幫助機器人識別比賽中的“暴扣”“絕殺”等勁爆瞬間。同時要重組數據結構,進行分級處理,通過知識建立起關聯性更強的數據網絡,使已識別“首三雙”等信息的機器人能夠尋找到對應的原數據、相關數據、文本庫進行挖掘和呈現,以及對如多次出現“灰熊”而未能歸納并列的文本實現數據的歸總,減少重復描寫。
在廣度上要通過建立標準數據模型實現數據的共享,實現多源異構、跨域關聯,保證數據流暢通,讓更多知識互通起來實現知識的拓展。目前,得益于計算方法的完善和互通互聯技術的提高,不同模型的專家系統逐步打破各自為政的限制,實現了多種模型的綜合運用,出現了以“通用性”“分布式”“協同式”[12]等為代表的“多專多能”的專家系統。媒體應該借助現有的專家系統,讓體育賽事新聞寫作機器人不僅懂得寫作,更懂得體育。要完成這一過程,就需要將專業人才引入媒體,或者媒體與專業數據公司合作,讓更多的數據和知識在機器中“活”起來,從對數據的初級處理向深度分析運用方向發展,使知識由簡單的評判向多維度的評估轉變,逐步實現深度報道。
3.3人工智能與人的工作:從單向輔助到相互協作目前,體育賽事機器新聞寫作所涉及的智能體現為一種判斷,即發現機械可獲取的數據后按照預設進行判斷、分析并輸出文本。所以,與其說它在模仿人類的“智能”,倒不如說它是在模仿人的部分認知能力。它雖然具有高效率、全時段、高精度、全方位等特點,但正如緝毒犬具有靈敏嗅覺能夠精準判斷毒品,但不能完全代替緝毒警察一樣,它們只是人類根據其特點制造或培育出的“幫手”。對于新聞記者和編輯而言,機器人是他們在“時間愈發緊迫”的今天高效完成信息收集、分析、過濾和撰寫報道的“幫手”。因此,從功能的角度看,對于機器新聞寫作的完善不能僅限于關注如何寫好文章、如何挖掘新聞點,也應加強對數據合法性、準確性和有效性的判斷,并對知識系統的正誤保持謹慎的態度。這就需要技術人員加強對機器人性能的完善,同時也需要記者、編輯對機器人作品進行審核和監督。
另外,前文述及機器無法擺脫人而獨立完成有創造性的撰寫報道,它所撰寫的報道都是對人工報道的模仿以及對預設的實現。那么,對于體育賽事報道而言,何種報道易于由機器人代替,何種又難以代替呢?從目前計算機邏輯推演的屬性出發,凡是重復性寫作和在可表達的框架下具有一定創造性的寫作將會被機器人替代。由于體育賽事的規則具有統一性且日程具有周期性,所以常規的賽前預測、實時報道、比賽戰報以及一般的評論都具有被替代的可能;而對于體育賽事中具有創新性的報道、對球員或球隊的深度訪談報道、體育賽事中的調查性報道、情感關懷性報道以及具有深度價值評論類的報道,人工寫作難度較大,目前很難被基于邏輯推演制造的機器替代。此外,機器所學習的報道均為人工報道,因此人類的工作還包括為機器學習提供新的模板,對機器出現的錯誤進行更正,監督機器的運行是否符合倫理和法律規范等。
體育賽事機器新聞寫作目前像是剛剛上路的孩子,會因為一次華麗的表現而讓我們驚喜,甚至恐慌,也會因為一次錯誤而讓我們沮喪,甚至否定。從古至今,技術進步和社會系統總是像孩子和父母一樣難以同步發展,舊有的社會系統與新生事物的發展之間難免會出現碰撞,而這種碰撞有時是痛苦的,社會需要給體育賽事機器新聞寫作一些空間。相信在未來的某天,“他”會寫出深入淺出、酣暢淋漓的報道。