那福忠
近來,有些報紙與雜志在特定的內容上開始使用軟件自動寫稿,一般讀者也沒有察覺到有什么不同。于是引發一個敏感的議題,計算機能否替代記者寫稿?運用計算機寫稿有兩大類:一是把從網絡上獲取的數據自動寫成文稿,比如地震實時報道;二是分析龐大數據找出關鍵信息,比如財務分析報道。計算機軟件能發展到什么程度的寫作能力?寫出來的內容值得信賴嗎?對新聞從業人員構成威脅嗎?這些問題引起了學術界的興趣。
荷蘭Tilburg大學Hille van der Kaa與Emiel Krahmer兩位學者,為此做了一個實驗,選擇兩個題目給計算機軟件,一個是關于一場球賽的體育類題目,另一個是報道一只股票價格的財經類題目,讓計算機用荷蘭文各寫兩篇報道,兩篇報道的內容完全相同,差別在作者的署名,一篇署名是記者寫的,另一篇注明是計算機寫的,然后以323名荷蘭當地人為實驗對象,其中64人為新聞從業人員。
實驗的方法是從4篇報道(2篇球賽、2篇股價)隨機取出一篇,展示給一名實驗對象,讓他就報道的專業程度與內容的可信度,作1分到5分的評估。這個實驗有幾個巧妙的運用,首先是看作者的影響,也就是計算機與記者有什么區別,因為“記者”也是計算機,如果有區別就可能是受名稱的感覺影響。另外是要看一般讀者與新聞從業者的差異,以及新聞從業者對文稿作者、計算機或是記者的差異。
實驗的結果是,一般讀者就寫作的專業與可信度上,對計算機與記者兩種作者的評估幾乎相同,僅覺得計算機作者的可靠度略高,而記者的專業略低,但都不構成統計上的差異。
但新聞從業人員有不同的看法,對寫作的專業,不分計算機與記者都給予較高的評分,但對可信度則有明顯的差異,給記者的評分顯著高于給計算機的評分。
至于一般讀者與新聞從業人員的差異,在可信度上沒有計算機與記者的區分,但在專業程度上,新聞從業人員給計算機的評分高于一般讀者給計算機的評分。
在題目的選擇上也影響內容的可靠度,大家對財經股票議題的信任度高于對運動球賽的信任度。
實驗的結果讓研究人員發現了更多的問題。新聞從業人員在可信度上認為記者高于計算機,實際上兩篇文稿完全相同,而且都是計算機制作的,那新聞從業人員是不是高估了自己的可信度?如果是,又是什么原因?新聞從業人員在專業程度的認知上高于一般讀者,是否因為有專業訓練使然?什么類別的內容會讓讀者產生較高的可信度?學者們表示這些問題都會納入下一次研究。
為什么新聞稿件可以用計算機軟件寫作,專家說新聞報道的寫作思維與計算機的“自然語言處理”(Nature Language Processing, NLP) 極為相似。首先選擇要表達的信息,下一步組織既有的信息與文稿的結構,再下一步決定文稿里的信息以及使用適當的詞匯,最后是表達與文法的修飾。這幾個基本的NLP步驟,可以最終建構文法正確、文字整潔的文稿。
NLP技術的發展,會增強計算機寫作的能力,讓文稿更人性化,加入情緒用字,避免重復等修辭技巧。有人說計算機軟件不會制作諷刺幽默的文稿,現在當然不會,但若說以后還是不會,計算機科學家就有所保留。
那計算機會不會替代記者寫稿?瑞典Karstad大學Christer Clerwall教授說在于經濟因素,也就是雇用并訓練記者、與購買維護計算機軟件之間的選擇,而寫作的數量成為關鍵因素。他說善用計算機軟件,可以把節省的人力資源用到計算機做不到的地方,特別是創意性與非例行必須靠人力寫作的文稿。而計算機的優勢在快速精確地更新,也更適合個人化的新聞制作,同一則新聞用不同的語句寫給不同的讀者。
計算機會替代記者寫稿嗎?我想最好先了解一點是計算機軟件的功能與可能發展的方向,從中找出計算機的弱項,變成自己的強項。至于計算機已經在做的,像是簡短的例行報道與復雜的數據分析,再跟計算機搶著做,意義就不大了。