◎劉藝文
騰訊財經機器人記者寫作研究
◎劉藝文
2015年9月10日,騰訊財經發布了一條由機器人“Dreamwriter”撰寫的稿件《8月CPI同比上漲2.0% 創12個月新高》,引發了行業關注。到目前為止,“Dreamwriter”已經寫作財經新聞近一年半時間。筆者通過分析其作品發現,這期間“Dreamwriter”的寫作內容發生了幾次較大的變化:從宏觀財經新聞跳到了公司新聞,進而又轉到了證券(股市)新聞。本文的目的就在于探討這其中的幾次變化。
騰訊財經 機器人 寫作 變化
2015年9月10日,騰訊財經發布稿件 《8月CPI同比上漲2.0% 創12個月新高》,文章署名“Dreamwriter”(自動寫作機器人)。這是機器人根據算法自動生成的稿件,據說在1分鐘內就可以完成寫作與推送。作為機器人自動撰寫的稿件,此稿在國內具有標志性的意義,因而引發了行業內的廣泛關注。
截止到目前,騰訊財經寫作機器人“Dreamwriter”已經不知疲倦的工作了近一年半時間。“Dreamwriter”寫了這么多的財經消息,其寫作內容會否發生變化?發生什么樣的變化?本文通過梳理騰訊財經發布的文末特別標注 “本文由騰訊機器人‘Dreamwriter’自動撰寫”的消息,發現“Dreamwriter”的寫作內容經歷了較大的變化,這些變化大概可以分為三個階段。
財經消息、財經新聞是一個很寬泛的概念,只要是和經濟有關的報道都可以歸為此類。如果只是一味籠統的說財經消息,很多東西就會被覆蓋住。比如說,今天“菜市場的大白菜賣到了20元一斤”,這是一條財經消息;今天 “銀行間隔夜拆借利率飆升”,這也是一條財經消息,但二者明顯不屬于一個類別。這就好比學生在上課,籠統而言都是在上課,但有的人在上文學課程,有的人在學化學方程式,差別較大。所以說,很多事物需要細分,只有細分才能更好的明白其差別。
財經消息的細分方式有很多種。按照新浪財經的欄目劃分來看,可以分為股票、基金、期貨、債券、銀行、保險等等。按照騰訊財經的劃分來看則有宏觀、證券、公司、新三板、理財、基金、保險等等。鑒于本文討論的機器人記者Dreamwriter是騰訊的,所以財經消息的劃分標準與騰訊財經的欄目保持一致。

按照騰訊的標準,財經消息的完整分類如下:宏觀、金融、證券、港股、美股、國際、公司、新三板、理財、基金、保險、大數據、視頻,一共13類。此處重點解釋幾個下文可能會涉及到的欄目:宏觀、證券、公司。“宏觀”是指涉及到宏觀經濟的一些消息,比如GDP情況、CPI(居民消費價格指數)漲跌、PMI、固定資產投資增速、失業率等,宏觀經濟的涵蓋范圍較廣。“證券”主要是指與股票相關的一些報道,比如股票的漲跌、開盤收盤的數據等。“公司”則是與公司相關的報道,諸如公司層面的一些動態、財報公布等。
近一年半的時間,Dreamwriter寫出了不少的財經消息。大范圍而言,寫的都是財經消息,沒什么變化。但是如果按照騰訊財經的欄目細分標準,Dreamwriter寫作的消息內容反而是出現了幾次較大的變化。具體而言,這種變化可以劃分為三個階段。
(一)第一階段:宏觀新聞
這一階段的時間為2015年8月到12月初。財經寫作機器人Dreamwriter每個月都會寫國家統計局公布的上個月CPI、PPI數據,該數據屬于宏觀財經領域。
具體的主要報道為 《7月CPI同比上漲1.6% 創9個月新高》(2015年8月9日),《8月CPI同比上漲2.0% 創12個月新高》(2015年9月10日),《9月份 CPI漲幅回落至1.6%》(2015年10月14日),《10月份CPI漲幅1.3% 繼續回落》(2015年11月10日),《11月份CPI漲幅繼續停留“1時代”》(2015年12月9日)。
需要特別說明的是,騰訊財經機器人Dreamwriter發布的第一條消息是在8月份寫的關于7月CPI數據的稿件,只不過當時并未引起公眾的注意。這幾條(不同版本算一條)宏觀財經消息是Dreamwriter的起步之作,也是其寫過的僅有的宏觀新聞。在寫作《11月份CPI漲幅繼續停留“1時代”》(2015年12月9日)之后,一直到現在,Dreamwriter再也沒寫過類似的報道。目前來看,Dreamwriter已經退出了宏觀新聞的寫作。
該類寫作有特定的模板,主要是引用統計局的數據、統計局的解讀分析,以及專業研究員的觀點研判。
(二)第二階段:公司新聞
這一階段的時間為2016年6月至11月左右。Dreamwriter寫了大量關于公司方面的新聞,其中主要是有關公司財報數據的簡訊。需要特別說明的是,在2016年1月至6月時間段內,沒有搜索到Dreamwriter的任何作品,該時間段為空白期。(利用百度搜索工具,時間段設置2016年1月至6月,關鍵詞為“機器人Dreamwriter”,站點為“finance.qq.com”)。
公司財報簡訊即發布上市公司公布的一些重要財報數據,比如營業收入、凈利潤之類的指標。現舉一例,標題為 《青島鼎信通訊股份有限公司2016中報歸屬股東凈利潤同比增長》(2016年10月12日),具體內容:
(1)直流正接打底 直流正接斷弧焊接時,電弧偏吹現象嚴重,根部出現單邊未熔合現象,焊縫正面出現較嚴重墜瘤,因此不能滿足質量要求(見圖1)。
“騰訊財經訊 青島鼎信通訊股份有限公司 (sh603421)最新公布的2016中報報告顯示,其營業收入5.12億元;歸屬于上市公司股東的凈利潤79.45百萬元,比上年增長。經營活動產生的現金流量凈額-85.36百萬元,比上年增長。基本每股收益0.2元/股,比上年增長。(本文由騰訊機器人Dreamwriter自動撰寫)”[1]
財報簡訊模板痕跡更重,不同公司的財報簡訊只須更改公司名稱及數據即可。去年6至11月集中發布財報簡訊與上市公司的財報公布時間有關,因為該時間段正是公司年中財報公布的時間。不過需要注意的是,今年的三四月份也是上市公司年度財報的集中發布時間,但是Dreamwriter發布的與之相關的簡訊少之又少。目前看來,Dreamwriter似乎是在有意淡化這方面的報道。
(三)第三階段:證券新聞
這一階段的時間為2016年12月至今。Dreamwriter主要報道的是股市方面的消息,也就是騰訊財經劃分標準中的證券新聞。在2016年12月之前,Dreamwriter也寫過一些股市消息,但是比較少。這一階段是開始密集報道,每天可達3到4條。
具體來看,Dreamwriter寫作的證券報道主要是股市每天的開盤收盤數據,漲跌情況等。比如下面這一例,標題為 《兩市萎靡 滬指下跌0.26%報3265.22點》(2017-04-13),內容如下:
“騰訊財經訊 周四開盤兩市下挫。截至發稿時間,滬指報3265.22點,跌幅0.26%,成交量26億元;深指報10578.58點,跌幅0.08%,成交量29億元;創業板指報 1896.49點,跌幅0.05%。
盤面上,機場,水泥,釀酒等板塊領漲;建材,旅游,園林工程等板塊跌幅居前。個股方面,廣州港,塔牌集團,新華文軒,金麒麟,龍蟠科技等個股漲停;閩發鋁業,天域生態,大連控股,超訊通信等個股跌停,瀘天化,埃斯頓,恒星科技等個股跌近10%。(本文由騰訊機器人Dreamwriter自動撰寫)”[2]
這類報道也是模塊化的數據,根據交易所的每個交易時段數據的變化自動生成,可以第一時間傳遞市場的情況。目前,Dreamwriter主要是在寫作這一類報道。
自從騰訊寫作機器人Dreamwriter推出之后,國內其他媒體紛紛跟進。2015年11月,新華社推出了寫稿機器人 “快筆小新”,2016年5月,第一財經推出了寫稿機器人“dt稿王”,2016年8月今日頭條推出了寫稿機器人“張小明”,2017年1月,南方都市報推出了寫稿機器人“小南”,等等。
就目前來看,這些機器人的寫作方向主要是財經與體育。其中,寫作財經消息的是騰訊的“Dreamwriter”、新華社的“快筆小新”、第一財經的“dt稿王”。新華社寫作財經消息的機器人“快筆小新”供職于新華社旗下的中國證券報,不過其寫稿不會直接署名“快筆小新”。因此,通過公開的渠道搜集不到“快筆小新”寫作的財經消息,因而無法進行比較借鑒。
第一財經的寫稿機器人“dt稿王”推出已有快1年時間,筆者通過在一財網上搜索以“dt稿王”為作者的文章,共搜索到了7篇。7篇文章中,有6篇是寫統計局公布的CPI、PPI數據,有1篇是寫統計局公布的官方制造業PMI數據。其最早的一篇報道是《7月官方制造業PMI降至49.9% 微低于臨界點》(2016年8月1日),最近的一篇報道是 《年初翹尾因素變化大 2月CPI降至0.8%、PPI增至7.8%》(2017年3月9日)。不論CPI還是PMI,都是屬于宏觀財經新聞的范疇。據此可以發現,第一財經的“dt稿王”與騰訊財經的“Dreamwriter”具有一定的相似性:初始階段都是在寫宏觀新聞。
(二)國外財經寫作機器人經驗
新聞寫稿機器人早在2009年就已出現,在當時美國的職業棒球大聯盟季后賽上,一款名為“StatsMonkey”的人工軟件完成了世界上第一篇機器稿件[3]。2014年7月,美聯社開始試運行機器人Wordsmith寫作財經新聞。此外,《紐約時報》推出了機器人Blossom,輔助編輯挑選出潛在熱文;《華盛頓郵報》使用“Truth Teller”核實新聞的準確性;《洛杉磯時報》的員工設計了智能系統,專注處理地震新聞;路透社利用名為Open Calais的智能解決方案幫編輯審稿;等等。[4]
就目前這幾種機器人來看,真正是用來寫稿且寫作財經消息的只有美聯社的“Wordsmith”。因此,“Wordsmith”的寫作情況可以用來與騰訊財經的“Dreamwriter”對比借鑒。從2014年7月試運行以來,“Wordsmith”工作已接近3年。3年期間,“Wordsmith”的寫作內容是否也如騰訊財經“Dreamwriter”一樣發生數次變化?
受制于各種條件,筆者無法找到“Wordsmith”寫作之初稿件的內容,但是國內對此的報道可以作為輔證。2014年7月3日,中國之聲《新聞晚高峰》報道,“北京時間今天上午,美國最大的通訊社——美聯社宣布,他們將使用一種新聞書寫軟件代替人力,處理許多財經記者賴以為生的美國企業財報報道。”[5]
說的很清楚,美聯社“Wordsmith”創立之初的定位就在于寫作企業財報報道,也就是公司新聞。一年之后的2015年5月,“Wordsmith”與 NPR(美國國家公共電臺)駐白宮記者、前任商業記者Scott Horsley進行了一場寫稿比賽,比賽內容依舊是寫作企業財報[6]。筆者通過在雅虎上搜索帶有關鍵詞“AP Automated Insights”的新聞(AP為美聯社簡稱,“Wordsmith”寫作的消息會帶有“Automated Insights”字樣,搜索時間為4月18日),在搜索結果中分別挑選第1頁、第5頁、第10頁、第15頁……第45頁共10個頁面100條新聞進行分析。結果顯示,100條新聞中有80條是美聯社機器人“Wordsmith”的作品,其中體育消息74條,財經消息16條,財經消息全部為企業財報報道。
由此可見,除了財報報道之外,并沒有其他的證據表明 “Wordsmith”寫過除財報之外的財經新聞。“Wordsmith”的專一寫作與騰訊財經的“Dreamwriter”存在較大的區別。
從財經新聞細分的領域來看,騰訊財經寫作機器人“Dreamwriter”在寫作的近兩年時間里,寫作重點先后從“宏觀新聞”轉到了“公司新聞”,然后又轉到了現在的“證券(股市)新聞”。這樣的轉變是好是壞?該如何評價?為此上文對比了國內外其他財經寫作機器人的相關情況。
國內財經寫作機器人除了騰訊財經的“Dreamwriter”之外,另外還有新華社的“快筆小新”、第一財經的“dt稿王”。“快筆小新”的作品不帶標識,因而無法拿來進行比較,“dt稿王”創立的時間較短,能搜集到的作品目前只有“宏觀新聞”,這與騰訊財經“Dreamwriter”初始階段的作品一致。在可比較的范圍內,國內財經寫作機器人的發展路徑具有一定的相似性。而國外可用來比較的美聯社機器人“Wordsmith”則與此大不一樣,“Wordsmith”從創立至今一直專注于企業財報寫作,即 “公司新聞”,其寫作內容未發生變動。
相較于美聯社的“Wordsmith”,騰訊財經“Dreamwriter”寫作內容的不斷變化究竟是好是壞?這其中可能是因為騰訊財經還處于探索階段;也可能是因為兩者的定位差異;還可能是因為背后技術方面的原因;當然最后也可能是因為國內外受眾對財經新聞的需求存在差異;等等。
[1]Dreamwriter:《青島鼎信通訊股份有限公司2016中報歸屬股東凈利潤同比增長》,http://finance.qq.com/ a/20161012/024399.htm,2016-10-12
[2]Dreamwriter:《兩市萎靡 滬指下跌 0.26%報 3265.22點》,http:// finance.qq.com/a/20170413/015257. htm,2017-04-13
[3]周揚:《入職一年,機器人寫稿前景如何》,《光明日報》2016-9-24
[4]虎嗅:《國外媒體用機器人寫稿一年多了,他們是怎么想這事兒的?》,https://www.huxiu.com/article/ 125576/1.html,2015-09-10
[5]張加寧:《美聯社將用機器人寫稿 可在幾秒內寫出300字快訊》,中 國 廣 播 網 ,http://china.cnr.cn/ xwwgf/201407/t20140703_515781250. shtml,2014-07-03
[6]何新田、孫夢如:《機器人也能寫新聞了!媒體記者會被取代嗎?》,人民網http://media.people.com. cn/n/2015/1015/c14677 -27702665. html,2015-10-15
(南昌大學新聞學碩士研究生)