一、機(jī)器寫(xiě)作會(huì)出錯(cuò)嗎?騰訊的機(jī)器寫(xiě)作兩年沒(méi)有出過(guò)一起事故。機(jī)器怎么做到零事故呢?機(jī)器寫(xiě)作基于數(shù)據(jù),只要數(shù)據(jù)沒(méi)錯(cuò)機(jī)器就不會(huì)有錯(cuò)。如何保證數(shù)據(jù)不出錯(cuò)?我們有嚴(yán)格的審核,比如說(shuō)邏輯審核、計(jì)算審核,我們還單獨(dú)有一套開(kāi)發(fā)的內(nèi)部審核系統(tǒng)平臺(tái)。總之我們一共有6個(gè)環(huán)節(jié)來(lái)審核,確保數(shù)據(jù)安全無(wú)誤,這樣就保證我們?cè)谧罱K的環(huán)節(jié)不會(huì)出現(xiàn)問(wèn)題。
二、機(jī)器是如何寫(xiě)作的?我講個(gè)跳水的例子大家可能容易理解機(jī)器是怎么生成文章的。跳水是一個(gè)評(píng)分制的比賽,它的每一個(gè)比分應(yīng)該對(duì)應(yīng)著一個(gè)工作環(huán)節(jié),以及評(píng)委對(duì)他的評(píng)價(jià)。在我們的數(shù)據(jù)庫(kù)里每一個(gè)數(shù)字都代表著一個(gè)動(dòng)作或描述,我們會(huì)從機(jī)器的角度把這些數(shù)據(jù)重新組合,還原成動(dòng)作本身和評(píng)委的評(píng)判,然后再通過(guò)擬人的口語(yǔ)化的表述做一個(gè)詞組和段落之間的聯(lián)系,包括連詞、語(yǔ)氣詞,這樣就可以由不同的比賽、不同的分?jǐn)?shù)形成不同的表述。
三、機(jī)器在媒體生產(chǎn)和分發(fā)的環(huán)節(jié)中有哪些優(yōu)勢(shì)?其實(shí)很簡(jiǎn)單,就6個(gè)字:多、快、好、省、準(zhǔn)、久。去年8月舉行的奧運(yùn)會(huì),由于里約奧運(yùn)會(huì)的時(shí)差跟我們大概有十幾個(gè)小時(shí),都是夜里三四點(diǎn),可能傳統(tǒng)的媒體記者都選擇加班,我們的系統(tǒng)只有3個(gè)人在維護(hù),不用加班,我們3600篇的稿子全是機(jī)器自動(dòng)生成的。
四、機(jī)器有哪些可以提高和改善的地方?第一個(gè)是數(shù)據(jù)源的問(wèn)題,騰訊的AI基礎(chǔ)是基于數(shù)據(jù),我們一定要找到豐富的數(shù)據(jù)場(chǎng)景來(lái)還原它。有的人會(huì)問(wèn)我,你們?cè)趯?xiě)足球、籃球的稿件里面,會(huì)有這樣的表述,說(shuō)某某人射門(mén)高出橫梁。按道理機(jī)器不會(huì)知道,它也不會(huì)知道球員的表現(xiàn),但事實(shí)上這些都可以在數(shù)據(jù)庫(kù)中體現(xiàn),因?yàn)楝F(xiàn)在的數(shù)據(jù)采集技術(shù)已經(jīng)非常好了。
第二個(gè)是深度學(xué)習(xí)和個(gè)性化,就是說(shuō),現(xiàn)在機(jī)器寫(xiě)不只是批量,也不只是速度快,我們爭(zhēng)取未來(lái)為不同的人群寫(xiě),甚至為每一個(gè)不同的個(gè)體寫(xiě)。每個(gè)人都有唯一的畫(huà)像,因?yàn)槊總€(gè)人都是唯一的,我們希望針對(duì)這些不一樣的地方給每一個(gè)不同的人寫(xiě)不同的文章。
第三個(gè)是弱AI到強(qiáng)AI,我們現(xiàn)在只能說(shuō)是弱AI時(shí)代,但我們一步步的往強(qiáng)AI時(shí)代邁進(jìn),因?yàn)榻K有一天機(jī)器會(huì)介入創(chuàng)作領(lǐng)域。
五、AI具體帶來(lái)哪幾個(gè)變化呢?我有一個(gè)特別推崇的詞,就是人機(jī)協(xié)同。未來(lái)記者、編輯很有可能每天都要跟機(jī)器打交道,一些復(fù)雜的收集、簡(jiǎn)單的稿件,可能就由機(jī)器寫(xiě)了,你只負(fù)責(zé)評(píng)判。
人機(jī)協(xié)作的改變,可能就在三五年內(nèi),我們會(huì)慢慢的適應(yīng)如何和機(jī)器打交道,如何通過(guò)機(jī)器、通過(guò)技術(shù)讓自己更強(qiáng)大。
針對(duì)騰訊新聞這樣的機(jī)構(gòu)來(lái)講,我們第一是希望做一些服務(wù),比如說(shuō)各個(gè)地區(qū)的黨媒有豐富的資訊信息,我們希望把這些信息進(jìn)一步的整合,或者說(shuō)做一個(gè)加工,幫助這些咨訊更有效的到達(dá)客戶,這是我們努力的方向。第二是想使資訊本身更有價(jià)值。媒體人將來(lái)重要的工作是什么呢?我覺(jué)得以前我們可能把更多的精力放在了加工、分發(fā)流通的環(huán)節(jié),未來(lái)將集中于信息的采集。另外,我們可以在單條資訊里面完成整個(gè)商業(yè)變現(xiàn)的閉環(huán),包括流量變現(xiàn)、用戶畫(huà)像的確認(rèn)等,未來(lái)的科技可以提供個(gè)人定制。第三個(gè)想發(fā)掘的是真正個(gè)性化的商業(yè)潛力,為每一個(gè)個(gè)體寫(xiě),這是我們未來(lái)特別希望做到的。
未來(lái)我們希望AI成為什么樣子的呢?它應(yīng)該是一個(gè)生活與資訊服務(wù)的平臺(tái),你可以把它當(dāng)做秘書(shū),讓它做很多特別辛苦、特別枯燥,但是同時(shí)又能幫助你提高生產(chǎn)質(zhì)量和生產(chǎn)效率的事情,這是我們未來(lái)一兩年都可以觸達(dá)的領(lǐng)域。
編輯:本刊編輯部