◎胡樂煒 王 源
2020年,一場突如其來的新冠肺炎使得全世界各國的經濟遭受了巨大打擊。為了有效應對疫情沖擊,拉動經濟的增長,我國首次將新基建政策寫入政府工作報告,通過建立5G基站、大數據中心、人工智能等新型基礎設施,為各行業發展注入數字動力。人工智能不再僅僅是存在于電影小說中的科技前沿,而是被國家列入新基建的七大核心領域之一的重點技術。新聞媒體行業的信息傳播和文字編輯屬性,使得人工智能在該行業的廣泛應用融合有著廣闊的前景,本文將結合人工智能在新聞媒體行業的應用現狀,探析該行業新業態的發展態勢。
1.人工智能的概念
簡單來說,人工智能(Artificial Intelligence)是計算機科學的一個技術分支,用來構建能夠執行通常需要人類智能的高階算法。
人工智能可以劃分為兩大類,包括狹義人工智能(Narrow AI)和廣義人工智能(General AI)。狹義的人工智包括當今在計算機程序算法中隨處可見的應用范式,即在沒有明確程序規則的情況下,學會如何執行特定任務的智能系統。
這種人工智能在智能手機虛擬助手的語音識別、自動駕駛汽車上的視覺識別系統、以及根據用戶過去購買過的產品推薦引擎中應用得很廣泛。然而,與人類不同,這些系統被局限在需要被教授如何做特定的單一任務。
廣義人工智能則非常不同,它是人類創建的適應性智力類型,展現為一種靈活的智力形式,能夠學習如何執行截然不同的任務,例如,從理發到編輯文字,或者根據其積累的經驗,推理各種各樣的主題。時至今日還并未真正實現。
2.人工智能的主要研究方向

當前,針對人工智能的研究囊括大量的研究議題,并且,其中有很多研究方向互為補充。機器學習是人工智能(Machine Learning)的一個很重要的研究方向。在機器學習的過程是通過向計算機系統輸入大量數據,然后用這些數據學習如何執行特定任務。在機器學習過程中,最為關鍵的是通過一定的算法構造神經網絡(Neural Network)。神經網絡中存在很多層次,由相互傳遞數據的節點(稱為神經元)連接,它們通過在各層之間傳遞輸入數據時調整輸入數據的權值來完成特定的任務。在訓練這些神經網絡的過程中,附加到不同輸入的權值將會持續變化,直到神經網絡的輸出非常接近期望的值,此時網絡將“學會”如何執行特定的任務。神經網絡的類型多種多樣,各有優缺點。例如,遞歸神經網絡是一種特別適合于語言處理和語音識別的神經網絡,而卷積神經網絡更常用于圖像識別。
人工智能研究的另一個重要分支是自然語言處理(NaturalLanguage Processing)。自然語言處理的目標是使機器能以一種特定的方式閱讀、破譯、理解人類語言。其任務在于將人類語言分解成更短、更基本的部分,理解這些部分之間的關系,探索這些部分是如何組合起來產生意義的。在自然語言處理中,機器學習算法可以幫助訓練已經被人類標記的成千上萬的文本樣本,單詞,句子和段落。通過研究這些例子,機器將獲得對人類語言上下文的一般理解,并基于這些知識來分析未來的文本。具體來說,自然語言處理包含文本分類、主題發現和建模、上下文提取、語義分析、文本概括等基本任務。
此外,進化計算(Evolutionary Computation)也是人工智能重要的研究方向。它借鑒了達爾文的自然選擇理論,認為遺傳算法會在兩代人之間進行隨機突變和組合,而不斷嘗試優化給定問題的最優解。進化計算的相關研究主要用來幫助設計人工智能模型,以有效地迭代提升人工智能程度。利用進化算法優化神經網絡被稱為神經進化,隨著智能系統的使用變得越來越普遍,特別是在對數據科學家的需求經常超過供給的情況下,進化算法在幫助設計高效人工智能方面發揮重要作用。
新興數字化技術不斷涌現總是推動著新聞媒體行業的重構。在過去的十幾年里,由于智能終端、無線互聯網的快速發展和成熟,催生了各種以電子雜志、有聲讀物等代表的商業模式。現今,人工智能技術又悄然融入新聞媒體行業發展的軌道之中,從中誕生出新的業態。
1.智能寫作
智能寫作也稱為機器寫作(Machine Writing),他基于經過訓練形成的寫作模板,利用自然語言處理技術,從海量的本文中抽取精確的語料進行加工處理,實現新聞的自動生成。由于智能寫作的及時性和便捷性,已經在國內外的新聞媒體行業的得到廣泛應用。例如:美聯社采用Wordsmith寫稿機器人后,每季度撰寫的財經簡報數量由原來的三百篇猛升至四千多篇;騰訊研發的DreamWriter能夠瞬間輸出分析和研判,一分鐘之內將重要資訊和解讀送達;快筆小新機器人有能力在紛繁冗雜的數據中,迅速采集整理,準確為新華社編寫新聞稿件。然而,機器人寫稿盡管能夠輔助編輯精確定位信息,快速撰寫簡報,但在推理、抽象等能力上還遠遠不能替代人類,因此目前的寫作類型局限在數據繁雜且強調時效性的財經類和體育類等方面。
2.智能編輯
智能編輯(AI Editor)幫助新聞媒體行業在多屏時代的大數據環境下對于新聞進行有效的分類和管理。每天,用戶都可以通過各種智能終端接收新聞信息,發表評論意見,如何從海量新聞數據中找到最有價值的新聞,并進行有效推送,以及如何識別和屏蔽不良和虛假信息是智能編輯的職責,支撐其的人工智能技術也一直不斷在演化改進。一方面,新聞媒體企業實時采集用戶的行為數據(例如:瀏覽時長、點贊數、關注用戶等),利用機器學習算法發現隱藏模式,為每位用戶所關注的新聞重要性進行排序,提供個性化推薦。另一方面,AI編輯能夠從人工生成的數據中識別真實數據源和真實新聞內容的模式。這些機器學習系統可以作為第一遍編輯控制,可以根據其他來源驗證新聞項目,自動提供來自第三方來源的驗證,并進一步幫助加強真實新聞故事或揭穿錯誤。新聞聚合器可以自動輸入真相檢查鏈接和來源,并對入站新聞報道進行真實的可能性評分。Facebook很早就開始采用NewsFeed為用戶推送感興趣的新聞,泰晤士報也在使用James智能編輯,收集的用戶數據,為他們精準“投喂”新聞內容。在國內,今日頭條的AI編輯通過輸入的新聞(如:圖文、視頻、問答、微頭條等),用戶(如:興趣標簽、職業、年齡、機型等),場景(如:工作、休息、旅游等)三個維度的信息來篩選合適的新聞內容推送給特定用戶。
3.AI主播
AI主播也稱為AI合成主播,是以真實的主持人為原型,利用虛擬圖像、語音識別、深度學習等人工智能技術捕捉真人海量數據所形成的。當輸入新聞文本數據,AI主播就能夠擬人化地形成一段新聞播報視頻。2018年,新華社聯合搜狗在互聯網大會上發布了首位AI主播-----新小浩(以新華社記者邱浩為原型),隨后又在重大的活動中不斷推出新的AI主播(例如:新小萌、小小撒、新小微等)上崗主持播報,這些近似真人的AI主播不知疲倦地播報新聞,不僅在表情神態上以假亂真,而且極大提升了稿件播報的準確性和新聞的傳播效率。然而,目前的AI主播普遍還只能表達新聞稿件的字面意義,無法傳遞出文字本后的情感。
基于應用現狀,本文對于人工智能在新聞媒體行業的應用前景進行歸納。
首先,無論是在機器寫作,還是智能編輯或者AI主播的應用中,人工智能還處于輔助新聞媒體從業人員處理日常慣例性工作的階段,缺乏獨立思考能力,模式較為固定。隨著人工智能技術的不斷演進,新聞媒體行業會朝向更高階的智能化方向發展。例如:在未來,機器寫作能總結歸納出自己的觀點,帶入一定的人文關懷,AI主播能具備現場應激能力等。
其次,隨著人工智能技術的深化應用必然會帶來一些負面的效果。例如:對于用戶隱私數據的過度采集和使用,新聞內容與國家政策相悖等。今后,也需要依據相關法規,利用人工智能技術制定合理高效的控制機制。
最后,新聞媒體行業從業人員也應該逐漸認識到人工智能技術是一些需要人為監督和引導的高階算法,在提升自身業務能力的同時,也需要不斷學習和掌握如何將該技術與行業進行更好的結合匹配。