楊逸云
近年來,人工智能寫作現象頻繁引發公眾關注,隨著微軟小冰詩集的迅速“出圈”以及機器新聞寫作的廣泛應用,不少寫作者擔心自己的職業會被取代。雖然“機器人成立作家協會”①韓少功:《當機器人成立作家協會》,《讀書》2017年第6期。目前看來尚無可能,但是智能化浪潮下,人工智能寫作的發展趨勢很難預測。人工智能寫作是會徹底取代人的寫作,還是會始終停留在目前的水平上無法取得突破?抑或是走向二者并駕齊驅、人機協同寫作的未來?由此,對當前人工智能寫作的應用現狀進行研究,厘清其中存在的基本問題,就成為了十分必要的工作。
“人工智能”(Artificial Intelligence)一詞產生于1956年美國達特茅斯會議,該會議的主題是“用機器來模仿人類學習以及其他方面的智能”,這是對“人工智能”最初的解釋。自此之后,人工智能不斷發展,但對于這一概念的定義,學界尚未達成共識。從字面上看,artificial在韋氏字典中被解釋為man-made(人造的),反義詞是natural(自然的)。因此,人工智能是通過人為設定的方法和流程,而不是自然創造出來的智能體。目前,學界對于人工智能的爭議主要是對智能程度的理解不同。有些學者認為,人工智能不過是給“自動化”披上了神秘的外衣,還未達到預期的標準,它無法完全模仿人類思考和學習。按照人工智能的發展水平,我們通常將其分為弱人工智能(Artificial Narrow Intelligence)和強人工智能(Artificial General Intelligence)。弱人工智能只在某一方面表現出智能,但是不具有與人類相當的智力水平和思維模式。阿爾法狗可以打敗世界圍棋冠軍,但它并不能處理其他領域的問題。強人工智能則是指機器可以像人一樣獨立自主的思考。不可否認的是,當前我們正處于弱人工智能階段,生活中已經廣泛應用的機器人、語言識別、圖像識別等技術,都只能解決特定場景的問題,它們都是弱人工智能的體現。
人工智能涉及數學、心理學、神經生理學、信息論、計算機科學、哲學等多個學科,寫作則是一項需要有文學、語言學等知識積累的腦力創造活動。人工智能寫作(Artificial Intelligence Writing)是人工智能技術與寫作結合的產物,是近幾年來人工智能的新興熱點話題。人工智能寫作,又被稱為“機器寫作”,它并不是由有形的機器人完成,而是通過算法自動生成。因此,人工智能寫作也被稱為自動化寫作(Automated Writing)。在人工智能應用到寫作領域之前,計算機首先改變了人的寫作方式。最初,人們使用電腦寫作,利用互聯網傳播文章,可以得到及時的反饋。電腦寫作改變了人們的書寫習慣,使人們更快地從網絡上收集素材,大大減少了寫作時間。人工智能寫作比電腦寫作更加便捷,它可以根據寫作范圍建立數據庫,直接從數據庫中獲取素材,再利用算法完成寫作。

圖1 人工智能寫作
人工智能寫作主要包括自動寫作與輔助寫作兩種形式。自動寫作不屬于強人工智能,它不是指計算機按照自己獨立的想法寫作,而是指寫作的過程中沒有人工干預,通過算法完成寫作任務。自動寫作多應用于“結構化”類型的寫作,例如新聞快訊、智能詩歌、智能春聯等。這幾類寫作都有一定的規律可循,計算機根據對應的算法,直接生成符合特定格式的內容。另外,自動寫作還被一些自媒體人用來“洗稿”。他們通過自動寫作的平臺,以改變文字排序、替換數字和單詞、插入文本鏈接等方式重新組織語言,將互聯網上的原創文章二次加工。輔助寫作是指在人類寫作的整個過程中,通過算法提供多種輔助功能,協助人類完成寫作任務。從寫作之前的構思,到實際寫作中的選材,再到完成寫作后的修改等,都可以使用輔助寫作。自媒體人還可以利用輔助寫作工具,為寫作內容添加標簽,通過個性化推薦將自己的文章精準地推送給感興趣的用戶。
無論是自動寫作還是輔助寫作,二者均未達到真正意義上的智能。從寫作主體上看,人工智能的創作主體是機器,但操控機器的仍然是人。從寫作客體上看,人工智能寫作基于大量的數據庫,而數據庫中的內容也是人類創作的。由此,我們可以這樣定義人工智能寫作:以人工智能技術為基礎,通過數據統計及深度學習等方式完成寫作,其目標是為了幫助人類提升寫作效率,探討人類寫作的本質規律。換而言之,人工智能寫作主要是通過人工智能技術,更深入、細致地分解寫作的形成過程,理解人類寫作的奧秘,幫助人類更好地完成寫作。
國內最早對人工智能寫作的探索是在詩歌領域。1984年,中學生梁建章自主設計了一個詩歌創作程序,這個程序可以在不到半分鐘時間內創作出一首五言絕句。之后,人工智能開始在寫作領域緩慢地發展,涉及的寫作形式越來越多樣。人工智能在寫作上的廣泛應用主要始于2015 年。2015年8月,騰訊推出由機器人“dreamwriter”創作的稿件,自此,人工智能寫作開始為公眾所熟知。隨后幾年,媒體紛紛效仿設計了自己的寫作機器人。
我國人工智能的發展得到國家政策的大力支持。2017 年3 月,在十二屆全國人大五次會議的政府工作報告中,“人工智能”首次被寫入政府工作報告。同年7 月,國務院發布《新一代人工智能發展規劃》,確立了新一代人工智能發展三步走戰略目標,將人工智能提升到國家戰略層面。近年來,醫療、養老、教育、文化、體育等多個領域都出現人工智能的身影。相對這些領域而言,人工智能寫作的發展是較為滯后的。2018年6月,中國智能寫作產業聯盟在北京成立,國家工信部信息化與軟件服務業司司長謝少鋒表示,智能寫作產業與蓬勃發展的智能語音產業相比,目前還處于起步階段。①《中國智能寫作產業聯盟成立》,中國新聞網,網址:https://baijiahao.baidu.com/s?id=1604702204279770381&wfr=spider&for=pc,發表日期:2018年6月30日。當前我國的智能語音行業已初具規模,有很多產品投入到市場中,例如手機中的虛擬語音助手、家居生活中的智能音箱等等,都已融入我們的日常生活。而人工智能寫作的商業化產品研究,除百度、騰訊等互聯網巨頭外,從事人工智能寫作開發的公司數量較少,但正在逐年增加中。
人工智能寫作應用有著巨大的市場需求。雖然人工智能寫作不能完全替代人類寫作,但能幫助寫作者減少重復性勞動,使他們有更多的精力進行更有意義的寫作。尤其對于自媒體編輯來說,有了智能寫作平臺的輔助,就不必再去網絡的海量信息中慢慢搜尋素材,節省了寫作時間。國家工信部信軟司在中國智能寫作產業聯盟成立大會上還表示,我國智能寫作產業的發展不能滿足潛在的巨大市場需求,信軟司將通過政策引導、工程引領以及搭建公共平臺等方式,發揮協同優勢,激發市場信心和活力,全力支持智能寫作產業的發展。②《信軟司參加中國智能寫作產業聯盟成立大會》,中華人民共和國工業和信息化部,網址:http://www.miit.gov.cn/n1146285/n1146352/n3054355/n3057656/n3057660/c6245647/content.html,發表日期:2018年7月3日。目前市場上的人工智能寫作平臺可根據其功能分為兩類:一種用于偽原創的文章編寫,例如小發貓AI+智能寫作、愛發狗軟文助手等。另一種用于輔助自媒體人的寫作,例如秘塔寫作貓、有專自媒體助手、Get 寫作、智搜寫作等。從時間上看,大多數人工智能輔助寫作平臺是在2017年后建立的,這也證實了近些年來公眾對人工智能寫作需求的進一步增長。隨著互聯網的發展,人們會越來越多地從網絡上獲取信息,人工智能寫作必然存在著較大的潛在市場。

表1 國內部分人工智能寫作平臺
從寫作的角度,人工智能寫作可以分為人工智能應用寫作與人工智能文學寫作。應用寫作與文學寫作不同,它偏重實用性,是客觀實際的體現;而文學寫作則偏重審美性,要求作者“神與物游”,把自己感知到的一切,用優美的文字傳遞出來。人工智能寫作在不同的寫作領域發展不一,有的應用較多,有的還處于開發階段。
1.新聞寫作
人工智能在寫作中應用最多的領域是新聞寫作。2014 年,美聯社自主開發了wordsmith 程序,主要進行財報類的新聞寫作,這是最早出現的智能新聞寫作應用。中國緊隨其后,2015年,騰訊和新華社分別推出各自的寫作機器人“dreamwriter”和“快筆小新”。到目前為止,已有不少的新聞媒體使用自己的寫作機器人(見表2)。

表2 國內主要新聞寫作機器人一覽
由上表得知,國內人工智能在新聞寫作中的應用自2015年后不斷增加,2016年和2017年增長幅度最大,近來又逐年減少。其次,寫作機器人都集中在特定的領域,以財經、體育最多,兼有民生、時政、天氣等。除上述所提到的領域外,還有一些領域是人工智能暫未涉及到的,例如房產、游戲、軍事等。
2.公文寫作
公文寫作是各類寫作中對語言規范、字體字號的格式要求最高的一種。由于其中要用到的核心技術——語義識別又不能達到完全準確,因此人工智能在公文寫作上的應用出現較晚。2019年,金山wps 推出了公文輔助寫作——“wps 智能寫作”應用小程序。它可以通過確定寫作關鍵詞,幫助我們自由選擇段落及對應的素材,最后生成文章。“wps智能寫作”是最早出現的智能公文輔助寫作應用,在實際應用中,它擬定的公文類型還不夠全面,多偏向于評論匯報類。
3.廣告寫作
人工智能在廣告寫作上主要分為兩種類型。一種是自研自用,例如淘寶和京東兩大電商,它們以自身平臺的海量優質內容為依據,分別推出了“阿里AI 智能文案”與“李白寫作”。目前,這兩個智能廣告文案寫作均可在1 秒鐘生成上萬條商品文案,生成速度快。第二種通過人工智能技術供應商生成內容,例如弈寫、智搜、GET 智能寫作等應用平臺,都可以輔助自媒體人寫作,并為其提供熱點話題推薦、內容創作方案。
4.論文寫作
人工智能在論文寫作中的應用較少。2019 年,英國倫斯勒理工學院、美國華盛頓大學等研究人員初步實現了運用人工智能技術寫論文,在他們發表的PaperRobot:Incremental Draft Generation of Scientific Ideas一文中,PaperRobot 可以幫助構建論文的背景知識圖,寫摘要、關鍵內容和標題,梳理結論并給出進一步的研究方向的建議。但它的最終目的并不是要替代人類的論文寫作,而是為了幫助科學家加快科學研究進程,只起輔助作用。
5.合同寫作
合同是經濟活動文書的一種,人工智能在合同寫作上的應用也剛開始出現。2019年神州泰岳公司在第二十三屆軟博會上展示了“合同審核”智能寫作軟件,顯示了我國人工智能在寫作領域的又一次擴展。
人工智能在文學寫作上的應用相對較少。我國人工智能技術在文學寫作中的應用主要集中在詩歌領域。2014年微軟(亞洲)互聯網工程院推出智能機器人“微軟小冰”,人工智能文學寫作才開始受到廣泛關注。2017年“微軟小冰”的詩集《陽光失了玻璃窗》出版,這部被稱為人類歷史上第一部完全由人工智能創作的詩集,引起了社會轟動。同年,清華大學自主研制的人工智能詩歌寫作系統“九歌”在央視節目中向三位青年詩人發起挑戰,并成功通過現場觀眾圖靈測試(意味著觀眾無法通過所創作的詩詞區分出人類和人工智能)。除此之外,上文提到過的京東智能寫作平臺“李白寫作”、封面新聞中的“小封”寫作機器人和“wps 智能寫作”小程序都有寫詩的功能。“小封”在封面新聞中開設了“小封寫詩”的專欄,目前篇均閱讀量保持在4萬次左右。人工智能技術在現代詩、古詩上都有應用,但總體水平并不高,暫時沒有超過人類寫作水平的可能。除詩歌寫作之外,有一些智能寫作平臺專注于輔助寫作者進行小說、散文的寫作,寫作者可以在這些平臺上尋找寫作靈感、獲取寫作素材。
隨著科學技術的進步和提高,以人工智能為代表的工業4.0時代已經到來①工業4.0是利用信息化技術促進產業變革的時代,也就是智能化時代。。“網絡文化”的發言人和觀察者凱文·凱利說:“未來20年最偉大的事情可能還沒有出現,但可以預判的是,人工智能將是未來20年內最重要的技術趨勢。”②葉靜宇:《凱文·凱利:未來20年創業的方向就是將人工智能應用于某個領域》,界面新聞,網址:https://www.jiemian.com/article/943213.html,發表日期:2016年11月7日。人工智能發展迅速,許多應用已被廣泛使用,但仍有不少人持悲觀態度,認為“人工智能比太空旅行更難實現”③[英]惠特比:《人人都該懂的人工智能》,郭雪譯,杭州:浙江人民出版社2019年版,第3頁。。確實,在弱人工智能階段,很多技術還未發展成熟,因此導致人工智能寫作存在種種爭議。
大數據的挖掘和分析是互聯網發展的重要手段,數據的收集和處理也是人工智能寫作中的重要環節。人工智能寫作的原理,就是運用大數據分析,將大量的數據統合進系統當中,使用對應的算法生成內容。人工智能寫作主要包含三個階段:處理數據、選擇算法、生成內容。
在大數據時代,信息開放使數據的價值得到充分體現,但與此同時也給個人隱私保護帶來了嚴峻的挑戰。由數據泄漏導致的隱私問題是互聯網發展過程中的共性問題,相對而言,人工智能寫作的版權問題更加突出。首先,我國《著作權法》中保護的對象是作為創作主體的人,雖然人工智能寫作的主體是機器,內容由算法生成,但處處都有人的參與。因此,人工智能是否具有創作主體的資格,創作的內容是否具備獨創性等問題都影響著最終版權歸屬的判斷。近年來,關于人工智能寫作版權的問題一直被廣泛議論,通過人工智能寫作平臺生成的文章是否涉及抄襲,抄襲人工智能生成的文章又是否造成侵權,都是談論的熱點。一方面,人工智能寫作的內容主要源于數據的拼接和處理,而大部分數據又來源于人。從這種意義上說,只有人類才是創作的“源頭”,人工智能的創作只不過是將別人的東西拿來己用。如果人工智能寫作未對他人的數據庫或網絡上的數據取得第三方授權,那么就會涉及侵權問題。互聯網上用人工智能寫作平臺進行“洗稿”的文章,即是這一類型的代表。這類寫作者只用簡單地復制粘貼,就讓“自己的文章”在網絡上傳播,對于原創者來說是很不公平的。如果這種行為沒有受到相關法律的制約,就會打擊原創者的積極性。另一方面,即使人工智能創作出的作品是基于合理數據的算法生成,那么其創作出的作品是否得到《著作權法》的保護,這一問題也有待解決,目前我國已有兩例此類案件。2018 年,北京菲林律師事務所起訴百度網訊科技公司侵權案中,北京互聯網法院認為涉案分析報告和圖表是由大數據自動生成,未引入任一方的個性化判斷與選擇,不能納入《著作權法》所保護的作品范疇。而2020 年騰訊公司狀告“網貸之家”案宣判結果卻認為,人工智能生成作品屬于《著作權法》保護范圍。判決書上顯示:“涉案文章由原告主創團隊人員運用Dreamwriter 軟件生成,其外在表現符合文字作品的形式要求,其表現的內容體現出對當日上午相關股市信息、數據的選擇、分析、判斷,文章結構合理、表達邏輯清晰,具有一定的獨創性。”由此可見,我國人工智能寫作版權的司法實踐中,并未形成一致的觀點。
人工智能寫作主要運用自然語言處理、知識圖譜、文本分析等技術。在大數據時代,人工智能寫作可以迅速通過對應的算法生成文章,一定程度上加快了文章的寫作速度。2017年8月8日四川阿壩州九寨溝縣發生7.0級地震,中國地震臺網的“地震信息播報機器人”僅僅用25秒就編寫了一條消息。人工智能新聞寫作在速度上的優勢非常明顯,提高了傳播的時效性,但同時也有其局限性。
目前,新聞寫作機器人只能撰寫消息類稿件,不能完成深度寫作及人物專訪。人工智能新聞寫作一般通過算法智能選擇模板組合生成新聞,模式化明顯。以今日頭條的智能寫作機器人——足球記者小明為例,在它發布的法國足球甲組聯賽的系列新聞中,標題部分都是以幾種組合方式呈現:當場比賽熱門球員得分+比賽的結果;當場比賽某球員犯規+比賽結果;比賽結果+比賽精彩瞬間。例如“奧辛亨攻入兩球!南特客場1-2負于里爾”“布雷斯特1-1打平圖盧茲!Efthymis最后時刻絕平救主”。其次,在內容上,都是以比賽背景、比賽過程、出場陣容、比賽賽程幾個版塊組成。體育類活動開始和結束的時間確定,結果較好預測,且球員的數據信息相對完整,因此非常適合用人工智能技術完成寫作。但在幾次國外進行的人機新聞對比測試當中,機器新聞均以速度取勝,卻在可讀性上敗于傳統新聞。
人工智能寫作在古詩中的應用亦是如此,幾乎都是將原有詩人的詩詞、句拼湊,然后再填充到不同類型的詩歌當中。以清華大學計算機詩詞創作系統——“九歌”為例,當我們將類型限定為五言絕句,輸入關鍵詞“秋天”時,生成的詩句是“秋天爽氣清,月色照江城。萬里煙波遠,千年草木榮。”這首由人工智能生成的詩,其中每一句都能在古詩中找到出處。第一句“秋天”是輸入的關鍵詞,“爽氣清”來源于宋朝劉子翚《晨興》的“爽氣清如沐”;第二句從字面上看可以理解為“月色照人愁”(陸游《五鼓送客出城馬上作》)與“如西子鏡照江城”(歐陽炯《江城子·晚日金陵岸草平》)的結合。后兩句中“萬里煙波”“草木榮”這種搭配在古詩中都出現過。由此看出,“九歌”創造出來的詩句只是在古詩中選取了一些相關的詞語,然后調整了詞語的搭配順序,表面看上去對仗整齊,實際上句與句之間并沒有太多的邏輯聯系。
由于人工智能的運行機制是基于算法的內容生成,這樣一種運行機制決定了人工智能寫作只能憑借數據最優解的選取進行所謂的文學創作,這也在客觀上決定了人工智能的創作只是文字符號的篩選與排列組合,而非真正意義上的人類創作①趙耀:《論人工智能寫作的可能與限度》,《福建論壇(人文社會科學版)》2020年第7期。。
自然語言處理(NLP,Natural Language Processing)是人工智能領域中的重要方向之一,也是人工智能寫作使用的核心技術。自然語言處理的關鍵在于研制自然語言通信的計算機系統,從而達到人機間的自然語言通信。人工智能寫作首先需要計算機理解自然語言(自然語言理解),然后再用自然語言表達出來(自然語言生成)。由于自然語言有著多樣化的表達形式,在上下文語境中經常會出現多義、歧義的語句,有的還需要特定的知識背景才能理解,涉及人類認知的層面,探索起來困難重重。
雖然自然語言有規定的語法,但人類在真正使用語言的時候會有許多新的創造。如果讓一個人對同一場景進行十次描述,他每次都會使用不同的詞語,但到計算機當中就毫無創造力可言,它會以“主謂賓—主謂賓—主謂賓……”的結構類推下去。很明顯,人類并不會這樣說話①[美]斯加魯菲:《智能的本質:人工智能與機器人領域的64個大問題》,任莉、張建宇譯,北京:人民郵電出版社2017年版,第182頁。。正因為自然語言很難把握,人工智能新聞寫作的實踐遠高于人工智能文學寫作。新聞寫作針對性強,格式比較固定,可創作的空間小。而文學寫作,尤其是小說寫作,寫作者需要構思文章的主題、結構、人物、場景等等,對創造力及語言運用的要求較高。但是我國人工智能寫作又始于文學寫作中的詩歌,因為詩歌這樣一種特殊的文體,一向被認為是沒有語法或不遵循語法的,其中詞語的不合理搭配還可以被闡釋為“陌生化”的藝術手法,這種對語法要求較低的文體類型最適用于人工智能寫作。因此,人工智能在語言運用要求較高的小說文體中實踐極少。
人工智能寫作要想取得關鍵性的突破,就必須學會理解和生成自然語言,否則,計算機永遠無法像人類一樣自然地表達,這與強人工智能的目標完全一致。由此可見,自然語言處理的未來與人工智能的整體發展密切相關。
人工智能應用如雨后春筍般涌入我們的日常生活。人工智能寫作依靠大數據、自然語言處理、文本分析等技術擴大了寫作領域的應用范圍,從最初的機器新聞寫作到如今的智能公文寫作、論文寫作等,人工智能寫作將幫助不同領域的寫作者更高效地完成寫作任務。目前,我國仍處于弱人工智能階段,正朝著強人工智能階段發展,技術的進步會逐漸克服人工智能寫作應用中出現的種種問題。另外,我們要利用好人工智能寫作的優勢,不管是自動寫作,還是輔助寫作,都必須與傳統寫作協調發展,最終形成一種“人機協同”的工作模式。當前人工智能寫作行業的缺口已經打開,未來的發展將有無限可能。