1956年達特茅斯會議以來,人工智能已經發展近七十年了。近十年,人工智能領域逐步實現了圖像識別、語音識別與合成技術的根本性突破,2022年11月30日ChatGPT的發布,標志著自然語言處理技術取得了根本性突破,次年3月,GPT-4的推出顯示出自然語言理解和生成能力已經達到和進入“好用、實用”的階段。以GPT-4為代表的LLM/AIGC(大語言模型/生成式人工智能),既有很強的“閱讀理解、歸納綜合”的語言能力,又具有一定的“分析推理”能力,展現出相當程度的智慧,此外還在某種程度上實現了對世界知識的壓縮和重新表達。所以,在LLM/AIGC“好用、實用”且“展現出智慧”的背景下,討論其對出版的影響、討論“數智出版”的問題,是一件非常及時且很有意義的事情。
之所以講現在討論LLM/AIGC對出版的影響和“數智出版”這一問題很有意義,絕不是一般意義上的評價和強調,而在于這一輪人工智能技術的突破,特別是在自然語言理解和生成方面的突破,對于出版而言具有特殊的價值和特別的影響。之所以做這樣的判斷,是因為如果我們將目光放遠一點,從出版行業編印發三個環節來分析思考的話,可以說現代印刷術帶來的是印刷環節生產力的變革,而激光照排技術的發明和廣泛應用帶動的則是印前環節生產力的變革,可以預言的是,LLM/AIGC的突破,則將帶來內容創作和編輯加工這一出版業的核心領域、核心環節的生產力變革,所以它對出版業的影響將是特別的、特殊的,也將是深遠的、持久的。在LLM/AIGC大發展的今天,從這個角度來認識和理解人工智能之于出版的影響,才是合適的。
數字出版產業高速發展,已超萬億規模。傳統出版單位在過去二十多年的數字化進程中積極作為,很早就開展了各種探索,但從客觀角度來看,傳統出版單位的數字化轉型還沒有完成,數字化進程仍在進行,這與行業的特殊性有很大關系。對于出版行業的智能化而言,目前觀察到的情況是,一方面,LLM/AIGC在第一時間對出版行業開始產生影響;但另一方面,其“幻覺”問題以及缺乏常識的問題,如果從內在機制上分析,可能又會使出版業智能化進程變得緩慢而艱難。所以,當下既要及時關注到人工智能技術對出版行業帶來的機會與挑戰,也不要忘記出版行業未竟的數字化進程。對當下和未來一段時間的出版行業來說,數字化進程還需要深入推進,同時,智能化進程也需要巧妙布局?;镜耐緩胶头绞骄褪?,以構建數字化大平臺為基礎,夯實出版大數據,推進大模型出版。大平臺、大數據、大模型,對于當下和未來的出版而言,三者是相輔相成、有機聯系和統一的。也許有朝一日,LLM就是出版物,LLM就是出版。
關于LLM/AIGC的討論,出版人要積極進行交流和研討,更應該努力做一個理性的實踐者——既跳出樂觀者的狂熱,又擺脫悲觀者的消極,客觀、理性、科學地去面對和解決出版行業面臨的這一課題,給出新時代出版人的合格答卷。對于LLM/AIGC的討論,不論是公開場合還是內部會議,出版界都啟動得較早,討論的議題也非常廣泛,覆蓋了法律、倫理、產業、學術、治理等諸多方面。不論討論哪個方面,或者其中的哪個細分領域,需要注意的是,人工智能技術相較于以往的數字技術對出版行業提出了更高要求,如果說數字化階段還可以采用拿來主義,將數字技術當作黑盒,依據直觀的想象,做簡單的數字化平移,那么LLM/AIGC對于出版而言,絕不能當作黑盒看待,而是要基于對LLM/AIGC技術原理的深刻理解和對其能力邊界的精準把握,找到當下和未來出版行業智能化演進的方向和路徑。
未來已來,當然,特別是在新一輪科技革命的年代,這是某種必然。時代永恒的主題就是變化,不變的,或者說應該堅守的,只有初心。就像我們在數字化進程中創造和發展“聚典”那樣,堅守出版的初心,又不囿于出版的形式,唯有這樣,才符合出版的使命。在智能化的進程中,這一點也是同理的。