文| 顧捷昕

AI 將承擔大部分煩瑣的日常工作,充分釋放人類的創造力,并倚重人類的判斷力。
生成式人工智能到底將給出版業帶來什么樣的變化?這些變化不僅前所未見,而且令人震撼:行業內的工作流程、經營模式以及讀者獲得的最終產品可能都會發生實質性的變化。然而,這項技術仍處于萌芽階段,通往未來的道路仍在建設之中。作為親歷出版業技術巨變的一線出版人,肯·布魯克斯(Ken Brooks)在美國書業媒體Publishers Weekly雜志上發表文章稱,對生成式人工智能的前景持有堅定的信心:它的應用范圍廣泛而多樣,同時具備顛覆整個行業的巨大潛力。
肯·布魯克斯是咨詢公司Treadwell Media Group的創始人,也是Publishing Technology Partners 的創始合伙人。他曾擔任Wiley 出版集團的首席內容官和Macmillan Learning 公司的首席運營官。他說,日常工作中,自己目睹了生成式人工智能多項用途的開發過程。它不是一個局限于紙上談兵的理論工具,而是一種目前正在發揮作用的操作工具。生成式人工智能具有什么樣的廣闊前景?其運用過程中又存在哪些誤區?肯·布魯克斯借此提出問題并闡釋他個人看法,希望幫助同人更深入地了解這項強大的技術及其徹底改變出版業的潛力。
肯·布魯克斯表示:“生成式人工智能工具大大提高了我的工作效率,以前耗費大量時間和精力的任務,如今可以輕松搞定。一朝神器在手,營銷文案不僅手到擒來,而且目標明確,讀起來引人入勝;利用它爭取到的寶貴時間,我能夠手動定制信息并實現迭代傳遞——若是沒有人工智能的幫助,這幾乎是不可能完成的任務。此外,實踐證明,人工智能非常擅長生成圖書元數據,簡化了一個煩瑣但對圖書發現和銷售至關重要的過程。”
他還嘗試運用人工智能應用完成如下任務:處理客戶服務電子郵件,破譯長篇累牘的討論部分;對內容和供應商合同進行初步分析,提取合同中的權利授予和版稅條款;整理提取的文本以創建電子書;找到競爭性圖書,以及識別手稿中潛在的問題。他認為,運用過程中,大多數情況下,人工智能全面碾壓真人操作:迅速、精確地完成多項任務,不僅節約時間,而且避免人為錯誤。
就上述用途而言,人工智能展示出巨大潛力,但是在運用過程中,還存在某些問題。事實證明,要想在出版業充分利用人工智能的力量,并不像即插即用那么簡單。作為AI 技術的使用者,我們需要謹慎思考、努力鉆研,并深刻理解人工智能技術、其運用方式以及出版業自身的特殊性質。實際操作中,用來執行任務的提示詞通常需要大量的迭代,其結果也需要真人仔細地檢查和編輯。
在運用人工智能提取合同條款的過程中,布魯克斯感嘆又一次深切感受到這項技術的強大力量。生成式人工智能具有高超的模式識別技巧,可以對密集的法律術語進行篩選,有效識別和提取關鍵術語,其精確度令人驚嘆。在審查版稅協議、期限和授予的權利類型時,每個元素通常都隱藏在一堆法律術語中,解讀起來可能很耗時。生成式人工智能接受訓練之后,可以用來識別這些特定條款,從而大大減少在合同審查上花費的時間。
產品編輯往往需要從PDF 等格式的文檔中提取文本,甚至還得從打印頁面的掃描件中提取文本——這也是編輯日常工作必須面對的常見困難。提取出的文本往往有百般疏漏:字符編碼錯誤,換行符錯位,成段文字缺失。按照業內標準流程,往往需要第三方服務商采取額外的步驟整理文本,確保適合進一步使用。布魯克斯透露:“我使用了生成式人工智能來取代這整個過程。應用程序甚至可以突出顯示已更正的元素,以便快速查看?!?/p>
AI 技術在出版業的運用不僅限于提高操作環節的效率,在數據分析方面,它同樣具有強大效力。采用OpenAI 發布的Code Inspector(代碼解釋器),出版業內日常操作生成的市場和物流數據成為可以任意取用的寶貴資源。比如,在教育出版領域,對交貨時間的分析至關重要——在銷售旺季,更是必須關注其中細節。將物流數據輸入AI 模型,用來分析趨勢,找到影響交貨時間的關鍵限制性因素。AI 模型熟練地處理大型數據庫,迅速找到問題癥結所在;這項工作如果靠人力來完成,則要耗費數天或是數周時間。運用過程中,我們必須有明確的考察目標,并且創建合適的可視化圖表,確保AI 模型能夠清晰地展示分析過程和結果,但是它只需數分鐘就能完成海量基礎數據運算。AI 工具會嘗試不同途徑,如果此路不通,會迅速轉換方法,直至得出恰當結果。

生成式人工智能技術在出版業到底會起到什么樣的作用?如下各個實例中反映出問題的實質:AI 具有強大功效,但是絕非準確無誤。AI 工具確實有卓越的技術性能,但是我們必須謹慎解讀它輸出的結果。
以發現競爭性圖書為例。表面看來,使用生成式人工智能,我們不費吹灰之力就能得到結果;但實際上,為合理運用AI 工具,我們必須對出版行業及其數據有深刻的了解。肯·布魯克斯說,與他共事多年的薩德·麥克羅伊在電子郵件往來過程中曾指出:“人們聲稱,AI是用來發現競爭性圖書的強大工具;但是我認為,說這話的人并不理解這句話到底意味著什么。我們到底出于什么樣的目的,才要去找尋競爭性圖書?這涉及數據處理中的推薦引擎系統。我們想要找到與我們計劃出版的書稿在風格/內容等方面最具相似性的圖書。這是一項棘手的工作……我們也得以避開那一道幾乎無解的難題:將仍受知識產權保護的圖書納入競爭性圖書數據庫?!?/p>
只要輸入一個或兩個詞組,AI 就能夠生成一系列可能的競爭性圖書標題。布魯克斯說,在他實際操作的案例中,當使用AI 查找競爭性圖書時,它生成了一個每個書名聽起來都很合情合理的競爭性圖書書單,但實際上這些圖書并不存在!實際上,AI 背后的開發商,推出ChatGPT 的OpenAI公司也承認AI 確實會“無中生有”。他們還就AI 輸出結果發出警告:生成的書名體現出用戶的搜索需求,但是列表中的圖書未必真實存在,其結果沒有權威性。
即使AI 具備分析數據的能力,能夠生成權威的揭示問題實質的輸出結果,用戶依然得滿足以下要求:有的放矢地提出問題,知道自己想要什么樣的答案。這意味著在AI 應用過程中,真人參與始終都是重要環節。AI提供工具,作為用戶,必須明確重點,并負責解讀結果。
乍一看,這貌似是AI 系統的不足之處,其實它可能恰恰又是優點。這表明AI 確實只是賦能用戶的工具,而非人類活動的替代者。AI 有助于提高我們的工作效率,為我們提供更多信息,讓我們具備處理更多任務的能力——無論從規模還是速度角度看,若是沒有AI,我們不可能具備如此驚人的能力。但是,AI 并未降低行業知識和人類判斷力本身的價值;實際上,為了實現AI 的全部潛力,這些要素反而顯得更加重要。
布魯克斯認為,真正具有擴展性的企業應用程序必須具有可預測性、一致性和精確性——你肯定不想公司的財務系統編造公司運營數據。生成式AI 尚不具備這樣的精確性,開發商一直努力做出改進,試圖消除AI生成結果的不確定性,確保AI 提供的答案無論從格式還是內容上,都具有一定的精確性。他們的目標是,AI將承擔大部分煩瑣的日常工作,充分釋放人類的創造力,并倚重人類的判斷力。
OpenAI 公司持續推出新的功能產品,為實現上述目標提供輔助。比如,它的開發人員最近發布一項新的產品功能,使得智能自動語音呼叫更加系統化,并具有可預測性。但是,AI 技術仍有很長的路要走。
在法蘭克福書展公司于9 月5 日舉辦的法蘭克福版權會議上,美國企鵝蘭登出版集團前首席執行官瑪德琳·麥金托什就提出,AI 是有效工具,但出版人仍然應該關注自身,而非糾結于軟件。
首先,她提到在企鵝蘭登出版的一本書《明天,明 天, 明 天》(Tomorrow,and Tomorrow,and Tomorrow)中,作者加布瑞艾拉·澤文(Gabrielle Zevin)寫出了十分吸引人的開頭。麥金托什以這段金句中的一個詞語作為提示詞,輸入AI 虛構寫作工具“Sudowrite”中,但是得到的文本讓她有不忍卒讀的感覺,與澤文的精妙原句相比,完全是天差地別:“我根本不愿意在此轉錄生成結果,因為它如此枯燥,讓我只想跳過開頭。總之,生成的內容讀來令人昏昏欲睡。”
“所以,我再次重申許多創作者對AI 技術的評價,”麥金托什說,“若是用它從事創造性寫作,其結果流于平庸”。由此看來,把AI 技術妖魔化為“圖書創作機器”,并且由此產生恐懼心理,未免言過其實。
麥金托什指出,由于缺乏溝通,作者不知道出版商有什么看法,出版商則擔心作者會因立場不同,對AI 抱有不同的態度;而許多業內人士在談起AI 技術對出版業的影響時,態度又過于輕率,仿佛這個問題根本不值得嚴肅討論?!俺霭嫒瞬槐叵嗷シ婪?,以秘密小圈子的方式,私下討論AI 在出版業內的運用情況,我真心希望,全行業應該聚在一起,分享觀點,分擔焦慮,并探討可能的AI 運用領域?!?/p>
談起對AI 的相關疑問,以及它對內容的調用,麥金托什說:“如果說,與AI 相關的風險正在蠶食我們的部分業務領域,最好的應對方式就是,嘗試利用技術實現行業的整體增長。不要認為,AI 會替代小說家,其實,AI 只是復制人類作者作品的機器人。”
她認為,AI 真正的才能,在于其發現能力?!叭魏螐氖麓蟊妶D書出版的業內人員都清楚?!丙溄鹜惺舱f,“內容生成根本不是我們的最大難題。早在很久以前,這就不再是出版商心中的頭號問題。實際上,我們的第一要務是,在浩如煙海的海量內容中,如何發現某一本書,或是一系列書,無論它以圖書、流媒體電影,或是其他形式出現。”
“我不知道到底哪一家開發商會解決這一問題,但是我認為,我們應該有信心:總會有創業者解決這一難題,我們將采用這樣的AI 利器,加速出版流程,提高出版效率,因為我們能夠找到最有可能和我們出版的最新流行小說產生共鳴的消費者。有了AI 工具,發現之路將更加暢通。”
托馬斯·考克斯(Thomas Cox)是位于牛津附近的Arq Works 公司的總經理兼董事,一直對AI 系統在出版業內的運用有獨到的見解。
在法蘭克福版權會議上,考克斯介紹了出版業內重要的AI 應用程序開發項目,以及ChatGPT-4 之外正處于開發過程中的(二級)開源項目。這些開源項目獲得了微軟,以及谷歌各類產品的支持??伎怂惯€詳細介紹了Llama 2(由Meta 公司于7 月中旬推出)的開發情況:“它是開源大模型,所以用戶不僅可以訪問,還能自主運行和加以調整,由于整個開源社區都參與開發,所以模型會高速發展?!?/p>
考克斯又談到Anthropic,這是一家“由前OpenAI員工創建的”AI 系統開發公司。Anthropic 的用戶能夠輸入整本書,然后向AI 提出相關問題,比如這本書的主要情節是什么,有哪些人物,而AI 那里擁有所有信息,能夠做出分析。考克斯又談到自己的公司:“我們開始發現,大批基于AI 技術的應用程序面市。許多程序供應商都聲稱,他們的AI 是自主開發的,但實際上,他們使用的依然是ChatGPT,或是谷歌等其他主要的AI 系統供應商提供的AI 系統?!?/p>

多年來,考克斯與法蘭克福版權在線交易項目合作,在版權交易方面積累了豐富的經驗。他說,“版權業務是私人業務:人情味、人際關系,以及溝通談判依然是業務核心。書展是開展版權業務的關鍵時間節點,目前情況并未改變。所以我認為,版權交易程序的核心也依然如故”。
“但是,這并不意味著這種局面以后也不會改變。如今業內已經出現了AI 輔助創作——有些人會坦率承認自己在寫作過程中使用AI 作為輔助工具,有些人不會,但事實是AI 創作輔助工具正在發揮作用?!?/p>
“業內還有由AI 配音的有聲書,如今這類書籍也越來越常見。谷歌和蘋果年初都推出了AI 配音服務,還有很多地方也能生成有聲書。AI 輔助翻譯已經屢見不鮮,而且其效果越來越好。圍繞上述所有服務,都存在與版權和合同相關的擔憂,這些還會影響流媒體版權。畢竟,我們將使用的AI 工具會發生日新月異的變化,出版業的變革也同樣迅速?!?/p>
如今看來,由AI 生成的文學內容依然是個遙不可及的概念,但考克斯認為:“這并不意味著就在數十年間不會出現針對某一特定時期,抑或是特定體裁而開發的新模型,這些模型會有自己的人格,就是所謂虛擬作者。”
他說,到那時,人們會逐漸接受由AI 生成的長篇內容。
目前,技術開發商們正在緊鑼密鼓地開發多個出版業專用的生成式AI 應用程序,其前景值得期待。比如,PanOpen Education 將AI 技術合成至課件平臺之中。AI 起到輔導老師的作用,提供各類輔助,幫助學生改正錯誤理解,節約出的課堂時間則用來開展深層次的討論。PanOpen 總裁布萊恩·雅各布說:“長久以來,打破教育的工廠量產模式,實現以個人為中心的學習一直是我們的夢想,如今有生成式AI 來相助,夢想正在變為現實。從這一點看,我們認為,AI 工具為教育者與學習者賦能,與之前的應用程序相比,其神奇效果遠超人們的想象。這類工具絕非教育者創造力的替代品,而是以新的形式,強力激發這種創造力?!?/p>
同樣,Gutenberg Technology 公司也運用AI 技術增加其創作工具產出內容的可訪問性。公司利用AI 解決如下問題:可訪問性補救措施(適用于所有出版商的服務方案),合規性,試題生成(教育出版商專用程序)。公司總裁Gjergj Demiraj 說:“我們引進AI 技術,旨在提高精確度和一致性,給作者和出版商帶來真正的福音。有了AI 的幫助,我們能夠確保出版商提供的內容符合標準,能夠被所有用戶訪問,而且不會限制創作者的創造性觀點。”
上述實例表明,生成式AI 具備技術優勢,而人類的創造力和判斷力無可取代,開發商努力實現強強聯合,打造出更高效、精確的創新性平臺,而且他們進步神速。他們還可能針對出版行業推出其他AI 應用程序,比如圖書內容開發、銷售、營銷以及運營和會計部門專用程序。
出版業已經踏上革新旅程,作為親歷者,必須與時俱進,掌握前沿知識。生成式AI 創造機遇,出版人不應棄之不顧,而是應該盡快掌握相關應用技能。出版人可以嘗試使用AI 工具,在新項目中納入這一元素,并探索其用法;參與相關討論,思考如何以符合道德規范的方式,運用AI 技術,辨析該技術的局限和前景。更重要的是,出版人應思考,如何塑造這一技術,為出版行業所用,為讀者所用,以創造我們共同的未來。AI 是否會在出版業內占據一席之地,這已經不是問題。問題是,在什么時候,AI 會以什么樣的方式,在出版業內發揮作用。如何保證這些“方式”符合出版人最遠大的抱負,最純粹的初心?!?/p>