丁靖佳?李佰玨?莊紅權


摘 要 ChatGPT等應用的崛起引發了國際出版界對生成式AI的廣泛關注與討論。學術出版商在謹慎規制生成式AI工具的學術倫理的同時,積極借助生成式AI開發增強型科學搜索引擎和聊天機器人;在大眾出版領域,生成式AI則引起了內容生成與分發的范式更迭“革命”,一定程度上造成了大眾出版生態的破壞;交互式、個性化的生成式教育出版知識服務逐漸成為現實,教材出版模式變革處于“現在進行時”。對此,進一步結合我國數字出版產業的發展特征,分別提出了相應的發展對策。
關鍵詞 生成式AI;國際數字出版;內容生產;生成式出版
ChatGPT、Midjourney、Stable Diffusion等生成式人工智能(Generative Artificial Intelligent)應用的出現引發了國內外各領域的熱議,出版界也不例外。作為一個以知識內容選擇、傳播、傳承為內在追求的內容產業,出版業與服務內容自動生成的生成式AI天然地有著緊密聯系[1]。事實上,生成式AI并不是一類新生事物,早在2017年,微軟聊天機器人小冰就出版了詩集《陽光失了玻璃窗》。受限于數據、算力及算法的制約,當時的生成式AI模型還未具有類人的學習、理解、推理和語言表達能力,故而沒能對出版業產生顛覆性的影響。近年來,得益于生成式AI算法的創新迭代、大規模語言模型(Large Language Model,LLM)的成熟以及技術應用成本的降低,生成式AI對出版業的“變革”從“遠在天邊”轉變為“近在眼前”。而國際數字出版產業因其相對開放靈活的市場環境、技術獲取與應用的便利性以及國際市場的競爭壓力,更為敏銳地感知到了這一變動。在此背景下,探討生成式AI浪潮下國際數字出版產業的發展態勢,不僅能夠勾勒出當前國際數字出版產業發展的整體性圖景,也能為我國數字出版業邁向生成式智能出版這一新業態提供有力參考[2-3]。
以國際視角來看,數字出版產業普遍被認為是使用在線技術、以數字形式復制和分發數字內容的內容產業,其市場可按內容分為文本、音頻和視頻三大細分市場[4]。粗略地看,國際關于數字出版產業的認知較之國內,內涵上整體具有一致性,外延則更為寬泛,更傾向于將所有數字內容產業都囊括進數字出版產業的范疇,甚至將奈飛(Netflix)、谷歌(Google)、蘋果(Apple)等視為國際數字出版產業的核心活動主體,致使國際數字出版產業與內容產業、科技產業的發展邊界也相對模糊。為兼顧內外,本文將數字出版產業的外延界定在互聯網期刊、移動出版、數字報紙、在線教育、電子書等細分市場內[5]。
1 學術出版:謹慎規制與大膽嘗試
從當前生成式AI的應用體驗來看,生成式AI非常擅長于輸出看似合理、實則存在事實性、知識性錯誤或偏見的內容,這顯然與學術出版對科學內容創新性、科學性、嚴謹性、可靠性的高標準有所相悖。因此,學術出版商規制生成式AI工具的使用是必要的,但他們也沒有為此忽略生成式AI的創造性應用潛力??梢哉f,在對生成式AI謹慎規制與大膽嘗試的博弈中,學術出版不斷涌現出新的發展機遇。
1.1 生成式AI工具的學術倫理規制
基于LLM的生成式AI已在學術界“大行其道”。事實上,不少研究人員已經利用生成式AI的相關工具及應用協助其學術思維組織、代碼編寫、文獻總結、論文修改撰寫等[6];基于生成式AI創作的學術論文、著作也開始在同行評議期刊以及大型學術出版商上出版;部分論著和預印本甚至將生成式預訓練變換器3代(Generative Pre-trained Transformer 3,GPT-3)、ChatGPT、Beta Writer(施普林格開發的生成式AI算法)等生成式AI模型或應用列為共同或唯一作者。對此,學術出版界普遍認識到了生成式AI及相關工具對學術交流過程的影響,紛紛發布相關政策、規范或指南以規制生成式AI的使用,部分代表性政策如表1所示。
從已發布的政策來看,大部分出版商或學協會都不允許將LLM、聊天機器人等生成式AI工具列為作者。基于問責制和對權利歸屬的考量,學術出版商或學協會普遍認為AI作為非法人實體,不能對已發表成果或研究設計的原創性、準確性和完整性負完全責任,也不具有法律地位或版權轉讓能力。也就是說,AI并不能履行作者的基本責任或行使作者的基本權利,因此不能被列為文章作者。
在生成式AI工具的使用上,不同出版商的態度和意見相差較大??偟膩碚f,大致可分為三類,一是完全禁止使用,如《科學》(Science)系列雜志便表示未經編輯明確許可,包含文本、圖片、圖像在內的人工智能生成內容(AI Generated Content,AIGC)都不能在文章中出現,違反這一規定即被視為科學不端行為[7]。二是有條件的禁止或許可。如愛思唯爾(Elesvier)、國際機器學會議(International Conference on Machine Learning,ICML)、美國醫學協會雜志(Journal of the American Medical Association,JAMA)等主體允許生成式AI工具用于語言編輯和潤色,或認為僅當AIGC本身是研究過程中的一部分時方能適用(如研究ChatGPT的回答是否具有意識形態傾向時,可將AIGC作為實驗數據寫入文獻中)。從限制條件來看,該類出版商或學協會旨在禁止文章的框架、觀點、思路等創新性內容由AI生成。三是開放式的使用許可,但需在恰當部分透明地披露使用情況,泰勒·弗蘭西斯(Taylor & Francis)、施普林格·自然(Springer Nature)、威利(Wiley)、國際出版倫理委員會(Committee on Publication Ethics,COPE)、世界醫學編輯協會(World Association of Medical Editors,WAME)等均實行此政策。值得注意的是,許多出版商或學協會對人工智能生成圖像、視頻進行了單獨說明,其態度或與生成式AI工具的使用一致,或全然相反??梢?,國際學術出版界在討論生成式AI工具的應用時,主要是強調人工智能生成文本介入科學生產過程的合理性與合規性,而人工智能生成圖像、視頻則需額外加以討論。
此外,WAME還在其《聊天機器人、生成式AI和學術手稿》(Chatbots,Generative AI and Scholarly Manuscripts)的建議指南中特別指出了編輯、同行評審專家使用生成式AI工具的規范,即“編輯和同行評審員應向作者和彼此說明在評估稿件以及生成評論和信件時使用聊天機器人的情況”“編輯需要適當的工具來幫助他們檢測人工智能生成或更改的內容”[8],將生成式AI的學術倫理規制對象從研究者擴大為編輯與審稿專家,也將規制流程從學術寫作延伸到了學術出版流程。
1.2 科學搜索引擎與聊天機器人
國際學術出版商,文獻數據庫或管理機構等主體長期以來都非常重視AI與學術出版、學術交流的融合。在直面ChatGPT等生成式AI應用可能對學術領域帶來的風險后,各類機構也積極涌入生成式AI的浪潮之中,希望借助生成式AI實現已有功能或服務的轉型升級。
基于LLM的科學搜索引擎是生成式AI在學術出版中的典型應用之一。2023年6月,科睿唯安(Clarivate)宣布與生成式AI領域領先的AI21實驗室簽署戰略合作伙伴關系協議,旨在將LLM集成至Web of Science中,以實現智能的學術對話搜索、發現等服務[9]。憑借其數十億的文獻、書籍以及專有數據點,科睿唯安認為它完全有能力把握生成式AI這一機遇并引領市場,為用戶提供更多的、更高質量的可信內容與服務。同時,Elicit、Scite、Semantic Scholar等學術服務平臺也開始在科學數據庫中應用LLM,以對比檢索上下文信息并回應用戶的具體問題。以Semantic Scholar為例,它開發的TLDR(Too Long; Didn't Read)功能通過融合專家背景知識和類似GPT-3的自然語言處理(Natural Language Processing,NLP)技術,通過生成基于文獻主要研究目標和研究論文的超短摘要,以緩解當前科學信息過載之困境、提高研究者的生產力和創造力。目前,TLDR功能的測試版本已發布,適用于計算機科學、生物學和醫學領域的近6 000萬篇論文[9]。
聊天機器人則是學術出版商應用生成式AI的另一典型場景。2023年8月,國際學術出版商巨頭愛思唯爾發布了聊天機器人“Scopus AI”的alpha版本。Scopus AI是一款將LLM(GPT-3.5)與Scopus中的可信內容和數據相結合的新一代生成式AI工具,能夠通過交互式的對話實現知識服務。為保證返回內容的可靠性和安全性,愛思唯爾還組建了由17名來自主要學科的世界知名科學家、研究人員和圖書館員構成的獨立審查委員會,以保證Scopus AI遵循相應的AI原則和基本倫理。目前,Scopus AI的功能包括:基于Scopus數據庫摘要的觀點總結、提供“深入鏈接”以擴展探索更多相關內容、自然語言查詢、生成圖片以揭示研究關聯。當然,Scopus AI也存在一定限制,即它只能基于5~10份研究摘要來生成答案,該規則旨在防止LLM經過大量文本訓練和學習后輸出可能包含事實錯誤或偏見的內容[10]。同日,數字科學(Digital Science,隸屬于德國霍爾茨布林克出版集團)宣布為其Dimensions數據庫推出AI助手Dimensions AI Assistant的Beta測試版本。Dimensions AI Assistant在接收到用戶查詢的請求后,一則能提供摘要總結,即在數據庫中查詢最符合情境化需要且相關性排名前4的文獻摘要,并經Open AI的GPT應用程序接口(Application Programming Interface,API)處理后生成摘要總結;二則能夠提供知識解決方案,即基于它自開發的LLM在排名前10的文獻中抽取核心內容加以學習和理解,由此生成最佳答案[11]。
2 大眾出版:范式更迭抑或混亂再起
大眾出版領域,包括大眾出版商在內的多元主體都將生成式AI視為創新發展的關鍵資源,期望借此實現內容生產與分發的范式更迭。然而,由于生成內容質量的參差不齊以及潛在的著作權爭議,生成式AI也潛在破壞了國際出版生態,致使包括出版在內的整個內容產業處于一種緊張的混亂狀態。面對這一情形,大眾出版界采取了主動的應對措施,擬通過協助立法、出臺政策、技術開發、使用限制等一系列行動重構國際出版生態。
2.1 內容生產與分發的范式更迭
面對來勢洶涌的生成式AI,各類新聞出版主體都采取了積極包容吸納的姿態。路透社(Reuters)最新報告稱,81%的受訪者認為AI對于自動化新聞生產(Automated Journalism)及編輯室工作流程加速有重要作用[12]。實際上,生成式AI已悄然融入出版內容生產和營銷推廣的全流程,以生成式之新特征推動出版內容生產與分發的智能轉向和范式變革。
輔助內容創作是大眾出版領域應用生成式AI的常見方式。阿根廷《國家報》(La Nación)自主建設了AI新聞室,通過機器學習和NLP技術進行文本分析和數據處理,輔助新聞報道的選題策劃與內容撰寫,目前該媒體已基于生成式AI技術發表了有關陷阱音樂、大選新聞、性別差異等議題的多篇報道?!度A盛頓郵報》(The Washington Post)、荷蘭地域性媒體集團北方報刊集團(Noordelijke Dagblad Combinatie)等也已利用生成式AI實現了新聞的自動化報道,發表了近900篇報道和6萬場足球比賽的報告。在圖書的內容生產上,生成式AI主要服務于智能審校和長文本生成?;谏墒紸I的寫作助手QuillBot便能夠借助NLP技術實現文本的自動糾正和語義增強,實時提供語法錯誤修正、抄襲檢查、文檔摘要生成等服務功能,極大地提高了內容的檢校質量和效率。在長文本生成上,日本公立函館未來大學松原仁教授團隊通過向自訓練的生成式AI模型輸入小說的基本架構、人物設定等關鍵信息,與生成式AI合著完成了小說《計算機寫小說的那一天》(The Day A Computer Writes A Novel),成功入圍了日本“星新一微型小說文學獎”??梢哉f,訓練有素的生成式AI語言模型已經能夠在人類指令的指導與調整下,生成堪比乃至超出專業作家水平的內容作品,出版內容生產上游的范式更迭無疑也將蔓延至出版活動的核心環節與步驟。
此外,大眾出版領域各主體也在利用生成式AI進行內容的分發推廣,通過個性化的營銷內容構建出版物與讀者間的聯通渠道。目前,Shimmr公司正在嘗試解決圖書的可發現性這一難題,其AI工具Shimmr.ai可以在計算圖書內容的情感與敘事技巧向量的基礎上,自動生成該圖書與類似作品關聯之處的智能模型,以圖書的相關性計算幫助讀者發現閱讀目標。而在圖書的反向發現性上,Shimmr公司利用圖書AI廣告幫助圖書“找到”讀者[13],其基本原理在于:首先,提取包含圖書結構、價值觀、興趣、情感等關鍵信息在內的“書籍DNA”,并為每個“書籍DNA”貼上符合用戶閱讀需求的若干標簽及關鍵詞;其次,將不同的“書籍DNA”進行“聯網”,形成一個大型“書籍DNA基因庫”;再次,基于讀者的閱讀痕跡、行為數據、用戶偏好等信息,在“書籍DNA基因庫”進行搜索、匹配最佳結果并進行廣告內容的個性化生成和推送,由此便實現了圖書與讀者“端到端”的納米級營銷。目前,福布斯圖書公司(Forbes Books)已經與Shimmr公司達成合作,旨在借助Shimmr.ai開展針對性的圖書營銷活動。
2.2 生態破壞與修復措施
盡管生成式AI能夠為大眾出版的內容生產與分發提供強大助力,其缺少人工監督、訓練數據良莠不齊等現實問題也帶來了諸多負面影響,如低質量的AIGC泛濫、版權爭議、用戶隱私泄露等。具體來看,生成式AI的應用為國際大眾出版產業帶來了以下兩方面的挑戰與問題。
一則,LLM的濫用致使劣質內容廣泛充斥大眾出版業。由于缺乏監督和篩選,AI生成的“偽書”正在滲透亞馬遜等電商網站與其他在線書店。2023年6月,亞馬遜“青少年當代浪漫電子書”暢銷書排行榜上的前100本書中就有81本由AI生成,這類“偽書”往往存在格式混亂、文本無序、封面拼湊、缺乏概要信息等諸多問題[14],極大地影響了大眾出版市場的市場生態。同時,《紐約時報》(The New York Times)、《泰晤士報》(The Times)、《幻想與科幻小說》(The Magazine of Fantasy & Science Fiction)、《阿西莫夫的科幻小說》(Asimovs Science Fiction)等在線出版商也稱AI生成的低質量圖書、虛假消息及平庸文章在其關鍵板塊中占據較大比例[15-16]。
二則,LLM的使用也存在多重風險。首當其沖的是著作權,對于著作權人來說,生成式AI未經授權且無償使用其所有作品進行模型預訓練或內容生成,本身就是一種侵害其作品復制權、改編權及匯編權的表現。2023年1月,美國3名漫畫家指控Stability AI在內的3家公司侵犯版權,認為它推出的付費AI圖像生成工具使用受版權保護的圖像生成“新”圖像,并因此獲利,使得原作品在交易市場中遭受損失[17]。其次,生成式AI因具有廉價、高效、便捷、即時的特征而被優先應用于不同場景,擠占了作者原有的工作機會,也減少了他本可能獲得的勞動報酬。出版商的生存空間也因此縮小,例如,搭載生成式AI的搜索引擎、聊天機器人將以內容摘要、知識解決方案等形式,直接服務用戶的各類知識需要。尤其是在生成式AI應用發展愈加成熟的趨勢下,用戶向出版商直接尋求知識服務的需求降低,出版的諸多服務功能或將被生成式AI替代。
面對生成式AI帶來的諸多風險,大眾出版業的各主體發布了不同政策。具體來看,可分為四個方面:①對AI劃分等級,以針對性實施管理,如歐洲議會(European Parliament)發布的《人工智能法案》(AI Act)就提出要將AI及其相關應用劃分為禁止使用、高風險、有限風險以及低風險四等,并針對不同級別制定監管規則。②要求生成式AI模型的訓練過程尊重版權,公布訓練集作品來源并取得受版權保護作品的權益人的權益人的使用許可,如意大利文化協會就提出AI開發人員必須確保所使用的受版權保護內容(包括預訓練數據集)得到權利人的批準和許可,且數據處理和收集過程必須盡可能透明[18]。③開發AIGC鑒別工具,識別“深度偽造”內容,防止AIGC冒名頂替人類作品,如內容來源和真實性聯盟(Coalition for Content Provenance and Authenticity)正在開發基于防篡改或顯竊啟元數據的“真實性證書”來驗證內容來源;BBC、《紐約時報》等也領導了“起源計劃”(Project Origin),旨在追溯內容的真實發布者,打擊假冒和虛假的AIGC信息[19]。④限制數據使用,禁止將非授權的出版資源用于生成式AI訓練,確保版權內容利益不受損害。如美國作者協會(The Authors Guild)就起草了一項新的出版條款,禁止在未經作者明確許可的情況下使用出版內容來訓練生成式AI模型;且出版商只有在獲得作者的書面同意后,才能將生成式AI用于書籍智能翻譯、有聲讀物配音或封面圖片創作。
然而,提高數據訪問壁壘、設置訪問限制等措施又帶來了次生危害。為應對AI爬取數據,擁有大量用戶在線互動數據的Reddit網站大幅提升了數據訪問定價,這使得依賴于API的一系列應用程序無法再以低成本方式訪問該網站。對用戶而言,持續升級的訪問限制又降低了用戶體驗,用戶需要付出比以往更多的精力對優質內容進行識別驗證。而隨著網絡上AIGC以及對抗生成式AI的內容比例逐漸增大,人類痕跡如同??滤缘摹吧碁┥系哪槨敝饾u被AI抹去,網絡或將進入“死亡互聯網”狀態[20]。
3 教育出版:“毀滅”還是“生存”?
生成式AI對學術出版和大眾出版的深遠影響主要發起于內容生產端,即是由出版產業鏈的上游驅動的。教育出版領域則相反,它更多是由用戶端,即出版產業鏈下游“倒逼”所形成的產業變革。
3.1 “一石激起千層浪”
生成式AI對教育出版業的“蝴蝶效應”始于一場“高科技抄襲”——大量學生開始頻繁使用ChatGPT來完成作業。2023年2月,沃爾頓家庭基金會(Walton Family Foundation)對美國1 002名K-12教師和1 000名12~17歲的學生進行了調查,發現51%的教師都使用過ChatGPT,其應用場景包括課程規劃(30%)、為課堂提出創造性想法(30%)或提供背景知識(27%);學生使用ChatGPT的比例則為33%(若不設年齡限制的話,這一比例將高達89%[21]);且大部分使用過ChatGPT的教師(88%)和學生(79%)都認為它對教育產生了積極影響[22]。5個月后,受訪人群中老師和學生使用過ChatGPT的比例分別上升到63%和42%且61%的老師認為ChatGPT將具有“不容忽視的合法教育用途”[23]。
硬幣的另一面,則是因ChatGPT等生成式AI應用潛在的抄襲、造假風險而掀起的一股教育恐慌。英國40%的高校表示他們已禁止ChatGPT的使用或正在修訂政策以取締聊天機器人的使用[24],美國紐約、西雅圖、洛杉磯等區的學校也逐漸宣布禁止學生訪問ChatGPT[25]……同時,ChatGPT等生成式AI的強大教育功能使投資者發現許多教育類機構的產品及服務極易被取代,進而引發了教育出版市場的股市“騷動”——美國在線教育公司Chegg預計將因此蒸發9.94億美元市值,而英國培生集團(Pearson)的股價則下跌超過15%[26]。
對此,新加坡、美國、芬蘭、韓國等數十個國家紛紛開始布局、更新教育領域的AI戰略或立法提案。在2023年5月最新頒布的《人工智能與教學的未來》(Artificial Intelligence and the Future of Teaching and Learning)中,美國教育部發現社會對教育領域的生成式AI的關注與討論興趣日益高漲。固然這些AI在個性化教育、智能輔導系統等方面具有強大的應用功能,美國教育部仍然呼吁所有相關群體以批判性之視角審視AI系統及相關工具在教育領域的應用。同時,國際教育技術協會(International Society for Technology in Education)、可汗學院(Khan Academy)、培生集團等全球共計56家教育科技公司、53家政府機構聯合發起了TeachAI項目,旨在為AI教學、AI素養提升建立一個全球性的框架[27]。
3.2 Open AI賦能教育出版新發展
在面對ChatGPT等生成式AI所帶來的恐慌后,不少國際教育出版、教育科技公司開始冷靜下來,重新審視生成式AI與教育融合的可能性,并開始或主動或被動地擁抱生成式AI的到來。目前國際市場上也出現了不少基于生成式AI的教育出版服務工具,部分如表2所示。
從開發團隊看,教育出版團隊普遍與Open AI建立了緊密的合作關系,旨在加快教育出版服務智能化轉型進程。除了本身就具有教育技術優勢的Paragon Prep之外,培生、Edx等教育出版機構普遍與掌握生成式AI技術的技術公司開展了合作,Open AI開放的ChatGPT API成為生成式教育出版服務工具構建的最優選擇。目前,Open AI開放提供GPT-4、GPT-3.5-turbo、babbage-002等已經訓練好了的LLM,用戶或機構通過Open AI的API接口就可以調用或調試相應模型,且整個調用或調試過程都十分簡單,其操作流程在Open AI的GPT指南中都有詳細介紹。出版機構便可以將這些模型集成至已有的應用或者產品之中,或是基于Open AI的LLM調試出更符合教育出版應用場景的新產品。在使用成本上,Open AI的官方網站顯示,GPT-3.5-turbo模型輸入1 000 token為0.001 5美元,也就是說,輸入100萬單詞的成本為2美元(約16元人民幣),較之ChatGPT剛發布時降低近90%,這無疑也將激勵越來越多的教育出版機構將GPT等生成式AI模型接入出版場景中。
從平臺功能看,交互式、個性化的生成式教育出版知識服務成為現實。教育出版領域已有的生成式AI應用或工具的功能可大致分為兩類,即教育輔導和課程建構,而交互式、個性化是上述功能的共性底色。教育輔導功能主要面向學生群體,通常以聊天機器人或AI導師的形象出現,它能夠個性化分析用戶的學習特征及學習需求,為學生選擇或生成恰當的教材、視頻等教育資料,并以交互反饋、學習引導的方式參與進學生的學習、閱讀、測評、評估的全過程。如學生在Khanmigo平臺閱讀《了不起的蓋茨比》時,就能與AI版的杰伊·蓋茨比(Jay Gatsby)進行實時對話,共同探討書中的內容及象征意義。課程構建功能則主要面向教師群體,能夠根據教師的授課需要以及班級學生的整體學習狀況制定課程計劃,包括確定相關閱讀材料、生成課堂測試問題、布置作業、追蹤學生學習進度等。教師可以準備多個版本的教材或課件來滿足一個班級中不同類別學生的教學需要??梢哉f,在生成式AI的加持下,教育的個性化、適人化理念得到了完美的實現。
從出版流程來看,教材出版模式變革已是“現在進行時”。生成式AI進一步推動了教材按需定制成為可能,也使以往靜態的、以文字呈現為主的教材“活”了起來。PhotoStudy基于GPT-3 APIs開發的MathGPT就旨在徹底變革教科書的出版模式。它以OpenStax在線開源的初等代數教材為訓練數據源,在融入數千名數學專家的訓練數據之后,開發了初等數學的AI教材。該教材能夠以學生的學習需要為導向隨時進行自主調整,同時具備文字、音頻、圖像等多模態呈現形式,能夠以問答乃至虛擬交互的形式進行教學或輔導。Quizlet的Q-Chat功能可以為每個用戶按需定制教科書,并基于每位用戶的學習進展和學習偏好調整教科書的測試題難度。從這個意義上說,未來的教材出版流程變革方向將更多是智能化、一體化、生成式的,而未來的教材內容及呈現形態則是個性化、跨模態和動態交互的。
4 國際數字出版產業發展態勢之啟
生成式AI對國際數字出版產業的影響可謂是全方位的。對此,國際學術出版界、大眾出版界和教育出版界分別交出了一份不盡相同的答卷,并逐漸形成了對待生成式AI的共識態度,即在合理規制的同時推動出版與生成式AI的創新融合應用,為我國數字出版產業的未來發展提供了參考依循。值得注意的是,由于國內外出版體制機制的差異,“刻舟求劍”“照貓畫虎”地將國際數字出版產業的成功經驗和范例移植至中國大地,顯然是不合適的,也不利于推動出版業的中國式現代化進程。對此,我們還需在面向國際數字出版視野的基礎上,立足中國數字出版實踐,切實把握好生成式AI浪潮下的數字出版發展時代脈搏[28]。
在學術出版領域,出版主體應借助生成式AI強化出版內容來源把關、評審加工和多維傳播。從國際數字出版產業發展態勢來看,目前搶先進入生成式AI賽道的出版機構的規模普遍較大、影響力較強、資源也相對充沛。而我國學術出版機構的核心主體——學術期刊則整體呈現“小、散、弱”的分布特征,在運營規模、產業影響力及資源儲備上都有所差距。因此,獨立自主開發科學搜索引擎和聊天機器人更適合規模較大的期刊集群和期刊知識服務商。事實上,中國知網已開發了CNKI AI學術研究助手和知網AI智能寫作的測試版,但其中涉及的技術倫理和學術倫理問題,還未有明確的解釋和說明。對其他大部分學術期刊主體而言,一則,更應關注因生成式AI而引起的學術造假、AIGC泛濫等問題,需在明確生成式AI工具使用規范及使用邊界的基礎上,強化學術稿件的審核把關。對此,可引入AI檢測工具作為學術稿件內容把關的第一道防線,以達到“以AI監管AI”的目的。同時,還可要求作者提供學術稿件的相關數據及迭代版本,輔助編輯更好地審查稿件來源。二則,鑒于生成式AI在知識學習、知識復雜推理等方面的優勢,學術期刊可嘗試訓練審稿機器人并將它作為評審輔助工具,以幫助編輯更高效地評估稿件主題、研究結構、內容完整度及創新性是否滿足期刊的基本要求,縮短期刊審稿周期。三則,學術期刊還可借助生成式AI實現學術作品的摘要總結或科普化表達,服務科研成果的科學傳播和科普傳播;實現學術作品的智慧化、情景化翻譯,服務科研成果的國際化傳播。
大眾出版機構則應借助生成式AI實現出版的再定位,在以往的內容編輯加工和分發商的基礎上,成為新型內容供應商。從當前國際大眾出版領域的已有實踐來看,大眾出版產業鏈上游的內容生產已呈現混亂趨勢,知名大眾出版商則處于觀望與被動應對的狀態,這對我國大眾出版機構而言無疑是一種警醒,也預示著新的發展契機。一方面,在內容編輯加工與分發上,大眾出版機構可借助生成式AI強化自身的專業技能與服務能力。如引入生成式AI工具,服務出版內容文本、圖像、音視頻的智能編校和多模態轉化,實現人機協同的內容編校與加工;綜合利用生成式AI與分析式AI工具,基于圖書內容與用戶大數據生成圖書關鍵信息“基因庫”與讀者畫像庫,并進行“端”到“端”匹配,實現精準、高效的內容分發。另一方面,就內容生產而言,國際大眾出版領域已充斥了大量的AIGC作品,雖然整體質量堪憂但也出現了少部分優質作品,這側面反映出生成式AI的內容創作能力有望在人類的恰當提示和語言模型的優化支持下達到較高的水平。對具有敏銳把握用戶和市場需求、擅長選題策劃和內容質量把關的出版機構而言,他們完全可以主動擁抱生成式AI的到來,在部分選題上形成“自給自足”的生產機制,以內容供應商的角色實現高質量出版作品的優質供給。
對教育出版主體而言,需借助生成式AI實現生成式教育出版知識服務。教育出版一直以來都強調教書育人、立德樹人導向[30],而從國際教育出版機構的產業實踐來看,生成式AI有望成為推動教育出版核心價值實現的關鍵“拐點”,尤其是在國際教育出版機構已搶先布局和發力的背景下,我國教育出版機構也需積極開拓生成式教育出版新模式。具體而言,首先,我國教育出版機構要整合教育出版數據資源,建立教育出版知識庫。海量、高質量、多樣化的語料資源是開展生成式教育出版知識服務的關鍵。因此,教育出版機構需在合法合規的基礎上,標準化整合已有的內容數據、用戶數據、交互數據,并對這些數據進行知識抽取、標引、表示和加工,架構教育出版知識庫,為教育出版的“生成式”轉型奠定資源基礎。其次,我國教育出版機構要積極與生成式AI公司建立合作,合力打造教育出版LLM。隨著生成式AI技術模型的迭代優化及API接入應用成本的降低,諸多國際知名教育出版機構都選擇接入Open AI的API快速開發生成式教育出版知識服務工具或功能。我國教育出版機構亦可主動與生成式AI技術服務商開展合作,快速搭建教育出版領域的LLM,以彌補當前的技術短板。最后,我國教育出版機構要融合LLM與教育出版機構主營業務,在合理借鑒國際經驗的基礎上,實現
[9] Clarivate Plc. Clarivate Announces Partnership with AI21 Labs as part of its Generative AI Strategy to Drive Growth[EB/OL].[2023-09-04]. https://www.prnewswire.com/news-releases/clarivate-announces-partnership-with-ai21-labs-as-part-of-its-generative-ai-strategy-to-drive-growth-301857301.html.
[10] Semantic Scholar.What Are TLDRs?[EB/OL].[2023-09-04].https://www.semanticscholar.org/product/tldr.
[11] VAN N R. ChatGPT-like AIs are coming to major science search engines[J].Nature,2023,620(7973):258-258.
[12] MISHA K. Powering research with Dimensions AI Assistant.[EB/OL].[2023-09-04].https://www.dimensions.ai/blog/powering-research-with-dimensions-ai-assistant/.
[13] NIC N,RICHARD F,CRAIG T R,et al.Reuters Institute Digital News Report 2022[R].2023.
[14] PORTER A.Artificial Intelligence:Threat,Opportunity and Shimmr[EB/OL].[2023-09-07].https://publishingperspectives.com/2023/07/ai-building-shimmr-on-the-threat-opportunity-continuum/.
[15] ADRIANNA N. Amazon Is Full of AI-Written Novels That Don't Make Senser[EB/OL].[2023-09-12].https://www.extremetech.com/computing/amazon-is-full-of-ai-written-novels-that-dont-make-sense.
[16] CHRISTIANNA S.How ChatGPT and AI are affecting the literary world[EB/OL].[2023-09-12].https://mashable.com/article/chatgpt-ai-books-literary-magazines.
[17] SCOTT R.AI-generated books are infiltrating online bookstores[EB/OL].[2022-09-12].https://www.axios.com/2023/08/16/ai-book-publishing-fake-amazon.
[18] MATTHEW B.Because AI needs to be fair & ethical for everyone[EB/OL].[2023-09-12].https://stablediffusionlitigation.com/.
[19] Confindustria Cultura Italia. LA POSIZIONE DI CONFINDUSTRIA CULTURA ITALIA SULL'INTELLIGENZA ARTIFICIALE[EB/OL].[2022-09-12].https://confindustriaculturaitalia.it/2023/07/20/intelligenza- artificiale-cipolletta-cci-come-settore-abbracciamo-questi-progressi-tecnologici-ma-allinterno-di-un-contesto-regolatorio-che-tenga-conto-del-rispetto-del-diritto-d/.
[20] BILL K.The Effort to Help Publishers Fight Disinformation Is Underway[EB/OL].[2023-09-12]. https://www.publishersweekly.com/pw/by-topic/digital/content-and-e-books/article/ 91398-will-artificial-intelligence-make-authors-irrelevant.html.
[21] The Conversation. The importance of editors in the age of(highly unreliable)AI[EB/OL].[2023-09-12].https://mediamakersmeet.com/the-importance-of-editors-in-the-age-of-highly-unreliable-ai/.
[22] CHRIS W.Educators Battle Plagiarism As 89% Of Students Admit To Using OpenAI's ChatGPT For Homework[EB/OL].(2023-01-28).[2023-09-12]. https://www.forbes.com/sites/chriswestfall/2023/01/28/educators-battle-plagiarism-as-89-of-students-admit-to-using-open-ais-chatgpt-for-homework/?sh=5857d166750d.
[23] Impact Research.Teachers and Students Embrace ChatGPT for Education[R].2023.
[24] Impact Research.Americans See Need to Better Prepare Students for National Security Careers of the Future[R].2023.
[25] POPPY W. Oxford and Cambridge ban ChatGPT over plagiarism fears but other universities choose to embrace AI bot[N].News:2023-03-01.
[26] TAYLOR S.Seattle Public Schools bans ChatGPT;district‘requires original thought and work from students[EB/OL].[2023-09-12].https://www.geekwire.com/2023/seattle-public-schools-bans-chatgpt-district-requires-original-thought-and-work-from-students/.
[27] DAN M.AI race is disrupting education firms-and that is just the start[N].Guardian:2023-05-03.
[28] Teach AI.Empowering educators to teach with AI and about AI[EB/OL].[2023-09-12].https://teachai.org/.
[29] 方卿,丁靖佳.中國式現代化視域下的出版學自主知識體系構建[J].科技與出版,2023(7):17-24.
[30] 方卿,張新新.推進出版業高質量發展的幾個面向[J].科技與出版,2020(5):6-13.