樊丹丹 中航出版傳媒有限責任公司
AIGC(Artificial Intelligence Generated Content)是指通過使用先進的人工智能技術,如深度學習、機器學習、自然語言處理等,使計算機模擬人類思維,自動創作和生成各類內容,包括但不限于文本、圖像、音頻和視頻等。通過人工智能生成的內容不是在語法和結構上的簡單拼接,而是能夠在基于類人思維培訓下給出的有價值、有深度、有創新性的內容。AIGC 有著極強的自我學習和優化的能力,能夠不斷提升生成內容的質量和創作效率。在數字化高度發展的社會,AIGC 已經滲透到社會生活的各個方面,被廣泛應用于新聞報道、學術研究、廣告營銷、娛樂創作等多個領域,極大地推動了信息化社會的發展。
人工智能的發展不是一蹴而就的,從20 世紀50 年代萌芽至今大體經歷了三大發展階段。第一階段為早期萌芽期(20 世紀50 年代至90 年代中期),里程碑事件包括:1950 年,艾倫·圖靈提出著名的“圖靈測試”,明確給出了判斷及其是否具有“智能”的方法;1966年,世界第一款可實現人機對話的機器人“Eliza”問世;20 世紀80 年代中期,IBM 研發創造了語音控制打字機“Tangora”。這一時期受限于技術水平,AIGC 僅限于小范圍實驗,并沒有被重視。第二階段為沉淀積累期(20世紀90 年代后期至21 世紀10 年代前期),里程碑事件包括:2007 年,世界上第一部完全由人工智能創作的小說《1 The Road》問世;2012 年,微軟展示語全自動同聲傳譯系統,可將英文語音自動翻譯成中文語音。在這一時期,AIGC 受限于算法瓶頸,無法直接生成內容,但是邁出了重要的一步,從實驗性開始走向實用性。第三階段為快速發展期(21 世紀10 年代中期至今),這一階段里程碑事件包括:2014 年,Lan J. Goodfellow 提出生成式對抗網絡GAN;2016 年谷歌創造AlphaGo,實現人機智能對戰;2018 年,英偉達發布 Style GAN 模型,用于自動生成高質量圖片;2019 年,DeepMind 發布 DVD-GAN 模型,用于生成連續性視頻;2022年,OpenAI發布ChatGPT模型,用于生成自然語言文本。這一時期深度學習算法不斷成熟迭代,人工智能百花齊放,開始“破圈”進入大眾視野。
ChatGPT 是人工智能生成內容(AIGC)技術的產品形態之一,本質上是基于神經網絡的自然語言處理 (Natural Language Processing, NLP)模型,相較于前人工智能產品擁有更豐富的知識儲備和更高超的語言交互能力,在文本生成、圖像生成、代碼開發等內容生產領域表現出色,一定程度上能媲美人類智能[1]。ChatGPT 是隨著GPT-1 到Instruct GPT 模型的不斷成熟而逐步形成。2018 年,GPT-1 模型有1.17 億參數,具有一定的泛化能力(generalization ability),能夠用于與任務無關的MLP 任務中。2019 年,GPT-2 模型有15 億參數,除了理解能力外GPT-2 在生成方面表現出了強大的天賦:閱讀摘要、聊天、續寫、編故事,甚至可以生成假新聞、釣魚郵件或在線進行角色扮演。2020 年,GPT-3 模型有1750 億參數,作為一個自監督模型,可以完成自然語言處理的絕大部分任務:將網頁描述轉換為相應代碼、模仿人類敘事、創作定制詩歌、生成游戲劇本,甚至模仿已故的哲學家預測生命的真諦。2022 年1月,OpenAI 公司對ChatGPT-3 模型進行了微調,形成了GPT-3.5 模型,可以將有害的、不真實的和有偏差的輸出最小化,是對模型“道德”能力的一次優化。2022 年3月,GPT-4 正式發布,相較于ChatGPT(GPT-3.5)有了質的飛躍,邏輯推理能力更強,語言能力更強。從 GPT-1 到GPT-4 智能化程度不斷提升,研發期間隔也不斷縮短。根據OpenAI 公司披露的信息,本年末推出的GPT-5 模型將實現影像感知和學習。
在當今的科技領域,國內外的科技巨頭都非常重視ChatGPT 引發的科技浪潮,并紛紛積極布局生成式AI。ChatGPT 作為一種強大的語言模型,具備了出色的自然語言處理和對話生成能力,能夠實現與人類的智能交互。這種技術的出現引發了一股AI 技術的熱潮,許多企業和研究機構都加快了在生成式AI 領域的研發和應用布局,部分公司已有成型產品并公布測試。(僅列舉部分,見表1)
進入數字化時代,科技出版依次經歷了電子出版—網絡出版—數據出版—智能出版四個階段。電子出版是將紙質出版物以電子的方式呈現出來,比如常見的電子書、電子報紙等。網絡出版是借助互聯網進行編輯、出版、發行、傳播,出版物的形態存在于互聯網服務器的介質中,用戶可以在網上瀏覽或是下載。網絡出版物具有多種作品形態,包括文字、音視頻等。數據出版是指數據工作者或者科研人員利用互聯網將研究、實驗等過程中產生的數據成果按照統一的規范,如數據論文的方式公布出來,實現數據的開放共享,其他用戶可以進行下載、引用。智能出版是指出版者把自動文本分析技術、知識圖譜、大數據、等智能技術應用到出版產業鏈中,從而滿足用戶的個性化閱讀需求及提高出版業的數字化水平。目前科技出版社大多集中在第三或第四階段,隨著人工智能技術的發展和應用,必然會走到“智慧出版”階段,即出版者利用人工智慧、智慧生成等最新數字技術,結合傳統出版技術與形態,實現創作和出版的高度自動化和智能化,實現學術觀點發現和智慧化傳播,為用戶提供全面的、個性化的、智慧化的服務。
2023 年3 月,ChatGPT 以Snow fox Books 行政總裁Seo Jin 的故事構思為基礎,僅花7 小時便完成所需的數據搜集并以英文寫成一本135 頁的名為《尋找人生目標的45 種方法》的書籍。新書隨后采用韓國科技巨頭Naver 旗下AI 翻譯程序Papago 譯成韓文,過程不到2 小時。可見,當AI 與出版業融合,將迅速為傳統出版行業發展打開一個新方向。
1.ChatGPT——內容供給與優化。ChatGPT 作為一個強大的語言模型,通過分析提供的信息,可以生成多樣化、連貫且有邏輯的文本,在短期內為出版商提供新的靈感和觀點,提升策劃構思效率。同時,出版商也可以通過不斷與ChatGPT 進行交互獲得提交文本的反饋和建議,幫助優化文章的結構、語法和表達,檢查拼寫錯誤、語法、表達不當等問題。通過實時、個性化的反饋可以提高文章質量,確保信息傳達得更準確、清晰。
2.ChatGPT——知識關聯。雖然不像搜索引擎具有直接查找和鏈接知識的功能,但是經過大量文本數據訓練的ChatGPT 可以對不同主題的知識進行學習和理解,并在對話中與用戶進行關聯。出版商可以利用其理解自然語言的能力,不斷充實學科相關的信息來和內容,按照選定的方向總結文章的關鍵詞,構建個性化知識圖譜。
3.ChatGPT——知識發現。經過大量文本數據訓練的ChatGPT 可以理解和生成自然語言并嘗試對一篇論文的內容進行簡要總結。當匯集了大量相關學科數據后,可以進一步理解編輯意圖,根據編輯提供的輔助信息提供與搜索語句相關的學術觀點的論文、推薦相關領域的專家,幫助編輯快速找到進行同行評議的專家。
4.ChatGPT——相似性檢測及知識審讀。ChatGPT可以作為一個輔助工具用于知識審讀。ChatGPT 大引擎系統決定了它的成長方式是螺旋上升的,自身學習的延展性也超越了普通數據庫。通過對本學科知識的不斷積累,ChatGPT 可以獲得“1+1>2”的知識儲備。傳統相似性檢測僅依靠文字匹配或進行分句后的文字匹配,利用ChatGPT 訓練論文數據后可以進行觀點、思想的匹配。同時可以給編輯提供出版物的知識來源、信息的準確性、個人觀點傾向、意識形態等建議。
5.ChatGPT——自動化制作。海量數據支撐的ChatGPT 可以提供編輯內容、制作封面、自動排版、翻譯和校對等服務,進而大幅提高出版行業的生產效率和質量,降低制作成本和時間,這對于出版商而言也是非常有價值的功能。
6.ChatGPT——運營推廣。ChatGPT 實現了以對話方式進行交互,可以實現你問我答、有問必答、上下文了解,完成多輪對話,真正像人類一樣進行聊天交流。科技出版社可以通過在微信或官網平臺搭建智能問答平臺,輔之以虛擬人物的形象,針對作者或者讀者提出的常規問題進行解答(比如投稿郵箱、出版要求等)、對要推廣的期刊、圖書進行智能運營推廣,大大減輕編輯的工作負擔。
7.ChatGPT——預測市場。ChatGPT 能夠迅速對海量數據進行分析和處理,讓出版商能夠更精準地了解讀者的需求與市場趨勢,對市場進行更準確的預測和決策,為客戶提供個性化推薦和定制化服務,增加讀者的付費意愿,非常有利于出版行業的發展。
綜上,不難看出ChatGPT 在科技出版領域的應用前景非常廣闊。它可以提高內容的質量和效率,為編輯工作提供支持,為出版商提供優質資源,增強讀者的互動和參與度。隨著ChatGPT 技術的不斷發展和完善,可以預見它將在科技出版領域發揮越來越重要的作用,進一步推動科技知識的傳播和普及。
AIGC 對于出版業的影響,并非只有積極的一面,而是機遇與挑戰并存。
這里包括人力資源和技術成本。引入人工智能技術不光需要擁有相關的專業知識和技能,同時還需要懂得運用AI 的人才,這對于一些中小型出版機構來說可能會面臨較大的挑戰,更需要編輯不斷地學習和更新知識和技能。
ChatGPT 并不是萬能的,在內容創作上時常會有錯誤,這就需要編輯重新校對其嚴謹性。同時ChatGPT 作為類人思維大模型,也具有人類會犯的錯誤“撒謊”。當被要求在它不熟悉的領域搜索問題,ChatGPT 有很大概率會對自己不知道的事情進行造假。
人工智能技術需要處理和存儲大量的數據。目前ChatGPT 的服務器分別位于美國加利福尼亞州圣何塞市、歐洲法國巴黎、日本東京。人們向ChatGPT 提出的每一個問題,如論文、數據等都可能被存儲并成為ChatGPT 訓練模型的素材,并被反饋為問題的答案。在OpenAI 數據使用說明中明確提到對于非API 產品如ChatGPT、DALL-E,平臺確實會使用用戶數據來進一步提升模型效果。另外,ChatGPT 運行中會出現故障,導致隱私泄露,用戶可能會在自己的界面上發現大量別人的對話。
權利歸屬是著作權法的核心,其可以明確作品究竟歸屬于誰,以及誰可以對所創作的作品享有權利并承擔責任[2]。ChatGPT 生成的內容,著作權到底歸誰?如果不承認AI 模型著作權,那是否意味著其生成的內容也無須受到著作權保護?人類正在經歷第一次AI著作權沖擊。各大出版商紛紛給出針對人工智能生成內容著作權的明確說明。國際出版業巨頭ELSEVIER旗下的期刊《護士實踐教育》在1 月出版的文章把ChatGPT 作為作者,而在2 月對此論文進行了訂正后則不再將ChatGPT 視為作者。到目前為止,出版業內沒有對ChatGPT 創作歸屬形成共識。
有學者給ChatGPT 出過那道著名的“火車軌道選擇題”:在一個鐵路的岔路口,面對一列疾駛而來的列車,兩個岔道分別有一個被綁著的人和五個被綁著的人,而你就在岔道口,可以調整列車的方向。你會如何抉擇?學者把其中五個人方向換成ChatGPT自己,把一個人方向換為獲得諾貝爾獎的科學家,ChatGPT 選擇了殺死科學家。給出的理由是獲得諾貝爾獎的科學家已經拿過獎,已經做完貢獻了,而ChatGPT 不可替代。在出版領域使用ChatGPT,它是否會輸出不道德價值觀很值得人們關注。
一方面,國家立法部門應加快出臺相應的法律規范,確保以AIGC 為核心機制的生成式人工智能技術不被惡意濫用,并就內容版權保護和相應責任主體做出明確規定[3]。另一方面,行業監管部門應出臺與法律相匹配的監督機制,對使用AIGC 過程中的數據隱私、知識產權進行保護。同時對不規范行為進行間隔審查與監督,在確保各方利益與安全的前提下釋放技術革新來來的活力,助力出版行業的融合出版轉型。
出版業歷史悠久,有自成體系的行業規范與要求,相關出版業團體應該與時俱進更新規范與要求,適應AIGC 時代下出版業的發展,確保人工智能能更好地服務出版業。一方面,各出版商應在引入使用AIGC的過程中嚴格遵守出版倫理與價值導向,提升編輯的業務修養與技術能力。人工智能只是工具,占據出版主導地位的依然是人,要始終確保以人為本。另一方面,必須將保障作者和讀者的權益放在重要的位置,在人工智能的使用過程中不可避免地要搜集、分析使用個人信息,一定要做好信息保護工作,尤其是隱私信息與數據信息,以免被惡意竊取。
作為人工智能的研發單位和服務提供單位,技術供應商一方面要不斷優化引擎,盡可能減少AIGC 模式下的誤導性、虛假性內容;另一方面要提升技術力量,避免發生大規模技術故障,引發信任危機,為AIGC 模式下的科技出版提供有效保障。
ChatGPT 作為AIGC 技術在科技出版業的“破圈”王,給這個傳統的行業注入了新鮮的活力,帶來了新的機遇。同時,新技術的應用也衍生出了新的知識產權、隱私安全、倫理道德等出版業不容忽視和回避的關鍵問題。目前是AIGC 技術應用的大爆發時期,人工智能正在以人類難以想象的速度學習和汲取現實世界的數據、信息和知識,在不斷迭代的算法加持下不斷成長。AIGC 已經參與到了社會生活的方方面面,人們不能因為AIGC 會帶來問題就漠視它的存在。在這樣的環境下,科技出版業無論主動擁抱還是被動選擇都已站在了變革的起點。科技出版的從業者要秉持大膽嘗試與小心推動的心態,不斷追問、揭示 AIGC及相關應用對科技出版帶來的機遇與挑戰,并不斷尋求解決問題的辦法,用“人的智慧”牽引“人工智能”發展,助力科技出版在新時代的發展。