摘 要:2023年,以ChatGPT為代表的生成式人工智能異軍突起,其優異的內容集成、整合、分析和生產能力與正在經歷跨領域融合發展的出版行業的發展需求不謀而合,并很快有了實際運用的范例。這對出版從業者作為知識密集型產業人員的關鍵能力構成和核心競爭力體現提出了新的挑戰和要求。本文試圖分析以ChatGPT為代表的人工智能生成內容在出版行業的實際運用中所呈現出的特點并與傳統人工運作的流程特點相比較,分析其對出版核心內容建構、跨媒介融合和提供知識服務等發展趨勢的利弊,得出AIGC背景下出版從業者應當具備的能力和素質,促進人機協同,推動出版業跨越技術桎梏實現高質量發展。
關鍵詞:AIGC;編輯出版;出版人才培養;模式創新;人機協同
DOl: 10.3969/j.issn.2097-1869.2023.03.005 文獻標識碼:A
本文著錄格式:徐怡行,劉洪權. AIGC環境下編輯出版人才的關鍵能力重構[J]. 數字出版研究, 2023, 2(3): 28-33.
2022年11月30日,美國人工智能公司Open AI推出了以多模態模型為基礎的人工智能ChatGPT,它通過自然語言對話界面收集用戶需求,集成運用大型語言模型、Transformer模型生成內容并通過人類反饋強化學習的形式不斷擴充原始語料庫并訓練改進回答方式,可以完成較高水平的語段組織、數據分析、圖片生成等任務。這種內容的生產方式被稱作AIGC(AI Generated Content),繼Web1.0時代的專業生產內容(Professional Generated Content,PGC)、Web2.0時代的用戶生產內容(User Generated Content,UGC)之后成為Web3.0時代新的內容產業風口,其極高的生產效率、極簡的操作門檻和極廣的應用范圍特點刺激著大眾不斷探索AIGC的使用方式和應用邊界。
AIGC在出版行業的運用由來已久,從2007年AIGC獨立完成并出版了世界首部人工智能小說《1 The Road》,到電子游戲出版中常使用AIGC輔助原畫生成、地圖渲染、NPC設計,到ChatGPT橫空出世不斷更新迭代到ChatGPT-4,并由人工輔助完成了《ChatGPT:AI革命》這部中國首部利用ChatGPT創作的關于ChatGPT的圖書。過去弱人工智能所表現出的模型功能上的單一、應用領域之間的隔閡以及自然圖形、語言理解能力的有限等問題都在逐一被技術的發展所攻破。AI能力的不斷提升對正處于融合發展關鍵期的出版行業是一個至關重要的機會,在市場調查、選題策劃、內容生產與編校、出版物設計制作、用戶反饋分析、社群運營方面都將起到較大的助力作用。但AIGC的使用對出版行業從業者而言是一把雙刃劍,這意味著在出版流程中人的主體性將有所降低,傳統工作內容可被替代,工作的重點也由傳統的數據分析、內容把控、運營策劃向更高的維度轉移。
作為國家文化宣傳的重要陣地,出版行業應當針對媒介融合發展背景下AIGC的特點,有預見性地對出版人才應當具備的核心能力和素質做出前瞻規劃。
1 AIGC功能特點及其與出版行業的接軌
1.1 數據分析能力助力選題策劃
大數據是AIGC運行的基礎,作為一個自然語言處理大模型,它具有極其龐大的原始語料庫。據統計,Open AI公司的ChatGPT擁有超過萬億單詞的人類自然語言數據集,參數量超過1 750億,國內由騰訊公司開發的混元模型也擁有五大跨模態視頻檢索數據集,參數達到了萬億級別[1]并且其模型自身也在不斷地從用戶交互中爬取更多信息。這些信息將會被延伸轉化為多維度向量以便于機器理解和采用。過去這種轉化需要人工進行分類和標注,在信息的時效性、分析效率和擴展維度精度方面依然有一些限制。而目前,隨著算法的迭代和模型的更新,ChatGPT所使用的Transformer模型基于注意力機制,將不同的單詞根據權重加以區分,在語義層次、語段位置、語法邏輯的處理上更加迅速精準,所用的訓練時間更少,在此基礎上的結果推斷和趨勢預測也更加可靠[2]。
這項技術賦能在出版物市場調查與選題策劃方面的優勢尤其突出。傳統的選題策劃過程需要編輯或專門的市場調查單位多方收集資料,并分類整理分析市場發展趨勢和內容出版的可行性,這個過程會受到編輯眼界、個人喜好和研究單位調查渠道、市場風潮轉變等因素的影響而產生一定偏差。AIGC在龐大數據的基礎上就能夠彌補編輯在細分領域所了解知識的不足,盡量囊括所有可能信息渠道的信息,并結合數據實時推斷文化市場的走向。
這一功能對數據調查、分析能力不足的傳統編輯來說無疑是一種使用門檻較低而計算效率卻較高的優秀輔助工具。然而對這種功能的依賴卻可能造成市場敏感度、內容敏感度以及政策敏感度的反向降低,使得出版工作陷入唯經濟效益、熱點流量和世俗偏好為機械導向的誤區。
1.2 內涵理解能力賦能多模態內容生成
無論是視頻、圖片還是音樂,不同的內容形態都可以被自然語言概括出內在的含義或表達,因此文本語義理解是AIGC的前提。從循環神經網絡(Recurrent Neural Networks,RNN)通過單獨計算上下文單詞前后關聯分析語義而無法短期記憶,到自注意力機制(Self-Attention)提出通過單獨分析詞語權重以達到單詞成句擺脫循環計算的阻礙,ChatGPT所代表的自然語言理解能力和效率正在通過模型的迭代和訓練數量的增加而不斷提升,這為AIGC輸出多模態內容打下了堅實的基礎。
單一的語言理解和文本輸出功能雖然應用范圍很廣,但對于Web3.0和出版融合發展的當下已不足夠。為了適應不同群體讀者的閱讀需求,相同內容可供出版的形式也變得多種多樣,如為兒童讀者設計帶有趣味交互活動的繪本讀物,為老年讀者設計操作簡單的有聲讀物,等等。而AIGC建立在語義理解基礎上的多模態生成功能可以為此提供有力的輔助。如中文平臺6pen-Art和百度旗下的文心一格能根據輸入的描述關鍵詞自主選擇風格進行作畫。Synthesia平臺則可以依靠文本輸入生成AI視頻,無需演員、相機或音頻設備。Google AI則在探索通過語言或樂譜的描述生成人聲音樂或樂器演奏。
媒介是人的延伸,這些AIGC工具一定程度上啟發了出版行業從業者對于內容呈現模式的想象力,提升了自身生產多模態內容的創造力,為出版行業自身低成本地進行IP開發、產業鏈延伸、跨媒介敘事的嘗試和試錯創造了捷徑。
1.3 自主學習能力強化個性化知識服務
GPT-3.5引入了一種人類反饋強化學習(Reinforcement Learning from Human Feedback,RLHF)機制。該機制能夠使機器系統從環境中學習并可以做到一邊計算數據輸出內容,一邊以最大化某種特定目標為目的改進行為方式。該方法通過引入“獎勵”和“懲罰”信號,讓系統自行探索環境并學習最佳行為策略。與傳統的監督學習不同,該機制無需大量人工標注訓練數據,而是依靠信號在人類反饋中強化學習。ChatGPT-3.5為此邀請了40名專家輔助系統訓練[3],以期系統表達能夠更貼近人類的語言思維習慣,并敏銳捕捉互聯網時代不斷發生的表達方式的細微變遷,進一步向“圖靈測試”發起沖擊。
在此基礎上結合用于細分領域的小模型和用于公共領域的大模型,AIGC已經能夠輔助甚至代替人工向用戶提供諸如閑聊互動、客服服務、心理咨詢、金融指導等知識服務。Web3.0時代的出版行業也在尋求從內容生產商向知識服務者的角色轉變。隨著媒介形式的多樣化和知識使用場景的轉變,傳統讀者的身份也逐漸向用戶身份過渡,出版行業憑借傳統的內容為王的核心思維已經不能夠滿足用戶“可靠、可變、可利用、可分享”的知識需求。而如何利用內容優勢打破瓶頸,構建優質高效的統一融媒體服務、營銷矩陣對出版單位而言又是極難越過的關卡,過度向知識服務、社群運營、媒介營銷等方面傾斜資源反而會弱化PGC模式生產效率和質量,造成本末倒置。AIGC的多模態內容整合輸出、人格化表達形式、不斷更新的自主學習特點,使其成為出版行業能夠以較低成本加以利用的重要資源。
2 出版文化產業屬性與AIGC機械理性的沖突
出版物是以精神屬性為核心的文化產品,這就意味著其中所蘊含的價值并非只有科學客觀和絕對理性,人文關懷、感性價值和創意靈光也是優秀出版物價值構成中極為重要的部分,也是過去編輯在進行出版工作時格外強調的部分,而AIGC在此領域內的表現目前還無法與人類思維產物完全一致。
2.1 數據分析導向下創意性缺失問題的發生
出版物市場由面向更廣大群眾的大眾出版物和面向細分領域的專業出版以及用作學習培養領域的教育出版等構成,各領域之下又根據具體內容的不同進行垂直細分。由于出版行業對內容質量的嚴格要求注定了出版行業必須以PGC模式為主,或者使用UGC、AIGC模式生產內容并進行嚴格的官方審查編輯,以保證出版物的內容質量和相對長久的市場生命力。這就意味著出版行業對內容時效性的要求較弱,但對內容的優質性、代表性和創新性等要求較強。但AIGC模式生產內容的基礎是大數據、精準計算,各領域的內容市場在一定的時間跨度內所產生的信息趨勢必然具有一定相似性,這就使得AIGC進行選題策劃時極易出現內核相似或實例表現同質化的情況,既不可能脫離信息桎梏在某一領域內獨樹一幟,也很難通過創造性決策或創意性改編引領下一階段的內容發展潮流。同質化的選題策劃或內容生產在一定程度上削弱了出版物個體的市場競爭力,破壞了出版產業追求的高質量精細化布局,導致資源浪費,甚至會阻礙文化發展的自然趨勢。
除了內容層面的同質化,AIGC在產業鏈創意性延伸方面也體現出一定的局限性。在出版行業開展IP轉化如火如荼的當下,如何創新IP的表現形式以彌補或延伸其在文本內容上呈現出的空白點,如何合理分配IP應用場景優化用戶體驗或進行個性化銷售和服務都是需要結合不同IP自身特色和其不同特點的用戶群體進行創新性探索的問題。從創新價值鏈角度來看,這涉及了創新思想產生環節、創新思想物化環節和創新產品價值化環節。然而根據學者結合中國2011—2021年30個省區市的數據發現,ChatGPT-AIGC只有對創新產品價值化環節,也就是產品推廣和銷售的作用是正向顯著的[4]。這說明現階段AIGC依然無法在出版行業最核心的價值領域,也就是創新內容生產和豐富內容呈現方面進行相對高效的賦能。對編輯而言這正是老生常談的,也是最無法被機械所替代的創新能力的價值所在。
2.2 原始數據復雜來源基礎下版權問題的出現
AIGC不斷擴大的語料庫和數據來源、不斷增加的訓練集和逐漸豐富的內容生成模態正在驅使著這種內容生產模式面向更廣闊的公共領域進行知識服務。反觀出版業,單一領域內的出版物反而對知識的廣度需求較為有限,對內容的正確性、可靠性,或者單一視角下內容切口的深度有更嚴苛的要求。目前幾個通用的AIGC模型源數據庫準確性尚不可知,AIGC是否能夠準確地從與用戶的交互中提取準確信息也具有不確定性。根據用戶反饋,AI生成的內容有時是披著“嚴密邏輯外衣”或“專業詞語堆砌”的胡說八道。這種經過邏輯化、人性化處理的錯誤信息隱蔽性較強,對于使用AI輔助的內容生產工作而言則增添了編輯檢查糾錯的壓力。而AI在視覺內容生成領域,爭論也時有發生,有些藝術從業者體驗后認為AIGC模式下生成的視覺作品是元素的簡單拼合,會產生如光影變化、人物關節刻畫、透視角度等諸多問題,缺乏藝術性,沒有圖層的疊加直接生成整體也不利于后續圖片的修改和應用。
AIGC模式在版權方面也存在一定問題。出版業對編輯的版權意識,和在工作中對于侵權問題的敏感度從過去就已有較高的要求。國家互聯網信息辦公室于2020年3月1日起施行的《網絡信息內容生態治理規定》第十二條指出:網絡信息內容服務平臺采用個性化算法推薦技術推送信息的,應當設置符合本規定第十條、第十一條規定要求的推薦模型,建立健全人工干預和用戶自主選擇機制。這對于人工審核機制的建立,和參與審核的編輯人員法律素質的提升更是提出了硬性的規定。
而AI生成的內容在版權上的歸屬目前尚無定論,各家企業、機構的要求也不盡相同。在歐盟法律標準下,德國將AI機器人視作著作權法保護的客體。而美國Open AI公司明確說明,ChatGPT是一個模型工具,并無主體意識,因此AIGC的產物及其權利屬于工具的使用者。在國外,國際學術期刊《科學》雜志主編認為AIGC的錯誤使用有可能損失學術研究的真實性和準確性,繼而傷害學術期刊的公信力,有礙于科學技術的發展。國內一部分高??镆惨笞髡弑仨毺拱资欠袷褂么祟惞ぞ?,注明生成內容所在,并進行詳細的引用論證,否則視同學術不端[5]。
即便如此,AIGC所使用的原始數據是否侵犯了數據擁有者的署名權、保護作品完整權、修改權,其在海量用戶所交互過程中所獲取的信息是否可以歸屬為用戶隱私等問題依然有待討論。
2.3 自主學習發展條件下認知偏差問題的產生
編輯能力培養的重要方面之一就是堅守正確立場,提升政治敏感度。在Web3.0時代,面對思想文化豐富激蕩、價值觀多元并存和審美標準多樣化轉變的時代文化背景,出版從業者依然堅持通過政治理論的深化學習、實踐與理論相結合以及切實為人民服務等方式不斷提升自身政治素養。
而反觀作為輔助工具的AIGC,其生成內容的基礎是源數據庫,不同數據庫受地理、政治、技術等因素的影響在內容的收錄和分類上必然會帶有一定的傾向性。而無論是應用于較大范圍的大型模型還是應用于細分領域或私人領域的小型模型,其學習的判斷標準和思考傾向都取決于與其進行交流的對象,也就是團體或個人[6]。這意味著,即使能夠保證源語料庫的內容正確客觀,一旦在訓練過程中摻雜了錯誤的語言習慣或思想導向,其生成的內容也不會是正確客觀的。
出版從業者要在正確政治導向的基礎上進一步保障內容質量,在這種情況下使用AI生成內容或輔助出版工作,首先要追溯其源語料庫數據來源是否安全可靠,其次在對模型進行應用化訓練時應當著重保證其政治導向,最后在應用時還需對內容進行嚴格的審查并管控數據流,防止導向問題或泄密問題的發生。
3 出版人才的關鍵能力重構
AIGC的應用對出版產業的發展是一個充滿挑戰的契機,尤其是對于出版行業從業者而言。傳統的工作可以高效率完成,新的問題卻又接踵而至。這意味著出版業人員應當摒棄對弱人工智能的偏見和強人工智能的恐懼,積極擁抱科技發展,并主動更新技能,在AIGC環境下做工具的掌握者,推動出版進一步融合發展。
3.1 突破數據壁壘,提升人文精神、創新意識
出版行業是服務人、宣傳人、教育人的行業,歸根結底,出版的發展成果應當由人民共享。因此,人文精神的延續在AIGC迅速發展的背景下顯得格外重要。人文精神是對人的價值的肯定和追求,表現為對人的尊嚴、價值、命運的維護、追求和關切,對人類遺留下來的各種精神文化現象的高度珍視,對一種全面發展的理想人格的肯定和塑造。因此人文精神和AIGC所體現出的高生產效率和普適性、追求經濟商業價值、重視數據背后的機械邏輯等特點存在相違背之處。新時代編輯人員應當重視人文精神的培養,跨過數據的抽象表面積極投身實踐,深刻感知讀者需求,回應社會期待,做好內容把關人和思想引領者的工作,使得AIGC模式所生產的內容更接地氣,能被受眾接受和共情,也更能創造出豐富的文化價值而非經濟價值。
除此之外,出版行業人員也應當注重創新意識的培養。一部優秀的出版物,必然是在內容構成、表現方式、觀點視角等方面具有獨創性,這是人類智慧靈光的體現而非是數據分析的產物。面對AIGC生成的決策或內容,編輯要敢于質疑和提出新的假設,不斷地進行驗證和試錯,同時也要堅定AI只是工具的信念,雖然自主創新結果并非每每都能適應市場發展,但一成不變必然阻礙文化發展。
3.2 主動擁抱技術,深挖使用規則、運行邏輯
生成式模型是人類智慧的產物,因此它的結構特征和運作邏輯必然能夠為人類所理解或掌握,并非是完全“自動化”的。技術高速發展背景下,編輯想要熟練地使用AIGC模式為出版賦能,就不得不了解AI運作的底層邏輯,學會從源頭掌握工具的正確使用方式。這一點在目前AIGC的應用中就已經初見端倪,如AI生成圖畫,僅僅輸入要素關鍵詞所生成的圖畫并不能完全反映用戶要求,還需要精密的邏輯詞、關系詞的限定和引導。又如ChatGPT的決策功能,如果提出要求的同時缺乏某些條件或依據,系統就會根據常識自行補充或直接忽略,導致決策的結果沒有可行性,或者出現疏漏。
因此,從根源掌握AI工具的使用方式十分重要。首先要了解所使用模型的數據庫來源,并使用多樣化的、可靠的信息渠道對AIGC模式生成的內容進行可靠性的驗證。其次在人類語言模式多種多樣且表達細節演進更替越來越快的當下,應學會如何進行條件充分、需求明確的提問并恰當組合使用副詞、介詞、連詞等從而不使機械理解產生歧義,并依據企業或個人生產需要對模型進行訓練,以提升輸出內容的效率和質量,降低模型使用限制和門檻。最后在使用私人小模型或國外開發的AI工具時應當注意用戶規則,明確上傳或交流時所產生的信息歸屬問題,防止出現關鍵信息被爬取使用或隱私泄露問題。在輸出內容后應仔細查證修改,賦予AIGC模式生成的內容以準確的信息、積極的價值導向和創意性內核。
3.3 迎合產業轉型,聚焦知識服務、社群運營
在跨媒體融合和平臺為王的當下,在出版行業從單純的內容生產商向知識服務的提供者轉型之際,無論是內容生產、營銷,還是附加服務,都在面向更垂直細分的領域、更專業化的產品和更個性化的用戶進行分化。在這一層面,得益于其獲取用戶畫像和進行精準分析的能力,多模態生產服務的AIGC大模型一定程度上保證了細分領域的服務效率,但其學習模式的反復又注定AIGC無法短時間內面對大量差異化個體提供優質的人性化服務。因此新時代出版行業從業者應當提升服務意識,抓住從大眾到社群、從讀者到用戶、從品牌消費者到品牌粉絲的多重轉變,借助AI綜合分析不同媒介平臺的不同用戶特點和偏好數據,結合出版物或出版單位的形象特點和定位,使用AIGC輸出相應模態和特點的內容,并差異化訓練AI,使得不同平臺、不同類型的用戶在提出同樣的問題時,AIGC也能以個性化的方式輸出相應內容的不同表達形式,增加用戶的體驗感,提升品牌黏性和流量轉化。
作者簡介
徐怡行,女,安徽大學新聞傳播學院碩士研究生。研究方向:融合出版。
劉洪權,男,安徽大學新聞傳播學院教授,博士生導師。研究方向:出版、圖書情報與數字圖書館、新聞與傳媒。
參考文獻
中國科技信息.AIGC分析報告[J].中國科技信息,2023,698(9):2-9.
王仕勇,張成琳.ChatGPT參與知識生產的技術路徑、應用與挑戰[J].教育傳媒研究,2023,44(3):53-55.
李志民.ChatGPT本質分析及其對教育的影響[J].中國教育信息化,2023,29(3):12-18.
賴俊明,王文青.ChatGPT-AIGC對創新價值鏈升級的影響[J].中國流通經濟,2023,37(5):16-27.
沈錫賓,王立磊,劉紅霞.人工智能生成內容時代學術期刊出版的機遇與挑戰[J].數字出版研究,2023,2(2):27-33.
史惠斌,郭澤德.邁向智能:AIGC內容生成模式引發的出版變革[J].數字出版研究,2023,2(2):34-42.
Reconstruction of Key Competencies of Editorial and Publishing Talents in AIGC Environment
XU Yixing, LIU Hongquan
School of Journalism and Communication, Anhui University, 230601, Hefei, China
Abstract: In 2023, generative AI represented by ChatGPT emerged with its superior content integration, consolidation, analysis, and production capabilities coincided with the development needs of the publishing industry, which is undergoing cross-domain integration and development, and soon had examples of practical application. This poses new challenges and requirements for the key competency composition and core competitiveness embodiment of publishing practitioners as knowledge-intensive industry personnel. This research attempts to analyze the characteristics of AI generated content (AIGC) represented by ChatGPT in the practical application of the publishing industry and compare it with the process characteristics of traditional manual operation, to analyze its advantages and disadvantages for the development trend of the construction of publishing core content, convergence of cross-media, and provision of knowledge services. The abilities and qualities that publishing practitioners should possess in the context of AIGC was concluded, promoting human-machine cooperation and the publishing industry to overcome technological constraints and achieve efficient development.
Keywords: AIGC; Editing and publishing; Publishing talent cultivation; Model innovation; Man-machine coordination