翟秀鳳
( 首都師范大學 文化研究院,北京,100089 )
AIGC(人工智能生成內容)已成為業界和學界的熱門議題。由于AIGC在創造性內容上的生成性,其對學術生產和出版的影響得到諸多研究者的關注。不過,現有研究主要聚焦于人工智能的技術可能性及其傳播倫理風險,較少將作為網絡內容經濟主體和生成性智能所有者的平臺作為關鍵主體加以探析。事實上,智能技術的實踐性恰恰來自于其與平臺內容經濟及其資本邏輯結合之后所引發的政治、經濟及社會效應?;诖?對AIGC與學術出版關系的分析,需要將前者置于其賴以發展的平臺經濟形態中,以厘清平臺內容經濟的發展邏輯如何介入知識生產過程及其產業模式。本文首先通過回溯UGC(用戶內容生產)到AIGC的內容產業脈絡,分析AIGC誕生的必然性。在此基礎上,探討平臺經濟何以依托其規則和技術優勢形成對學術出版產業的挑戰和風險,并嘗試沿著這一思路探討可能的治理進路。
平臺的內容生產機制經歷了從UGC、PGC(專業內容生產)、AI輔助內容生產到AIGC的演進歷程。在不同的發展階段,平臺選擇性地創造和調用不同的生產理念及運行模式,以適應其內容變現的原初目標?;仡欉@一歷程,將有助于理解算法迭代如何助推了平臺內容經濟的演進,并厘清平臺內容經濟所遵循的基本邏輯。
平臺內容經濟緣起于用戶的免費勞動和自發性參與。在平臺興起的初期,吸納和鼓勵用戶加入社交網絡,并迅速完成原始數據積累是平臺發展的首要目標。這一階段,以倡導參與式傳播為特征的UGC成為平臺發展的主流理念,與之伴隨的是一套以去中心化、反權威性和技術賦權為核心的主流話語。然而,隨著用戶體量和規模的上升,平臺迅速發現了以UGC為基礎的商業模式的內在悖論:散亂無章的用戶業余內容與商業營銷的明確需求之間的矛盾。一方面,平臺需要吸引大量用戶持續生產內容,以便積累用于營銷活動的數據;另一方面,“用戶生成的業余內容可能不像主流媒體商業內容那樣符合廣告的要求”(1)Andrejevic M, “Exploiting YouTube: Contradictions of user-generated labor”, The Youtube Reader, vol.413,No.36, 2009, pp.406-423.,因為廣告商需要的是與自身商業訴求相一致的專業內容。這一階段,平臺商業宣傳往往聚焦于用戶總數及其變現潛力,其本身數據挖掘和算法開發的能力仍十分有限。
在解決上述悖論的過程中,平臺內容經濟模式逐漸發生轉變:PGC成為平臺更為青睞的生產機制。傳統媒體生產機構(新聞機構、電視臺或其他影視制作機構)有更為專業的生產能力和對目標受眾的吸納能力。他們的入駐使傳統媒體影響力向平臺機構逐漸轉移,傳統媒體也試圖借此完成其數字化轉型和渠道拓展。然而,平臺很快洞察到以PGC為基礎的商業模式的新弊端:專業生產機構的數量和內容產量有限,無法面向平臺海量、多層次的用戶開展內容定制;同時,版權購買成本高,這極大地壓縮了平臺盈利的空間。在此階段,平臺已經著手挖掘用戶行為和消費數據,并開發出一系列用于內容變現的算法程序和營銷工具。鼓勵用戶對算法后臺和營銷工具的創新性使用,培養平臺原生的消費主義倡導者成為平臺的重要目標。
在此過程中,一批平臺原生的內容創作者開始涌現,并逐漸成為網絡影響力版圖中不可忽視的力量。他們既包括專注于新聞資訊和知識生產的自媒體內容創作者,也包括面向各個商業垂直領域的消費主義倡導者。為了提高網絡內容的變現效率,平臺開始積極促進AI輔助內容生產的推廣和擴散。這一階段,算法在平臺內容經濟中的角色主要可以概括為三個方面:一是內容需求分析,算法后臺工具用于分析目標受眾數據并提供內容定制的方向性建議;二是內容精準推送,通過推送算法使內容抵達目標受眾并提升用戶黏性和消費欲望;三是內容營銷變現,為內容生產者和用戶提供專門的后臺算法工具,用于匹配相應的廣告和營銷需求。至此階段,除了少數新聞機構和組織開始嘗試規范性文本的機器輔助撰寫(如體育新聞稿、實時地震資訊發布等)外,AI輔助內容生產主要體現在算法對用戶數據和分發渠道的挖掘,并未進入創造性內容生產的層面。
在以上過程中,算法對內容貨幣化的支持作用日趨顯著,平臺內容經濟的規模出現了爆發式增長,并產生了流量分成、打賞機制、版權轉化、網絡直播等新穎的盈利模式。不過,以上所有的算法仍然不具備創造性內容的產出能力,且均屬于傳統意義上的分析式算法(Analytical AI),即利用機器學習分析數據的分布特征,從而開展樣本分類、預測等任務。與其相比,新近的生成性人工智能(Generative AI)的運行邏輯與分析式算法則顯然不同。生成性AI不僅分析數據本身,更能夠學習數據的產生模式(如語言模型),因而能夠根據所學模型創作數據中并不存在的內容。例如,AIGC不僅能形成由原始素材拼湊而成的抽取式文本摘要,還能輸出生成性文本摘要,即在對文本形成抽象認識的基礎上創造新詞并靈活概括。
AIGC的出現是平臺大量資本投入和技術研發的結果,同時也是平臺內容經濟運行邏輯的必然產物。從UGC到AI輔助生產,算法雖然已經成為內容生產的基礎設施,但平臺對內容生產的主導性仍未能完全確立。這與平臺內容經濟希望全面占有信息資本生產要素(如數據、內容)的訴求產生了矛盾;與此同時,人工內容生產的相對低效和不穩定性,也限制了平臺對內容生產規模化的追求。正是在這些問題的驅動下,大型互聯網企業開始全面發力生成性人工智能。除了以微軟為代表的百億美元企業投資,風險投資也成為AIGC的主要資本來源。知名跨國投資機構紅杉資本近年來共投資50余家AIGC初創企業,僅文本生產領域就有20余家。在國內,百度、阿里、字節跳動等平臺持續押注AIGC,而美團對人工智能企業光年之外的21億元并購,更是成為迄今國內最大的AIGC投資。
隨著AIGC技術的不斷迭代,加之資本強勢介入所產生的收益訴求,網絡內容市場的盈利機制也會出現更新與調整:與AIGC直接相關的創作型內容產業會成為平臺重點投資的領域,其中的典型領域如學術出版產業將受到直接的沖擊和影響。
當然,這一趨勢并非平臺向學術出版領域的單向運動。事實上,學術出版業對平臺規則的主動適應已經成為顯著的趨勢。近年來,數字化轉型、平臺化轉型和知識服務功能轉型成為學術出版領域的突出表現,主要包括對數據畫像、內容評級等算法手段的引入(2)季丹:《數字時代國際出版業的平臺型商業模式研究》,《出版發行研究》2022年第3期。,以及對出版內容公眾接受度評價的重視(3)陳銘:《知識生產視域下的科學數據出版實踐——兼論學術出版商的角色定位與功能分析》,《科技與出版》2022年第12期。。這些探索與平臺內容經濟的運行邏輯有著內在一致性:在內容組織上,以平臺化方式重組信息,并希望借助智能算法介入內容傳播過程;在內容生產上,弱化對生產端專業主義價值的突出強調,強化對知識服務和受眾需求端的滿足;在內容評價上,要求提升信息更新的頻率,并引入對內容推廣的量化考核體系。
可以說,在AIGC出現之前,平臺內容經濟的一整套組織、生產和評價體系已經在持續影響和塑造著學術出版產業。而AIGC的出現無疑成為持續加速這一過程的催化劑。因此,對AIGC的思考不應局限于技術的倫理思辨或文化價值的悲情哀惋,更應該將其背后的平臺內容經濟納入分析視野。換言之,AIGC不僅僅是技術創新和產業融合問題,更是一個平臺內容經濟跨越其技術壁壘,邁入創造性勞動領域的重大轉折,由此帶來的知識生產和傳播的政治經濟問題值得深入討論。
自互聯網誕生以來,資本始終在尋求一種穩定、高質量的內容輸出能力:UGC不穩定的數量和參差不齊的質量、PGC的高成本和數量限制、早期Al輔助生產內容的低自動化、低智能化及其對人工監督的依賴等,都難以滿足資本對兼具數量、質量、效率的商業內容的迫切訴求。而在AIGC領域,技術和資本再次找到了一個兼具技術想象力和市場吸引力的結合點??梢哉f,AIGC技術的應運而生是全球互聯網資本面向其長期訴求開展大規模資源配置的結果。與此同時,平臺已經建構起一整套內容經濟的成熟的規則體系和運行機制(包括所有權屬界定、用戶積累方式、內容供給調節等)。隨著AIGC在創造性內容領域為平臺打開新的技術可能性,平臺將利用其規則建構和技術優勢,重塑學術生產和出版的運行邏輯。具體而言,其主要包括以下方面:
按照大型互聯網平臺的現有注冊協議,用戶在平臺注冊的賬號、發布的內容,其所有權、著作權、使用權均歸屬平臺所有,因此平臺有權對內容開展商業利用,對用戶開展算法測試,并有權對內容和賬號開展限流、屏蔽、封禁等一系列的操作。換言之,平臺作為網絡應用這一基礎設施的提供者,對在此應用上所生產的內容具有完全法律權限。這是平臺內容經濟得以運行和發展的基礎性優勢,也是信息資本現有運行機制中的關鍵一環。
按照此邏輯,如果用戶注冊平臺的賬號并使用平臺提供的AIGC工具進行內容生產,那么平臺就可以通過用戶協議獲得對這一內容的所有權、使用權和收益權。然而,這一訴求與傳統學術出版中對著作權主體(人類作者)的保護產生了顯著的權屬爭議和沖突?;谄脚_及其AIGC工具所產出的內容,究竟應該歸屬個體創作者所有還是平臺投資者所有?這一問題已經引發諸多爭論。
部分學者依據現有著作權的定義,對AIGC的“獨創性”持有堅決的否定論。這些學者認為,人工智能缺少直覺、靈感等思維要素(4)李俊:《論人工智能生成內容的著作權保護》,《甘肅政法學院學報》2019年第4期。,沒有作為精神與意識活動的創作過程、認知能力、主體性意識和內在人格基礎,因而不具備獨創性。讀者獲得的知識、思想和情感僅僅是人工智能工具運用算法規則進行模板化輸出和模仿的結果。(5)王遷:《論人工智能生成的內容在著作權法中的定性》,《法律科學(西北政法大學學報)》2017年第5期。此外,人工智能生成成果是依托文字、色彩、線條和符號等公共性資源生成的非稀缺性、非競爭性成果,為避免通過強力計算獲得大量數據并要求版權保護的“數據圈地”行為,AIGC成果不應受《著作權法》保護。(6)宋紅松:《純粹“人工智能創作”的知識產權法定位》,《蘇州大學學報(哲學社會科學版)》2018年第6期。
與之相對,有相當一部分學者倡議給予AIGC成果以著作權。這些學者認為,AIGC內容已經具有了與人類創作作品的“不可識別性”(7)吳雨輝:《人工智能創造物著作權保護:問題、爭議及其未來可能》,《現代出版》2020年第6期。和不依賴人類寫作的實踐過程,因而應對其著作權予以認定。有學者進一步建議按照分類保護的治理進路,對人工智能創作作品與傳統版權作品開展區分。該思路建議按照“老人老辦法,新人新辦法”的現實問題導向,為AIGC作品設置與傳統版權領域不同的判斷標準,以便在短期內達成維持傳統版權利益格局與保護新興產業利益的雙重目的,之后逐漸探索基于平臺參與的“特別許可市場”,從而實現著作權屬從“創作者所有”向“投資者所有”的轉變。(8)郭萬明:《人工智能生成成果的法律性質及著作權保護》,《出版發行研究》2022年第5期。
倡導對AIGC著作權以及投資者權利的認定,是在嘗試回應技術發展帶來的新變化。然而值得注意的是,這里所論及的“投資者”和“開發者”無疑主要集中在以大型平臺為代表的商業巨頭。因而,這些主張的本質是從數據財產保護的正當性視角來闡釋平臺占有AIGC成果的法律邏輯,進而為平臺AIGC成果確權。
然而,與確權傾向伴隨的是問責機制的嚴重滯后。一方面,AIGC并非自然人或法人,其無法對算法生成的成果承擔相應責任。如《科學》(Science)和《自然》(Nature)等頂級期刊仍然拒絕接受生成性工具產出的成果,其原因就在于智能工具無法承擔成果的真實性、準確性等一系列責任。另一方面,如何界定作為數據搜集者、算法開發者、算法所有者的大型互聯網平臺在生成性內容中所具有的社會責任,仍是一個懸而未決的問題。大型互聯網平臺兼具資本優勢和技術優勢。如果他們獲得對生成性內容的法律權力,也就獲得了相關資源配置和盈利模式的絕對主導權。相對來說,學術出版機構與個體作者的議價能力可能會被削弱,這與學術出版對創造性勞動保護的初衷背道而馳。
平臺內容經濟的核心邏輯是以用戶吸引和用戶積累為基礎,進而提高網絡內容的變現效率。如果平臺介入學術生產和出版,該領域將可能產生平臺算法工具下的一場關于技術開發能力和經濟投入的軍備競賽。
一方面,平臺會通過推廣AIGC工具迅速吸引一大批學術生產領域的用戶和使用者,從而沖擊高校和科研機構的現有運行規則。按照內容市場的一般運行機制,平臺希望通過用戶和數據量級的提升激發爆發式的飛輪效應,以便進一步提升模型準確性。飛輪效應指的是隨著用戶的增加,更多的數據能用于訓練更好的模型,而更好的模型能吸引更多用戶,如此循環往復。事實上,ChatGPT僅用了2個月就達到了1億用戶,而TikTok和Instagram達到該數量分別用9個月和2.5年。而ChatGPT的現有用戶中,很大比例來自于高校和科研機構,大量國內科研人員也已經下載并正在使用AIGC工具。
另一方面,平臺對AIGC的免費或低價推廣會迅速占領以高校學生為代表的學術預備群體,從而在人才培養和知識代際的層面弱化科研出版的價值。通過學術閱讀補充課程教育,從而完成自身的研究任務(如學術論文),是高校學生購買和閱讀學術出版物的直接原因。如今,AIGC帶來了科研投機的便利。美國北密歇根大學的教授在學生作業中發現了一篇關于世界宗教的“完美論文”,其語法幾乎無可挑剔,而這篇論文最終證明是由ChatGPT撰寫的。盡管不少高校已經明令禁止使用ChatGPT完成作業,但也有諸多高校正在將ChatGPT引入圖書館的工具庫中。快餐式的學術撰寫一旦成為合法化的常態,作為專業主義場域的學術生產便面臨著祛魅,其作為知識傳承和人文鏈接的價值也因此被消解,而基于此所形成的學術出版產業也必然面臨萎縮的可能。
一方面,規?;a可能會弱化學術成果的專業性和權威性。在低注意力持續時間和閱讀量大幅減少的趨勢下,AIGC所提供的高效的、淺表性的專業知識生成越來越與平臺倡導的信息服務邏輯趨于一致,以用戶信息定制和品味迎合為基礎的平臺信息服務與專業知識生產之間的界限進一步變得模糊。如今,社交媒體文章已經成為學術發表的重要引用來源之一。如果AIGC在自媒體內容生產中得到普及,那么按需定制的信息服務就可以以專業知識生產的面貌實現規?;纳a。不難想見,AIGC撰寫的文章之間還可以實現相互引用和對話。在此意義上,AIGC不僅會帶來剽竊民主化的風險,同時更會構成對學術知識獲取方式和知識理念的沖擊。在學術研究壁壘相對較低的學科,科研人員的智識積累將被迫與平臺的算法訓練成果開展比較,甚至陷入“專家不如AI”的輿論處境中。
另一方面,規?;a的便捷性會放大訓練數據中已有的社會偏見。人工智能所依賴的訓練數據缺乏公開性和社會監督,其不僅體現著開發者的價值觀念,也承載著數據本身的社會偏見。使用AIGC進行研究資料收集和撰寫,不僅直接受制于訓練數據集的選擇范圍,同時也會復制訓練過程中的偏見和歧視。這都會損害學術研究的客觀性和嚴謹性,降低學術成果的說服力。此類成果偏見一旦經過大眾傳媒的二次傳播和意義再生產,將會帶來大規模的社會關注、討論甚至網絡暴力。例如,曾有人用1.35億條仇恨言論信息訓練AIGC,隨后該AIGC模型在不到24小時內發布了超過1.5萬條網絡暴力網文,且在最初沒有人識別出這些內容來自AI。算法黑箱中的社會偏見一旦被學術成果引用并得以傳播,會天然獲得權威性和專業性的“背書”,因而也會對社會規范和倫理道德帶來更加深刻的危害和沖擊。
學術性內容是平臺一直以來試圖開發的垂直內容領域,平臺樂于使用“專家”的概念來獲取公眾的關注。學術背景和專家身份意味著信息的權威性,同時也是從內容權威到消費主義權威轉型的關鍵文化資本。各大平臺都注重推送專家在經濟政策解讀、金融知識普及、熱點知識科普等領域的內容,因為這些領域背后都對應著明確的受眾群體和消費趨向;而知乎平臺的興起以及嗶哩嗶哩網站大量學習型內容的爆發,同樣是對此類學術內容開發的結果。
AIGC垂直訓練是指在現有訓練的基礎上對任一學科領域開展強化訓練,對基礎模型和用戶體驗加以微調,從而產出面向特定受眾群體的垂直寫作助手,進而影響學術生產的供給結構。例如,近期已有國外學者使用ChatGPT完成專著或論文,并與AI聯合署名。(9)該書書名為“Impromptu:Amplifying Our Humanity Through AI”(《即興表演:通過人工智能放大我們的人性》)。該書共計223頁,分為10個章節。作者Reid Hoffman與ChatGPT聯合署名。又如,谷歌訓練的醫學語言模型Med-PaLM 2已經通過美國醫學執照考試,且在85%的情況下給出醫學專家級回答。(10)Michael DePeau-Wilson, Google AI Performs at ’Expert’ Level on U.S. Medical Licensing Exam, Retrieved from https://www.medpagetoday.com/special-reports/exclusives/103522, March 14, 2023.事實上,在對馬克思、法農、葛蘭西等人的著作進行簡單學習后,ChatGPT很快便習得有關資本主義和工人運動的批評話語,并在回答中“呼喚一場反對帝國主義控制的革命”(11)Mohamad Ali Nasser, How this AI became a communist,Retrieved from https://towardsdatascience.com/how-this-a-i-became-a-communist-ddf9146bc147, March 27, 2020.。
以往學術熱點的生成和學術議程的設置,往往是學術共同體驅動下政策助推、市場需求和研究路徑依賴所共同塑造的結果。(12)李二斌:《學術熱點的生成機制及應對策略研究——基于期刊的視角》,《出版發行研究》2022年第8期。這是一個需要耗費時間、并開展充分協商的過程。未來,如果大型互聯網平臺針對學術群體開發出AIGC寫作模型,并以開放獲取方式為這些AIGC成果提供網絡傳播渠道,學術內容供給結構和學術熱點生成機制的改變將不可避免,這也將進一步沖擊傳統學術出版所擁有的渠道價值和壟斷優勢。當然,平臺的熱點制造邏輯絕非出于科研潛力和社會價值,而往往是基于內容炒作的經濟價值和變現價值:病毒性傳播價值和“熱搜潛質”將成為平臺在制造和炒作學術論點時的重要判斷標準。
基于以上分析可以看到,平臺內容經濟已經形成了一套基于所有權屬界定、用戶吸納積累和內容供給調節的商業運行邏輯。通過用戶協議、免費推廣和技術工具開發,這套運行機制能夠迅速被植入相關的內容產業中。傳統的學術出版通?;趯热輨撟髡邫鄬俸蛡€體積極性的保護,強調對學術共同體的建構而弱化對大眾用戶的吸引,強調特定領域的專業主義培養而非對速成內容生成的追求。然而,隨著AIGC工具的完善,平臺將會迅速推進以工具理性所驅動的內容盈利目標,以便加速生成性內容的商業化。技術的迭代、加之資本的強勢介入和收益訴求,可能在學術出版市場引發劣幣驅除良幣的溢出效應,并加劇和催生更多的學術黑灰產業。
首先,一批以AIGC為工具的寫手會迅速進入學術生產場域,挑戰研究者以長年學歷教育和學術訓練建構起來的文化資本。學術成果交易可能會成為更大規模的市場。在傳統學術出版中,“槍手”代筆一直是難以根除的行業痼疾。以往,由于受限于“槍手”的學術水平、人工寫作速度相對有限以及國家對代筆產業的打擊,這一灰色產業面臨著顯著的質量挑戰和法律風險。AIGC的出現將可能帶來一批隱藏在算法黑箱背后的“槍手”,而在屏幕背后發送指令的他們難以被現行法規所限制,也難以被學術編輯所察覺和識別。生成性人工智能在創作型內容方面的顯著提升,無疑也給學術黑灰產業帶來了技術迭代的可能。
其次是學術“造假”和“洗稿”的風險大大增加。學術投機的便捷性將會弱化科研工作的創新動力,引發學術不良競爭,并直接挑戰現行的學術把關和出版機制?!跋锤濉敝傅氖峭ㄟ^對文本用語的技術性改寫,復制原文的觀點,規避以原文重合度為基礎的抄襲侵權風險。在社交媒體上,“洗稿”而成的論文甚至比原文獲得的影響力和關注度要大得多?,F有AIGC技術已經具備文本“洗稿”的絕對能力,甚至可以實現實時“竊取”學術觀點并謀求發布。對原創者而言,論證自身成果的原創性、首發性和“洗稿”成果的侵權性十分困難。此外,AIGC能夠基于專有語料庫的模型微調,完成對人類作者寫作風格的復制,甚至能根據觀點需要生成深度假文本(如以假亂真的假引文和假參考文獻(13)Day T, “A preliminary investigation of fake peer-reviewed citations and references generated by ChatGPT”, The Professional Geographer, 2023, pp.1-4.)。不僅如此,AIGC還可以尋找邏輯漏洞,按照作者的意圖進行遞歸循環(反復修改),從而最終收斂至人類滿意的輸出結果。而人類在此過程中僅需要承擔指令發送和文本潤色等輔助性功能。換言之,在無須通過大量閱讀占有研究資料的情況下,僅憑對算法工具的利用,人類作者即可收獲一篇內容尚佳的論文。而人類編輯卻很難通過人工方式甄別其作者構成的狀況。算法工具的投機性一旦被高效濫用,獨立思考和深度研究的性價比會大大降低,科研積累和科研創新的環境也會因此惡化。長遠來看,這不僅會打擊科研人員的學術積極性,也會傷及學術生產和學術出版賴以生存的倫理追求。
盡管互聯網平臺的興起曾長期引發對傳統媒體至暗時刻的討論,但就學術出版而言,其內容創造性和發表渠道的壟斷性使其自身保持著相對獨立的文化場域,并為學術研究保留了較為充分的探索空間和產出時間。在過去相當長的時間內,學術生產、審核和出版發表遵循著專業主義的范疇。發表主體一般須為經過高等教育并經過專門學術訓練的研究者,他們在一定程度上壟斷或優先享有學術發表的渠道。渠道的相對壟斷和發表主體的身份門檻設定使學術發表保持了一定的獨立性,而學術生產和文章刊發的相對長周期也緩解了研究者的產量焦慮。這一運行模式給知識分子的批判性思維和創作過程以相對充分的空間。
然而,平臺內容經濟的擴張與AIGC工具的興起,即時的、大篇幅的、媲比人類表達的文本生產將成為可能,這些功能將被嵌入文本的規劃、起草、修改、發表、傳播之中,以極致化的工具理性沖擊知識分子的價值理性和文化資本。這將使研究者開始面臨行動和理念的猶疑:知識生產是一種沉淀于時間的厚積薄發和價值理性,還是立足于前沿技術的高效產出和工具理性?更為重要的是,平臺對創造性知識成果的占有訴求、強大的用戶吸納能力、高效的算法工具開發能力,及其對量化評價和盈利效率的強調,都會通過其產業布局及算法工具介入學術出版產業中,對學術寫作、發表和出版這一傳統創造性活動及其運行規則形成顯著的挑戰。
面對工業和科技的巨大進步,馬克思曾在1856年《人民報》創刊紀念會上談到,“我們的所有發明和進步,似乎都賦予物質力量以智慧,而使人類的生命鈍化為物質力量”,這種技術的巨大進步和社會頹廢的征兆正同時發生并構成了19世紀的特點和“偉大事實”。(14)Karl Marx, Speech at Anniversary of the People’s Paper, 1856, Marx/Engels Selected Works, Vol.1, Moscow: Progress Publishers, 1969, p.500.面對無孔不入的人工智能對社會的系統性影響,馬克思的話語尤為振聾發聵。近期,已有多所高校學生在校園網發起倡議,要求學校圖書館引進生成性智能技術。AIGC越是被如此迅速地接受和使用,其可能帶來的文化價值風險越是迫切需要警惕和分析。
在以往的研究中,平臺作為內容經濟主體和AIGC產業鏈上游的角色尚未得到充分討論,使得現有治理思路集中于產業鏈的下游而缺乏全面性。作為典型的文化產業,學術出版需要直面平臺內容經濟邏輯通過AIGC向自身領域滲透的現實。這一過程絕不僅是出版業主動謀求數字轉型和媒體融合的過程,而可能是來自平臺的釜底抽薪式的反噬;著作權也絕不僅是通過分類治理的權宜之計就能化解的權屬問題,而必然是平臺資本、傳統學術出版業、科研群體、政府公共力量等利益相關方博弈和角力的場域。因此,對AIGC介入學術出版產業的治理,既要將平臺作為關鍵主體納入考慮,也要重視以多主體協同、技術性應對、全球性合作、法律-道德雙重監督的思路開展應對。
首先,只有從平臺的內部機制和商業邏輯入手,算法的解碼才具有可能性。人工智能算法并非一成不變、觸不可及的黑箱。盡管其具有隱蔽性、動態性及不可回溯性,但平臺為算法所制定的績效評價體系和預期商業目標卻有著高度的可見性、連續性和穩定性,并直接體現為平臺產品的某種功能。即便監管者無法窺見黑箱內部的結構,仍然可以通過考察其用戶協議和商業模式的合法性來解碼其運行機理和價值導向。(15)胡凌:《人工智能視閾下的網絡法核心問題》,《中國法律評論》2018年第2期。面對可能的學術剽竊和技術濫用,AIGC的開發平臺需要秉持基本的社會責任,推動算法的開源和透明,使AIGC對自身產出的成果給出權威性的來源說明。在學術出版等對知識產權保護要求嚴格的領域,應該嘗試推行AIGC內容的唯一識別碼。
其次,要以著作權界定為核心,盡快推進AIGC的權責界定研究和法律體系建設。著作權是出版業的核心資產和行業基石,無法對著作權進行清晰、準確、高效的界定將直接影響學術出版業的運行。其一,要推進AIGC著作權界定的跨專業研討和分析。AIGC著作權界定涉及計算機科學、法學、編輯出版學等諸多學科。各學科專家需要以協同科研的方式開展研判,借鑒各國前沿的人工智能治理方案,推進界定的合法性、合理性和可行性。其二,要以AIGC著作權案例的司法實踐為基礎,增加AIGC指導性案例的效力和數量。(16)方卿、丁靖佳:《人工智能生成內容(AIGC)的三個出版學議題》,《出版科學》2023年第2期。這既需要在AIGC著作權案例中審慎處置,構建可行的判決標準,也需要以相關判例為基礎,盡快建立可推廣性的判決經驗和案例指導。其三,在著作權界定過程中,要從數據權屬和內容經濟的運行機制出發,對人類作者、網絡平臺、出版機構等主體的權力和義務進行明確區分和界定。
再次,學術出版機構應積極作為,開展以技術駕馭技術的必要應對。一方面,學術出版機構應嘗試綜合國內外經驗,對AI工具的使用規范加以明確,通過行業協會的形式發布相關倡議;另一方面,開發和引進公共性的、第三方的AIGC甄別工具同樣重要。目前,國外的GPTZero、Plagibot等工具已經能夠對人工智能生成內容進行一定程度的甄別,但相關工具主要集中在英文內容領域,且均為私有資本所持有。毋庸置疑,類似檢測技術的發展迫切需要公共力量的扶持和關注。公共力量通過與學術出版機構的密切協作實現技術突破,有助于建立服務于公共利益的技術防范體系,防止AIGC甄別技術長期落后于商業AI的開發過程。
復次,要以AIGC為契機,建立作者、學術出版機構、高??蒲性核餐瑓⑴c的AIGC誠信共識和問責機制。一是倡導作者的誠實披露。學術成果的發表者必須明確表明自身使用何種工具、使用了哪些生成性內容,以及這些內容所依托的原始引用來源。對引用來源的基本尊重是學術規范性的基礎。二是建立AI濫用的問責和懲罰機制。由于AI工具的易獲得性,對工具的禁絕缺乏現實可行性,因而對濫用者的規則威懾顯得尤為重要?;谛袠I基本共識和道德要求,有必要建立“一處失信、處處受限”的科研負面清單。對于拒絕披露、刻意隱瞞、內容剽竊、學術洗稿等行為,要建立針對性、分層次的學術準入限制,以及期刊發文限制、同行風險預警等失信懲罰機制。三是高校和科研院所應積極開展有關AIGC的倫理科普、宣傳和教育。針對科研人員與高校學生的具體使用場景,從日常教學、人才培養、科研管理、成果評價等多方面制定針對性的使用規范,以便建立從學術生產、學術管理、學術把關到學術出版全流程的倫理倡議和行為約束。四是依托跨國合作建設倫理規范和監管機制。聯合國教科文組織發布的《人工智能倫理問題建議書》(Recommendation on Ethics of AI)和中共中央辦公廳、國務院辦公廳印發的《關于加強科技倫理治理的意見》已經給出了宏觀方向的人工智能技術指引。但具體到學術出版業,還需要在共性框架下制定具體的開發倫理、行動指南、應用場景、監管機制和懲罰舉措,以警惕AIGC技術邏輯和資本邏輯對出版文化建構邏輯的“蠶食”。(17)方卿、丁靖佳:《人工智能生成內容(AIGC)的三個出版學議題》,《出版科學》2023年第2期。
最后,AIGC產業同時也是一個平臺參與下的學術出版國際競爭場域。與之相伴隨的學術話語權爭奪、科技創新能力與創新機制、以及更為深入的意識形態和文化安全問題,迫切需要得到關注和重視。以往,推特、臉書等平臺在篩選和推送涉華內容時,往往通過算法優先曝光涉華負面內容,這種意識形態滲透已經成為西方大型互聯網企業的常規操作。當前,以微軟、谷歌為代表的企業在AIGC開發中具有顯著的壟斷性和先發優勢,其訓練數據則主要取自代表西方主流意識形態的內容。由于算法的隱蔽性,這種訓練過程和意識形態偏見并不為使用者所知,其產出內容中所帶有的價值偏向也因而被掩蓋了。這給我國出版業的文化安全和把關責任帶來了新的挑戰和風險。打破西方企業在英文AIGC領域的壟斷性局面,培育具有國際領先水平的中文AIGC生成工具,并將中國文化和中國理念納入相關語言學習模型中,避免國外平臺的AIGC工具所帶來的系統性偏見、文化刻板印象和意識形態歧視,這是構建以我為主的人工智能產業所需要面對的問題。
從UGC到AIGC的發展過程可以看到,AIGC并非科技力量的突變和驟然創造,而是內生于平臺內容經濟發展軌跡的必然產物。而平臺及其AIGC正試圖以其內容經濟運行規則挑戰和塑造以學術出版為代表的創造性內容領域。因此,探索其治理邏輯,需要回歸平臺內容經濟的運行規則和具體過程,從技術演進和經濟邏輯中探尋思路。與此同時,這一復雜議題既需要研究主體的跨學科合作和各利益相關方的深度協同,也需要超越國界的全球視野和治理努力。只有這樣,才能避免資本主義追求無限商業變現的動力將AI帶向與社會文化福祉背道而馳的方向。