菲力

人形機器人拿著畫筆站在畫架前進行創作,圖像由AI生成
生成式AI及背后的科技巨頭,正張著血盆大口,對古老的出版行業虎視眈眈。
今年4月,美媒爆出Facebook母公司Meta一份內部會議記錄,原來,早在一年前,Meta內部幾乎每天都開會討論如何獲取更多數據,來訓練人工智能模型。在這份文件中,公眾得以窺見科技巨頭如何看待書籍、知識和數據,以及其中隱含的微妙態度。根據會議記錄,Meta的生成式人工智能負責人Ahmad Al-Dahle告訴高管們,公司已經使用了互聯網上幾乎所有的英文書籍、詩歌和散文來訓練模型,因此正在尋找新的訓練材料來源。
他們清楚一點,AI在未經授權的情況下,已經窮盡了素材,如果要引用更多,必然意味著潛在的訴訟風險。律師指出了其中的道德問題,高管們卻沉默了。
其中一則錄音顯示,與會者討論收購全球五大出版商之一的美國西蒙與舒斯特公司(Simon&Schuster),或者以每本書10美元的價格,取得新書的全部授權。但方案未能落實,原因很簡單,相關的知識產權還是一片空白,AI還可以厚著臉皮肆無忌憚地挪用。
去年11月,加利福尼亞州聯邦法官文斯·查布里亞(Vince Chhabria)駁回眾多作家對Meta未經許可就用其書籍訓練AI的指控。這向他們傳遞了一個信息,在知識產權混亂的當下,還有灰色操作的余地。
但無可否認,當下,各大AI巨頭,正在為高質量文本的追逐蓄勢待發。擁有優質內容的傳統出版行業,正是其瞄準的目標。我們來到了一個關鍵的歷史節點,圍繞書籍這種人類引以為傲的智慧結晶,更多的撕扯、博弈將會展開。盡管科幻電影對AI的想象無窮無盡,但現實的發展還是超出了人們的預期。就像紐扣和紐扣洞、罐頭和開瓶器不是同時出現的,世界的格局不是一蹴而就的,在問題找到答案之前,難免經歷混亂與遐想、博弈與突圍。

Meta公司

美國西蒙與舒斯特公司
Epoch(人工智能研究機構)預測,到2026年,所有高質量可用數據都可能被耗盡。
“Word,你是個成熟的軟件了,該學會自己碼字了。”這話剛出口沒多久,鍵盤俠們還在為自己的幽默感沾沾自喜。OpenAI、ChatGPT和Sora、Midjourney的先后誕生,就一口氣取代了人們對Word、Excel和PPT的全部期待:自己碼字、自己統計數據,自己生成影像,甚至自己討好甲方。
一個人工智能領域的基本常識:AI不是生來就這么聰明的,不論ChatGPT還是OpenAI,模型只是模型。要使其具備可持續進化的智能,“數據堆肥”是關鍵的一步。在這一點上,人工智能和人的嬰兒時期是相似的,都要依靠外界的輸入,建立起自身最初的認知基礎。2022年11月,ChatGPT橫空出世,人工智能領域的數據饑渴被徹底引爆。快速成長中的人工智能對數據調用的需求,已經遠超科學家們的投喂速度—孩子嗷嗷待哺。
一年之后,《紐約時報》狀告OpenAI和微軟侵犯其版權,宣稱其出版的數百萬篇文章被用于訓練OpenAI旗下的聊天機器人。這些機器人作為人類社會新的信息來源,與新聞機構展開了直接競爭。《紐約時報》表示,如果新聞機構無法制作和保護獨立的新聞報道,將會造成AI無法填補的真空。此話不假。但更切實的理由是,人工智能站在巨人的肩膀上,卻沒向巨人付費。
第一個為“巨人”付費的公司是谷歌。2024年初,法國競爭管理局表示,谷歌在未經允許的情況下,使用了法國出版商和新聞機構的內容訓練大模型Gemini,對此處以2.5億歐元的罰款,由此結束了互聯網漫長時間以來免費的午餐。
Meta全球合作伙伴和內容副總裁Nick Grudin表示:“唯一阻礙我們達到ChatGPT水平的因素就是數據量。”流出的Meta內部會議記錄顯示,高層早就開始商議收購出版巨頭西蒙與舒斯特公司,以廉價獲取更多書籍、詩歌和文章來訓練旗下的人工智能產品。流出的資料還顯示,當時參會的成員中,有人曾表示在未經許可的情況下使用更多文本,哪怕有被起訴的風險,也是值得的。

約翰內斯·古騰堡正在檢查用活字印刷的樣張
這場毫無武德可言的現代戰爭正在進入白熱化。
即便如此,Epoch(人工智能研究機構)預測,到2026年,所有高質量可用數據都可能被耗盡。但屆時,人工智能可能已經在巨人肩膀上完成了自身從0到1的起步。這之后,就像人成年之后,一切經驗的取得得靠自己,而不是他人喂養。比如,由人工智能模仿人類生成文本,再用這些文本訓練人工智能的“合成數據”,似乎是一個可行的選擇。但也有研究人員表示,這些近親繁殖而來的數據,或許最終導致“哈布斯堡詛咒”,讓最終的輸出缺乏多樣性,讓偏見永遠是偏見。
包括新聞機構、出版社在內的一大批傳統媒介,對待人工智能的態度不可謂不惶恐。新技術的出現有其蠻不講理的一面,但也有其勢不可擋的生命力的另一面。從印刷機到人工智能,歷史從不創新,只是一再重演。
讓我們回想15世紀,活字印刷機剛剛面世的時刻,約翰內斯·古騰堡將印刷生產能力從每小時5頁提升到25頁,使圖書得以廣泛普及,但也遭到了手抄員和教會的花式推諉。一直等到半個世紀之后,印刷機才被廣泛接受,并重塑了現代出版業。
美國伊利諾伊大學的學生Hart是古騰堡的后繼者之一。1971年,Hart獲得了學校材料研究實驗室中Xerox Sigma V大型計算機的使用權限,并預見計算機將會普及,于是決定將紙本書籍電子化,以供人們自由閱讀。很長一段時間內,西方文明中的文學作品、期刊,甚至比如樂譜之類的非文本作品,都是依靠“古騰堡計劃”的志愿者們手動錄入的。這一計劃不失為對文明遺產的一種存續與保護,但至于流傳和普及,“閱讀”仍是一個難以企及的門檻。
今天,古騰堡計劃中的60000本電子作品已經全部進入公域版權。麻省理工學院計劃運用AI生成語音,將其中5000本作品轉化為免費、開源的有聲書,以更便捷的方式提供給所有人,包括視障人士。這一回,得益于日新月異的人工智能技術,如今串接大型語言模型的有聲書呈現,已經能夠以低成本支援多種聲線,斷句與標點符號停頓,甚至音調、情緒等副語言,都與真人朗讀相差無幾。
2022年歐美科技大廠大裁員,導致大量科技人才擁入AI賽道,之后就迎來了2023年的AI大爆發。
有聲作品的接受門檻要比紙本低得多,某種程度上,這也是在與當今的新聞機構和出版社做競爭—競爭人們的注意力與時間。對此,出版從業者的做法是:打不過就加入,紛紛開發有聲產品,但人工配音的成本不可謂不高昂。2023年1月的世界數位圖書會議上,全球有聲內容負責人Bar-Kar表示,使用AI能夠協助出版業者以較低成本出版有聲書。若銷售狀況良好,出版業者可再次請真人配音員重新錄制有聲書。這種服務與合作的態度,顯然要比“不經允許直接挪用”得體許多。
這一切改變都指向一個結果:屬于21世紀的“古騰堡時刻”正在來到。很快,人們或許可以在家務的碎片時間里完成一部古典名著的閱讀。和15世紀的活字印刷一樣,知識的落差將再一次被抹平。

日本女作家九段理江
如果說出版社和新聞機構面對人工智能的恐慌,還只是未能分得一杯羹的忿恨,那么創作者面臨被取代的威脅,存在的價值受到質疑,則是一種更深切的恐懼了。
說來也蹊蹺,2022年歐美科技大廠大裁員,導致大量科技人才擁入AI賽道,之后就迎來了2023年的AI大爆發。平面設計師、翻譯工作者、文案工作者甚至作家和畫家,人人自危。起點和終點,都是人類社會的智力再分配,過程中,每個個體都將重新思考關于價值的定義。
2024年初,在面對人工智能惶恐、迷茫、抵觸的暗流中,有一個聲音躍出水面。日本女作家九段理江憑借小說《東京都同情塔》獲得日本文學大獎芥川獎,作品中5%的文字直接取自現實中的生成式人工智能。九段理江表示,盡管人工智能表述的精準度仍不理想,但只要稍作調整,就可以很好地融入。質疑和贊許一樣洶涌,對錯沒有定論,唯一可以肯定的是,這絕不是人工智能第一次或最后一次介入人類的藝術創作。
中國的“AICG藝術家”陳哲,在使用Midjourney創作時也遇到了“不精準”的問題。他發現這位掌握了人類海量數據的賽博巨人不是那么好馴服的,偶爾也會產出一些奇奇怪怪的事物,比如三只手的人、長了羽毛的馬等。但陳哲認為,這種不精準恰是現階段AI眼中的物理世界的反映。何不讓這種天馬行空,成為藝術的一種?在那些描繪異想場域的作品中,AI的作用不僅是提高效率,而是作為創意者參與靈感的啟發。
在一次知識版權大會上,曾有觀眾請教律師:未來什么樣的技能,是人工智能難以取代人類的?律師道:背鍋。
雖是調侃,但換個角度解讀也不無道理。“錯誤”何嘗不是人類智力成果的一種特殊沉淀?它與想象力同源。深度學習本就是為了塑造一個從容量到性能有遠超人腦的超級智能,人類在機器擅長的領域過多踟躕并無益處。比如翻譯,不同語言之間的互相轉譯正在被人工智能全面取代,但要實現“信達雅”的理想仍脫離不了人類智力的再創造,而如果要翻譯詩,則需要再斟酌著去犯一些美麗的語法“錯誤”。
從版權劫掠到技術合作,再到創意啟發,以OpenAI為代表的人工智能新勢力,就像一個調皮的孩子,不停地拆著盲盒。但盲盒里的所有,無非是人性的放大器,幫助人類,再一次,向內打開。
特約編輯姜雯 jw@nfcmag.com