OpenAI，到底Open了什么？

2024-06-17 07:51:02菲力

看世界 2024年10期

菲力

人形機器人拿著畫筆站在畫架前進行創作，圖像由AI生成

生成式AI及背后的科技巨頭，正張著血盆大口，對古老的出版行業虎視眈眈。

今年4月，美媒爆出Facebook母公司Meta一份內部會議記錄，原來，早在一年前，Meta內部幾乎每天都開會討論如何獲取更多數據，來訓練人工智能模型。在這份文件中，公眾得以窺見科技巨頭如何看待書籍、知識和數據，以及其中隱含的微妙態度。根據會議記錄，Meta的生成式人工智能負責人Ahmad Al-Dahle告訴高管們，公司已經使用了互聯網上幾乎所有的英文書籍、詩歌和散文來訓練模型，因此正在尋找新的訓練材料來源。

他們清楚一點，AI在未經授權的情況下，已經窮盡了素材，如果要引用更多，必然意味著潛在的訴訟風險。律師指出了其中的道德問題，高管們卻沉默了。

其中一則錄音顯示，與會者討論收購全球五大出版商之一的美國西蒙與舒斯特公司（Simon&Schuster），或者以每本書10美元的價格，取得新書的全部授權。但方案未能落實，原因很簡單，相關的知識產權還是一片空白，AI還可以厚著臉皮肆無忌憚地挪用。

去年11月，加利福尼亞州聯邦法官文斯·查布里亞（Vince Chhabria）駁回眾多作家對Meta未經許可就用其書籍訓練AI的指控。這向他們傳遞了一個信息，在知識產權混亂的當下，還有灰色操作的余地。

但無可否認，當下，各大AI巨頭，正在為高質量文本的追逐蓄勢待發。擁有優質內容的傳統出版行業，正是其瞄準的目標。我們來到了一個關鍵的歷史節點，圍繞書籍這種人類引以為傲的智慧結晶，更多的撕扯、博弈將會展開。盡管科幻電影對AI的想象無窮無盡，但現實的發展還是超出了人們的預期。就像紐扣和紐扣洞、罐頭和開瓶器不是同時出現的，世界的格局不是一蹴而就的，在問題找到答案之前，難免經歷混亂與遐想、博弈與突圍。

Meta公司

美國西蒙與舒斯特公司

Epoch（人工智能研究機構）預測，到2026年，所有高質量可用數據都可能被耗盡。

巨人要求付費

“Word，你是個成熟的軟件了，該學會自己碼字了。”這話剛出口沒多久，鍵盤俠們還在為自己的幽默感沾沾自喜。OpenAI、ChatGPT和Sora、Midjourney的先后誕生，就一口氣取代了人們對Word、Excel和PPT的全部期待：自己碼字、自己統計數據，自己生成影像，甚至自己討好甲方。

一個人工智能領域的基本常識：AI不是生來就這么聰明的，不論ChatGPT還是OpenAI，模型只是模型。要使其具備可持續進化的智能，“數據堆肥”是關鍵的一步。在這一點上，人工智能和人的嬰兒時期是相似的，都要依靠外界的輸入，建立起自身最初的認知基礎。2022年11月，ChatGPT橫空出世，人工智能領域的數據饑渴被徹底引爆。快速成長中的人工智能對數據調用的需求，已經遠超科學家們的投喂速度—孩子嗷嗷待哺。

一年之后，《紐約時報》狀告OpenAI和微軟侵犯其版權，宣稱其出版的數百萬篇文章被用于訓練OpenAI旗下的聊天機器人。這些機器人作為人類社會新的信息來源，與新聞機構展開了直接競爭。《紐約時報》表示，如果新聞機構無法制作和保護獨立的新聞報道，將會造成AI無法填補的真空。此話不假。但更切實的理由是，人工智能站在巨人的肩膀上，卻沒向巨人付費。

第一個為“巨人”付費的公司是谷歌。2024年初，法國競爭管理局表示，谷歌在未經允許的情況下，使用了法國出版商和新聞機構的內容訓練大模型Gemini，對此處以2.5億歐元的罰款，由此結束了互聯網漫長時間以來免費的午餐。

Meta全球合作伙伴和內容副總裁Nick Grudin表示：“唯一阻礙我們達到ChatGPT水平的因素就是數據量。”流出的Meta內部會議記錄顯示，高層早就開始商議收購出版巨頭西蒙與舒斯特公司，以廉價獲取更多書籍、詩歌和文章來訓練旗下的人工智能產品。流出的資料還顯示，當時參會的成員中，有人曾表示在未經許可的情況下使用更多文本，哪怕有被起訴的風險，也是值得的。

約翰內斯·古騰堡正在檢查用活字印刷的樣張

這場毫無武德可言的現代戰爭正在進入白熱化。

即便如此，Epoch（人工智能研究機構）預測，到2026年，所有高質量可用數據都可能被耗盡。但屆時，人工智能可能已經在巨人肩膀上完成了自身從0到1的起步。這之后，就像人成年之后，一切經驗的取得得靠自己，而不是他人喂養。比如，由人工智能模仿人類生成文本，再用這些文本訓練人工智能的“合成數據”，似乎是一個可行的選擇。但也有研究人員表示，這些近親繁殖而來的數據，或許最終導致“哈布斯堡詛咒”，讓最終的輸出缺乏多樣性，讓偏見永遠是偏見。

古騰堡再革命

包括新聞機構、出版社在內的一大批傳統媒介，對待人工智能的態度不可謂不惶恐。新技術的出現有其蠻不講理的一面，但也有其勢不可擋的生命力的另一面。從印刷機到人工智能，歷史從不創新，只是一再重演。

讓我們回想15世紀，活字印刷機剛剛面世的時刻，約翰內斯·古騰堡將印刷生產能力從每小時5頁提升到25頁，使圖書得以廣泛普及，但也遭到了手抄員和教會的花式推諉。一直等到半個世紀之后，印刷機才被廣泛接受，并重塑了現代出版業。

美國伊利諾伊大學的學生Hart是古騰堡的后繼者之一。1971年，Hart獲得了學校材料研究實驗室中Xerox Sigma V大型計算機的使用權限，并預見計算機將會普及，于是決定將紙本書籍電子化，以供人們自由閱讀。很長一段時間內，西方文明中的文學作品、期刊，甚至比如樂譜之類的非文本作品，都是依靠“古騰堡計劃”的志愿者們手動錄入的。這一計劃不失為對文明遺產的一種存續與保護，但至于流傳和普及，“閱讀”仍是一個難以企及的門檻。

今天，古騰堡計劃中的60000本電子作品已經全部進入公域版權。麻省理工學院計劃運用AI生成語音，將其中5000本作品轉化為免費、開源的有聲書，以更便捷的方式提供給所有人，包括視障人士。這一回，得益于日新月異的人工智能技術，如今串接大型語言模型的有聲書呈現，已經能夠以低成本支援多種聲線，斷句與標點符號停頓，甚至音調、情緒等副語言，都與真人朗讀相差無幾。

2022年歐美科技大廠大裁員，導致大量科技人才擁入AI賽道，之后就迎來了2023年的AI大爆發。

有聲作品的接受門檻要比紙本低得多，某種程度上，這也是在與當今的新聞機構和出版社做競爭—競爭人們的注意力與時間。對此，出版從業者的做法是：打不過就加入，紛紛開發有聲產品，但人工配音的成本不可謂不高昂。2023年1月的世界數位圖書會議上，全球有聲內容負責人Bar-Kar表示，使用AI能夠協助出版業者以較低成本出版有聲書。若銷售狀況良好，出版業者可再次請真人配音員重新錄制有聲書。這種服務與合作的態度，顯然要比“不經允許直接挪用”得體許多。

這一切改變都指向一個結果：屬于21世紀的“古騰堡時刻”正在來到。很快，人們或許可以在家務的碎片時間里完成一部古典名著的閱讀。和15世紀的活字印刷一樣，知識的落差將再一次被抹平。

日本女作家九段理江

犯錯是一種高級智慧

如果說出版社和新聞機構面對人工智能的恐慌，還只是未能分得一杯羹的忿恨，那么創作者面臨被取代的威脅，存在的價值受到質疑，則是一種更深切的恐懼了。

說來也蹊蹺，2022年歐美科技大廠大裁員，導致大量科技人才擁入AI賽道，之后就迎來了2023年的AI大爆發。平面設計師、翻譯工作者、文案工作者甚至作家和畫家，人人自危。起點和終點，都是人類社會的智力再分配，過程中，每個個體都將重新思考關于價值的定義。

2024年初，在面對人工智能惶恐、迷茫、抵觸的暗流中，有一個聲音躍出水面。日本女作家九段理江憑借小說《東京都同情塔》獲得日本文學大獎芥川獎，作品中5%的文字直接取自現實中的生成式人工智能。九段理江表示，盡管人工智能表述的精準度仍不理想，但只要稍作調整，就可以很好地融入。質疑和贊許一樣洶涌，對錯沒有定論，唯一可以肯定的是，這絕不是人工智能第一次或最后一次介入人類的藝術創作。

中國的“AICG藝術家”陳哲，在使用Midjourney創作時也遇到了“不精準”的問題。他發現這位掌握了人類海量數據的賽博巨人不是那么好馴服的，偶爾也會產出一些奇奇怪怪的事物，比如三只手的人、長了羽毛的馬等。但陳哲認為，這種不精準恰是現階段AI眼中的物理世界的反映。何不讓這種天馬行空，成為藝術的一種？在那些描繪異想場域的作品中，AI的作用不僅是提高效率，而是作為創意者參與靈感的啟發。

在一次知識版權大會上，曾有觀眾請教律師：未來什么樣的技能，是人工智能難以取代人類的？律師道：背鍋。

雖是調侃，但換個角度解讀也不無道理。“錯誤”何嘗不是人類智力成果的一種特殊沉淀？它與想象力同源。深度學習本就是為了塑造一個從容量到性能有遠超人腦的超級智能，人類在機器擅長的領域過多踟躕并無益處。比如翻譯，不同語言之間的互相轉譯正在被人工智能全面取代，但要實現“信達雅”的理想仍脫離不了人類智力的再創造，而如果要翻譯詩，則需要再斟酌著去犯一些美麗的語法“錯誤”。

從版權劫掠到技術合作，再到創意啟發，以OpenAI為代表的人工智能新勢力，就像一個調皮的孩子，不停地拆著盲盒。但盲盒里的所有，無非是人性的放大器，幫助人類，再一次，向內打開。

特約編輯姜雯 jw@nfcmag.com