劉瑞生 韓博
摘 要:2022年11月,美國公司OpenAI推出的ChatGPT火爆全球,這款聊天機器人程序成為有史以來用戶增長最快的網(wǎng)絡應用。“橫空出世”的ChatGPT具有標桿性的意義:作為通用人工智能領域的“破土性”應用,它已經(jīng)具備與人類深度交互并進行“仿人”甚至“超人”創(chuàng)作的特質(zhì);作為第一款大規(guī)模商業(yè)化的通用人工智能應用,ChatGPT具備了將人工智能技術深度“嵌入”網(wǎng)絡應用的潛質(zhì)。隨著技術的進階和各種類ChatGPT的不斷推出,引發(fā)整個數(shù)字產(chǎn)業(yè)鏈的新一輪博弈。人工智能技術將加速向社會擴散,將在與人的“鏈接”和與社會的相互建構中演進,深化“交融”效應,引發(fā)傳播變革。
關鍵詞:人工智能 ChatGPT 技術特質(zhì) 傳播影響
人工智能,被視為未來經(jīng)濟社會發(fā)展的新引擎,是當今主要國家競相發(fā)展的“戰(zhàn)略高地”,也是諸多高科技企業(yè)激烈博弈的前沿技術。隨著移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、算法等技術的不斷升級迭代,近年來“智能”亦開始成為新媒體的一種“浸入性”要素,以至于有學者呼喚“智媒”時代的來臨。[1]不過,人工智能技術雖然不斷演進和迭代,但更多是作為專用人工智能領域而停留于“幕后”的研發(fā)階段,抑或成為主流平臺輔助應用的“配角”,在通用人工智能領域并未出現(xiàn)有突破創(chuàng)新性功能而產(chǎn)生擴散效應的“爆款”應用。
然而,美國人工智能公司OpenAI開發(fā)的一款人工智能聊天機器人ChatGPT,則徹底打破了這一局面,讓通用人工智能技術徹底“浮出水面”。ChatGPT自上線后迅速火爆全網(wǎng),其獨特的功能吸引了全球關注,用戶數(shù)量迅速破億,一些平臺企業(yè)亦紛紛表示將步其后塵推出類ChatGPT應用。ChatGPT,成為當下新媒體領域最熱的話題。本文將梳理ChatGPT的發(fā)展歷程和技術特質(zhì),解析ChatGPT何以能“嵌入”新媒體生態(tài),展望ChatGPT將引發(fā)數(shù)字產(chǎn)業(yè)鏈的“擴散”效應,以及ChatGPT對傳播與社會的“交融”性影響。
一、“破土”:ChatGPT的技術演進與特質(zhì)
2022年11月30日,美國人工智能公司OpenAI開發(fā)的人工智能聊天機器人ChatGPT正式上線。盡管在形式上只是一款至簡的聊天機器人程序,但功能強大的ChatGPT卻是人工智能技術“厚積”數(shù)十年而“破土”的應用,它積淀著人工智能的底層技術,濃縮著人工智能的發(fā)展特質(zhì),是人工智能領域集大成的頂級應用,標志著人工智能技術在“強”方面的突破性進展。
1.技術實質(zhì):“強”人工智能的突破性新應用
聊天機器人(chatbot)實際上是人工智能技術早就開始探索的領域,較典型的代表如1966年的ELIZA和1972年的PARRY。2016年,Skype、Line、Facebook等平臺亦開始引入了聊天機器人程序。隨后,類似的聊天機器人以彈窗類應用或虛擬助手、智慧助手等小程序形式開始廣泛進入商業(yè)、教育、娛樂、金融、健康、新聞等領域。這些聊天機器人,雖能與用戶進行簡單對話并能完成一些指令性操作,但由于智能程度不高被用戶趣稱為“智障”,只能作為手機、網(wǎng)絡平臺的輔助性“配角”。
ChatGPT則是一款以“主角”身份出現(xiàn)的聊天機器人程序,其全稱為聊天生成預訓練轉換器(Chat Generative Pre-trained Transformer)。與以往的“聊天機器人”相比,ChatGPT在形式上相似,是一款可以模仿人類對話者和用戶進行互動交流的獨立程序,但在技術底層和功能上差異較大。ChatGPT基于最高階架構的大型語言模型,并歷經(jīng)多年深度學習強化訓練,在智慧上已經(jīng)類似于人類,具備極其強大的功能。由于對人類意圖的高識別率和理解的高精準度,ChatGPT能夠通過學習和理解人類的語言來和注冊用戶進行對話互動,它能更精準地理解用戶意圖及實現(xiàn)類人的回復,能更精確、更加可控地完成撰寫郵件、視頻腳本、代碼、菜譜、詩歌、音樂、小說、商業(yè)計劃書、童話故事和論文等各類文字輸出型任務,甚至在人類的合適引導下可以完成邏輯推理、新知識快速學習等復雜任務。
簡單來說,人工智能技術可以劃分為專用人工智能和通用人工智能。專用人工智能主要針對具體領域專業(yè),其相對任務單一、需求明確、建模簡單、應用邊界清晰;通用人工智能(Artificial General Intelligence,AGI),也稱為強人工智能(Strong Artificial Intelligence),是真正意義上完備的人工智能系統(tǒng)。[2]新世紀之后,互聯(lián)網(wǎng)技術雖然大大推動了人工智能技術的創(chuàng)新性和應用性,但主要是在專用人工智能領域取得了較大突破,而在通用人工智能方面卻處于探索階段。ChatGPT的出現(xiàn),使得人工智能真正進入到“強”的發(fā)展階段。
2.發(fā)展程度:頂級人工智能技術的集大成者
作為通用人工智能第一個“爆款”應用,ChatGPT可謂當前世界科技巨頭和頂級技術的集成。
ChatGPT背后的三項底層基礎技術為開源框架、算法模型、編譯器,經(jīng)美國人工智能公司歷練多年。在語言模型的三個重要組成部分方面,即算力、數(shù)據(jù)、算法上,ChatGPT亦占有軟件和硬件的優(yōu)勢。
算力是支撐背后大語言模型訓練的硬件基礎,而OpenAI公司的背后是科技巨頭微軟。微軟2019年向OpenAI公司投資10億美元,并與OpenAI公司獨家合作打造了一臺性能位居全球前五,擁有超過28.5萬個CPU核心、1萬塊英偉達V100GPU、每塊GPU擁有400Gbps網(wǎng)絡帶寬的超級計算機——Azure AI超算平臺。[3]
數(shù)據(jù)是影響模型能力強弱甚至生成質(zhì)量的關鍵。在數(shù)據(jù)層面,從2018年起,OpenAI就開始發(fā)布生成式預訓練語言模型GPT,在第三代模型(GPT-3)的數(shù)據(jù)訓練量就達到45TB,參數(shù)量達到了1750億,因此,無論在訓練時間還是模型的量級來說,ChatGPT都建立了極大優(yōu)勢。
算法則包括模型架構和優(yōu)化方法,決定著模型的核心技能。ChatGPT本質(zhì)上是一個由浮點數(shù)參數(shù)表示的深度神經(jīng)網(wǎng)絡大模型,仍然屬于深度學習算法的框架,而深度學習作為人工智能的主流算法,自2006年被提出,在美國已經(jīng)發(fā)展了17年。ChatGPT的算法訓練非常重視真實世界數(shù)據(jù)的調(diào)用,并通過這些數(shù)據(jù)對模型進行迭代,進而不斷提高其人工智能水平,并形成了獨特的算法生態(tài)體系。
由于在算力、數(shù)據(jù)和算法方面有美國科技巨頭和頂級技術的支撐,ChatGPT成功“出圈”。
3.歷史演進:濃縮人工智能發(fā)展特質(zhì)的應用
ChatGPT雖一日爆紅,卻是美國人工智能多年積淀的結果。現(xiàn)代人工智能的概念自1956年被提出后,在美國已經(jīng)發(fā)展了將近70年。其中,大多數(shù)人工智能領域難以付諸大規(guī)模商用,屬于投資大而見效慢的燒錢行業(yè)。
ChatGPT也濃縮著美國人工智能公司的這種特質(zhì)。OpenAI公司于2015年由一群美國科技精英創(chuàng)辦后,就專注于研究通用人工智能,從2018年起,OpenAI就開始發(fā)布第一代生成式預訓練語言模型GPT,用于生成文章、代碼、機器翻譯、問答等各類內(nèi)容,之后經(jīng)過第二代和第三代,才在2022年11月推出相當于第3.5代模型的ChatGPT,而其一次訓練成本就高達數(shù)百萬美元。即使成功推出了火爆的ChatGPT,而OpenAI公司2022年僅收入3600萬美元,全年虧損超過5億美元。
4.技術水平:人工智能顯著提升的標志性應用
2018年OpenAI公司帶動了大模型技術的興起,近年來國內(nèi)外也發(fā)布了多個模型參數(shù)龐大的深度神經(jīng)網(wǎng)絡大模型,但只有ChatGPT引發(fā)了全球學術界和產(chǎn)業(yè)界的熱議和關注,原因在于ChatGPT在諸多維度能力的顯著提升,包括海量高價值信息的全量在線記憶能力、自然語言輸入的任意任務和多輪對話理解能力、復雜邏輯的思維鏈推理能力、多角色多風格的長文本生成表達能力、即時新知識學習應用與進化能力、自動寫代碼和理解代碼的能力等。
與傳統(tǒng)認知智能需要針對各領域任務定制對應的系統(tǒng)不同,ChatGPT不僅能完成多個場景、多輪人機對話,還能在交互中以“類人”的方式交流、學習和進步,自主、快速、不間斷地學習各領域專業(yè)知識并達到人類專家水平。根據(jù)斯坦福大學的研究發(fā)現(xiàn),ChatGPT已擁有同理心,可以解決93%的任務,所擁有的心智相當于9歲兒童。[4]正是初步綜合實現(xiàn)的“智慧涌現(xiàn)”,讓ChatGPT成為一款與眾不同的爆款應用。
5.局限與潛力:尚處于初級階段具有無限可能的應用
2022年11月剛進入商用的ChatGPT尚處于第3.5代模型,其應用中仍有一些局限性。主要包括:語法和語義錯誤,在生成文本時會出現(xiàn)語法錯誤和語義不一致的情況;泛化能力有限,在處理新的任務時泛化能力較弱,它可能無法準確地回答新的問題或處理新的文本數(shù)據(jù);缺乏邏輯推理能力,無法通過推理來得出結論,在處理復雜的問題時可能會出錯;依賴輸入文本,對輸入文本的內(nèi)容有非常高的依賴性等。
ChatGPT可以通過GPT模型的不斷的迭代來提升性能。例如2023年3月14日,OpenAI公司推出了第四代模型GPT-4,在安全性、一致性、真實性方面有所提升,例如在其內(nèi)部評估中,GPT-4對被禁止內(nèi)容的請求做出回應的可能性比GPT-3.5低82%,做出真實回應的可能性高40%。[5]
二、“嵌入”:ChatGPT對人工智能發(fā)展的促推效應
火爆“出圈”的ChatGPT,很可能對人工智能技術發(fā)展和產(chǎn)業(yè)生態(tài)產(chǎn)生極為重要的影響。在ChatGPT的示范效應下,諸多科技巨頭表示將推出類ChatGPT應用,這預示著人工智能應用將迅速“嵌入”全球網(wǎng)絡生態(tài),并引發(fā)人工智能產(chǎn)業(yè)鏈變革。
1.“里程碑”:ChatGPT令人工智能產(chǎn)業(yè)鏈“浮出水面”
ChatGPT是第一款面向大眾的、可以初步進行商業(yè)應用的通用人工智能聊天機器人應用,邁出了商業(yè)應用的第一步。第一步往往是具有里程碑意義的。ChatGPT之前,受技術程度所限,發(fā)展將近70年的人工智能最核心的技術一直停留在“幕后”的“燒錢”和小規(guī)模的局部應用階段。ChatGPT的火爆,則成功地推動人工智能技術進入大規(guī)模商用階段,人工智能被推向“臺前”。
一旦步入商用后,ChatGPT將形成引領效應,后續(xù)企業(yè)紛紛效仿,產(chǎn)業(yè)迅速跟進,從而進入技術競爭與生態(tài)體系膨脹的快車道。從互聯(lián)網(wǎng)瀏覽器的誕生,到門戶網(wǎng)站的建立,再到即時通信技術的發(fā)展,都可以印證這一基本規(guī)律。這是互聯(lián)網(wǎng)時代以來的技術生態(tài)發(fā)展總體態(tài)勢,即新技術一旦進入商用就會迅速滲透社會,帶來產(chǎn)業(yè)鏈的巨大變革。
美國目前的科技巨頭公司如谷歌、微軟、亞馬遜、Meta等都在通用大模型上進行了進一步的布局與投資。繼ChatGPT之后,我國的各科技公司紛紛加入了大模型開發(fā)和應用的隊伍。例如騰訊、阿里、百度、華為、科大訊飛等均在跟進大模型的研發(fā)與應用。
2.“加速器”:引發(fā)消費端、產(chǎn)業(yè)端、社會端的全面智能化升級
以ChatGPT為代表的人工智能進入大規(guī)模商用后,首先會影響內(nèi)容生產(chǎn)領域的消費端升級,進而導致數(shù)據(jù)引領的產(chǎn)業(yè)端提速,最終激發(fā)文化創(chuàng)意的社會端革新,社會端再促發(fā)應用技術不斷升級迭代,循環(huán)往復,加速人工智能社會化和人類社會智能化。
消費端,類ChatGPT應用將在人類指導下進行內(nèi)容創(chuàng)作,形成全新的內(nèi)容生產(chǎn)形式,并逐步融入文字、圖片、視頻、3D制作等領域。這導致ChatGPT很快會作為一種技術和功能要素依次嵌入搜索引擎、瀏覽器插件、辦公軟件/WPS、會議系統(tǒng)自動摘要、新聞客戶端以及內(nèi)容安全、即時通信、短視頻、游戲、網(wǎng)絡音樂、電商購物等。
產(chǎn)業(yè)端,合成數(shù)據(jù)(synthetic data)將超越人類用戶生產(chǎn)的大數(shù)據(jù)而成為新的戰(zhàn)略資源。合成數(shù)據(jù)是計算機模擬技術或算法創(chuàng)建、生成的自標注信息,是在數(shù)字世界中創(chuàng)造出來的新型數(shù)據(jù)。《麻省理工科技評論》(MIT Technology Review)將大模型合成數(shù)據(jù)列為2022年十大突破性技術之一;全球IT研究與咨詢機構Gartner預測,到2024年用于訓練大模型的數(shù)據(jù)中有60%將是合成數(shù)據(jù),到2030年大模型使用的絕大部分數(shù)據(jù)將由人工智能合成。[6]這將對自動駕駛汽車、機器人、安防、制造業(yè)等相關產(chǎn)業(yè)產(chǎn)生直接影響。例如,目前已經(jīng)存在的平臺包括英偉達的元宇宙平臺Omniverse,可在虛擬環(huán)境中對機器人進行訓練,之后直接運用在現(xiàn)實世界。
社會端,多模態(tài)內(nèi)容自動組合,解放人類創(chuàng)造力,助力創(chuàng)新。互聯(lián)網(wǎng)時代以來,創(chuàng)意材料極大豐富,但自動創(chuàng)意生成一直難以實現(xiàn),以ChatGPT為代表的內(nèi)容生產(chǎn)人工智能應用則很大程度上解決了這一問題。未來,ChatGPT將實現(xiàn)多模態(tài)內(nèi)容跨種類的綜合性組合,并不斷提升創(chuàng)意與資料的再整合生產(chǎn)能力。而隨著這種創(chuàng)新能力的提升,人工智能將徹底進入人類社會的工作和生活中。
3.“新賽道”:對全球既有技術生態(tài)產(chǎn)生強烈沖擊
以ChatGPT為代表的人工智能將對全球既有生態(tài)產(chǎn)生極為強烈的沖擊。
一方面,ChatGPT將“逼迫”既有生態(tài)的“局中人”進入人工智能新賽道。從順應技術潮流來看,所有企業(yè)和平臺都要考慮融入類ChatGPT技術或推出相似產(chǎn)品,ChatGPT的“攪入”打亂原有的、潛在的技術生態(tài)發(fā)展步調(diào),全球技術生態(tài)被ChatGPT引入人工智能新賽道。
另一方面,ChatGPT作為美國引領的最前沿技術應用,有著極高的技術壁壘、時間壁壘、成本壁壘,一旦使用類似技術產(chǎn)品,局中的參與者就變成人工智能新賽道上對ChatGPT難以企及的追趕者。谷歌、微軟都是業(yè)內(nèi)遙遙領先的全球性巨頭,調(diào)集其綜合資源才實現(xiàn)ChatGPT的快速更新迭代。ChatGPT背后的支持模型,參數(shù)量從最開始的1.17億增加到1750億,龐大的預訓練數(shù)據(jù)量和高額的訓練成本,使得一般企業(yè)根本沒有能力完成通用型人工智能的開發(fā)。此外,這種始于2018年的投入已經(jīng)形成“時間壁壘”效應,ChatGPT是“時間+數(shù)量”的質(zhì)變成果。
具有示范效應的ChatGPT,不僅增強了科技公司對該領域的投入,也加劇了在人工智能方面的競爭,加快了推出類ChatGPT的速度。隨著超級平臺以ChatGPT為中心的新一輪“技術競爭”的加劇,類ChatGPT應用將進一步“嵌入”數(shù)字社會生態(tài)中。
三、“擴散”:ChatGPT對傳播與社會的影響
1.向社會的傳播“擴散”加速泛人工智能生態(tài)的生成
ChatGPT發(fā)布后,其月度活躍用戶數(shù)量僅2個月便激增1億多,超過之前TikTok9個月用戶破億的速度,成為互聯(lián)網(wǎng)時代以來全球用戶增長最快的應用。ChatGPT的火爆,不僅引發(fā)相關概念股狂漲,還促使國內(nèi)外諸多科技公司加快推出類似產(chǎn)品。2023年2月,谷歌推出類似于ChatGPT的對話人工智能服務Bard。百度也于2023年3月發(fā)布大語言模型“文心一言”(ERNIE Bot)。全球已經(jīng)開始涌現(xiàn)一波由ChatGPT引領的人工智能熱潮,以ChatGPT為技術特征的人工智能將“重構”網(wǎng)絡生態(tài)和全球科技生態(tài)。
在ChatGPT出現(xiàn)之前,如果說人工智能尚停留于小規(guī)模應用和測試階段,可見度不高,那么ChatGPT則將人工智能從“幕后”推到“臺前”。在ChatGPT的示范效應和風險投資的加持下,類ChatGPT將伴隨著大規(guī)模商用而“擴散”至社會諸領域。根據(jù)埃弗雷特·羅杰斯(Everett Rogers)的創(chuàng)新擴散理論(Diffusion of Innovation Theory),技術的創(chuàng)新特征包括相對優(yōu)越性、兼容性、易用性、可試性和可察性等方面,而ChatGPT在這五個方面都大大超越了之前的人工智能應用,這將加速推動ChatGPT的擴散網(wǎng)絡的形成。[7]在ChatGPT的“擴散”中,人類社會將生成一個泛智能的社會生態(tài),人機互動在未來成為普遍趨勢,AI機器人將開始大規(guī)模涉足知識類和創(chuàng)造性工作。
2.在與人類社會“互構”中的風險
盡管目前ChatGPT對我國大陸不開放,中國用戶在使用層面受限,無法直接訪問其服務,但隨著國內(nèi)企業(yè)的跟進,類ChatGPT產(chǎn)品將迅速把人工智能應用引入我們的社會工作和生活,在提供諸多便利的同時,也不可避免地帶來諸多新的“風險”。例如,北京師范大學互聯(lián)網(wǎng)發(fā)展研究院院長助理吳沈括認為,ChatGPT在實際應用層面將面臨三種風險:第一種是在更加巨量數(shù)據(jù)匯聚的過程中,可能會產(chǎn)生法律和安全風險;第二種是在模型和算法設計的過程中,可能產(chǎn)生倫理和違法風險;第三種是在實際應用過程中,可能被用于違法犯罪行為,進而帶來社會風險。[8]目前較為顯見的是,ChatGPT產(chǎn)品這種類人的內(nèi)容生產(chǎn)活動的風險,主要是在諸多方面“以假亂真”的內(nèi)容生產(chǎn)所衍生出的不道德甚至違法犯罪行為。
例如,加拿大麥吉爾大學研究團隊曾使用GPT-2模型閱讀加拿大廣播公司播發(fā)的約5000篇有關新冠疫情的文章,然后要求其生成關于這場危機的“反事實新聞”,結果,與最初人類記者的新聞報道中更側重于個體和地緣政治的“假新聞”不同,GPT-2生成了大流行在生物學和醫(yī)學方面的“假新聞”。OpenAI公司也警告ChatGPT用戶,它“可能偶爾會生成不正確的信息”,“產(chǎn)生有害指令或有偏見的內(nèi)容”。[9]ChatGPT可以模仿特定的語言風格進行內(nèi)容生產(chǎn),其話語結構、用詞特點等與真人高度相似,由于能夠產(chǎn)生出高質(zhì)量的人類口語文本,可被用來進行網(wǎng)絡欺詐。
整體來看,類ChatGPT應用的智慧化程度高,拉低了人工智能生產(chǎn)的技術使用門檻,極大提升了內(nèi)容生產(chǎn)的速度、自動化和仿真性,對未來的信息內(nèi)容治理提出了進一步挑戰(zhàn)。尤其是在新聞出版方面,當前“以假亂真”的ChatGPT已經(jīng)產(chǎn)生了一定影響,并引發(fā)科學界和新聞出版界的警惕。例如,自2023年1月24日起,《自然》規(guī)定在其旗下所有期刊的論文中,ChatGPT 等大語言模型不能列入作者。[10]同月,學術期刊《科學》禁止在論文中使用ChatGPT 生成的文本,也禁止將ChatGPT署名為作者。
3.“交融”中的演進
作為一項新技術,ChatGPT仍在不斷更新中,并在與人和社會的“交融”中“擴散”和演進。
ChatGPT的應用可能在深度聯(lián)網(wǎng)中加速應用的“擴散”。在5G時代,ChatGPT最快落地場景之一是5G消息,估計未來市場規(guī)模達3000億元。[11]如果ChatGPT能上網(wǎng)自己尋找學習語料和搜索知識,將產(chǎn)生更大的突破,其與微軟Bing搜索引擎合作已經(jīng)進行了初步探索。2023年3月,OpenAI對ChatGPT進行重大升級,通過插件功能授予ChatGPT訪問第三方知識源和數(shù)據(jù)庫(包括網(wǎng)絡)的權限來擴展其功能,ChatGPT將能直接檢索到最新新聞,與5000多個第三方應用插件交互,實現(xiàn)查詢世界各國語言詞匯、短語,查詢實時股票、航班、酒店信息,規(guī)劃差旅,訪問各大電商數(shù)據(jù)幫助比價下單,還支持個人或企業(yè)把私有數(shù)據(jù)(文檔、筆記、郵件等)發(fā)給ChatGPT,成為人的“第二大腦”或企業(yè)的智能助理。[12]
而在社會的主體人類的高度關注和各種張力中,ChatGPT亦將被加入算法屏蔽,走AI向善路線。在各個行業(yè)的應用中,為了避免ChatGPT染上“惡習”,可以通過算法屏蔽,減少有害性和欺騙性的訓練輸入。
當然,ChatGPT也將在與人類社會的“互構”中不斷演進,不斷提升準確度。繼續(xù)加大數(shù)據(jù)量,特別是實時數(shù)據(jù)的輸入后,ChatGPT將在聯(lián)想能力方面大大提升,最終誕生高于文本內(nèi)容的憑空創(chuàng)造能力,接近甚至超越人類,這將是通用人工智能發(fā)展的高級階段。
(作者單位系中國社會科學院新聞與傳播研究所)