龐鋼明 王聃鋒

山姆·奧特曼(左二)正從日常職責中抽身出來專注于“OpenAl”的研發,這是一家他與特斯拉創始人埃隆·馬斯克(左一)共同創辦的非營利性人工智能研究組織。
截止到2023年1月,ChatGPT月活躍用戶數量迅速飆升至1億,平均每天約有1300萬用戶訪問ChatGPT網站。目前用戶數量仍在持續增長,ChatGPT成為互聯網歷史上用戶數量增長最快的應用。“OpenAI公司”總部位于舊金山,最早由特斯拉的馬斯克等投資者在2015年共同創立,公司建立的目標是“開發造福全人類的人工智能工具”,目前由微軟持股。
ChatGPT脫胎于2018首次發布的生成式預訓練轉換模型(即Generative Pre-training Transformer項目,縮寫為GPT)。先后經歷過GPT-2(2019年),GPT-3(2020年)多次的技術迭代,而GPT-4預計將于2023年年底發布,現有的ChatGPT則是基于現階段最新版本的GPT-3.5研發的。

手機版“Chat Bot”正在與使用者聊天。

目前“OpenAI公司”并未公開ChatGPT的技術細節。但從過往公開發表的文獻推測,其主要使用了“強化學習”的AI技術:首先搜集、整理、構建超大規模的樣本數據集,包含公開網頁、書籍、報紙等文本資料。工程師用樣本數據來“喂養”一個處在“嬰兒期”的AI模型,得到預訓練的AI模型,類似于“孩童期”。工程師隨后對它進行強化訓練——由人類親自對它生成的答案進行打分,打分高則“獎勵”它,打分低則“懲罰”它。通過不斷的訓練學習,它的表現越來越接近人類。值得一提的是,這個打分的過程需要耗費大量的人力,為此OpenAI雇傭了大量的廉價肯尼亞工人,時薪低至2美元,這也遭到了眾多媒體的抨擊。
但不難看出,ChatGPT在底層技術原理上并沒有根本性的突破,更多地體現在“超大規模取勝”上。這也意味著它需要超大規模的算力、人力、電力資源的支撐。早在2020年5月發布的GPT-3算法模型的參數量就達到了驚人的1750億條,訓練迭代一次的資金成本高達1000萬美元。相比之下,谷歌開發的圍棋對弈算法“AlphaGO”從零“學會”下棋,就經歷了成千上萬次訓練的迭代,但因為超大規模的ChatGPT“學習”的成本過于高昂,所以即便在訓練時發現了它的某個錯誤,工程師也不會就這一個錯誤去重新訓練它。從規模到做法以及迭代費用上,ChatGPT真的堪稱“前無古人”。
ChatGPT幾乎是一位全能的“助手”,使用它也非常簡單,輸入一個問題,它就能根據你的要求給出答案。用戶既可以和它進行簡單日常對話:你今天的心情如何?也可以常識問答:中秋節是哪一天?或者知識問答:牛頓第二定律涵義是什么?文本改寫:給出一段徐志摩的詩歌,把它改寫成“歡樂”風格的文體,等等。除此之外,它還能根據上下文意思,進行閱讀理解、邏輯推理、糾錯改正等。無論是工程、科學、商業、歷史等專業領域的問題,還是體育、文學、文化、藝術等貼近日常生活的問題,ChatGPT都能給出非常準確和引人入勝的回答,而且生成的回答中語法和句法錯誤很少,書面結構邏輯清晰,甚至ChatGPT能夠承認自己回答的錯誤,指出用戶提問中的細微錯誤,對話能力超乎大眾“心理預期”。具體而言它可以成為人類的寫作、編程等工作的“全能”小助手。
2023年2月以色列總統艾薩克·赫爾佐格在一個網絡安全會議上致辭時便使用了ChatGPT創作的部分演講稿。他演講稿中的一句“警言”——“讓我們不要忘記,是我們的人性讓我們真正與眾不同。”正是源自他向ChatGPT提出問題的回答——“寫一段關于人類在超人類科技世界中所扮演角色的勵志名言”。
ChatGPT能夠以B級成績通過美國賓夕法尼亞大學沃頓商學院MBA的期末考試,以C+成績通過明尼蘇達大學四門課程的研究生考試,甚至通過了美國執業醫師資格考試。根據沃頓商學院一項針對4497名學生的匿名調查,約有17%的學生承認他們使用了ChatGPT來輔助完成作業,5%的學生則承認他們直接使用了ChatGPT生成的回答。北密歇根大學的哲學教授安東尼,在為自己任教的一門世界宗教課程的學生論文評分時,發現里面得分最高的居然是由ChatGPT創作的。盡管少部分教授認為將ChatGPT融入到教學中能夠相得益彰,但更多的老師認為這與“抄襲”無異。在老師們看來,學生無需思考便能得出研究結果,會扼殺學生的創造力、想象力等。許多美國中小學校與高校都禁止學生使用ChatGPT完成作業,一些學校甚至取消了課后作業,改為隨堂測試、手寫作業或者口試等方式。華盛頓大學等高校也開始著手修訂關于學術誠信的新政策,將“使用生成式AI”定義為“剽竊”。
由哈佛醫學院作為共同完成單位發表的一篇論文《ChatGPT在人工智能輔助醫學教育上的應用潛力》,則首次將ChatGPT作為了共同署名的作者之一,并聲明ChatGPT對該論文的寫作做出了貢獻。但ChatGPT“創作”生成的文章并非總是“盡如人意”,存在觀點不可信、事實性錯誤、數據錯誤、數據來源不合規、版權糾紛等問題,甚至會“一本正經地胡說八道”。《自然》《科學》等頂級學術期刊認為AI無法對其生成的文章負責,要求作者不能使用AI生成論文,也不允許將ChatGPT列為署名作者。國際機器學習會議也要求論文中不能包含由類似ChatGPT工具生成的文字。國內《暨南學報(哲學社會科學版)》也聲明隱瞞ChatGPT使用情況將被退稿或撤稿。
ChatGPT也可與用戶結對編程,結對編程是指兩個程序員在一個計算機上共同工作,一個人輸入代碼,而另一個人審查他輸入的每一行代碼,這是一種商業軟件公司推崇的軟件開發的高效方式。而ChatGPT既能扮演“駕駛員”角色,生成用戶需求的代碼,也能與用戶互換角色,扮演“觀察員”角色,審查用戶提交的代碼是否存在錯誤等。向ChatGPT輸入“用Python語言(一種編程語言)生成俄羅斯方塊游戲代碼”,它便可使用Pyhton編程語言生成完整的俄羅斯方塊游戲源代碼。用戶運行游戲代碼后若出現錯誤,可將錯誤信息再次“反饋”給ChatGPT,ChatGPT會提示用戶需修正哪些代碼片段。但要知道的是,這里的錯誤既可能是因為用戶軟硬件型號差異從而出現錯誤,也可能是ChatGPT生成的代碼本身就帶有錯誤。
一些技術能力較低的黑客也正在利用該功能生成惡意代碼等黑客軟件。以色列的信息安全研究機構“Check Point”發布的研究報告表明,他們在暗網中發現了大量利用ChatGPT工具生成的黑客軟件工具,“菜鳥黑客”在ChatGPT的幫助下也能輕易掌握原本技術門檻較高的網絡攻擊、網絡竊密等黑客技術。但ChatGPT對于算法構架設計等技術難度較高的問題就表現得“力不從心”了,生成的代碼也并不完美。總而言之,ChatGPT現階段擅長針對計算機軟件開發領域的基礎問題,生成商用成熟的代碼片段,能夠在一定程度上幫助“新手”學習編程,取代一些低階的軟件開發工作。

AI作畫系統為世界名畫《戴珍珠耳環的少女》畫出了人物手臂和房間的背景陳設。

2020年3月日本漫畫周刊《Morning》上刊登了AI仿制的手冢治蟲作品《Paidon》,這也是世界上第一部由AI參與制作的漫畫。


2015 年, 谷歌開源了用來分類和整理圖像的AI程序“ D e e p -Dream”。“DeepDream”的開源除了幫助我們深入了解深度學習的工作原理外,還能生成一些奇特、頗具藝術感的圖像。

2021年二次元漫畫風格遷移工具“AnimeGAN”發布了其二代版本,更新后支持了風景照片和風景視頻的三種動漫化風格(分別是宮崎駿、新海誠和金敏),視覺效果更佳。
ChatGPT作為AI技術中自然語言處理方向發展比較成熟的項目,也可以和其他架構的人工智能系統相結合,在更多領域的應用場景中發揮作用。如“語音識別AI、聊天AI、模擬人聲AI”和ChatGPT結合后,會達到意想不到的體驗感受:當用戶撥打電話,“語音識別AI”系統將通話語音識別成為文本,輸入到ChatGPT平臺中,將它生成的答案文本,通過“模擬人聲AI”轉換生成模擬真實人聲的聲音片段,這個過程完全依靠計算機軟件代碼自動完成,用戶根本無法察覺他們正在與AI通話。
“OpenAI公司”此前發布了一個名叫“DALL·E2”的AI作畫系統,這個系統可以根據文本內容生成圖像,如果將這類AI作畫系統與ChatGPT相結合, ChatGPT優異的上下文理解能力,有助于AI作畫系統更好地理解用戶意圖,從而生成更符合用戶心意的AI繪圖作品。但這種耦合的方式引發了一些擔憂。美國貝爾弗科學與研究中心聲稱ChatGPT會“劫持民主”:別有用心的人可以利用它對每天的新聞快訊、博客條目和社交媒體的帖子發表數百萬次的評論,從而影響大眾的判斷和社會輿論,而且手段非常隱蔽。

使用人工智能制作視頻動畫, 可以有多種不同風格。

輸入一張手繪簡圖(左),通過圖像合成系統,可以生成一張虛擬的照片圖像(右)。
同時,ChatGPT最值得關注的商業化路徑便是將它嵌入到搜索引擎中去。2023年2月微軟宣布將ChatGPT技術嵌入到自家搜索引擎“必應”中,并展示了嵌入ChatGPT的搜索引擎將如何運行:將傳統搜索引擎的搜索結果與ChatGPT對搜索結果的注釋并排顯示,用戶也可以與得到ChatGPT技術加持的“必應聊天機器人”對話。微軟的“Edge瀏覽器”在嵌入ChatGPT之后,也增加了“聊天”與“轉寫”功能——用戶可以將這兩個功能設置在側邊欄中,“聊天功能”可以讓用戶提問關于正在查看的網頁或文檔的問題,而“轉寫功能”就是提供寫作助手之類的功能。
搜索引擎在嵌入ChatGPT后能夠提高用戶獲取有用信息的效率。當輸入“發燒該吃什么藥?”時,傳統搜索引擎會給出大量網頁鏈接,用戶需逐個點擊網頁鏈接直至得到所需的有用信息。而在ChatGPT技術的加持下,用戶則直接得到“一般需要阿匹斯林類藥物,但需在醫生的建議下服用藥物。”這個有用信息。因為ChatGPT強大的上下文本理解能力,所以能夠比傳統搜索引擎更加有效地理解用戶意圖,輔助篩選搜索引擎給出的搜索結果,刪減無效信息,提高信息匹配度,節約了用戶的時間成本,從而提高了用戶的使用體驗。但是,有些證券市場分析師不看好這個商業化路徑,證券公司摩根士丹利認為,要消費者改變搜索和瀏覽的習慣本身困難重重,而且商業利益模式的改變更加困難,例如廣告費用。
綜合而言,如此高度自動化的ChatGPT若能投入商用,勢必會取代或者優化大量重復、機械的文字類工作。如語音/文字客服、大規模數據統計分析、消息類新聞寫作等等,但ChatGPT并不能完全取代人類工作,而是在一定程度上提高人們的工作效率,減少人為差錯,豐富學習手段等等。律師、醫生、學生、科研人員等職業將會因此而受益,因此“OpenAI公司”將ChatGPT平臺描述為一種旨在補充人類而不是取代人類的工具。
ChatGPT的火熱是多方因素綜合作用的結果。首先,ChatGPT的出色表現足夠驚艷,這反映了“OpenAI公司”深厚的技術能力。但出色表現并不意味著ChatGPT必然爆火,前代“GPT-3”問世時也驚艷了眾多工程技術人員,但“GPT-3”對普通用戶并不友好,使用難度較高,必須具備一定技術基礎的計算機工程師才能駕馭。相比之下,ChatGPT入門門檻低,無需具備較高的教育文化背景就能“傻瓜式”地與其對話,受眾面較廣是爆火的原因之一。同時“OpenAI公司”使用內容過濾器技術,有效規避了道德、宗教等敏感話題,普遍用戶根本無法誘導它“作惡”,媒體公共輿論壓力大幅度減少,保證了其能夠持續運營、繼續擴充用戶。
其次,用戶與ChatGPT進行對話,就是上文提及的“打分”過程。“OpenAI公司”需要通過大量用戶的使用記錄,構建更加接近大眾認知的超大規模樣本的數據集,用作下一步的算法模型訓練,這也是“OpenAI公司”和微軟公司不遺余力地推廣ChatGPT的原因之一。
再者,“OpenAI公司”與資本市場需要相互成就。一方面ChatGPT如此超大規模的算法模型成本高昂,需要市場投入資金。而另一方面,投資市場需要新的商業項目作為資金的流動出口,以尋求新的經濟增長點;最后,ChatGPT觸發了人類價值的焦慮。近年來“AlphaGo”“GPT-3”“DALL-E2”等爆款AI頻出,它們的問世都能引發一輪“打工人”的恐慌,不斷沖擊人們對以往AI的預期認知,引發了大眾對自我價值認知和生產方式轉變的廣泛討論。

《百駿圖》

《漢宮春曉圖》

《千里江山圖》局部。

中國畫很難畫,但通過AI的修復及重新繪制,能夠生成可輸出的高分辨率圖像。這UVQ2VKXMhTW8lX7qy8m1ig==項技術可以用在老舊照片、藝術品修復及圖像內容數字化等領域。
但ChatGPT離大規模商業應用仍然“為時尚早”。即使微軟已將ChatGPT技術嵌入到自家商業應用必應搜索引擎中,但這種嵌入并不是完美的有機結合。用作ChatGPT訓練的數據集僅更新到2021年,意味著它并不知道當下發生的時事,更無法對新聞做出評論,時效性較強的新聞寫作無法勝任。例如它并不知道2022年美國中期選舉的結果。
從技術原理的角度看,要解決ChatGPT“知識庫”陳舊的問題,則必須從零開始訓練“學習”,而無法單獨增加某個領域的知識,面對更大規模的互聯網信息,ChatGPT若要實時抓取互聯網知識并實時訓練更新迭代,無論是從技術難度還是資金規模都難以想象,這也注定它無法作為搜索引擎使用。更為重要的是ChatGPT的底層AI技術原理并無根本性的進步,曾經“智障”AI普遍存在的問題ChatGPT也同樣存在。
例如算法“黑盒”問題。由于AI技術本身的復雜性以及媒體機構、技術公司的排他性商業政策,算法猶如一個未知的“黑盒”,用戶并不清楚算法設計的目標和意圖。設計開發者也會因為算法規則不斷的改變疊加,而無法對算法的底層原理做出現有問題內容的解釋;以及算法偏見問題。這是指AI對某些事物并不能做出客觀評價,也是因為AI的底層算法造成的,如果用大量“戰爭無罪”的數據訓練它,那么AI就會得出“戰爭無罪”的結論;還有懂“計算”不懂“算計”的問題,AI也不具備人類通常具備的邏輯引申等能力;魯棒性問題,也就是算法運行是否絕對可靠等問題。因此,ChatGPT需要進行持續優化算法,降低規模,才能走向大規模商業化,真正“造福全人類”。
19世紀,英國取得工業革命的巨大成功,機器制造大量取代人工勞動,蒸汽機技術加持的紡織機生產效率驚人,大量紡織工人下崗,引發大眾對機器的恐慌,大量英國紡織工人闖入紡織工廠破壞搗毀機器,最后英國政府不得不派出軍隊進行鎮壓,此為“盧德運動”。
毋庸置疑,以ChatGPT為代表的人工智能技術假以時日勢必會取得巨大進步,和工業革命時期機器“消滅”眾多體力勞動崗位一樣,人工智能也勢必會取代落后于時代的眾多勞動方式甚至勞動崗位,很可能會讓許多人失業。但我們也應該積極地看到,工業革命淘汰落后生產力的同時,也誕生了更多先進的技術崗位。
再回看工業革命的時代,因為空前解放的生產力,創造了巨大財富,人們也逐漸認識到破壞機器本身并不能阻止時代洪流滾滾向前。主動適應時代的人類,自身勞動技能和生產能力也同樣得到了長足進步,思想精神文明也隨之極大地豐富起來,經濟發展邁入了持續至今的繁榮時期。為此,不斷學習,才能真正告別ChatGPT帶來的失業焦慮,告別“盧德運動”。
(責編:南名俊岳)