王俊煜
這個月,互聯網從業者離不開的話題就是以ChatGPT為代表的大語言模型領域的進展,我也不例外。很久沒有對新技術這么興奮了。
《星際穿越》中,老人坐在谷倉前回憶,“當我還是個孩子的時候,每天都好像有新東西出現。一些新玩意兒或者新想法,就像每天都是圣誕節……”最近一個月就是這個感受。每天早上醒來,好像都會看到什么新的AI技術、AI產品發布,而且每個放在以前都是大新 聞。
可以說,我們親身體驗到了人類科技的非線性、指數式進步。幾天前和主編提議寫這個話題,現在卻擔心等雜志送到各位手上,這里面的觀點已經過時了。世界是在加速變化的。iPhone在2007年發布,等到2010年年初我們創業做豌豆莢的時候,大部分媒體、投資人依然不認為移動互聯網是個大機會。而ChatGPT是互聯網史上增長最快的產品,在發布后的兩個月內就到達了1億活躍用戶,連我關注的地方黨報都會介紹ChatGPT,這可比移動互聯網成為共識的速度快多了。
很多人會覺得通用人工智能的“iPhone時刻”已經到來—使用類比來討論問題總是不那么精確,但有助于我們找到思考的出發點。如果從用戶數和行業興奮度的角度,我想的確已經到了“iPhone時刻”。但我是一名設計師,關心如何連接人們的需求和技術的潛力。從使用體驗的角度,我感覺今天還是更像處在BlackBerry的階段。
別誤會,這么說不是潑冷水,也不是“別著急可以再等等”,而是我相信今天還沒有人能預見到未來通用人工智能會通過什么形式成為普通人工作和生活中的空氣與水。薩姆·奧特曼(OpenAI公司CEO)也不能,這和聰明與否無關。人類的過去告訴我們,我們是挺不擅長預測未來 的。
2006年我開始用BlackBerry時還是大學生,在中關村的地下商鋪花幾百塊淘來翻新的二手機器后,需要自己做不少破解工作。屏幕很小,網速很慢,上網也很貴,但第一次走在路上收到E-mail、回復Google Talk的時候,我還是覺得很興奮,打開了一點對未來的想象。
只是人類擅長的想象方式是一元的線性外推。雖然不難想象這個東西將來可以變得更好用—網速會變快,資費會更便宜,但當初手上拿著一臺BlackBerry時,很難想象其實手機可以把鍵盤去掉,變成像iPhone這樣的全觸摸屏設計,也不再是以商務人士為主要用戶的通訊工具。
這是我們說的“iPhone時刻”,iPhone讓普通人看到新的全觸摸屏交互方式,而不僅僅是想象。即使如此,我相信喬布斯2007年站在Moscone中心的舞臺上首次向世界介紹iPhone時,他也無法預見到在未來10年內,全球各市場的主導應用都將是像微信這樣的即時通訊App—初代iPhone可是連App都不讓裝。我猜全世界的微信們也很難預見到,會對它們形成威脅的不是某種新的通訊方式,而是讓人們可以不費腦子不斷下劃的短視頻App。
這些都不是某個天才設計出來的,就和生命游戲一樣,是我們人類和技術在這個混沌系統共同進化的過程中作出的選擇。人們最后發現,“聊天”這種基于短信息的異步溝通方式,是移動互聯網第一個10年的最佳應用。
ChatGPT對于通用人工智能來說,屬于什么階段呢?它是一個讓人拍案叫絕的演示產品,用一種人們熟悉的方式,重新“包裝”了大語言模型這種難以被普通人理解的新技術。根據《麻省理工科技評論》對OpenAI的采訪,他們對于ChatGPT在發布后迅速流行也感到意外,因為它使用的技術在當時實際上已經發布接近一年了。
但仍然是需要想象的。作為一個喜歡嘗試新事物的人,我在初次使用ChatGPT的時候就錯過了那個令我感到興奮的“Aha”時刻。寫這篇專欄的時候我翻查瀏覽器歷史記錄,驚訝地發現我在去年12月4日,也就是ChatGPT發布頭幾天的時候就注冊試用過。我承認自己當時沒有留下什么印象,很快就給忘了,真是有眼無珠。我猜,我當時和許多人的第一次使用一樣,和它聊了聊天,假裝討論了一些哲學問題,請它講了講笑話,也嘗試過請它寫文章……我感覺和過去的產品比是要好一些,但好像也沒有什么特別的。
等到1月底2月初閑下來以后讀了一些朋友寫的科普文章,才知道要理解它能做什么、對未來產生想象,得像在2006年用BlackBerry一樣,需要自己也付出許多成本去摸索,學習、理解它的技術原理,甚至做一些“破解”,所謂的“提示詞工程”(Prompt Engineering),就是你要掌握、練習一些和它對話的技巧,才能挖掘出它作為一個通用人工智能的潛力。
今天的ChatGPT也存在一些比較明顯的缺陷,比如,沒有實時數據、喜歡胡編亂造、記憶力不太好、速度很慢……等等。這些缺陷很容易被普通用戶感受到。隨著技術的進步這些缺陷都是可以被消除的,OpenAI現在的改進速度非常驚人,比如3月中旬OpenAI突然發布了GPT-4和新版的ChatGPT,我正在寫這個稿子的時候他們又突然發布了ChatGPT的插件系統,這些缺陷中的一部分已經解決了。但即使我們對未來充滿樂觀,今天的用戶依然需要面對許多未解決的缺陷。
克服了這些困難后,我才真的感受到了大語言模型的神奇之處,我的工作和生活越來越依賴它了,默認瀏覽器切換到了Edge,也拋棄了使用了二十多年的Google。當我工作的時候,總有一個瀏覽器窗口開著ChatGPT,就如現在。但這些都是在我付出了摸索、學習的成本后才能解鎖的。因此,從使用體驗上,我感覺還在BlackBerry階段。
上周我和一個CEO討論,他認為微軟在辦公套件中增加的Copilot就是“iPhone時刻”了。我覺得有這個可能性,畢竟制表、寫演示文檔就是大部分公司人日復一日的痛苦源泉,至少人們是有共鳴的。等這個產品正式發布再看看實際效果吧。
那么,能不能說“聊天”作為一個界面,就像iPhone的觸摸屏呢?我也沒那么確定。
“聊天”是今天最容易想到的形態,也是被ChatGPT普及的形態。過去一個月里發布的各類“Copilot”產品在各種各樣的場景中都增加了一個聊天窗口。這很自然,過去十多年我們已經很熟悉“聊天”作為互聯網的一種自然語言界面存在了,只是過去是和其他人類聊天,現在是和機器聊天。
但一問一答的方式在完成很多任務時也是很啰嗦的,我今天需要不斷在各種窗口之間復制粘貼,離無縫的體驗還很遠,是非常原始的使用體驗。會不會這其實只是因為我們熟悉它,但不代表未來形態呢?當年BlackBerry的支持者也認為,既然過去人們已經在電腦上熟悉全鍵盤,為何不在手機上也使用呢?在當時看來,這也是有道理的。
GPT插件系統的發布,則是在各式編輯器中直接嵌入GPT的創作能力。唯一的問題就是,這只能在創作時使用。而且我在看微軟的發布視頻時在想,技術都這么先進了,為什么一定要花時間做PPT呢?這項工作看起來只是為了連接新世界和舊世界而存在的,就像以前尋呼臺的接線員一樣,隨著技術的進步,這個環節總要被跳過的。
所以我其實也沒有什么答案。歷史總是在后視鏡中才變得清晰的。只能說,我覺得應該還有屬于通用人工智能時代更“原生”的應用形態,這也是我作為設計師最感興趣、想要去探索的事情。
也可能就是聊天了吧,被人們接受的應用形態不一定是最先進的、最終極的,正如前面說的,這是一個混沌系統在演化過程中的選 擇。
說這個也是希望不要所有人的思路都被“聊天”帶偏,聊天有可能是用iPhone的觸摸屏,也可能是用BlackBerry的全鍵盤。和我一樣逐漸“認知升級”的從業者應該也不少,在過去一個月里,接入GPT能力的應用呈指數式增長。如果過早在某個過渡性的產品形態中安營扎寨,也許會看不到更大的畫面。今天在后視鏡中看移動互聯網時代自己的經歷,即使是在我自己喜歡的內容分發領域,也是因為豌豆莢在2010年到2011年以這種形態成功了,而忽視了許多真正在后來接受度更廣的應用形 態。
當然,今天的許多接入GPT能力的應用,更像是最早在iPhone上做了一個指南針,是更容易被取代的形態。
至于我們自己呢?最近一個月被拉回到許多技術圈的討論中,才意識到其實過去幾年自己的關注點已經離“技術”已經很遠了,離“人文”更近一些。技術圈的特點是“FOMO”,害怕錯過的恐懼帶來了許多焦慮。投資人、創業者想知道,大語言模型是不是會帶來下一個像字節跳動這樣的機會?個人也害怕失業,大語言模型和其他生成式AI的應用正在取代許多職位,這也在實實在在地發生。
好在我們今天并不成功,也就不害怕失去什么,反而也可以退后一步來觀察。與其擔心失去,不如將注意力放在有什么新的可能性上。大語言模型在閱讀領域天然地有數不清的應用機會,比較容易想到的形態,都和閱讀效率相關—人們日常的大部分閱讀是帶有明確目的的,如獲取資訊、學習知識等等,大語言模型在優化信息獲取效率、改進個人知識積累上大有可為。到我寫這篇文章為止,似乎還沒有讓人滿意的產品出現。我想即使出于個人興趣,也是值得一試的。
只是就今天的閱覽室而言,讀者的閱讀多數不是為了效率或知識,他們沒有明確目的。大語言模型在這種產品中如何發揮價值,也需要開放地探索。
大語言模型的出現也會給許多媒體的生產模式帶來巨大改變和顛覆。不夸張地說,大部分媒體的價值會消失,媒體和受眾的關系也會發生變化。我和主編老師小心翼翼提出這個想法,她倒是很樂觀:其實記者們也很害怕寫文章(我還以為只有我寫得很艱難),如果能把這一步省去,豈不是大家都可以專心做自己最喜歡做的事情?采訪、與人建立連接,等等。這里面,其實也有許多商業機會。
當然,這些想法的目標也不是要去做出多大的公司。本文不構成任何創業建議,這也不是這個專欄的目的。如果從做出高估值公司的角度,這些都不是最有吸引力的想法,聽起來也不是很有趣。有句俗話說,機會是留給有準備的人的,如果你過去的思考和沉淀恰好能在這個機會下綻放,那么行動起來后自然也會綻放。
也是給自己打打氣吧。