王俊煜
跨年的那個夜晚,我自己一個人在辦公室沉迷工作。等到想起來要看一下時間的時候,發現離2024年只剩4分鐘了。打開B站的跨年晚會,剛好趕上倒數,屏幕里塞滿了快樂的年輕面孔,看起來對新的一年充滿了期待。那一刻我想,視頻直播這種同步的媒介,相對于文字而言,還是更容易在此時此刻讓人感受到連接 吧。
于是就這樣,進入了2024年。
新年到來之前,我們完成了兩項工作。其一,我們給閱覽室的創始讀者們發了一封郵件,交代了閱覽室“毫無進展”的2023年,以及談論了關于2024年的想法。我們在12月花了兩個周五下午來聊這些問題,再通過錄音整理出來,其中的核心內容在上一期的專欄中已經向各位讀者介紹過了,郵件發送給創始讀者的是更詳盡的對談記錄。
過去這一年我們“毫無進展”,創始讀者不時會在群里面詢問進展,語氣總是感覺很無奈。11月初,群中發生了一些比較激烈的討論,有一位一直很活躍的創始讀者批評,遇到問題為什么不努力去解決?即使解決不了也應該和大家溝通,而不是“擺爛”。這個道理本身我很認同,我以前也常常這么說別人。將“毫無進展”看作一個結果,我不覺得愧疚;但“不努力”和“擺爛”是關于過程的,這兩個標簽被貼到自己身上,我還是感到愧疚的。
現在,既然力氣“完全恢復”了,那就可以去面對這些難題了,也可以去做更透明的溝 通。
“完全恢復”這四個字也出現在了我們的對談稿中,發布前我們就這幾個字有一些討論。真的“完全”恢復了嗎?我想,如果我們自己覺得完全恢復了,那就是完全恢復了。而且,重要的是,也應該按“完全恢復”來要求自 己。
第二個工作,是我們的第二個AI產品原型也上線測試了。
這里面其實有一些節奏把握的問題。我們現在進入上線測試階段的AI產品原型共有兩個,之前一個是在8月中旬上線的。由于產品質量還沒有達到我們認為可以公開發布的標準,所以都還停留在隱姓埋名的測試階段。本來應該在第一個產品正式發布、從測試階段“畢業”后,第二個產品才能進入測試,這樣子兩個產品所處的階段可以有一些差異,管理時可以使用不同的腦子。但由于前一個產品的改進速度偏慢,造成了“追尾”。
現在我終于可以相信,自己一個人也可以發布一個產品了。
上一期《第一財經》雜志的封面報道對2023年AI行業的發展做了“周年全記錄”,其中將AI產品分為了模型層和應用層。按這個分法,我一直關心的是面向消費者的應用層。常讀本專欄的讀者也一定知道,我一直期待在應用層能出現聊天之外的應用形態,也認為應當出現聊天之外的應用形態。所以,我自己探索的AI產品也是希望能在這個層面上有一些突 破。
過去這一年,應用層能力的演進很快,但產品形態上的演進相對保守。消費者能接觸到的最好用的產品還是ChatGPT,其他大廠或自研大模型的公司推出產品進都盡量向ChatGPT那并不完美的設計看齊。前兩天我參加了一場大學同學的小聚會,十多個同學里待在學術界的和進入職場的大約各半,目前從事領域橫跨哲學、經濟學、城市規劃、公共衛生、金融、投資、互聯網、傳媒、教育、影視……但飯桌上討論最多的話題,竟然是ChatGPT。
第二個產品上線測試后,我大概花了一個多星期觀察用戶如何使用這個產品。需要特別說明一下,在測試版產品中,我們在很明顯的位置提示了用戶,使用記錄可能會被人工評估,以便改進產品。這對產品改進的確是很重要的。現在有許多基礎的分析工作已經可以由AI完成,大大提升了效率。在AI的幫助下,我們了解到用戶在使用產品時會遇到幾個很具體的障礙。這部分是因為我們希望通過最低的成本來驗證猜想中的產品價值是否成立,開發的是所謂的MVP(Minimal Viable Product,最小可用產品),想盡可能在非差異化的體驗上減少投入。在這件事情上,我們也算是做到了極致——可能有些過于極致了,以至于對用戶使用造成了障礙。
比如,雖然我想探索的是聊天之外的產品形態,但出于成本考慮,目前產品仍然是通過在聊天應用中的一個“機器人”來落地的,用戶通過給這個機器人發送消息來完成任務。我們并不希望用戶和機器人對話,但由于身處一個聊天應用中,這個誤會似乎很難避免。當我看到用戶和機器人說“謝謝”時,反而覺得不是一件好事情,因為這個產品的最大價值是“快”和“隨意”。想象一下,“文件傳輸助手”如果混入了情感的部分而不是被當作單純的工具,是會影響這些價值的發揮的。如果不考慮成本,肯定開發一個App更好。但我們不能不考慮成本,所以還是通過文案等形式盡量引導用戶改變預期。
說回那次聚會,大家在飯桌上的交流竟然也沒有離開“提示詞工程”。作為畢業二十多年后的一次聚會的主題,這實在有些出乎意料。如果僅通過我的大學同學這個樣本來觀察,會以為LLM今天在各行各業中的應用已經相當普遍了,因為他們似乎已經將AI看成自己日常工作中習以為常的工具了。我知道這不能代表真實的情況,但還是應該樂觀,如果我們這群非技術背景的人也能如此使用AI,那AI成為所有人的工作伴侶將是一轉眼間的事情,而不是未來。
不過,我的這群同學雖然大多不在技術行業,也沒學習過相關專業(其中文科生更多一些),但他們具有樂意嘗鮮的探索精神,這和普羅大眾還是有一些區別。既然人們還需要學習所謂的“提示詞工程”,適應AI的思維方式,那AI暫時還不是給普通人使用的。
我做應用層的工作也是希望解決這個問題,讓普通人開箱即用。目前在線上測試的兩個產品,在策略上恰好對應著我在2023年11月刊的本專欄中分享的兩種市場切分模式:第一個產品找到了一個垂直人群,試圖滿足他們的通用場景需求;第二個產品,也就是前面討論的這個產品,希望能進入大多數人都有的一個日常場景需求,成為那個場景中離不開的工 具。
第一個版本的產品(還是測試版)遇到的問題總是很多的。我們一方面關注有沒有什么不可逾越的問題(沒有),另一方面,更值得關注的是,有沒有機會給用戶帶來讓人驚艷的體驗?所以,我也重點關注了突破重重難關開始使用這個產品的用戶的體驗。從觀察來看,我認為其中的一些用戶還是可以感受到所謂的magic moment的,也就是你覺得這個產品最神奇、最與眾不同之處。由于案例數量不夠多,我還不能確定這個產品是否可以成為一個普通人離不開的工具,但也沒有什么否定性的答案。所以我還是保持謹慎樂觀,先努力解決了前面提到的影響用戶使用的障礙再說。
豌豆莢最早的時候上線半年多仍乏人問津,每天打開的用戶只有幾十個,大概在很多人看來我早該放棄了。但我覺得,重要的還是弄明白為什么大家不來用。當時最突出的一個障礙,是我們的產品連接手機的成功率其實很低(那時候豌豆莢是在電腦上運行的,通過數據線將應用傳輸到手機上安裝),即使產品能帶來magic moment,這種基礎問題得不到解決,產品也是0分。所以我們下功夫花了幾個月解決這個問題,在這之后豌豆莢也的確迎來了爆發式的增長。
低成本的開發模式看起來帶來了一些問題,但我仍然認為這是正確的做法。我們創新的重點在新的交互模式,不確定性極高,團隊之間如果配合不好,反而迭代慢。
模型的能力限制不是做不出好產品的理由,歷史上無數的偉大創新都是在今天難以想象的技術限制下發明的。擁有無限制的資源,反而容易繞開更難的問題。所以,和上期雜志中的一個看法相比,我認為應用層的突破仍然應該來自“低成本+小公司”。要做通用人工智能助手,應該連點成面,先從局部突破。入局后先努力追趕ChatGPT,我覺得也很無趣。
我和一些本身做大模型的人交流時,他們并不贊同這個看法。當然,這也許是因為大家擁有的資源不同——如果我自己也有一個大模型,說不準也會有不同的看法。其實我們也有很多看法是一致的:不管如何,都必須追求單個用戶的使用頻率。而且,度過了最早的產品與市場匹配階段后,勢必還是要在模型上投入的,否則很容易遇到產品能力的天花板。我最近很喜歡使用的Perplexity,也從用已有大模型“套殼”慢慢過渡到開始訓練自己的大模 型。
Perplexity的CEO在最近一次分享的時候理直氣壯地說,大家別覺得“套殼”沒有技術含量,這跟覺得交響樂團的指揮沒有技術含量,覺得喬布斯對蘋果不重要一樣——雖然他們看起來什么都沒有做。
當然,我們的“低成本”可能比一般的低成本還要更低。不管產品最后成不成功,至少這半年我個人的一個收獲是,發現自己也是可以獨立完成一個產品的工程工作的。當然,這也要感謝AI的幫助。創業十多年,似乎有兩個彼此有些沖突的變化在同時發生:一方面,知道自己不知道的越來越多;另一方面,隨著自己的技能樹不斷補全,又覺得自己能做的越來越多。一開始覺得自己只會做設計,不知道怎么建團隊,做PR、品牌、營銷、運營……隨著將工程也納入自己的技能范疇,現在我終于可以相信,自己一個人也可以發布一個產品了。