在一本月刊上寫(xiě)“AI實(shí)用手冊(cè)”確實(shí)風(fēng)險(xiǎn)不小。
就拿上期專(zhuān)欄來(lái)說(shuō)吧,我想探討的是新一代推理模型能否真正解決我們工作中“最難的問(wèn)題”。寫(xiě)的時(shí)候,我用的是OpenAI的o1。結(jié)果DeepSeek恰好在截稿當(dāng)晚發(fā)布了R1,完美錯(cuò)過(guò)。
倒不是說(shuō)內(nèi)容會(huì)瞬間過(guò)時(shí)。我寫(xiě)這個(gè)專(zhuān)欄時(shí)希望,既然是印在紙上的文字,盡量做到在一年后讀也有價(jià)值。上期專(zhuān)欄探討的是推理模型,而同日發(fā)布的R1和Kimi的k1.5都是和o1能力相近的推理模型,現(xiàn)在再讀上期專(zhuān)欄,對(duì)理解它們?cè)趯?shí)際應(yīng)用中的能力和局限也有幫助。唯一的遺憾是,由于文中沒(méi)有直接提到R1,讀者需要自行建立這個(gè)關(guān)聯(lián)。
R1相對(duì)o1帶來(lái)了幾項(xiàng)重要改進(jìn):可以聯(lián)網(wǎng)搜索,這樣就不會(huì)“不知魏晉”了;默認(rèn)展示推理過(guò)程,讓用戶能更直觀地看到推理模型的神奇之處—很多時(shí)候推理過(guò)程比結(jié)果更值得一讀。最重要的是,DeepSeek將OpenAI的付費(fèi)功能變成了免費(fèi)服務(wù),又憑借開(kāi)放策略讓它在市場(chǎng)上遍地開(kāi)花,讓數(shù)以千萬(wàn)計(jì)的人第一次體驗(yàn)到了推理模型的魅力。人們很快發(fā)現(xiàn)了許多不太“正經(jīng)”的創(chuàng)新玩法:寫(xiě)同人小說(shuō)、角色扮演游戲、占卜算卦……連跟它模擬談戀愛(ài)都覺(jué)得它帶有理科男特有的蠢萌感。這樣一來(lái),推理模型就不再局限于解決上期專(zhuān)欄提到的“最難的問(wèn)題”了。
這其實(shí)就是新技術(shù)發(fā)展的規(guī)律,只是現(xiàn)在變化得更快了。隨著成本降低,新技術(shù)從專(zhuān)業(yè)領(lǐng)域走向日常化、娛樂(lè)化場(chǎng)景,變成真正的創(chuàng)新。繼續(xù)用我們的比喻,如果說(shuō)大語(yǔ)言模型就像是一個(gè)接受過(guò)良好通識(shí)教育但不具有專(zhuān)業(yè)知識(shí)的助理,那么推理模型就把這位助理的學(xué)歷從本科升級(jí)成了博士,而成本的快速下降讓每個(gè)人都能擁有不止一個(gè)助理,可能是成千上萬(wàn)個(gè)。上萬(wàn)個(gè)!想象你有1萬(wàn)個(gè)博士當(dāng)助理—那你可不得給他們找各種雞毛蒜皮的活兒來(lái)干?
所以,新技術(shù)的有趣之處不在于替代現(xiàn)有勞動(dòng)力,而在于它能做那些你今天根本想不到可以雇人來(lái)做的事情。
其中一件這樣的事情,就是“AI知識(shí)庫(kù)”。
先不去管它的定義,每個(gè)互聯(lián)網(wǎng)資深用戶肯定都像倉(cāng)鼠一樣囤積了不少東西。“將來(lái)可能用得上”的資料:電子書(shū)、課程講義、數(shù)以千計(jì)的待讀文章,各類(lèi)行業(yè)的研究報(bào)告和幻燈片,微信、小紅書(shū)、即刻等社交應(yīng)用中的收藏夾,手機(jī)相冊(cè)里的無(wú)數(shù)截圖,還像很多父母一樣,網(wǎng)盤(pán)中存著大量“也許孩子將來(lái)用得上”的學(xué)習(xí)資料……
這當(dāng)中的許多囤積,是源于對(duì)知識(shí)匱乏的恐懼。有研究人員將這種習(xí)慣稱(chēng)之為“數(shù)碼囤積癥”(digitalhoarding),數(shù)碼倉(cāng)鼠們收藏了過(guò)多資料卻從不學(xué)習(xí),確實(shí)是一個(gè)讓人焦慮的不良習(xí)慣。
AI能在很大程度上解決這個(gè)問(wèn)題。這并不是說(shuō)讓AI來(lái)替你學(xué)習(xí)—學(xué)習(xí)只能由自己完成。但換個(gè)角度來(lái)想,并非所有知識(shí)都需要經(jīng)過(guò)學(xué)習(xí)才能被我們使用。很少有人會(huì)把字典從頭到尾讀完,大部分我們一生中可能用到的知識(shí),只要在需要時(shí)知道怎么去找就夠了。
AI能幫你做到這一點(diǎn)。以前的問(wèn)題是,你收集的學(xué)習(xí)資料不像字典那么結(jié)構(gòu)化,如果不學(xué)習(xí)一遍,等將來(lái)要用的時(shí)候你也無(wú)法找到,甚至不知道這個(gè)知識(shí)的存在。有了AI后,可以將它想象成一位不知疲倦的圖書(shū)管理員,它能將你所有的藏書(shū)通讀一遍。雖然它不是某個(gè)領(lǐng)域的專(zhuān)家,但它會(huì)努力用自己的常識(shí)來(lái)理解每本書(shū)的每一頁(yè)講了什么、包含什么概念,并記錄下來(lái)。和傳統(tǒng)的關(guān)鍵詞搜索不同,當(dāng)你向這位管理員提問(wèn)時(shí),它能理解你的問(wèn)題,找出概念上相關(guān)的段落,重新組織語(yǔ)言將這些內(nèi)容整合為完整的敘述來(lái)回答你,而不是機(jī)械地查找關(guān)鍵詞。
日常使用中最讓我驚喜的是,它能在我熟讀的書(shū)中挖掘出我未曾想到過(guò)的角度。比如我將收集的育兒書(shū)籍交給AI,問(wèn)它“孩子沉迷?shī)W特曼卡片怎么辦?”,它用一本近百年前的書(shū)中的觀點(diǎn)回答了我。顯然,百年前的書(shū)不知道什么奧特曼,也不知道現(xiàn)代兒童會(huì)流行收集“谷子”,但書(shū)中關(guān)于兒童的收藏偏好和占有欲的見(jiàn)解仍然適用。
R1近乎免費(fèi)的價(jià)格,讓我毫不猶豫地將我的圖書(shū)管理員升級(jí)成了博士學(xué)歷,它在看似毫不相關(guān)的資料中推演出意想不到的角度的能力也大幅增強(qiáng),你還能看到它如何鑒別信源、思考問(wèn)題。不過(guò),所謂巧婦難為無(wú)米之炊,AI仍依賴(lài)我們?nèi)祟?lèi)來(lái)提供可靠的信息源。如果你在某個(gè)專(zhuān)業(yè)領(lǐng)域收集了足夠全面、高質(zhì)量的資料,以此建立AI知識(shí)庫(kù),就相當(dāng)于創(chuàng)造了一個(gè)很棒的垂直搜索產(chǎn)品,回答質(zhì)量應(yīng)該能輕松超出市面上的通用AI搜索。
我們收集的內(nèi)容中,還有大量互聯(lián)網(wǎng)碎片信息。如果你搜索“知識(shí)庫(kù)”搭建教程,它們往往會(huì)強(qiáng)調(diào)知識(shí)庫(kù)應(yīng)該是“結(jié)構(gòu)化”“體系化”的。
但大部分日常信息本就不是體系化的,過(guò)度追求結(jié)構(gòu)反而限制了知識(shí)的活力。何況,大語(yǔ)言模型在大量碎片信息中大海撈針、穿針引線的能力遠(yuǎn)超人類(lèi)。對(duì)它們來(lái)說(shuō),所有文本都是一串串token,并不需要特別的結(jié)構(gòu)。春節(jié)前,我們讓AI閱讀了閱覽室去年推薦過(guò)的大約300篇和個(gè)人成長(zhǎng)有關(guān)的文章,然后根據(jù)用戶的新年愿望給出具體建議,并生成一張帶有座右銘的手機(jī)壁紙。例如,我的新年愿望是“產(chǎn)品準(zhǔn)時(shí)上線”,AI敏銳地建議我要避免完美主義,并生成了一張寫(xiě)著“許多偉大事業(yè)都是從某人說(shuō)‘這有多難’開(kāi)始的”圖片,它就是我現(xiàn)在的手機(jī)壁紙。
我也試著把我去年全年的日記給AI,請(qǐng)它歸納我情緒的變化和困擾的來(lái)源,這讓我從新角度看到了自己。
很多人忽略了AI還能利用知識(shí)庫(kù)中的現(xiàn)有素材再創(chuàng)作。這篇文章的提綱就是用R1生成的。我把我日常記錄零碎想法的筆記本和本專(zhuān)欄的定位提供給它,AI就在這些未經(jīng)整理的碎片中找出了與知識(shí)庫(kù)、知識(shí)管理相關(guān)的碎片,連點(diǎn)成線,串聯(lián)成了文章的雛形。用同樣的方法來(lái)生成新產(chǎn)品策劃,效果也令人驚喜。
這讓我反思各種知識(shí)管理的方法論。在計(jì)算機(jī)進(jìn)入人們的生活之前,我們就發(fā)明了各種筆記方法來(lái)手動(dòng)為知識(shí)建立索引。某種意義上,我們花費(fèi)大量時(shí)間整理筆記,都是為了方便將來(lái)查找和回顧,這實(shí)際上是在和想象中的未來(lái)的自己對(duì)話,一種難度極高的未卜先知。我覺(jué)得,這些“管理”工作反而讓我們成為知識(shí)的仆從,而不是知識(shí)的主人。
Gmail在2004年發(fā)布時(shí)有一句令我印象深刻的宣傳語(yǔ):“Search,don’tsort”(搜索即可,無(wú)需分類(lèi)),這也改變了我管理郵箱的習(xí)慣,就是不再管理。AI時(shí)代既然已經(jīng)到來(lái),我們也應(yīng)該用新的方式來(lái)積累和管理知識(shí)。最好的知識(shí)管理工具,就是不需要管理。既然AI能夠喚醒我們積累的零散知識(shí),我完全接受自己的筆記習(xí)慣與“結(jié)構(gòu)化”“體系化”背道而馳—想到什么就隨手記下來(lái)。在我看來(lái),快速捕捉思維碎片,比構(gòu)建深思熟慮的體系化知識(shí)更重要。
不過(guò),今天暫時(shí)還沒(méi)有完美的工具。最簡(jiǎn)單的實(shí)踐方法,是直接把文本貼到和AI的對(duì)話框中,或?qū)⑽募鳛楦郊蟼?。如果還不夠用,可選用專(zhuān)門(mén)的“知識(shí)庫(kù)”工具,每個(gè)工具都有一些不同的限制:數(shù)量、容量、格式、單個(gè)文件字?jǐn)?shù)……沒(méi)有哪個(gè)工具能將我收集的文件一次導(dǎo)入。更糟的是,社交應(yīng)用的數(shù)據(jù)導(dǎo)出往往很麻煩,甚至可以說(shuō)不可能。即使我用AI編程工具寫(xiě)了各種格式轉(zhuǎn)化、切割、數(shù)據(jù)抓取和下載工具,對(duì)有些數(shù)據(jù)還是無(wú)能為力。
即使克服了這些困難,這些工具還有一個(gè)根本問(wèn)題:它們都將知識(shí)庫(kù)和日常積累知識(shí)的場(chǎng)所割裂開(kāi)了。這樣一來(lái),只適合用它們建立靜態(tài)的知識(shí)庫(kù)。想活用實(shí)時(shí)更新的日常零散知識(shí),要么使用本身具備AI搜索問(wèn)答能力的知識(shí)積累工具(比如我使用的Notion),要么就得改變收集知識(shí)的習(xí)慣,按知識(shí)庫(kù)產(chǎn)品的要求來(lái)收集。
這也是為什么我覺(jué)得這個(gè)領(lǐng)域要?jiǎng)?chuàng)業(yè)有點(diǎn)難,因?yàn)橐屓烁淖兞?xí)慣非常困難,為已經(jīng)存放了用戶數(shù)據(jù)的產(chǎn)品增加AI搜索問(wèn)答能力則容易很多。稍微暢想一下,如果微信可以直接把你的聊天記錄變成知識(shí)庫(kù),那該有多強(qiáng)大。