再聰明的AI,都需要人類來“飼養”。只不過它們吃的不是米飯,而是數據。越是高質量的、標注清晰的數據,越能幫助AI更快成長,變得更強大。27歲的亞歷山大·王(Alexandr"Wang)就掌握著世界上最著名,也是最龐大的AI“飼養廠”。這個數據“王國”名為Scale"AI。在這里,王指揮著20多萬名遍布全球的員工,進行故事輸入、圖片標注、句子編寫等工作,為各種AI大模型提供更好地理解人類語言模式所需的文本,從創作詩句、總結新聞稿件到用烏爾都語撰寫故事,不一而足。
在許多人工智能初創公司尚未賺到一分錢的時候,Scale"AI在2024年的年化收入已經達到近10億美元(約合人民幣71億元)。要知道,推出ChatGPT的Open"AI公司的年收入,也僅僅是35億~45億美元。王甚至將自己公司在人工智能革命中的重要性比作英偉達。目前,Scale"AI估值已超過140億美元,他個人持有的股份估計價值20億美元(約合人民幣142億元),這使他成為世界上白手起家的最年輕的億萬富翁之一。
也是大學退學生
人類每一次巨大的技術變革,都會迎來一場造富神話。王,成為AI時代一個新的神話般的人物。這位1997年出生的華裔少年,長著一雙很細的眼睛,臉上還有這個年齡階段難以擺脫的青澀。正常而言,他現在正是讀大學的年紀。但從高中開始,他就擺脫了大多數人常走的那條路,開啟了一場人生的冒險。
王出生于美國新墨西哥州的洛斯阿拉莫斯,這里是原子彈的誕生地。他的父母都是從事武器研發項目的科學家,從他上幼兒園起就開始教授他高等物理知識。
在一篇題為《一六年我學到了什么》的文章中,王寫道,他在9年級(相當于初三)時就開始計劃創建一家公司,當時他和一個朋友在谷歌文檔上記下了創業的想法。
夢想只是一顆種子,種下之后并不一定會馬上萌發。十幾歲時,王像一些普通“好學生”一樣,參加辯論隊,學習拉小提琴,他還經常參加全美各地的數學和物理競賽。高中,他的人生開始走上“岔路”。
他提前一年離開高中,前往硅谷工作,成為“美國知乎”Quora的一名工程師。那時,他17歲。
在Quora,他每天工作12小時。這種如今被視為“牛馬”般的工作強度,卻讓他切身體會并愈加重視努力的重要性。在那里,他還遇到了日后成為Scale"AI聯合創始人之一的露西·郭——一個和他一樣年輕,生于1994年的華裔女孩。
王表示,他是在參加舊金山的SPARC(應用理性與認知夏令營)后,第一次看到了人工智能的突破性潛力。該夏令營旨在將有數學和科學天賦的學生聚集在一起。在那里,他結識了OpenAI聯合創始人格雷格·布羅克曼等早期人工智能研究人員,這激發了他對人工智能技術的興趣。
為了學習機器學習,2015年,王進入麻省理工學院學習。大一時,他同時修讀了5門研究生計算機科學的課程,并利用春假開發了一款名為Ava的iPhone應用,幫助用戶預約醫生。
2015年夏天,他退學了。聽起來又是一個俗套的大學生退學創業的故事。但那時候的王意識到,技術帶來的機會不會待在原地等待自己。他必須做出選擇。
這一決定是在與在線房屋交易平臺Opendoor的首席執行官埃里克·吳交流后做出的。吳勸說王加入當時尚在起步階段的Opendoor,而不是去成熟的科技公司工作,并鼓勵他趁年輕多冒險。
9年級時,寫在谷歌文檔上的夢想,在這一刻蠢蠢欲動了。“我意識到,如果不在最佳時機冒險成為一名創業者,我一定會后悔。”
2016年夏天,王為Ava報名參加了由著名風險投資公司Y"Combinator(當時由薩姆·奧爾特曼領導,他現在是OpenAI的首席執行官)舉辦的創業培訓項目。不久之后,他和露西·郭一起,將Ava擴展成了一個更宏大的構想,取名為Scale"AI。
在新冠肺炎疫情期間,王一直和奧爾特曼住在一起,后者最終通過與Y"Combinator的交易間接擁有了Scale"AI的股份。
“我告訴我的父母,這只是我夏天隨便玩玩的事。”王說,但顯然,他再也不想回學校了。
一個敏銳的機會主義者
有時候,你必須大膽地冒著風險去追逐夢想,即使這條路是非傳統的。王后來回憶道,自己看到了數據標注的巨大潛力,也明白時機的重要性。如果自己耐心完成學業,就可能會錯失一個快速增長的市場。
他可能失敗,但決心要冒這樣的風險。
“即使最令人印象深刻的人工智能系統,背后也是人。”王在接受媒體采訪時說。任何試圖保持競爭力的人工智能公司,都需要“大量的人給數據貼上標簽,訓練數據,并在數據混淆時澄清數據”。
然后,這些經過注釋的數據就可以賣給OpenAI這樣的公司,用于訓練他們的算法。
這需要大量人力資源。Scale"AI旗下的子公司Remotasks在全球范圍內雇用了20多萬名外包工人,王稱這些工人“對于構建強大的人工智能系統至關重要”。
相比之下,OpenAI公司只有約1700名員工。
《福布斯》雜志報道稱,在創業的“頭幾個月”,王和露西·郭“意識到Scale"AI是一個可行的解決方案”,可以解決影響自動駕駛汽車公司的問題,而這些公司當時正處于“人工智能的前沿”。這些公司擁有數百萬英里的駕駛錄像,但沒有足夠的人來標注圖像,以便讓自動駕駛汽車識別停車標志和行人等物體。
Scale"AI成立幾個月后,就簽下了Cruise(通用汽車的子公司)和特斯拉作為早期客戶。到2018年,Scale"AI的客戶名單已經包括了豐田和本田等“主要國際汽車制造商”。同年,王登上了福布斯“30位30歲以下創業者”榜單。
“每個行業都坐擁大量數據,”王說,“我們的目標是幫助他們釋放數據的潛力,并用人工智能來增強他們的業務。”
面對數據這座金礦,Scale"AI成為最早的掘金者之一。正如他年輕時在Quora經歷中學到的,王變成了一個工作狂。他提出了“為什么不更快”和“穿墻而過”等公司口號,并積極尋求風險投資支持。2019年,Scale"AI的估值達到了10億美元。
當然,事情并非一帆風順。創辦Scale"AI時,王只有19歲,露西·郭也只有21歲。“這無疑讓招聘變得更加困難了,”王說,“有人會問我,‘請給我解釋一下,為什么我應該把我的事業托付給你?’”不少潛在的投資者也猶豫不決。
王證明了自己是一個“敏銳的機會主義者”。當舊的收入來源枯竭,他及時將Scale"AI引向新的方向。2019年,他與OpenAI簽訂了公司的第一份生成式人工智能合同,為ChatGPT背后的語言模型早期版本標注數據。
“王非常善于洞察先機,”指數風投公司的退休合伙人、Scale"AI董事會成員之一邁克·沃爾皮說,“他將多種創業技能和遠見卓識融為一體。”
“他有一種絕對瘋狂的職業熱情”
不少人,尤其是Scale"AI的競爭對手,對這家公司嗤之以鼻。“Scale"AI把自己定位為一家科技公司。但對我們來說,他們與任何業務流程外包的公司沒有什么不同。”初創公司Labelbox的聯合創始人馬努·沙爾馬表示。
像沙爾馬這樣的科技新貴認為,他們可以比Scale"AI做得更好;而傳統外包商則認為,他們可以比Scale"AI做得更便宜。
“我想說的是,我們在這一領域研究的時間比任何人都長,所建立的技術也比任何人都多。”王對此反駁道。
他放棄麻省理工學院的學業更早抓住機會,以及“為什么不更快”的工作狂做法,為公司帶來了領先地位。而為了保持這種地位,Scale"AI不斷壯大員工隊伍。
“我們總是希望有更多人參與其中。”王說。
在位于舊金山、占地1.67萬平方米的辦公室里,Scale"AI的員工通過在Reddit和LinkedIn等網站上發布廣告招募標注員,他們的主要目標是“全球南方”的廉價勞動力。其他員工則負責審查標注好的數據,或處理員工入職和薪資問題。
管理這支龐大的團隊非常困難。最早的標注員中有許多人來自菲律賓,他們在網吧工作,一邊玩游戲一邊完成外包任務,每小時能賺1.5美元,每周工作10個小時。Scale"AI的支付系統不夠穩定,時常導致工人的薪水無故延期或根本沒有發放。一些人辭職了,其他人則想方設法在工作中作弊,以提高效率,賺更多的錢。有時,他們標注的數據質量太低,以至于Scale"AI的員工、高管,甚至是王本人,都不得不親自上陣重做。
2023年,Scale"AI差點搞砸了Meta公司的一個項目。
2023年初,這家科技巨頭要求Scale"AI創建2.7萬條問答數據,以幫助其訓練人工智能聊天機器人。當Meta的研究人員收到這些數據時,他們發現了一些奇怪的現象。許多答案看起來都一樣,或者以“作為一個人工智能語言模型……”開頭。原來,Scale"AI的外包員工使用了ChatGPT來編寫他們的回答。
王不得不宣布公司進入緊急狀態,號召全體員工奮力挽救這份合同。他要求員工們不分晝夜地工作,重設全部問答。一個內部排行榜顯示了誰完成了最多標注任務,優勝者的獎品是帶薪休假。
幸運的是,在他的帶領下,Scale"AI最終保住了Meta的合同。
“他取得今天的成就并不是因為他是個少年天才——麻省理工學院有很多這樣的天才輟學學生。”Scale"AI的董事會成員威廉·霍基說,“(他能走到今天是因為)他有一種絕對瘋狂的職業熱情,而這,是我所見過的其他人都不具備的。”
編"輯/張"亦