快手：用大模型點燃北京AI第一城的生產力

2025-09-15 00:00:00魏蔚

中關村 2025年8期

從中關村科學城的實驗室到快手可靈AI事業部的工位，我國AI濃度最高的北京不斷向外輻射創新推動力。這里有全國近四成備案上線的大模型，AI企業數量超2400家，核心產業規模接近3500億元。

“制作”到“智作”的生產力革命

北京的AI成績源于智源研究院的技術突破，亦莊、朝陽區等超3.3萬P算力供給等看不見的支撐，還有以可靈AI為代表的大模型應用對生活生產場景的滲透。

技術、人才、場景、政策的多重加持，讓北京率先探索出“技術突破—產業應用—創新消費”的AI發展閉環。從高端制造業的智能生產，到內容平臺的創意爆發，再到城市治理的智慧升級，快手的案例只是縮影，AI第一城群星閃爍。

當前，多模態大模型幾乎成為大模型企業標配，可生成圖片、可生成視頻、可多樣化交互，這種更容易感知的生產方式，讓抽象的代碼離用戶更近，它可以是生產線上的“創意工人”，也可以在體驗式消費中提供情緒價值。

2024年6月，異類Outliers團隊用一個晚上生成了一部小短片，那是一輛小汽車飛上太空的影像，技術來自于可靈AI。一個月后，導演陳坤帶著與可靈AI共創的《山海奇鏡之劈波斬浪》，在中影國際影城cinity 7號廳超前點映。

他向媒體披露了多組數據，“同樣體量和質量的短劇，制作周期最少需要3—6個月，視頻大模型讓《山海奇鏡之劈波斬浪》的制作只用了2個月”，“過去我們做傳統影視，外拍需要100多人的制作團隊，包括演員、攝影、燈光、音響、劇務、服化道等。現在全片沒有一個畫面是真人拍攝，服化道也可以通過AI生成”。

觀眾不見得熟悉“幕后”故事。7月27日，在2025世界人工智能大會期間，快手可靈AI舉辦了以“生成式AI應用元年”為主題的生態論壇。會上披露，可靈AI目前已在全球擁有超過4500萬創作者，產品自發布以來迭代升級30余次，累計生成超2億個視頻和4億張圖片，服務超過2萬家企業客戶。與此同時，可靈AI還重磅發布了全新升級的多圖參考和靈動畫布等功能。

AI故事的主角不光在屏幕里，文旅機構和各大高校把可靈AI的“快來惹毛我”創意特效玩出了梗，將知名地標變成毛絨玩具，相關內容在快手站內的播放量數以億計，還火到了小紅書等站外平臺。

從“制作”到“智作”一字之差，創意的狂歡可見，成本上的明顯差別卻不為人知。據快手內部測算，AI大模型預計可以把客戶的短視頻營銷素材制作成本降低60%—70%，甚至更高。

“制作”到“智作”的流程變化，也不是簡單地增減某一環節，而是重構。

2025年6月，異類Outliers團隊制作的全球首部AI單元故事集《新世界加載中》在快手上線，第一個單元《馬丁癥》上線當天收獲2100萬次收看。

16分鐘的《馬丁癥》，制作團隊最喜歡一段漫畫風格的打斗戲。如果用傳統拍攝手法來制作，每個人的動作和軌跡是可控的，但當前AI很難讓快速連續的打斗動作銜接得自然流暢。異類Outliers成員設計了詳細的動作腳本，利用可靈AI的首尾幀技術，來腦補中間的過渡畫面，整個過程其實非常繁瑣，最終呈現出來后，還是讓團隊很欣慰和激動的。

方法論上，異類Outliers創始人陳翔宇強調，“必須根據已有的或者自研技術去建立階段性的、不斷更新的AI制作體系、腳本、美術、動畫、算力儲備還有算法測試，再到最終成片，每一步都需要在表達和執行性之間反復試探”。

據他透露，上線的這一系列影片其實在2024年底已制作完成，中間有新的技術迭代。自2024年6月發布，快手可靈AI累計完成超20次迭代，2025年5月底可靈2.1系列模型上線，目前可靈AI全球用戶規模突破2200萬，累計生成超過1.68億個視頻及3.44億張圖片，為超過1萬家的企業客戶提供API（應用程序編程接口）服務。

通過API，技術普惠得以在各個領域共享。以電商領域為例，傳統的商品拍攝需雇傭模特、租賃影棚、反復修圖，如今商家只需上傳服裝照片，AI便能生成不同膚色、體型的虛擬模特展示效果，甚至自動合成動態視頻。

基于大模型，醫療行業同樣經歷著效率革命。

近日，清華大學智能產業研究院院長張亞勤表示，AI醫院用2天時間便可完成三甲醫院2—3年的診斷量，而且目前來看診斷的準確率很高，超過了96%。他所指的人工智能醫院，是2025年4月清華大學成立的。按照規劃，初期將建設AI醫院系統，依托北京清華長庚醫院及北京清華長庚互聯網醫院試運行，以全科醫學科和眼科、放射診斷科、呼吸科等專科為試點。

從“功能”到“體驗”的消費升級

2025年被業界定義為大模型應用落地元年，全球大模型技術加速從“技術驗證”向“商業閉環”跨越，“大模型+消費”的想象上限也不斷被拉高，對電商退貨成本的控制是觀察窗口之一。

可靈AI平臺的AI試衣功能是一種能讓人“穿”上指定衣服的圖像生成技術。

想象一下，消費者正在家里，也許還穿著睡衣，躺在沙發上在網上購物，看到一件心儀的衣服，但不確定穿在自己身上會是什么樣子。這時候，消費者只需要上傳一張自己的照片，虛擬試穿就會把這件衣服“穿”在身上。

可圖虛擬試穿在可圖文生圖模型基礎上，引入衣服SKU（最小存貨單位）保持網絡、人物pose（姿勢）、背景修復等技術，實現任意衣服、任意身材、任意動作的試穿效果生成。就算在復雜的人物背景下，也可以生成高質量的試穿結果。

消費者可以通過可圖虛擬試穿各種類型的衣物，它能細致地保留衣物上的圖案、文字和花紋的細節，保證試穿效果和實物商品一致。

站在時間維度，“AI+電商”的體驗感也有不同。24小時，數字人主播在直播間持續介紹商品，AI驅動的虛擬人能實時回答商品問題，也能根據用戶彈幕調整講解重點。

2024年四季度，快手AIGC短視頻營銷素材和虛擬數字人直播解決方案的日均消耗突破3000萬。2025年一季度，快手僅AIGC營銷素材的日均廣告消耗就已達3000萬元。

“人貨場”關系再造，消費從標準化走向個性化，當AI能瞬間理解并滿足個體需求時，傳統零售的貨架邏輯被顛覆，內容成為電商商品的載體，消費者在優質內容的影響下進行消費決策。

這種以內容驅動消費決策的新范式，在2025年春節營銷中迎來爆發式落地。快手可靈AI聯合快手電商推出“靈蛇奇遇”主題活動，攜手周大福、瑪氏箭牌、青島啤酒，以可靈AI創作的“靈蛇”形象為核心，獨家首發蛇年新春定制生肖聯名款產品，依托可靈AI強大的視頻生成技術能力，打造“靈蛇奇遇”主題爆款視頻。線上直播線下聯動營銷，數據顯示，該項目總曝光量4億，AI概念視頻播放量超1000萬，三大品牌單日GMV（商品交易總額）破歷史峰值。

新體驗帶來消費新增量。傳統產業如服裝，有數據顯示，預計到2028年，全球AI時尚市場規模將達到49.5億美元。新技術正在為“美麗經濟”解鎖新玩法，用AI定制化生產只是方式之一。

從技術提供方到各個產業和消費者，再回到大模型應用企業本身，商業通路被打開。根據快手2025年一季度財報，可靈AI營收超過1.5億元。3月（正式推出后的第10個月）實現年化經常性收入（ARR）超1億美元，4月和5月的月度付費金額均超過1億元。

AI之都的全球坐標

應用是技術呈現的方法，技術實現的核心要素是基礎設施，對資金、協調能力和服務能力有要求的AI基礎設施尤為考驗一個城市的能力。

位于朝陽區酒仙橋的北京數字經濟算力中心，是一座五層建筑，可提供的每秒百億億次計算能力，相當于50萬臺高性能電腦同時工作。

位于三層的核心機房擺放著成排的國產AI服務器，這些閃著微光的機器，已經吸引朝陽區AIGC視聽產業創新中心落地，推出支持數字人建模、數字創意、影視制作等“虛擬制片工具包”，助力影視行業AIGC視聽作品快速孵化；在醫療領域，北京數字經濟算力中心與中日友好醫院共建“醫療可信數據空間”，開發“櫻智醫療大模型”，涵蓋多科室專病模型及助診、助研等全場景應用。

據北京市經信局最新數據，2025年一季度北京市算力供給總規模超3.3萬P，預計年底算力供給總規模將超4.5萬P。

從酒仙橋向西，位于海淀的智源研究院從核心技術和原始創新切入，推動人工智能領域發展政策、學術思想、理論基礎、頂尖人才與產業生態的五大源頭創新。

北京之所以能領跑AI競賽，技術基座的自主可控是關鍵。6月，智源研究院繼“悟道”系列大模型后，推出“悟界”系列大模型，其中RoboOS 2.0實現了小腦技能的免適配注冊機制，顯著降低開發門檻，典型場景下，相關代碼量僅為傳統手動注冊方式的1/10。

北京市通過多政策協同積極推進各領域應用場景開放，積極組織應用場景供需對接，形成支持大模型應用落地的產業環境。

諸如算力和大模型等AI基礎設施，為各類AI應用的開發和測試提供了全方位支撐，企業創新因此形成了閉環合力。頭部企業如快手、百度聚焦底層技術突破，中小企業開發細分場景應用，最終在消費端完成價值驗證。

政府工作報告起草組成員、國務院研究室副主任陳昌盛3月答記者問時表示，2024年政府工作報告首次提出要實施“人工智能+”行動。2025年春節前后，中國人工智能產業確實跑出了“加速度”。提及人工智能應用時，他還提到可靈在國際上的評價。

也是在2025年開年，《北京具身智能科技創新與產業培育行動計劃（2025—2027年）》《北京市加快推動“人工智能+新材料”創新發展行動計劃（2025—2027年）》等多項政策出臺。

不難看出，北京人工智能發展與硅谷側重基礎研究的路徑不同，走出了一條“技術研發—場景驗證—商業轉化”的特色道路，這種模式路徑既推動了生產力提升，也催生了新的消費形態。

當北京邁向AI之巔，快手這樣的企業如同城市脈絡中的根系。它們將技術融入短視頻、直播電商等老百姓的日常土壤。北京之所以成為AI第一城，正因懂得：真正的智能高地，不在實驗室的參數里，而在普通人指尖流轉的生活中。

·聲音·

快手科技副總裁、可靈AI技術負責人張迪：我們要做AI時代的“右腦”

關于技術

張迪：過去人類視覺表達的媒介是攝像機，移動設備崛起后變成了手機。與攝像機、手機等相比，AI讓視覺表達的能力邊界進一步擴展，能夠以更低的成本創造出更具想象力的內容，讓每個人都能用AI講出好故事。以可靈AI為代表的大模型技術正在構建全新的視覺表達基建。打個比方，一部具有科幻感的廣告短片，使用可靈AI后能節省約90%的成本。

目前可靈AI已成為擁有AI圖片、AI視頻和AI音頻能力的多模態創意生產力平臺。可靈AI用戶規模已突破2200萬，累計生成1.68億個視頻和3.44億張圖片，ARR（年度經常性收入）超1億美元。

關于業績

2025年一季度，可靈AI營收超過1.5億元，4月和5月的月度付費金額均超過1億元，對于可靈AI獲得的這些商業化成績，張迪表示：

是技術研發能力與應用落地能力的雙重作用。可靈AI的技術實力，源自研發能力和研究能力的齊頭并進。圍繞底層技術，僅過去兩年，可靈AI團隊已發表超80篇國際頂刊頂會論文，獲得超過3萬次引用。

以技術路線為例，一方面，可靈AI基于現有成熟技術路線精耕細作，將模型性能做到極致；另一方面，跳出現有技術路線，另辟蹊徑地前瞻探索未來更有前景的技術路線。整個科技行業發展非常快，AI發展非常快，最重要的還是AI轉化為新質生產力。

關于競爭

從2024年至今，視頻生成是大模型賽道的競爭重點，不只在北京，全球都在講多模態生成的故事，對于可靈AI在同行中的定位，張迪認為：

我們的愿景是讓每個人都能用AI講出好故事。一個好故事的講述，從能力實現的角度，要首先用畫面復刻出人們內心的那個想法，如果再進一步，能用AI呈現出超越人們內心的想法，真正實現人與人工智能的互動創作、啟發式創作，實現從可用到好用，是接下來我們要做的事。

中關村2025年8期

中關村的其它文章: 科創之樹：根深葉茂的北京創新生態; 中關村視線; 蕭蕓：一片冰心大愛灑向下一代; 全球AI少年聚首，共繪科技未來新圖景; 賽納生物：基因測序解鎖“治未病”新選項; 兩大重磅指南齊發，AI教育步入規范發展新階段