從中關村科學城的實驗室到快手可靈AI事業部的工位,我國AI濃度最高的北京不斷向外輻射創新推動力。這里有全國近四成備案上線的大模型,AI企業數量超2400家,核心產業規模接近3500億元。
“制作”到“智作”的生產力革命
北京的AI成績源于智源研究院的技術突破,亦莊、朝陽區等超3.3萬P算力供給等看不見的支撐,還有以可靈AI為代表的大模型應用對生活生產場景的滲透。
技術、人才、場景、政策的多重加持,讓北京率先探索出“技術突破—產業應用—創新消費”的AI發展閉環。從高端制造業的智能生產,到內容平臺的創意爆發,再到城市治理的智慧升級,快手的案例只是縮影,AI第一城群星閃爍。
當前,多模態大模型幾乎成為大模型企業標配,可生成圖片、可生成視頻、可多樣化交互,這種更容易感知的生產方式,讓抽象的代碼離用戶更近,它可以是生產線上的“創意工人”,也可以在體驗式消費中提供情緒價值。
2024年6月,異類Outliers團隊用一個晚上生成了一部小短片,那是一輛小汽車飛上太空的影像,技術來自于可靈AI。一個月后,導演陳坤帶著與可靈AI共創的《山海奇鏡之劈波斬浪》,在中影國際影城cinity 7號廳超前點映。
他向媒體披露了多組數據,“同樣體量和質量的短劇,制作周期最少需要3—6個月,視頻大模型讓《山海奇鏡之劈波斬浪》的制作只用了2個月”,“過去我們做傳統影視,外拍需要100多人的制作團隊,包括演員、攝影、燈光、音響、劇務、服化道等。現在全片沒有一個畫面是真人拍攝,服化道也可以通過AI生成”。
觀眾不見得熟悉“幕后”故事。7月27日,在2025世界人工智能大會期間,快手可靈AI舉辦了以“生成式AI應用元年”為主題的生態論壇。會上披露,可靈AI目前已在全球擁有超過4500萬創作者,產品自發布以來迭代升級30余次,累計生成超2億個視頻和4億張圖片,服務超過2萬家企業客戶。與此同時,可靈AI還重磅發布了全新升級的多圖參考和靈動畫布等功能。
AI故事的主角不光在屏幕里,文旅機構和各大高校把可靈AI的“快來惹毛我”創意特效玩出了梗,將知名地標變成毛絨玩具,相關內容在快手站內的播放量數以億計,還火到了小紅書等站外平臺。
從“制作”到“智作”一字之差,創意的狂歡可見,成本上的明顯差別卻不為人知。據快手內部測算,AI大模型預計可以把客戶的短視頻營銷素材制作成本降低60%—70%,甚至更高。
“制作”到“智作”的流程變化,也不是簡單地增減某一環節,而是重構。
2025年6月,異類Outliers團隊制作的全球首部AI單元故事集《新世界加載中》在快手上線,第一個單元《馬丁癥》上線當天收獲2100萬次收看。
16分鐘的《馬丁癥》,制作團隊最喜歡一段漫畫風格的打斗戲。如果用傳統拍攝手法來制作,每個人的動作和軌跡是可控的,但當前AI很難讓快速連續的打斗動作銜接得自然流暢。異類Outliers成員設計了詳細的動作腳本,利用可靈AI的首尾幀技術,來腦補中間的過渡畫面,整個過程其實非常繁瑣,最終呈現出來后,還是讓團隊很欣慰和激動的。
方法論上,異類Outliers創始人陳翔宇強調,“必須根據已有的或者自研技術去建立階段性的、不斷更新的AI制作體系、腳本、美術、動畫、算力儲備還有算法測試,再到最終成片,每一步都需要在表達和執行性之間反復試探”。
據他透露,上線的這一系列影片其實在2024年底已制作完成,中間有新的技術迭代。自2024年6月發布,快手可靈AI累計完成超20次迭代,2025年5月底可靈2.1系列模型上線,目前可靈AI全球用戶規模突破2200萬,累計生成超過1.68億個視頻及3.44億張圖片,為超過1萬家的企業客戶提供API(應用程序編程接口)服務。
通過API,技術普惠得以在各個領域共享。以電商領域為例,傳統的商品拍攝需雇傭模特、租賃影棚、反復修圖,如今商家只需上傳服裝照片,AI便能生成不同膚色、體型的虛擬模特展示效果,甚至自動合成動態視頻。
基于大模型,醫療行業同樣經歷著效率革命。
近日,清華大學智能產業研究院院長張亞勤表示,AI醫院用2天時間便可完成三甲醫院2—3年的診斷量,而且目前來看診斷的準確率很高,超過了96%。他所指的人工智能醫院,是2025年4月清華大學成立的。按照規劃,初期將建設AI醫院系統,依托北京清華長庚醫院及北京清華長庚互聯網醫院試運行,以全科醫學科和眼科、放射診斷科、呼吸科等專科為試點。
從“功能”到“體驗”的消費升級
2025年被業界定義為大模型應用落地元年,全球大模型技術加速從“技術驗證”向“商業閉環”跨越,“大模型+消費”的想象上限也不斷被拉高,對電商退貨成本的控制是觀察窗口之一。
可靈AI平臺的AI試衣功能是一種能讓人“穿”上指定衣服的圖像生成技術。
想象一下,消費者正在家里,也許還穿著睡衣,躺在沙發上在網上購物,看到一件心儀的衣服,但不確定穿在自己身上會是什么樣子。這時候,消費者只需要上傳一張自己的照片,虛擬試穿就會把這件衣服“穿”在身上。
可圖虛擬試穿在可圖文生圖模型基礎上,引入衣服SKU(最小存貨單位)保持網絡、人物pose(姿勢)、背景修復等技術,實現任意衣服、任意身材、任意動作的試穿效果生成。就算在復雜的人物背景下,也可以生成高質量的試穿結果。
消費者可以通過可圖虛擬試穿各種類型的衣物,它能細致地保留衣物上的圖案、文字和花紋的細節,保證試穿效果和實物商品一致。
站在時間維度,“AI+電商”的體驗感也有不同。24小時,數字人主播在直播間持續介紹商品,AI驅動的虛擬人能實時回答商品問題,也能根據用戶彈幕調整講解重點。
2024年四季度,快手AIGC短視頻營銷素材和虛擬數字人直播解決方案的日均消耗突破3000萬。2025年一季度,快手僅AIGC營銷素材的日均廣告消耗就已達3000萬元。
“人貨場”關系再造,消費從標準化走向個性化,當AI能瞬間理解并滿足個體需求時,傳統零售的貨架邏輯被顛覆,內容成為電商商品的載體,消費者在優質內容的影響下進行消費決策。
這種以內容驅動消費決策的新范式,在2025年春節營銷中迎來爆發式落地。快手可靈AI聯合快手電商推出“靈蛇奇遇”主題活動,攜手周大福、瑪氏箭牌、青島啤酒,以可靈AI創作的“靈蛇”形象為核心,獨家首發蛇年新春定制生肖聯名款產品,依托可靈AI強大的視頻生成技術能力,打造“靈蛇奇遇”主題爆款視頻。線上直播線下聯動營銷,數據顯示,該項目總曝光量4億,AI概念視頻播放量超1000萬,三大品牌單日GMV(商品交易總額)破歷史峰值。
新體驗帶來消費新增量。傳統產業如服裝,有數據顯示,預計到2028年,全球AI時尚市場規模將達到49.5億美元。新技術正在為“美麗經濟”解鎖新玩法,用AI定制化生產只是方式之一。
從技術提供方到各個產業和消費者,再回到大模型應用企業本身,商業通路被打開。根據快手2025年一季度財報,可靈AI營收超過1.5億元。3月(正式推出后的第10個月)實現年化經常性收入(ARR)超1億美元,4月和5月的月度付費金額均超過1億元。
AI之都的全球坐標
應用是技術呈現的方法,技術實現的核心要素是基礎設施,對資金、協調能力和服務能力有要求的AI基礎設施尤為考驗一個城市的能力。
位于朝陽區酒仙橋的北京數字經濟算力中心,是一座五層建筑,可提供的每秒百億億次計算能力,相當于50萬臺高性能電腦同時工作。
位于三層的核心機房擺放著成排的國產AI服務器,這些閃著微光的機器,已經吸引朝陽區AIGC視聽產業創新中心落地,推出支持數字人建模、數字創意、影視制作等“虛擬制片工具包”,助力影視行業AIGC視聽作品快速孵化;在醫療領域,北京數字經濟算力中心與中日友好醫院共建“醫療可信數據空間”,開發“櫻智醫療大模型”,涵蓋多科室專病模型及助診、助研等全場景應用。
據北京市經信局最新數據,2025年一季度北京市算力供給總規模超3.3萬P,預計年底算力供給總規模將超4.5萬P。
從酒仙橋向西,位于海淀的智源研究院從核心技術和原始創新切入,推動人工智能領域發展政策、學術思想、理論基礎、頂尖人才與產業生態的五大源頭創新。
北京之所以能領跑AI競賽,技術基座的自主可控是關鍵。6月,智源研究院繼“悟道”系列大模型后,推出“悟界”系列大模型,其中RoboOS 2.0實現了小腦技能的免適配注冊機制,顯著降低開發門檻,典型場景下,相關代碼量僅為傳統手動注冊方式的1/10。
北京市通過多政策協同積極推進各領域應用場景開放,積極組織應用場景供需對接,形成支持大模型應用落地的產業環境。
諸如算力和大模型等AI基礎設施,為各類AI應用的開發和測試提供了全方位支撐,企業創新因此形成了閉環合力。頭部企業如快手、百度聚焦底層技術突破,中小企業開發細分場景應用,最終在消費端完成價值驗證。
政府工作報告起草組成員、國務院研究室副主任陳昌盛3月答記者問時表示,2024年政府工作報告首次提出要實施“人工智能+”行動。2025年春節前后,中國人工智能產業確實跑出了“加速度”。提及人工智能應用時,他還提到可靈在國際上的評價。
也是在2025年開年,《北京具身智能科技創新與產業培育行動計劃(2025—2027年)》《北京市加快推動“人工智能+新材料”創新發展行動計劃(2025—2027年)》等多項政策出臺。
不難看出,北京人工智能發展與硅谷側重基礎研究的路徑不同,走出了一條“技術研發—場景驗證—商業轉化”的特色道路,這種模式路徑既推動了生產力提升,也催生了新的消費形態。
當北京邁向AI之巔,快手這樣的企業如同城市脈絡中的根系。它們將技術融入短視頻、直播電商等老百姓的日常土壤。北京之所以成為AI第一城,正因懂得:真正的智能高地,不在實驗室的參數里,而在普通人指尖流轉的生活中。
·聲音·
快手科技副總裁、可靈AI技術負責人張迪:我們要做AI時代的“右腦”
關于技術
張迪:過去人類視覺表達的媒介是攝像機,移動設備崛起后變成了手機。與攝像機、手機等相比,AI讓視覺表達的能力邊界進一步擴展,能夠以更低的成本創造出更具想象力的內容,讓每個人都能用AI講出好故事。以可靈AI為代表的大模型技術正在構建全新的視覺表達基建。打個比方,一部具有科幻感的廣告短片,使用可靈AI后能節省約90%的成本。
目前可靈AI已成為擁有AI圖片、AI視頻和AI音頻能力的多模態創意生產力平臺。可靈AI用戶規模已突破2200萬,累計生成1.68億個視頻和3.44億張圖片,ARR(年度經常性收入)超1億美元。
關于業績
2025年一季度,可靈AI營收超過1.5億元,4月和5月的月度付費金額均超過1億元,對于可靈AI獲得的這些商業化成績,張迪表示:
是技術研發能力與應用落地能力的雙重作用。可靈AI的技術實力,源自研發能力和研究能力的齊頭并進。圍繞底層技術,僅過去兩年,可靈AI團隊已發表超80篇國際頂刊頂會論文,獲得超過3萬次引用。
以技術路線為例,一方面,可靈AI基于現有成熟技術路線精耕細作,將模型性能做到極致;另一方面,跳出現有技術路線,另辟蹊徑地前瞻探索未來更有前景的技術路線。整個科技行業發展非常快,AI發展非常快,最重要的還是AI轉化為新質生產力。
關于競爭
從2024年至今,視頻生成是大模型賽道的競爭重點,不只在北京,全球都在講多模態生成的故事,對于可靈AI在同行中的定位,張迪認為:
我們的愿景是讓每個人都能用AI講出好故事。一個好故事的講述,從能力實現的角度,要首先用畫面復刻出人們內心的那個想法,如果再進一步,能用AI呈現出超越人們內心的想法,真正實現人與人工智能的互動創作、啟發式創作,實現從可用到好用,是接下來我們要做的事。