莊嘉
自然人與虛擬數字人并存的時代即將到來,數字世界或將迎來新的裂變。2022年伊始,虛擬數字人競相亮相,抓人眼球。從榮獲“萬科最佳新人獎”的數字員工“崔筱盼”,到北京衛視2022年春節聯歡晚會的虛擬人“蘇小妹”;從全球首個登上奧運會的虛擬歌手“洛天依”,到新華社推出的首位虛擬網紅“熱愛REAL”作為冬奧公益宣傳大使……一時間,虛擬數字人成了網絡世界的新爆點。
虛擬數字人的頻繁出現,意味著諸多領域將迎來大進化的關鍵變革。究竟何謂“虛擬數字人”呢?根據中國人工智能產業發展聯盟總體組和中關村數智人工智能產業聯盟數字人工作委員會發布的《2020年虛擬數字人發展白皮書》,“虛擬數字人,是指通過計算機圖形學技術創造出的與人類形象接近的數字化形象,并賦予其特定的任務身份設定”。從相似度上來看,虛擬數字人就是數字化外形的虛擬人,擁有三方面“類人”特征,即人的外貌(長得像人),人的行為(能說話,能舉手,能做鬼臉),以及人的思想(會學習)。
據統計,在2022年北京冬奧會上,至少出現了28位虛擬數字人,應用類型囊括了氣象主播、真人虛擬形象主播、手語主播、奧林匹克公益宣傳大使、冬奧官方周邊帶貨主播等,參與主體涵蓋了新華社、騰訊、百度、阿里、中國移動、科大訊飛、微軟小冰等20家科技、平臺類巨頭。京東云更是明確對外宣稱,“將深入探索虛擬數字人領域”。
這股虛擬數字人的風潮實際上得益于國務院在2022年初發布的《數字經濟十四五發展規劃》。該規劃明確提出,“十四五”時期數字經濟發展要以數字技術與實體經濟深度融合為主線,賦能傳統產業轉型升級。到2025年,數字經濟核心產業增加值占國內生產總值比重達到10%,數字技術與實體經濟融合取得顯著成效。

在這樣的大背景下,從2021年下半年開始,國內便興起了一股數字虛擬風。據統計,2021年下半年,虛擬數字人相關企業融資超過了20起。紅杉資本、IDG資本、順為資本等一線基金紛紛入局。2021年6月15日,清華大學計算機系舉行“華智冰”成果發布會,宣布“華智冰”正式入學,迎來了中國首個原創虛擬學生。國家廣電總局于2021年10月20日在《廣播電視和網絡視聽“十四五”科技發展規劃》中首次明確指出,“推動虛擬主播、動畫手語廣泛應用于新聞播報、天氣預報、綜藝科教等節目生產,創新節目形態,提高制播效率和智能化水平。到2020年,IP化制播標準體系基本完善”。2021年12月5日,新華社成立了元宇宙聯創中心,多次發文表示“鼓勵探索,構建數字空間新生態”,并推出首位虛擬網紅“熱愛REAL”作為冬奧公益宣傳大使。
據天風證券統計數據顯示,“2021年中國虛擬數字人行業的市場規模近2000億元人民幣”。另據《量子位:虛擬數字人深度產業報告》,“到2030年,我國虛擬數字人市場規模將達到2700億元人民幣”。實然,這股虛擬數字人的春風已經起了勢!
與以往的虛擬影像不同,虛擬數字人異于虛擬人、數字人的重要分水嶺在于其具備“智”的潛力——即思考能力。從研發前景來看,虛擬數字人是AI人格化催生的“數”與“智”的結合。核心潛力是其具備持續的學習能力,能逐漸“成長”,不斷學習數據中隱含的模式,包括文本、視覺、圖像、視頻等,就如同人類能夠不斷從身邊經歷的事情中學習的行為模式一樣。隨著時間推移,虛擬數字人針對新場景學到的新能力,將有機地融入自己的模型中,從而變得愈發“聰明”。
由于虛擬數字人具備的成長潛能,海內外廠商正在加速布局虛擬數字人賽道。比如,德國的德意志銀行于2020年7月推出了全球首個虛擬數字員工“Blue Bot Yi”,旨在負責為德意志銀行兩家在華客戶提供實時定制交易報告、現金池報告的服務,并能處理和響應客戶查詢指令。德國的制表品牌NOMOS Glashütte于2022年1月推出了品牌時光摯友-虛擬數字人“阿喜”,意圖進一步增強品牌用戶在手表視覺體驗上的交互感。
又比如,新西蘭的UNEEQ公司“以橄欖球運動員約翰·基爾萬為原型,打造了一款可以隨時隨地為用戶提供心理健康支持的虛擬數字人“DJK”。其不僅可以幫助用戶制定睡眠改善計劃,還能回答用戶圍繞睡眠行為所提出的一系列問題。其優勢在于,它既可以讓用戶隨時隨地與體育巨星進行個性化的對話和互動,又可以接收經驗豐富的臨床醫生以及心理學專家的專業知識。
我國也開始布局虛擬數字人行業。《每日經濟新聞》已經打算與微軟小冰公司聯合打造全球首個全流程由人工智能技術驅動的視頻直播電視欄目“每經AI電視”,此直播節目將保持“7×24小時”不間斷播出。
當然,不可否認的是,目前大多數虛擬數字人仍不具備人類的思考能力,絕大多數與外界的交互是由人類操控的,最典型的例子就是“虛擬主播”。由此可見,文本驅動、會話場景驅動以及真人驅動仍然是虛擬數字人當下的主流,而無智能驅動的虛擬數字人才是未來發展的方向。
隨著計算機圖形學、深度學習、語音合成、類腦科學等聚合科技的進步,虛擬數字人的應用場景將得到進一步擴展。作為多模態升級的代表,技術虛擬數字人的應用場景將與各行業各領域相結合,從早期的泛娛樂化逐漸延伸到傳媒、文化、教育、金融、文旅、醫療、零售、體育等各個領域。虛擬數字人也將朝著智能化、便捷化、精細化和多樣化方向發展。
目前,開發虛擬數字人的三大關鍵技術分別是“建模”“驅動”以及“渲染”。
建模層面,“靜態掃描建模”仍是主流,“動態光場三維重建”初現端倪。比如,IR及Ten24等大型影視數字人制作運用的是靜態掃描建模技術。韓國人工智能初創企業明芒科技公司DeepBrain AI創建的人工智能工作室,制作的虛擬數字人視頻多是運用靜態掃描建模技術。相較而言,瑞典在虛擬數字人建模領域位居世界前列。著名VFX制作公司ILM(工業光魔)為瑞典的頂級流行音樂組合ABBA(阿巴樂隊)提供視效制作支持,并運用動態光場三維重建技術為他們創建立體多維的數字模型,其皮膚、紋理、五官近乎真人。
我國的商湯科技在人臉識別領域已經開始運用動態光場重建技術。
驅動層面,主要有兩項核心技術,分別是“智能會成”以及“動作捕捉遷移”。其中,“動作捕捉遷移”是核心中的核心。日本克理普敦未來媒體于2007年8月就推出了虛擬歌姬“初音未來”,之后經過動作捕捉遷移技術層面的改良,使得其捕捉采集的動作能夠更順暢地與“初音未來”融合,成為了全球知名的虛擬數字人。又如,瑞典的沃爾沃公司研發了“Teslasuit動作捕捉服”,可以精確捕捉車手和乘客在賽道上試駕時的生理感受,從而提升車輛的用戶滿意度。
從渲染層面來看,算法突破已成為核心路徑。比如,2021年初,虛幻引擎開發商Epic Games推出了MetaHuman Creator(Meta人類創造者),用于快速創造逼真的虛擬數字人,并且通過動作捕捉系統在虛擬引擎中實時驅動及加以渲染。
編輯:黃靈? yeshzhwu@foxmail.com