顏媛媛


大家好,我是數字人大亨,很榮幸能夠與大家探討一個備受關注的話題:AIGC(AIGC 即AIGeneratedContent,是指利用人工智能技術來生成內容)是否能代替人類進行創作?歷史證明,人類的創造力和創作風格是隨著時代和技術革新不斷演進的。在內容創作,尤其是創作優質個性化內容方面,AIGC 和人類的協同是非常必要的一環。
3月30日,在2023新榜大會上,騰訊內容平臺部副總經理姚天恒通過他的數字人“大亨”做了這樣的開場演講(如圖1)。令人關注的是,這個數字人不僅在形象上高度逼真,而且在語音、語調、唇動等方面也非常真實,甚至連姚天恒慣常的表情和動作都毫不馬虎地模擬了出來。
數字人“大亨”是以姚天恒真人為原型打造,采用騰訊智影最新人工智能技術,通過深度學習他本人少量的真實音頻、視頻數據生成的分身模型。借此機會,騰訊也正式對外發布了全新的AI智能創作助手“騰訊智影”,通過為內容創作者提供一系列的智能創作工具,幫助創作者在內容創作時提質增效。
騰訊在AI 領域的動作很快,距離騰訊在2022全年業績財報電話會上坦言AI“非常令人興奮”,并表態未來可能將AI 納入微信和QQ,剛剛過去一周時間,騰訊就分別在博鰲亞洲論壇2023 年年會“下一代互聯網”
論壇上透露正在研發類ChatGPT 聊天機器人,并且集成到QQ、微信,以及騰訊云的版本“都會有”,以及正式在“2023 新榜大會”上發布“騰訊智影”。
然而,很多人都沒想到“騰訊智影”發布的第一時間,人們就可以在微信小程序中找到并體驗,與此同時,用戶還可以使用PC 瀏覽器登錄zenvideo.qq.com 開啟“騰訊智影”平臺,以獲得更便利的操控體驗。
在官方主頁可以看到,騰訊智影主要提供“人”“聲”“影”三個方面的能力。其中在“人”的方面,“智影數字人”是騰訊智影最核心的功能。用戶輸入文本或音頻內容,即可生成數字人播報視頻。根據用戶差異化的應用需求和場景,“騰訊智影”又細分為視頻剪輯、文本配音、數字人播報、視頻審閱等多個功能(如圖2)。
在“聲”的方面,騰訊智影則提供了文本配音、音色定制、智能變聲等功能。在“影”的方面,通過騰訊智影文章轉視頻能力,創作者可以直接將自己撰寫的文字轉化為視頻內容,無須進行繁瑣的素材收集和處理。此外,騰訊智影分段式的素材呈現方式,讓創作者可以快速處理分鏡,添加卡點、濾鏡、特效等,從而大大縮短視頻制作的周期和成本。
如此強大的功能,再憑借騰訊微信小程序的覆蓋面,自然在第一時間成為市場關注的焦點。
在“騰訊智影”主界面點擊“數字人播報”后即可打造屬于自己的數字人主播。用戶首先需要選擇相應的數字人形象(提供2D和3D兩個類別可供選擇),即可進入數字人創作界面(如圖3)。
這里要提醒大家的是,“騰訊智影”需要在Chrome瀏覽器進行訪問,即便是騰訊QQ瀏覽器也會提示PC 用戶更換瀏覽器進行工作。在3D主播生成界面可以看到,左側主要是工具欄界面,數字人、背景、配樂等細節都可以單獨編輯,以“數字人編輯”為例,用戶可以對3D主播的形象及動作、畫面、字幕等細節進行個性化打造。
從服裝樣式、服裝顏色、人物姿勢到動作,“騰訊智影”都提供了預設模式給用戶選擇,用戶只需要根據個人偏好進行點選即可,上手非常快(如圖4)。

追求易用性的同時,“騰訊智影”在細節上并沒有完全“放權”。用戶可以選擇3D數字人各種動作表達,配合文字內容形成自然、連貫的播報,但數字人具體發型、面部表情其實是沒辦法做個性化定制的,不過在“高級編輯”中,用戶還是可以上傳自己的視頻、音頻和圖片資料,進而強化數字人主播內容的差異化。

不過目前“騰訊智影”只對免費用戶開放了部分體驗功能,其余大部分需要用戶付費使用。如免費版,可以獲得每個月5分鐘的免費數字人生成視頻時長,每天3 次的智能工具使用等;398元一年的高級會員是每個月10分鐘的數字人生成視頻時長或高級+ 專業音色的文本配音服務二選一,以及每天50次的智能工具等。而在數字人定制上,目前照片定制數字人形象的價格為首年3999元,視頻定制數字人形象的價格為首年7999元(如圖5)。
值得一提的是“騰訊智影”內部已經嵌入了金幣體系,部分服務需要使用“金幣”付費,而金幣除了注冊時贈送的1000金幣外,還可通過簽到等活躍行為獲得。
拋開數字人的打造,“騰訊智影”本身是一款影音剪輯工具,對于不少“小白”用戶而言,其在文本配音、視頻剪輯等方面的工具屬性更具實用性。
在“騰訊智影”主界面中點擊“文本配音”后進入相應編輯界面,在頂部菜單欄找到“導入文本”的選項,平臺支持doc、docx、txt 等格式的文本,默認文本上限 8000 個字,足以滿足半小時左右的配音需求了。不同于其他視頻剪輯軟件,用戶能對配音的節奏(整體速度、局部速度)、發音等等進行調校,最為強大的地方是智影“文本配音”支持不同句、不同字添加不同配音,比如旁白、開場都可以選用不同的人聲(如圖6)。
除配音功能非常人性化外,“文本配音”本身預置了數十款配音素材可選,用戶可以根據視頻配音、文章播報、新聞播報、有聲小說、語音助手等分類快速選擇最適合自己的配音模板,而且頂部還有語氣和情緒的分類,再加上“百變”標簽人物下的方言選項,足以為用戶帶來靈活多變的文本配音。
而對于高階玩家,“文本配音”還提供了“定制專屬音色”服務,系統可根據用戶上傳音色進行“聲音復刻”,從而打造獨一無二的配音(如圖7)。
除了極其強悍的配音功能外,視頻剪輯也是“騰訊智影”的基礎功能。從素材到音軌,從轉場到特效,“騰訊智影”的視頻剪輯功能可以說是相當強大,無論是初學者還是專業剪輯師都能快速上手。
素材和快捷鍵可


以說是“騰訊智影”剪輯功能的一大特色,在軌道區進行創作,免不了對素材進行雕琢,智影目前已具備十余種素材調整操作功能,而且右上角的快捷鍵欄也上線30 余個預設快捷鍵,極大提升了剪輯效率。
相對功能強悍的PC版,微信“騰訊智影”小程序同樣能夠實現數字人、智能配音等熱門功能,但受限于手機操作空間,視頻剪輯等功能并非其主打,而是引入了當下最熱門的“AI繪畫”。
進入AI繪畫頁面后,發現“騰訊智影”在繪圖方面支持文本生圖和圖生圖兩種生成方式,其中圖生圖只能生成動漫風格一種風格,但可以額外添加文字修飾,以更加準確地生成自己想要的效果(如圖8)。
而文本生圖支持的風格則比較多元,有2D動漫、2.5D動漫、國風、彩漫、素描、線稿、人像特寫、油畫、印象派共9 種,比較遺憾的是暫時只支持生成人像。從最終生成效果來看,“AI繪畫”最終成像效果還是比較讓人滿意了。
總體而言,“騰訊智影”本身并非全新產品,本次在AI 上的升級,讓其不僅兼顧了市場上已有的功能,而且更是從一個視頻創作工具升級為“智慧”的創作助手,無疑能進一步解放短視頻創作者生產力,更讓入門級用戶也能通過數字人踐行自己的想法,極大地推動了AIGC內容產業落地。
