劉 妍
(作者單位:重慶工商大學)
截至2022年11月,以“虛擬主播”為主題在知網進行檢索,共檢索出1 274篇相關文獻,從年度發表趨勢來看,發表數量從2016年開始明顯增多,并呈不斷上升的趨勢。在這一千余篇文獻中,有78篇文獻的篇名帶有“虛擬主播”這一關鍵詞。目前熱度較高的論文研究主要包括虛擬主播行業發展狀況、虛擬主播技術研究、虛擬主播的情感倫理問題、虛擬主播在各行各業的應用這四大方向。
在梁志立等學者的研究中,虛擬主播主要指人工智能(Artificial Intelligence,AI)合成主播,無須真人表演參與,采用超寫實三維數字人建模、多模態識別及生成技術合成,目前主要應用于廣電行業[1]。而謝曉凌等學者將虛擬主播定義為由真人進行配音、解說、表演和演繹,通過面部和動作捕捉技術傳輸給虛擬主播系統,實時控制虛擬形象,從而通過網絡平臺與觀眾互動[2]。在本篇論文研究中,對“虛擬主播”這一概念的限定是與高勇、馬思偉、宋博聞、李繼平、謝曉凌等學者保持一致的。
虛擬主播即以電子手段合成的虛擬形象為主體,通過真人臉部和動作實時捕捉,從事視頻內容制作或直播的個體。用電子手段合成虛擬形象即為“建模”,“建模”前找專業畫師根據需求繪制虛擬形象,然后再找專業建模團隊依據繪制出來的形象制作二維或者三維模型。前者以Live2D技術為基礎,配套面部捕捉軟件實現虛擬形象的運動;后者則是以三維技術為基礎,配套動態捕捉設備來操作虛擬形象[3]。虛擬形象以二次元形象(“二次元”原指二維世界,后來二維圖像的動畫、漫畫、游戲等作品統稱為“二次元”)為主,再融入其他多種元素。面部和動作捕捉以及聲音提供所依賴的背后真人即為“中之人”,“中之人”在虛擬主播中占據主導位置,賦予了虛擬形象靈魂。本篇研究的虛擬主播最重要的一個特征是實時性,虛擬形象的動作、聲音等都不是提前錄制好再進行后期制作的,而是實時捕捉“中之人”的動作,實時同步聲音,實時轉化。簡單來說,這里所指的虛擬主播是虛擬形象與“中之人”缺一不可的。
嗶哩嗶哩(bilibili,簡稱“B站”)作為從AcFun彈幕視頻網分家的二次元亞文化社區,前身名叫MikuFans,Miku就是當下最有名的虛擬歌者之一初音未來(Hatsune Miku)。2019年,B站正式收購上海禾念信息科技有限公司,洛天依、樂正綾、言和等一眾人氣較高的虛擬偶像正式入駐B站,隨后特別舉辦了中國最早的虛擬偶像線下VR演唱會Bilibili Macro Link,簡稱BML。B站擁有天然的二次元生長與發展的環境,助力了國內的虛擬偶像植根于此發展自身,曾經的許多“唱見”(以翻唱為主的網絡歌手),如“泠鳶yousa”“Hanser”等,紛紛定制了自己的虛擬形象,從亞文化的小眾層面贏得了更多二次元愛好者的關注與喜愛。
然而目前,B站擁有100萬以上粉絲數量的虛擬主播只有30位,頭部主播競爭不算激烈,并且還有很大的增長空間。作為二次元文化聚集區,B站的虛擬主播發展可以說處在前沿,但也只是處于初級階段,距離具有超大影響力的虛擬主播的出現仍然路漫漫。
將B站虛擬主播的創作內容垂直細分,大致劃分為動畫、游戲、音樂、生活及其他五大類,動畫、游戲和生活是投稿數量較多、競爭壓力較大的三個領域,播放量較高的視頻則集中在動畫、音樂和游戲這三類優質視頻。高播放量意味著高流量,也就意味著高收益。根據投稿量和播放量的不完全匹配問題,尚未做出成績的B站虛擬主播應當調整內容創作方向,以受眾需求為準及時調整自身定位。
隨著受眾的擴大,許多虛擬主播已經意識到了這個問題,開始涉足游戲領域。例如B站頭部虛擬主播唱見“阿梓從小就很可愛”,以及從游戲主播轉型、定制虛擬形象的“Asaki大人”,日常的直播內容已經變為“虛擬形象+熱門游戲實況”,將游戲與虛擬形象相結合,獲得了更高的關注度。
這里的“視覺呈現”可以理解為“視覺傳達”,它不單單指虛擬主播的外在形象。已知虛擬主播是以虛擬形象呈現的,而虛擬形象是按照需求繪制出來的,所以所有虛擬主播的外在形象都堪稱完美。但是,同樣都有著完美外在形象的虛擬主播的熱度并不相同,粉絲忠誠度也不同,傳播效果也相差甚遠。這就是視覺呈現所包含的各個方面的差異造成的。視覺呈現包括畫面質量、品行、內容創作、語言風格等方面。畫面質量是指技術設備方面,比如畫面清晰度、背景契合度、模型高級度等。品行一般指真人的品德行為,而在虛擬主播上指人設,就是利用標簽化的方式突顯差異性[4]。
虛擬偶像雖然是虛擬的身份,但是會被賦予特定的性格,也就是專屬于自己的人設,這種設定一般是官方預先賦予,此后可以根據粉絲訴求進行完善。在B站點開虛擬歌者的主頁,可以看到樂正綾的定位是個性鮮明、樂正家族的大小姐,言和是一個外表帥氣、內心溫柔的少女。由于并非真人,這種設定也會處于長期保持的狀態。
與虛擬歌者不同的是,更多的虛擬主播基于預設的虛擬形象,會一定程度展現“中之人”的性格或是背后商業公司要求打造的匹配性格,其間自由度的高低將由虛擬形象背后的商業利益決定。一些并不完美的小“瑕疵”可以給觀眾更加豐富的情感體驗。
內容創作主要指虛擬主播的內容創作方向,即以何種內容來實現與觀眾之間的有效互動。語言風格則要求說話方式在符合二次元的大前提下又有自己的顯著特征,包括語種選擇、變音等。近年來,越來越多的外語虛擬主播入駐B站,雖然直播內容對于國內大部分觀眾來說有語言隔閡,但是有了優質的虛擬形象、立體的人物性格、好聽的音色,就足以俘獲大量受眾。簡單來說,有“好看的皮囊+有趣的靈魂”才能實現虛擬主播的成功運營。
B站虛擬主播的數量早已過萬,但參考粉絲量和播放量,大部分還未形成一定程度的傳播效果與范圍,傳播效果的研究價值較低,所以本文將選取達到一定傳播規模的虛擬主播案例進行分析。
以隨機選擇的某幾日B站虛擬主播的直播情況為例,通過觀看發現以下幾位的直播觀看人數皆達百萬以上且呈常態趨勢:團體主播“A-SOUL女團”和個體主播“泠鳶yousa”“多多poi丶”等。其中,A-SOUL的直播觀看人數更是一騎絕塵,常常達到四五百萬的人氣數值。
3.2.1 技術設備精密,打造視覺盛宴
虛擬主播團隊A-SOUL是相對獨特的存在,屬于樂華娛樂的虛擬偶像團隊。背靠大型娛樂公司,實現了“技術+美女”的完美結合。A-SOUL的技術在中國虛擬主播界屬于領先地位,在大多數虛擬主播還是以半身Live2D模型為主、少數三維模型的動作捕捉也限于上半身的情況下,A-SOUL就擁有了全身動作捕捉的三維模型。動作捕捉系統主要是光學動作捕捉和慣性動作捕捉,A-SOUL采取的是精密度更高的光學捕捉系統,動作細節甚至可以細膩到舞蹈中的手指動作[5]。所有的動作捕捉加上后期渲染都可以實現精細化。
畫面質量在虛擬主播間存在差異,主要受分辨率、幀率和碼率三個因素影響,簡單說就是數值越高,畫面質量越好。4K超高清分辨率技術的成熟給觀眾帶來極大的視覺享受,而5G技術又使4K直播更為普及。直播是4G時代的產物,對碼率有高要求。虛擬主播的動作捕捉需要傳輸和處理大量數據,為保障畫面流暢度和高清晰度,就離不開專業設備的支持,上述具有代表性的虛擬主播都具備高質量畫面。
3.2.2 直播畫面精美,滿足審美需求
受眾的審美需求分為感官需求、情感需求和理性需求三個層次。簡單來說,感官需求是對聲畫系統的需求,情感需求是追求情感共鳴與認同,理性需求是求知欲等需求。這三個層次的需求驅使受眾產生觀賞行為[6]。所以,觀眾審美需求的滿足不僅需要上述技術設備的“硬”支撐,也需要“軟”支撐。在直播畫面流暢度和清晰度得到保障的前提下,整個直播場景的搭建也很影響觀眾的體驗,這就類似于“舞美”的概念。與真人直播不同,虛擬主播的直播背景也是虛擬的。虛擬背景的選擇要契合虛擬形象和虛擬主播當期的直播主題。
例如,虛擬主播“泠鳶yousa”的直播內容基本以聊天、唱歌和游戲為主。玩游戲時整個直播的界面是同步游戲界面,虛擬主播只在界面左右下角露臉。當切換到聊天或者唱歌階段,直播背景就會變化,并不是單一純色背景,而是與自己虛擬形象相符合的一些二次元的現實場景,如臥室、街道、舞臺。A-SOUL“海邊集訓之表演集訓”主題的直播,直播背景就契合主題換成了海邊沙灘,虛擬形象也都換上了泳裝。整個直播背景的細心搭配滿足了觀眾對精美畫面的審美需求,也給人以代入感。在特殊的節日或者日期,虛擬主播之間也會實現聯動,穿著睡衣圍爐夜話或者身著打歌服集體表演,在精美的服飾和舞臺布景之外,與現實世界同步的生活和慶祝氛圍加強了主播與觀眾的情感聯結,讓觀眾在互動中獲得更多的真情實感。
3.2.3 完美人物設定,自由釋放內心
從視覺傳達層面來說,外在容貌是最為直接的刺激符號,直接影響著虛擬主播對觀眾的吸引力。前文說到虛擬形象都是近乎完美的存在,在繪制時摒除了一切現實人類的瑕疵,將所有美的元素集于一身,是對完美的極致化追求。所以,完美的虛擬外在形象并不是虛擬主播之間熱度高差異化的主要原因,鮮明的人設才是。打造虛擬主播,除了建模外必須對人物的背景、性格、三觀等進行塑造,還要有才藝傍身,以便后期更好進行內容創作與運營。虛擬主播所發生的各種行為的邏輯要符合人設,語言表達同樣也是區分人設的標簽。語言表達在說話語速、音調、音色、口音各個方面形成差異化。當虛擬主播具備了鮮明的人格化特質,就會拉近傳受雙方之間的距離,增強傳播效果[7]。
美國精神分析學家唐納德·霍頓和理查德·沃爾在1956年提出了“準社會交往/準社會關系”理論,該理論描述了媒介接受者與他們所消費的媒介人物之間的關系,即二者間的準社會關系是受眾通過媒介構建的一種假想的自己與媒介人物之間的親密關系[8]。虛擬主播以完美的外形和獨特的人設吸引受眾,讓受眾產生對他們之間的“準社會關系”的想象,從而獲取高流量。
與“虛擬”一詞相對的是“真實”,虛擬空間是逃避現實的去處。網生代認為將二次元角色作為情感寄托會更加可靠穩定且忠誠,現實中所遭受的不順可以在二次元角色上找到慰藉,這也是虛擬主播得到發展的契機。脫胎于二次元的虛擬主播更加貼近現實,模糊了虛擬與現實的邊界,拉近了與受眾的距離。再加上二次元“紙片人”(二次元的作品多為二維,像是紙片,所以里面的角色被稱為“紙片人”)無法比擬的高互動性,更容易引起受眾的情感共鳴,讓他們在虛擬與現實交錯的空間里自由釋放自己的內心。
3.2.4 占據頭部流量,全方位拉大差距
B站直播領域里增長最快的模塊就是虛擬直播,在2020年有超過32 000虛擬主播在B站開播。對于絕大多數的個體虛擬主播而言,技術層面無法比擬A-SOUL或其他熱度較高的個人主播,畫面的精美度也略顯不足,這背后既有商業資本的原因,也有定位不同的因素。A-SOUL作為娛樂公司推出的虛擬偶像團體,在人物設定和工作安排上都遵循了基本的商業邏輯,從而受到了觀眾的喜愛。而許多個人虛擬主播都是從原本不出鏡的唱見或游戲主播轉型而成,本身具有一定的粉絲基礎,區別于真人出鏡,他們的受眾多為二次元亞文化的愛好者,所以打造虛擬形象不僅方便互動,更符合了觀眾的期待,這也是他們能搶先牢牢把握住流量的主要原因。
由于資金與經驗的缺乏,更多的“后來者”只能在直播形式或其他方面構思創意,填補設定與技術的缺憾。但金字塔的格局已經形成,不管是短期形勢還是長期格局,在這個把握住視覺呈現質量就把握住受眾喜愛的領域里,注定只有技術、畫面與情感高度配合,才能獲得較為成功的傳播效果,獲得觀眾的支持與喜愛。
隨著科學技術的發展,會有更多的新興技術被運用到各類虛擬形象中。例如元宇宙概念的提出,這種集合了新型社交與互聯網技術運用的形式,幫助人們增強對虛擬世界的認識,創造了真實世界的鏡像。從功能性的虛擬語音助手到提供情感與互動支持的虛擬偶像,在未來,關于虛擬與現實,需要面對更多的討論與審視。