林華



【摘 要】“虛擬數(shù)字人”作為一種人工智能產(chǎn)物,在不斷地進行著技術(shù)更新的同時也在不斷創(chuàng)新用戶與虛擬世界連接的場景,不斷賦能新的行業(yè)發(fā)展。本文主要探討元宇宙技術(shù)浪潮下,利用“虛擬數(shù)字人”技術(shù)賦能微課制作的技能,同時思考元宇宙技術(shù)浪潮對未來教育變革的影響。
【關(guān)鍵詞】元宇宙;虛擬數(shù)字人;微課制作
【中圖分類號】G434? ?【文獻標識碼】A
【論文編號】1671-7384(2023)04-078-04
教育技術(shù)的迅猛發(fā)展一直深刻影響著教育領域快速地迭代發(fā)展著,隨著人工智能對內(nèi)容生產(chǎn)能力的極大提升,2021年“元宇宙”元年爆發(fā)對“虛擬數(shù)字人”賽道的催化,“虛擬數(shù)字人”在更多的場景和領域得到了進一步發(fā)展和應用,這其中也包括教育行業(yè)對“虛擬數(shù)字人”的探索和實踐。本文將分享虛擬數(shù)字人技術(shù)在微課制作中的應用,探索運用虛擬數(shù)字人技術(shù)賦能微課制作的技能。
元宇宙與虛擬數(shù)字人
1.元宇宙概念
1992年Neal Stephenson的科幻小說《Snow Crash》(《雪崩》)中提出了“metaverse(元宇宙)”和“化身 (Avatar)”這兩個概念,書中情節(jié)描述了一個現(xiàn)實人類通過VR設備與虛擬人共同生活在一個平行于現(xiàn)實世界的虛擬數(shù)字世界并參與相關(guān)社交活動。2021年,隨著游戲公司Roblox將“元宇宙”寫進招股說明書、Facebook改名為“Mata”等行業(yè)標志性事件發(fā)生,人工智能、數(shù)字攣生、腦機接口等智能技術(shù)的應用,元宇宙元年開啟。
從傳播學的角度看,元宇宙是“繼承與融合現(xiàn)在與未來全部數(shù)字技術(shù)于一體的終極數(shù)字媒介”,通過實現(xiàn)現(xiàn)實世界和虛擬世界的全連接,形成更高維度的超現(xiàn)實世界,個體以虛擬形象和數(shù)字身份在其中探索更多的實踐空間與社交場域[1]。隨著元宇宙新技術(shù)、新產(chǎn)品和新場景的不斷創(chuàng)新,元宇宙也將不斷賦能各行各業(yè)的全面升級和發(fā)展,最終實現(xiàn)現(xiàn)實世界與虛擬世界的變換、連接與融合。
2.虛擬數(shù)字人
虛擬數(shù)字人作為一種人工智能產(chǎn)物,作為用戶與元宇宙世界連接交互的第一入口,在不斷地進行著技術(shù)更新的同時也在不斷創(chuàng)新用戶與虛擬世界連接的場景,不斷賦能新的行業(yè)發(fā)展。
(1)虛擬數(shù)字人的界定
虛擬數(shù)字人是指存在于非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創(chuàng)造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產(chǎn)物[2]。虛擬數(shù)字人的本質(zhì)是具有人類人設的數(shù)字化形象,即具有類似于人類特征以及人類的相關(guān)能力[3]。業(yè)界一般將虛擬數(shù)字人稱為虛擬形象、虛擬人、數(shù)字人等,但這種稱呼是不嚴謹?shù)?。雖然數(shù)字人、虛擬人、數(shù)字虛擬人從目標上看具有一致性,即三者都是利用計算機、人工智能等技術(shù),打造具有特定人設的數(shù)字化形象,以實現(xiàn)與人類的共情、溝通和互動,但三者是有本質(zhì)區(qū)別的:首先,從概念的外延上看,數(shù)字人、虛擬人、數(shù)字虛擬人是包含和被包含的關(guān)系,即數(shù)字人包含虛擬人和虛擬數(shù)字人,而虛擬人又包含虛擬數(shù)字人,虛擬數(shù)字人是最小的概念范疇。其次,三者可以從范圍、定義、實例等方面進行區(qū)別(表1)。
(2)教育虛擬數(shù)字人
教育虛擬數(shù)字人是教育元宇宙與現(xiàn)實世界的重要連接工具,其教育性、交互性、虛擬性和擬人性對增強教育元宇宙的真實感、互動感和沉浸感具有非常重要的作用。教育虛擬數(shù)字人意指具有數(shù)字化外形的與教育息息相關(guān)的虛擬人物,不僅擁有人的外觀、行為和思想,還具有識別外界環(huán)境、與人交流互動的能力[4]。從教育虛擬數(shù)字人是否具有交互性的角度我們可以把教育虛擬數(shù)字人分為真人驅(qū)動型和技術(shù)驅(qū)動型兩種類型,它們各自的特點和作用如表2所示。
在本文中,我們主要討論的是真人驅(qū)動型教育虛擬數(shù)字人賦能微課制作的技巧與過程。
虛擬數(shù)字人在微課制作中的應用
1.問題的提出
經(jīng)過最近十幾年的發(fā)展,微課在當今中國的教育界已經(jīng)被廣大教師廣泛接受并熟練應用,在各高校師范生的培養(yǎng)中各學科都已普遍開設了微格教學課程,微課技術(shù)被廣泛地應用于課堂教學和課后輔導中。常規(guī)的微課制作方式在技術(shù)上各有優(yōu)劣,可以根據(jù)不同制作者需要制作適合不同學習需求的微課,但往往都會面臨一個共同的困境:微課最終呈現(xiàn)的效果可能會因不同制作者的口音、外表、情緒等主觀方面的因素影響而出現(xiàn)良莠不齊的課堂效果,進而可能會影響使用微課的學習者的學習效果。
用什么樣的技術(shù)手段可以盡量降低甚至消除制作者因為個人語言、形象等主觀差異而帶來的不同教學影響呢?虛擬數(shù)字人的出現(xiàn)為解決這一問題提供了強有力的技術(shù)支撐。
2.問題解決的方法和路徑
自己制作虛擬數(shù)字人對絕大多數(shù)教師來說是性價比極低的事情,最佳的選擇是使用成熟技術(shù)的免費虛擬數(shù)字人來滿足自己的微課制作需要。本文將以制作“答好科教興國‘時代考題”微課為例探討使用騰訊智影的免費虛擬數(shù)字人制作微課的方法和路徑。
(1)下載騰訊智影虛擬數(shù)字人的軟件和平臺
在網(wǎng)頁端搜索“智影”,點擊官方網(wǎng)站(https://zenvideo.qq.com)進入主界面,既可以下載軟件使用,也可以在線使用(圖1)。
(2)使用騰訊智影平臺的數(shù)字人播報功能
制作PPT時先預留虛擬數(shù)字人在PPT頁面中的空間。常規(guī)PPT制作的時候,文字和圖片(視頻)通常是整體考慮布局和排版的。但是使用騰訊智影平臺的虛擬數(shù)字人需要預留PPT左側(cè)或右側(cè)三分之一左右的空間來插入虛擬數(shù)字人。
①選擇虛擬數(shù)字播報人。騰訊智影平臺的數(shù)字人播報功能預設了2D數(shù)字人和3D數(shù)字人兩種類型,用戶可以根據(jù)自己的需要在“數(shù)字人與畫面設置”中選擇不同類型的虛擬數(shù)字人。通常情況下,我們一般選擇騰訊智影平臺的數(shù)字人播報功能預設的2D虛擬數(shù)字人來制作微課,這樣選擇的理由主要有:一是目前騰訊智影平臺的數(shù)字人播報功能預設的3D數(shù)字人只有一個,不如騰訊智影平臺的數(shù)字人播報功能中2D虛擬數(shù)字人的類型豐富,可以選擇的范圍太小,除非特定的場景需要,我們一般不考慮選擇騰訊智影平臺的數(shù)字人播報功能里的3D虛擬數(shù)字人。二是目前騰訊智影平臺的2D數(shù)字人的仿真度相當高,不仔細辨別一般都會被誤認作真人(圖2)。
從視覺效果上看,因為虛擬數(shù)字人大多會經(jīng)過計算機的渲染和美化處理,在人物形象的塑造視覺效果上一般優(yōu)于真人。并且騰訊智影平臺的數(shù)字人播報功能預設了不同的發(fā)音類型,有細膩的導航條選項,可以根據(jù)需要選擇該平臺虛擬數(shù)字人的不同發(fā)音類型及對該平臺的虛擬數(shù)字人的發(fā)音進行個性化編輯。
②對虛擬數(shù)字人進行個性化設置。在騰訊智影平臺選定基本的虛擬數(shù)字人類型之后,點擊下方數(shù)字人播報,會出現(xiàn)“文本驅(qū)動”或“音頻驅(qū)動”,用戶可以根據(jù)自己的需要依據(jù)文本或音頻創(chuàng)建自己的虛擬數(shù)字人。在“數(shù)字人與畫面設置”中選取角色后,用戶可以依照個人喜好或需要對角色的服裝、語音、語速等選項進行調(diào)試,再根據(jù)需要調(diào)整好位置和大小,也可以對畫面背景做出調(diào)整。這里的背景主要在“畫面設置”中選擇,可以在它提供的背景圖庫里選取,如果沒有喜歡的背景則可以設置成綠色背景,方便后期的剪輯摳圖使用,也可以直接自定義背景。在微課設計中,可以將PPT內(nèi)容頁作為自定義背景導入使用。此外,還可以加上logo,給微課打上專屬符號。
③插入腳本內(nèi)容。在上個環(huán)節(jié)里用戶選擇了“文本驅(qū)動”或“音頻驅(qū)動”模式,在這個環(huán)節(jié)里,用戶則根據(jù)驅(qū)動模式要求,將腳本內(nèi)容導入其中。制作微課我們一般選擇“文本驅(qū)動”,將提前設計好的腳本內(nèi)容、旁白等復制粘貼在右側(cè)空白文本框中,根據(jù)語氣語境的需要適當?shù)夭迦胪nD,甚至可以給數(shù)字人插入適合的動作展示。此外,還可以調(diào)整語速快慢,選擇適合的聲音,以及選擇是否顯示字幕等,在確保生成的預覽視頻視聽無誤后即可導出生成視頻。
在這個環(huán)節(jié)有一個非常重要的小提示:騰訊智影平臺制作虛擬數(shù)字人播報功能目前無法連貫地把整套微課用PPT連續(xù)地播報完,需要提前把PPT轉(zhuǎn)化為一張張圖片,再把每一張PPT的圖片作為虛擬數(shù)字人播報微課內(nèi)容的背景圖片插入騰訊智影平臺虛擬數(shù)字人播報的相應文字內(nèi)容的位置,用騰訊智影平臺制作虛擬數(shù)字人播報功能創(chuàng)作每一張PPT的播報內(nèi)容,生成相應視頻。
④對生成的一系列視頻進行后期處理。在下載完根據(jù)對應微課PPT每一張內(nèi)容創(chuàng)作的由騰訊智影平臺虛擬數(shù)字人播報的相應視頻后,需要對這一系列的視頻進行后期處理,這就進入到正式的微課制作環(huán)節(jié)了。第一步,在作品欄點擊剪輯,進入剪輯頁面,與主流剪輯軟件的界面一樣,上手簡單。第二步,導入準備好的PPT視頻或其他的視頻素材。第三步則是簡單的剪輯合成,根據(jù)需要加上背景音樂。這樣,一個有數(shù)字虛擬人的微課視頻就做好了,不僅形式豐富了一些,效果也很不錯。
3.使用騰訊智影免費虛擬數(shù)字人制作微課的用戶反饋
(1)使用騰訊智影免費虛擬數(shù)字人制作微課的優(yōu)勢
騰訊智影平臺為用戶提供了便捷體驗和制作虛擬數(shù)字人的平臺,有多款免費2D或3D虛擬數(shù)字人可以供用戶選擇和使用。騰訊智影平臺的2D虛擬數(shù)字人制作精良,仿真度高,個性化定制的空間比較大。使用騰訊智影的免費虛擬數(shù)字人制作的微課美觀度比較高,有利于自身外表形象不夠優(yōu)秀或語言發(fā)音不規(guī)范的老師制作精美微課課件。
(2)使用騰訊智影的免費虛擬數(shù)字人制作微課待優(yōu)化的幾個問題
①騰訊智影平臺操作過程比較麻煩。騰訊智影平臺制作虛擬數(shù)字人播報功能目前無法連貫地把整套微課用PPT連續(xù)地播報完,需要提前把PPT轉(zhuǎn)化為一張張圖片,再把每一張PPT的圖片作為虛擬數(shù)字人播報微課內(nèi)容的背景圖片插入騰訊智影平臺虛擬數(shù)字人播報的相應文字內(nèi)容的位置,用騰訊智影平臺制作虛擬數(shù)字人播報功能創(chuàng)作每一張PPT的播報內(nèi)容,生成相應視頻。這對使用騰訊智影的免費虛擬數(shù)字人不熟練的用戶在PC端操作剪輯視頻會顯得相對麻煩,效率低下。
②騰訊智影平臺自身存在局限性。在騰訊智影平臺利用虛擬數(shù)字人播報功能制作PPT頁面內(nèi)容講解時,由于需要將PPT分頁裁剪作為視頻背景,課件本身的動畫效果便顯現(xiàn)不出來,缺少趣味性。在騰訊智影平臺利用虛擬數(shù)字人播報功能制作視頻有時間限制,新人每個賬號有十分鐘的免費制作時長,這十分鐘使用完就需要充值會員或付費使用,但其會員可用時長也非常短。
③無法連續(xù)編輯視頻。在騰訊智影平臺利用虛擬數(shù)字人播報功能制作視頻只能是按每一張PPT內(nèi)容制作分段的微課視頻,無法連續(xù)編輯視頻。如需要做成完整的微課視頻,還需要借助其他視頻編輯工具。比如我們是先將每頁PPT進行虛擬數(shù)字人播報制作,再利用手機軟件(如剪映)對視頻素材進行整合與調(diào)整,最終完成虛擬數(shù)字人播報的微課制作。
關(guān)于元宇宙、虛擬數(shù)字人賦能教育變革的幾點思考
1.關(guān)于元宇宙賦能教育變革
元宇宙與教育的融合應用涉及兩方面的問題:一是技術(shù)頂層設計,即運用系統(tǒng)論的方法,從全局的角度對元宇宙賦能教育變革這項技術(shù)的各方面、各層次、各要素統(tǒng)籌規(guī)劃,以提升工作效益,高效快捷地實現(xiàn)知識、技術(shù)、情感價值觀等各層面的教育教學目標。教育元宇宙技術(shù)頂層設計指為實現(xiàn)任何時間、任何地點、任何角色都可以在互動空間中教育、教學、生活和工作而進行的方案研究。二是教育范式研究,即通過創(chuàng)新教學模式,使教育元宇宙賦能課堂教學,讓現(xiàn)實課堂教學與虛擬世界的學習融合在一起,真正促進學生知識、能力、情感等的發(fā)展,培養(yǎng)學生的創(chuàng)新精神和實踐能力。
2.關(guān)于虛擬數(shù)字人賦能教育變革
虛擬數(shù)字人作為一種人工智能產(chǎn)物,是元宇宙的關(guān)鍵要素。將虛擬數(shù)字人和元宇宙云課堂(或微課視頻等)相結(jié)合,有利于打造AI新生態(tài)下融合多種技術(shù)的教育應用新場景。
目前能夠使用的國內(nèi)虛擬數(shù)字人的平臺少,虛擬數(shù)字人可以選擇的類型不夠豐富,收費項目多,對于絕大多數(shù)用戶來說可以免費使用的虛擬數(shù)字人更少。這些硬傷對于目前虛擬數(shù)字人獲取更多的潛在用戶的商業(yè)應用具有難以突破的瓶頸,因此,虛擬數(shù)字人在教育領域的使用數(shù)量和場景的拓展對降低教育領域使用虛擬數(shù)字人的成本有極其關(guān)鍵的作用。
虛擬數(shù)字人作為人與場景連接和反饋的“向?qū)А保湓O計和外表會影響用戶對于交互過程中的真實感、在場感、信任感、群體滿意度等方面的感知。虛擬數(shù)字人的語言表達(聲音、說話節(jié)奏等)與非語言表達(面部細節(jié)、微表情、身體完整性、真實程度、肢體語言與行為姿勢等),都有可能影響用戶在各類場景中的交互質(zhì)量。
參考文獻
程思琪,喻國明,楊嘉儀,陳雪嬌. 虛擬數(shù)字人:一種體驗性媒介——試析虛擬數(shù)字人的連接機制與媒介屬性[J].新聞界,2022(7):12-23.
量子位. 虛擬數(shù)字人白皮書[EB/OL].[2021-09-07].https://www.doc88.com/p-34661791153830. html.
郭全中. 虛擬數(shù)字人發(fā)展的現(xiàn)狀、關(guān)鍵與未來[J].新聞與寫作,2022(7):57-64.
婁方園,齊夢娜,王竹新,王娟. 元宇宙場域下的教育數(shù)字人及其應用[EB/OL].[2022-06-09]. https://kns.cnki.net/kcms/detail/44.1306.G2.20220608.1116.004.html.
作者單位:廣東韓山師范學院
編? ?輯:徐靖程