陳 軍 趙建軍 魯夢河
北京電影學院影視技術系,北京 100088
近年來,人工智能(Artificial Intelligence,AI)技術的爆發式躍進,使電影的制作方式、技術流程、創作思路都面臨著革命性改變。在制作端,AI 可以輔助創作者在前期籌備階段進行劇本創作、概念設計、市場預測;在拍攝和后期制作階段提高制作效率;在發行放映階段,AI 可以通過全方位的信息處理,提供更加科學合理的排片,使制作方獲得最大收益;在影片修復與增強處理方面,AI 極大提高了效率和質量。總之,今天的電影行業已經無處不“AI”了。
AI 的概念是隨著時間不斷演進的。1956 年,美國計算機科學家約翰·麥卡錫將AI定義為“研制智能機器的科學與工程”[1]。1996 年,英國認知科學家瑪格麗特·博登認為AI旨在“研究如何構建或編程計算機,使其能夠完成人腦所能完成的工作”[2]。2019年,歐洲學者卡普蘭和海恩萊因將AI解釋為“系統正確解釋外部數據,從這些數據中學習,并利用這些知識通過靈活適應實現特定目標和任務的能力”[3]。上述定義強調AI的目標是使計算機能夠模擬人類的智能行為過程,包括感知、分析、理解、思考、決策等。當前,AI 的研究分支十分廣泛,包括機器學習(ML)、自然語言處理(NLP)、計算機視覺(CV)、語音識別(SR)、決策系統(DMS)等。
AI 的形態也在不斷變化,隨著算力的快速發展,AI 正從弱人工智能、強人工智能向超人工智能過渡。弱人工智能(Weak AI)又稱狹義人工智能(Narrow AI),是指專門設計和訓練用來執行特定任務的人工智能系統,可在特定任務或領域內表現出智能行為,但不具備真正的認知與自我改進能力。強人工智能(Strong AI)又稱通用人工智能(Artificial General Intelligence,AGI),是指能夠像人類一樣具備智能、意識和自我意識的人工智能系統,能夠執行任何人類智能可以執行的任務。超人工智能(Artificial Super Intelligence,ASI)又稱超級智能(Superintelligence),最早由英國哲學家尼克·博斯特羅姆定義為“一種幾乎在每一個領域都勝過人類大腦的智慧”[4]。強人工智能算法可與人類大腦媲美,而超人工智能則是超越人類智慧的存在。
AI 的核心分支是機器學習(ML),其基本思想是使用特定算法和模型針對大量數據進行自動化學習訓練,使計算機程序獲得識別模式、完成任務、預測結果等模擬人類智能的能力。根據監督信息的多少與反饋機制的差異,可將機器學習方法分為無監督學習、監督學習、強化學習等類別。深度學習(Deep Learning,DL)是近年來發展迅速的一種實現機器學習的技術,是以模仿人腦神經元系統的神經網絡(Neural Network)模型為架構,采用分層特征提取算法對數據進行特征學習的方法,可用于識別數據中的復雜模式,從而生成準確的認知和預測。近年來最具代表性的深度學習框架包括深度神經網絡(Deep Neural Network,DNN)、卷積神經網絡(Convolutional Neural Network,CNN)、深度信念網絡(Deep Belief Network,DBN)、循環神經網絡(Recurrent Neural Network,RNN)等。大規模預訓練模型(Largescale Pretrained Model)是一類基于深度神經網絡和自監督學習技術的,在大規模、廣泛來源數據集上訓練的AI 模型,其通過微調(Fine-tuning)等手段可直接在一系列下游任務上使用。自2017 年谷歌翻譯團隊提出基于“編碼器-解碼器”結構和自注意力機制的自然語言處理模型Transformer[5]以來,以大語言模型(Large Language Model,LLM)為代表的大規模預訓練模型迎來高速發展期。近年來大語言模型發展[6]的主要分支包括在Transformer 基礎上僅保留編碼器的BERT 模型、僅保留解碼器的GPT 和LLaMA 模型等。Transformer 模型也因其高效性,很快應用于語言、語音、圖像、視覺等多個領域,并催生了生成式人工智能(Generative AI)的發展。
當前,AI 在電影制作中的應用以弱人工智能為主,強人工智能為輔。弱人工智能通過大量數據訓練使計算機完成特定任務,可以輔助或部分取代制作流程中的重復勞動,提高制作效率,也可以基于智能分析為創意、市場營銷等環節提供信息參考,輔助創意決策。近年來,強人工智能在電影制作中開始初步應用,隨著大型預訓練模型等深度學習方法的成熟,各類人工智能生成內容(AI Generated Content,AIGC)技術呈爆發式發展,可以清晰預見,以多模態為典型特征的強人工智能創意工具,將進一步滲透并革新電影的制作流程與創作思路,催生電影智能制作的新范式[7]。
近年來,電影行業逐漸提出了電影智能制作的概念,但是目前還沒有統一的定義來明確什么是電影智能制作。要明確定義電影智能制作,首先要研究清楚其概念、內涵及特征。
電影智能制作概念的產生是一個漸進的過程。初期時并沒有提出電影智能制作的概念,是因為AI只介入個別制作環節,當很多環節都開始采用AI 技術,從制作技術到創意手段都引入AI后,人們自然想到了電影智能制作的概念。
從行業一般認知看,電影智能制作是一種利用人工智能技術來輔助、優化和創新電影制作過程的方法。它涵蓋了從劇本創作、角色設計、場景生成,到后期特效制作、音頻處理等多個環節,通過引入機器學習(ML)、圖像識別(IR)、自然語言處理(NLP)等技術,以更高效、創新、個性化的方式參與電影制作的各個階段。電影智能制作旨在提升電影創作的質量、效率和創新度,同時為創作者和制片方提供更多的創意和技術手段。
傳統上,電影制作中的智能技術主要用于后期制作,如特效處理、音頻編輯等,以提高效率和質量。但隨著AI 和計算機技術的發展,電影制作開始探索如何將智能技術引入到創作階段,從而更直接地影響電影的故事構建、角色發展和創意產生[8]。因此,從發展角度看,電影智能制作可以分為三個階段,從AI 技術僅僅輔助制作的初級階段開始,發展到今天已經進入輔助創意和創作的中級階段,而未來的超人工智能技術能夠根據市場需求直接創作電影作品,而這將是電影智能制作的高級階段。
電影智能制作是電影與科技的交叉融合,隨著科技的發展,電影與科技的交叉融合將會更加深入。AI 在電影制作中應用的初期階段,是弱人工智能在感知與記憶存儲等單一環節的應用,AI 可以輔助進行圖像識別與處理等相關操作,其處理信息是單一性質的簡單數據,而在強人工智能應用的當下,AI 可以學習多模態信息以及強關聯,并進行簡單的藝術特征識別和模仿,如智能調色、智能剪輯等。在未來的電影智能制作中,超人工智能將廣泛應用,AI 可以學習藝術風格等高維信息,甚至是獨立創新,生成特定風格的電影(圖1)。電影作為特定的藝術形式和媒介,對科技的應用場景提出了特異的需求,電影智能制作就是使用AI 技術,理解并輔助這種特異性的藝術表達。

圖1 電影智能制作的內涵
總結電影智能制作的共性,具備下列幾個特征。首先是自動化,借助AI技術,實現電影制作過程中一些繁瑣手動操作的自動化,減少人工成本。其次是自我學習和優化,通過機器學習(ML)和深度學習(DL)等方法,從用戶反饋和數據中學習,并不斷優化自身的能力,提升制作質量。另一個特性是快捷高效,可以大幅度減少制作時間,極大地提高制作效率,降低制作成本,使更多的電影項目得以實現。電影智能制作最后還有個特性是大數據驅動——利用大數據、機器學習(ML)等技術,分析電影、觀眾偏好、市場行情等,提供可靠的數據支持,幫助制作團隊進行決策和優化。
研究了電影智能制作的概念、內涵和特征后,我們可以給電影智能制作這樣的定義:以人工智能為核心技術的電影工業化制作(Artificial Intelligence Industrial Production,AIIP),包含AI 輔助制作(Artificial Intelligence Aided Production,AIAP)、AI 輔助創作(Artificial Intelligence Aided Creation,AIAC)和AI 自主創作(Artificial Intelligence Autonomous Creation,AIAC),它以自動化制作和自我學習優化為典型特征,極大提高了電影的生產能力。
當前,人工智能技術和工具已經廣泛應用于電影制作的各個環節,電影智能制作也從AI 輔助制作的初級階段進入AI 輔助創作和制作的中級階段,下面梳理一下具體的應用情況。
在電影的前期開發環節,人工智能當前主要應用于分析劇本內容、預測市場收益和觀眾反饋等。如比利時的ScriptBook(2015)集成數據分析、機器學習(ML)、自然語言處理(NLP)、特征選擇算法(FSA)等技術,對用戶輸入的劇本進行分析,以可視化方式輸出角色和情緒特征、商業可行性、票房和觀眾評級預測等,從而輔助制片人進行創意決策[9]。該系統使用超過6500 個劇本及其市場反饋作為訓練數據,可認為是監督式機器學習的應用。同類企業和產品還包括美國Cinelytic(2016)[10],迪士尼研發的StoryPrint(2019)[11],我國海馬輕帆智能創作平臺[12](2021)、安捷秀(AgileShot)制片管理系統[13]等。這些產品強調通過智能化拆分劇本元素、可視化分析劇本內容,輸出內容評價與市場反饋預測等結果,輔助而非代替主創進行創意決策、制片管理等。
隨著以OpenAI 公司ChatGPT(2021)、百度“文心一言”(2023)為代表的基于大語言模型(LLM)的文字生成產品不斷成熟,未來的電影劇本創作將更多引入人工智能生成內容。生成式人工智能可在輸入文字源素材及提示詞的基礎上,按照編劇要求生成多種劇情走向、豐富構思、填充細節,并可以進一步生成分鏡頭腳本等,其功能已經從輔助決策過渡為直接參與創意生成,實現對編劇行業的賦能[14]。
在美術設計與數字資產制作環節,生成式人工智能工具(圖2)在二維圖像、三維資產、紋理、動畫、場景生成領域均取得飛速發展,已開始應用于電影數字資產、美術場景、概念圖等素材生成流程中。

圖2 生成式人工智能在圖形圖像領域的應用[15]
在二維圖像生成方面,Stable Diffusion、DALL·E、Midjourney 等產品[16],采用流模型(Flow-based Model)、擴散模型(Diffusion Model)、生成式對抗網絡(Generative Adversarial Network,GAN)、變分自編碼器(Variational Auto-Encoder,VAE)等基于深度學習(DL)的圖像生成方法,基于對大規模標簽化圖像數據的監督學習,實現生成符合給定文本描述的真實圖像(Text-to-Image)、對輸入圖像進行擴展填充等任務,輔助美術設計、概念圖生成、故事板繪制等工作[17](圖3)。此外,基于上述技術的AIGC 工具也集成在平面圖像處理軟件中,如Adobe Photoshop 新增人工智能工具Firefly(2023),可實現基于文字生成圖像、生成式填充等功能,提升了對二維圖像生成內容的再加工自由度。

圖3 使用Stable Diffusion、DALL·E、Midjourney 生成場景與人物概念圖
在三維數字資產生成方面,三維數字資產分為模型、貼圖、骨骼、動畫等,其中三維模型分為網格(Mesh)、體素(Voxel)等。當前主流三維數字資產生成工具中,Barium AI、Spline 等產品可生成平面貼圖,Leornado.Ai、Polyhive 等產品可在UV 空間生成貼圖,而Meshy、Kaedim 等工具可根據文字提示或二維草圖直接生成三維模型[18](圖4)。Luma AI 發布英偉達(NVIDIA)插件[19],基于神經輻射場(NeRF)與體渲染(Volume Rendering)技術,從圖片或視頻快速創建真實對象的三維數字模型,并導入虛幻引擎5(UE5)作為數字資產使用,無需對幾何結構或材質等進行修改。

圖4 Kaedim 從二維草圖生成三維模型
近年來,人工智能技術的引入使動作和表演捕捉流程向著無標記、智能化、便捷化發展。知名動作捕捉技術廠商Vicon 與視效企業Artanium 及VR 企業Dreamscape 合作,在SIGGRAPH 2023 發布其基于機器學習方法的無標記、多模式、同時支持6 人的實時動作捕捉解決方案[20](圖5)。MOVE AI 發布無標記動作捕捉工具Invisible(2023)[21](圖6),并與Disguise達成合作,該工具基于人工智能與計算機視覺算法,可從任何視頻、高清攝影機、移動設備中提取人物運動軌跡,并綁定至模型或角色身上,實現高保真效果的動作捕捉。Wonder Dynamics 公司開發Wonder Studio 云平臺(2023)[22](圖7),使用機器學習算法創建人臉和身體動作的逼真3D 模型,并直接在實時視頻片段中無縫替換。

圖5 Vicon 在SIGGRAPH 2023展示其無標記動作捕捉方案

圖6 MOVE AI無標記動作捕捉與傳統光學動作捕捉的對比

圖7 Wonder Studio 在視頻片段中將真實人物替換為虛擬數字人
在角色視效制作流程中,基于深度學習(DL)和神經網絡(Neural Network)的人工智能技術,可以減少繁復的人工操作,在提升效率的同時增強各類效果制作的真實性。Wētā FX 視效總監Joe Letteri 團隊在《阿凡達:水之道》(2022)面部捕捉工作中,開發新的解剖學上可信的面部系統(APFS)[23]取代FACS 管線,基于真實肌肉運動與連接建立神經網絡,對來自80 個動態運動剪輯的6000~8000 幀掃描進行機器學習,更逼真地模擬符合解剖學的178條面部肌肉纖維曲線(圖8)。視覺特效公司MOREVFX 在《流浪地球2》(2023)中使用吳京年輕時的視頻素材訓練AI 模型,基于Deepfake 算法并結合手動調整,實現“劉培強”角色減齡(De-aging)[24](圖9),相關算法也被應用于人物換臉等視效制作中。

圖8 APFS 系統用于《阿凡達:水之道》面部特效制作

圖9 《流浪地球2》基于Deepfake 算法的角色減齡
電影后期制作是以現場拍攝階段的工作結果為起點,以產出完整的影片為目標而開展的一系列電影生產工作,包含剪輯、視效合成、調色、聲音和音樂制作、母版制作等工序。人工智能工具在上述各個環節都有著廣泛的應用。
人工智能工具在剪輯方面的應用已有較長歷史,可實現根據劇本內容自動組接鏡頭與轉場效果,生成初步或最終剪輯版本。2016 年,基于人工智能的計算機系統IBM Watson 為恐怖電影《摩根》剪輯了6 分鐘的預告片[25],該模型接受了100 多部恐怖電影預告片的訓練,從而學習了類似作品獨有的結構和模式。IBM AI Vision“視覺大腦”(2018)應用于騰訊等平臺體育賽事智能剪輯流程中,通過機器學習(ML)識別球星、動作、得分,可生成高光集錦等視頻素材[26]。Adobe 系列后期制作工具應用Sensei AI 插件(2018),可實現智能剪輯等功能[27]。Anthropic 公司推出Premiere Pro 插件“AutoPod”(2023),可判斷視頻語境,自動完成多至10 機位的音視頻剪輯工作[28]。
人工智能在視效合成工具中的應用,也可以顯著提升動態遮罩制作(Rotoscope)等傳統特效流程的效率。2021 年,Nuke 13.0 推出機器學習工具集AIR,其中的CopyCat 節點允許視效制作者根據少量示例幀進行神經網絡訓練,批量自動生成動態遮罩,并結合Inference、Upscale、Deblur 等節點實現跨序列應用與效果調整,節省大量的手動摳像時間[29]。
在后期調色工作中引入人工智能工具,可提升鏡頭匹配等流程的工作效率,使調色師更加專注于創意環節。在影像修復與畫質增強方面,國家中影數字制作基地自主研發的“中影·神思”(2018)人工智能圖像處理系統,采用GAN、DenseNet、CycleGAN等神經網絡模型開發了分辨率提升畫質增強處理單元、標清圖像去場處理單元、圖像數字修復處理單元等模塊,實現視頻資料畫質修復[30]。中國電影資料館與火山引擎合作(2023),在膠片物理修復和數字化處理的基礎上,對百部港片進行人工智能修復,實現4K 分辨率上變換與畫質修復[31]。
在聲音與音樂制作方面,人工智能的應用模式從輔助制作向內容生成轉變。iZotope 系列軟件使用人工智能工具檢測和修復音頻噪聲,并實現基于風格學習的自動混音。人工智能聲音修復技術也應用于《流浪地球2》(2023)中,基于李雪健早期作品音頻訓練AI 模型實現聲音修復。在內容生成方面,微軟發布“神經編解碼器語言模型”VALL-E(2023)[32],基于Meta EnCodec 技術將語音輸入生成聲學令牌,可根據僅3 秒的語音輸入模擬人聲音色、情感音調、聲學環境。Google 發布AI 音樂大模型MusicLM(2023)[33],直接實現由文本生成音樂(Text-to-Music),可指定風格、時長、樂器等,實現為圖片和視頻自動配樂。其他人工智能音樂生成工具和平臺還有iMyFone MusicAI[34]、Mubert[35]等。
隨著多模態AIGC 工具進一步發展,影視創作者已可以直接實現基于風格化遷移與多模態生成活動影像內容的制作。如英偉達(NVIDIA)于2023 年發布AI視頻生成模型Video LDM[36],可以根據用戶的文本描述自動生成視頻(Text-to-Video),最高分辨率可達2048×1280 24FPS,時長最長可達4.7 秒(圖10)。2022 戛納短片電影節最佳電影《烏鴉》(The Crow),由人工智能藝術家格倫·馬歇爾(Glenn Marshall)將舞蹈短片《Painted》輸入OpenAI 創建的神經網絡CLIP 中,指導生成式對抗網絡(GAN)或擴散模型生成視頻幀序列。2023 年,Runway Research 公司發布視頻生成工具Runway Gen-2,可根據文字或圖片素材直接生成短視頻,標志著多模態生成式人工智能發展到達新的階段[37](圖11)。

圖10 Video LDM 生成的視頻片段截圖

圖11 Runway Gen-2從文字或圖片直接生成視頻
可以看到,當前的電影智能制作是傳統制作各個環節對于弱人工智能和強人工智能技術手段的綜合運用,AI 直接生成的活動影像還只能實現低質量和短時間的畫面,離電影復雜敘事、長時間及大銀幕放映還有很大距離。
每一次技術革命,都給現有的制作流程和藝術創作帶來機遇,但也帶來了巨大的挑戰。電影智能制作除了需要不斷解決技術問題外,同樣也帶來了一些嶄新的問題。
電影智能制作依賴AI 技術的支撐,AI 技術存在的問題自然影響到電影智能制作,如生成結果不可控性、傾向性等,制作過程算力消耗巨大,另外,目前制作的畫面技術質量不能滿足大銀幕放映要求,無法生成長時間的活動影像等。
當前,AI 系統普遍缺乏透明性和可解釋性,可調試能力差,特定研究對應的應用效果也缺乏可預見性。由于深度學習(DL)等技術的復雜性,生成式對抗網絡(GAN)等AI 模型參數的意義不明,AI 的訓練和決策往往是黑箱操作,沒有可表述的邏輯和明確的原因,這使得人們難以理解AI系統輸出,也不易進行調試。如ChatGPT 等大語言模型的“涌現現象”是科研人員所無法預料且難以解釋的。在三維重建中,深度學習(DL)可以提升傳統三維重建性能,完成圖像中不可見部分的建模,甚至Magic123 等算法直接基于單張圖像進行三維重建。理論上講,單張圖像不包含物體的三維信息,不能恢復深度信息,但AI學習人難以解釋的經驗可以大致估計物體的距離。這種直觀上不易理解的“合理性”在具體應用中也不易進行調試,而一旦面對不同對象和應用場景,AI 系統需要重新選擇AI算法、模型與參數進行訓練,且其最終效果難以保證。
AI 系統在訓練和學習中需要用到大量數據,其數據依賴性強,容易產生數據偏見或數據不平衡,這也使得其抗干擾性差,易受攻擊。AI 人臉識別系統中,如果其訓練數據存在性別、地區、文化、面部疾病等方面的偏見或缺失,將會顯著影響人臉識別系統的性能和公平性。此外,AI 系統的結構性漏洞,導致了其“對抗樣本攻擊”風險不可預知。如對抗性攻擊通過對輸入數據進行微小的、精心設計的改變,可使AI 系統產生錯誤的結果或不安全的行為。這也是人臉識別和人體識別應用中的典型問題:比利時魯汶大學研究人員借助簡單圖案,可以躲過YOLO(v2)開源對象識別系統的識別,莫斯科國立大學和華為莫斯科研究中心研究人員也利用對抗攻擊技術攻破了公共Face ID 系統——ArcFace。另外,對抗性攻擊在自然語言處理(NLP)領域,特別是像GPT 這樣的大語言模型(LLM)上也是非常典型的問題和重要的挑戰。由于GPT 依賴于數據,系統的攻擊者向訓練數據注入干擾數據,將可能導致模型產生非常大的誤導性或不準確,甚至不正確的輸出,很大程度上影響GPT 的表現。
傳統意義上,計算機軟硬件輔助創作人員制作的作品版權和所有權是沒有問題的,因為計算機只是一種技術工具,像畫家手中的筆、演奏家的樂器一樣。然而,隨著強AI 的爆發式發展,AI 已經可以在沒有人為干預的情況下,生成很多具有“創造性”的內容。像很多AIGC 應用領域一樣,電影智能制作在版權方面也面臨著具體的挑戰,主要涉及到創作權、使用權和產權等方面的問題。版權通常要求作品具有原創性和獨創性,而如果AI 生成的內容是基于已有素材和數據,那么其原創性和獨創性如何界定;當使用AI 生成創作內容時,誰應該擁有由AI 生成的內容的創作權也需要進行明確界定。
大多數國家對原創的定義都需要是人類作者,如包括西班牙和德國在內的大多數國家都規定,只有人類創作的作品才能受到版權保護。而在一些國家,雖然未明確禁止對AI生成的作品授予版權,其具體執行也非常慎重。2023 年8 月美國法官貝利爾·豪威爾(Beryl A.Howell)駁回了AI 企業家斯蒂芬·塞勒(Stephen Thaler)對美國版權局的訴訟,裁定由AI生成的藝術作品不受版權保護,并強調人類創作是“有效版權主張的重要組成部分”。同樣,澳大利亞一家法院宣布,由于計算機生成的作品不是人類完成的,故不受版權保護[38]。
此外,AI 可能使用大量的數據和素材進行學習和生成,但這些數據的版權和合法性該如何保護。同理,如果電影智能制作生成的內容是其他作品的改編、轉化或衍生,需要確保符合法律規定的派生作品條件。然而難點在于,由于電影智能制作所涉及的AI 模型的復雜性和大數據特性,從技術上調查取證十分困難。
電影智能制作有藝術創作者和AI協同創新工作的巨大空間,但是如何界定兩者之間的版權權益和責任分配也是一個問題。
電影作為一門藝術形式,其中包含著不可或缺的人類情感。隨著強人工智能技術開始介入內容創作,引發了其是否可能替代人類創作者并對電影敘事倫理性產生何種影響的深刻思考。這個問題是行業內需要慎重對待和思考的問題,ScriptBook 首席執行官Nadira Azermai 介紹,制片公司開始采用其AI 技術,同時必須簽署保密協議。2020 年1 月,華納兄弟宣布采用Cinelytic 的AI 項目管理系統,這是好萊塢公司首次公開宣布采用AI 替代人進行創造性工作。ScriptBook 和Cinelytic 這些電影AI 創作應用的先行者,強調用大數據建模的AI 模型是客觀體現創造力的工具,可以進行人工調整,而且AI技術是對創作的客觀評價或者參考啟發,并不會影響藝術的人文性[39]。然而使用AI 生成的劇本、短片或者電影是否是從人性的角度和情感出發,其作品是否缺乏人類創作者的情感和獨特視角,這一定會引發有關電影藝術性和現實性的倫理考慮。
AI 需要大量數據來學習和生成內容。因此,電影制作中使用的數據可能涉及到個人隱私,如何合理使用并保護這些數據,是電影智能制作中的一大難點。AI 可以根據觀眾數據生成個性化的電影內容,個人的隱私性和合規性如何保護,此外,AI 個性化推薦是一種形式的信息過濾,有可能導致“信息繭房”問題。
解決這些問題需要制定倫理準則和監管政策。同時,電影從業者需要積極參與倫理討論,以確保電影制作既具有創新性,又能夠維護藝術和社會價值。
近年來AIGC 技術發展迅猛,這一斷裂式的技術創新(Discontinued Technology)將會帶來階躍式的產業變革,給電影制作的未來帶來無限可能性。
未來,AI 技術將可能在軟硬件以及應用模式上取得更大的發展,從而為電影智能制作提供更多可能性。AI 系統可能極大程度上增強自主決策和學習能力,并且持續進行自我學習,從而在藝術創作中會有更多風格鮮明的內容生成。基于特定數據集、快速自適應算法,通過經驗來優化學習算法本身,這將使得同一AI系統在不同風格的電影制作時能夠更快地進行學習和適應。此外,AI 技術將會在多模態融合感知上取得更大突破,并應用于電影智能制作,這樣通過多種感知方式,如圖像、語音、自然語言等,能綜合性地輔助電影創作。
此外,當前大模型和大數據,都存在不可解釋性和潛在的偏見問題,未來的AI 技術可能會更加強調可解釋性,確保算法的公平性和透明性,并讓人能夠更加深入,以更加可理解的方式進行創作,AI 系統將更多地與人類進行緊密合作,從而提供更好的輔助和支持,而不僅僅是替代人類工作。
下一步電影智能制作有潛力在多個方面助力藝術創作,提供更多創意,提高創作效率。未來的電影智能制作可能更多地關注如何協助創作者釋放創意潛能,成為一個創意伙伴,為創作者提供靈感、場景設定、角色構建等建議,從而促進更富創造力的電影創作。
首先,AI 可以學習分析創作者大量的電影作品和創意數據,從中提取模式和趨勢,為創作者提供創意啟發和輔助,如生成情節故事、角色設定和視覺效果,為創作者提供新的創意方向。
其次,電影智能制作實時、沉浸式幫助創作者將想法可視化,通過簡單的語義描述或問題提示即可實時生成場景草圖、虛擬模型、動畫甚至是真實感三維場景,幫助導演和攝影師更好地規劃和預演鏡頭。
再者,AI 技術不斷進步,可以學習藝術作品的情感和情緒表達。電影智能制作中,可以通過音樂、音效和圖像處理輔助創作者表達情感和情緒,這些音樂生成和情感識別技術可以使電影更具感染力和共鳴。
最后,AI 可以方便進行大規模創作和生成,這種短時間內生成大量的創意效果,可以激發擴展創作者的創作能力,借助AI的“頭腦風暴”,能夠快速制作和嘗試新穎的創意。
未來電影智能制作最終將借助超人工智能技術,徹底打破今天電影制作的流程和各個技術環節,最終實現從創意構思直接生成高質量電影成片的終極理想,即AIGF(Artificial Intelligence Generated Film),進入電影智能制作的高級階段(圖12)。

圖12 電影智能制作的未來發展
面對迅猛發展的電影智能制作,我國電影行業應該如何應對,如何抓住這次蝶變的契機,迎接數字化、虛擬化之后更大的一次挑戰,是電影人不得不面對和深入思考的問題。過去20 多年,我國成功完成了電影數字化轉型之路,對于接下來的電影智能化發展之路如何走,筆者建議從以下幾個方面入手(圖13)。

圖13 我國電影行業應對及產業升級思路
電影智能制作涉及到諸多的硬件,包括專業攝影設備、渲染服務器、云服務器、高性能圖形處理器,也需要AI 軟件和算法支撐,如大數據、大模型、云計算和存儲,還涉及到大量電影專業應用軟件。當前電影智能制作的硬件,尤其是AI 的核心基礎CPU 與GPU 以及服務器等,主要以國外產品為主,而在通用人工智能的算法和應用領域方面,我國則具有很強競爭力。但是在電影制作具體領域的軟硬件方面,產業應用以國外產品為主,我國自主可控的AI 制作體系還處于起步階段,急需開拓研究。當前背景下,進行自主知識產權的關鍵性電影科技研究,開展關鍵技術和裝備的國產化替代技術體系研究,為構建符合國情的體系打好電影智能化基礎。
加快標準和規范建設,構建電影智能制作學科體系和學術話語體系。近年來,以AI 為核心的科技戰略競爭,是影響甚至決定大國發展走勢的重要因素,其在電影領域,勢必引發新一輪電影智能制作的競賽。2023 年8 月發布的《中國電影數字制作規范》對于規范我國電影數字制作、提升我國電影質量、推動我國獨立自主電影技術創新具有重要意義,由于電影智能制作相關概念、技術流程等尚未統一,在規范中尚未涉及。如何把握未來電影AI 科技發展趨勢,梳理AI 技術在電影制作不同階段統一的技術標準和操作規范,有助于整個電影制作產業的標準化。此外,未來的電影智能制作將是全新的電影制作范式,其中電影作品的著作權歸屬、版權分紅比例、人與AI的倫理等也是需要業界全面考慮的問題。我們還要積極參與國際電影智能制作的相關標準制定,主導制定國際社會普遍接受的國際電影智能制作規范,增強我國電影制作的國際話語權。
當前,科技創新范式正在發生深刻變化和持續演進,學科領域間交叉滲透跨界發展態勢更加明顯,基礎科學理論革命性突破發展,將可能直接誘發電影這一應用領域的巨大突破,重大科技設施和新算法技術等成為電影技術革命式發展的利器。我國要發展電影智能制作技術,必須打破行業壁壘,借助我國在AI、虛擬現實(VR)、智能圖形學等科技領域的競爭優勢,在AI 芯片、AI 云服務器、面向電影制作的AI 大模型、渲染引擎等領域發力。只有堅持交叉融合創新,才能在電影制作領域自主研發,只有掌握電影智能制作核心技術,才能在未來國際電影市場競爭中立于不敗之地。
重點建設幾家相關科研和應用示范機構,發揮專業研究機構、科研院所和高校的業務示范作用,支持電影企業的應用推廣。精良的影視制作尤其是大制作電影,其投資收益高,但是投資大、風險高,潛力巨大的電影智能制作,同樣也面臨巨大的投資風險。電影智能制作研發周期和研發投入都是未知數。華為云人工智能領域首席科學家田奇表示“大模型研究資本門檻高,大模型開發和訓練一次1200萬美元;技術門檻高,需要對AI 框架深度優化和超強的并行計算能力。”我國電影科技的前沿探索中,相關專業研究機構、科研院所和高校肩負引領電影行業科技進步、支撐產業提質升級的職責和使命,要深化電影智能制作的科技自主創新,推動關鍵核心技術與軟硬件系統研發與突破。在此基礎上,建立電影企業產業應用示范,支持相關電影企業的電影智能制作推廣應用,建立健全市場和產業體系,加快推動電影智能制作的多場景應用落地,推動我國電影高質量發展。
電影智能制作將是未來電影技術創新的主要陣地,可能會對電影制作產生一百多年來從創作到制作最大的一次變革,中國電影人只有選擇積極面對,中國電影產業只有自立自強,才能走好電影智能化之路。