林盈

施瓦辛格有一部系列電影《終結者》,說的是機器人在能力上超過了人類,并且有了自我意識,反過來要統治人類。現實中當然沒有那么夸張,但是現在的機器人在很多方面開始接近人類也是一個趨勢。如今,機器人已經不滿足于從事掃地和兒童早期教育這些重復性勞動了,它們開始準備向文化創意產業發展。機器人寫小說已經不是什么稀奇事,這不,北京航空航天大學和清華大學的科學家又開發出了一個能夠進行電影剪輯的機器人——你講故事,它剪視頻。
這個機器人的名字叫作“Write-A-Video”。它拍攝和剪輯的范圍很廣,網絡文本、童謠、人物介紹等都可以。
拍攝的第一步當然是要理解文本。Write-A-Video會運用挑選關鍵詞的方法理解文本的含義,然后在它的素材庫中挑選合適的素材進行剪輯。比如,當劇本中“汽車”這個詞語出現了很多次,Write-A-Video就會認為這個劇本和汽車有關,便會在自己的素材庫中查找標簽是“汽車”的視頻片段。
找到了合適的視頻片段之后,Write-A-Video會自己分鏡頭。當然,它是不能理解視頻內容的,但是它可以通過統計畫面數據來確定分鏡頭的位置。常看電影的人都知道一個最基本的規律,在鏡頭切換的時候,畫面的色彩就會出現明顯的變化。Write-A-Video就是利用了這個規律,統計出每幀圖像的色彩數據,并發現緊鄰著的兩幀圖像,如果它們的色彩數據80%都變化了,Write-A-Video就會認為這里是鏡頭切換的位置,將視頻分割成兩個部分。
上面只是計算機視頻處理的常規操作,下面才是Write-A-Video大顯身手的時刻。這里的主角是一個叫作視覺語義嵌入的程序。這個程序可以比較視頻和文字內容的相似程度,并且給它們打分。因為根據標簽搜索的視頻數量較多,這時就需要視覺語義嵌入程序來判斷應該把哪個片段放到最后的影片中。
到底什么樣的視頻才算是“好看的”,這是審美問題。好在通過大量的機器學習,Write-A-Video已經建立了一套審美標準。首先,畫面要明亮,色彩要生動;其次,畫面不能抖動得太厲害;最后,畫面必須連貫,不能出現跳接。
這樣簡單的審美要求距離成為一個大師級的電影導演還有很遠的距離,目前我們不能指望這樣一個機器人通過鏡頭語言表達什么深刻的思想,但是做一些簡單的剪輯工作它還是能夠勝任的。比如,制作新聞報道和簡單的紀錄片,只要能夠做到視頻和解說內容相呼應,鏡頭轉換自然,就達到了剪輯的要求,而這正是Write-A-Video大顯身手的領域。
人工智能最大的優勢是處理重復問題時的效率,Write-A-Video也不例外,面對簡單重復的任務,它可以把剪輯的時間縮短到原來的幾十分之一。比如網劇要換演員,原來演員的鏡頭都要刪掉,這對剪輯師來說是艱巨的考驗。然而,有了Write-A-Video,一切就輕松了,因為它可以根據劇本找到演員出現的鏡頭,然后批量刪除,一鍵解決。
以往人們都認為,機器人即便能代替人類的工作,也只是一些重復性的勞動密集型崗位,對于文化創意這種需要天賦和個性的工作,機器是永遠都學不會的。現在看來,大家想得或許太簡單了,誰知道哪天它們不會強大起來和導演們搶飯碗呢?