張宏羽

“Sora”演示視頻截圖
2023年,人工智能大語言模型“ChatGPT”憑借強大的自然語言處理能力和對上下文理解的深度“爆火”,給沉寂多年的人工智能行業撕開了一道口子。彼時,奇績論壇創始人陸奇就已預測,未來大模型無處不在,是技術世界中的“全新物種”。
時下,人工智能浪潮愈發涌動,“無處不在”的預言初見端倪:2024年2月,人工智能視頻生成類模型“Sora”將技術推到了一個全新的視覺維度,其可以根據用戶輸入的提示詞,生成長達一分鐘的高清視頻,堪稱“指上生花”。在官方公布的演示視頻中,一名時尚女性走在城市街頭,從主要人物到背景人物、從遠處的建筑到近處的地面,具有極強的真實感,連臉部細節都清晰可見。
當然,“Sora”并非完美,發布者對此并不避諱,模型在準確模擬復雜場景的物理特性方面可能會遇到困難,或是無法理解具體的因果關系實例,還可能會混淆提示的空間細節,并且在處理隨時間發生事件的精確描述方面也可能存在困難……盡管如此,“Sora”的橫空出世仍被不少業內人士視為人工智能模型領域的一大里程碑。在360創始人周鴻祎看來,“Sora”只是小試牛刀,它展現的不僅僅是視頻制作能力,而是大模型對真實世界有了“理解”和“模擬”之后,會帶來新的成果和突破。
相較于以往的視頻生成類模型,“Sora”甫一誕生,就展現出技術的新姿態。中國信息協會常務理事、國研新經濟研究院創始院長朱克力在接受記者采訪時表示,傳統的生成式人工智能多依賴于預定義的規則和算法來生成內容,“Sora”則引入更為先進的深度學習機制,特別是對抗網絡和自編碼器等技術。這使得“Sora”在生成內容時能夠更好地模擬人類的創造性和直覺。
對于“Sora”的顯著優勢和特點,物聯網產業專家袁帥從四個方面向記者進行了分析。一是多模態融合。“Sora”能夠同時處理文本、圖像和音頻等多種模態的數據,實現跨模態的生成。這種多模態融合的能力使得其具有全面地理解和表達信息的能力,從而生成更加豐富的視頻內容。
二是高度定制化。“Sora”能夠根據用戶的個性化需求生成定制化的視頻內容。用戶可以通過輸入文本描述自己的需求和意圖,“Sora”將這些想法迅速轉化為具體的視頻畫面,盡可能滿足用戶的個性化需求。
三是高效率與高質量。“Sora”采用了高效的生成算法和模型架構,能夠在短時間內生成高質量的視頻內容。這使得其在處理大規模數據集或實時生成任務時具有顯著的優勢。
四是可擴展性與靈活性。“Sora”的架構設計使得它易于擴展和適應不同的應用場景。通過調整模型參數和引入新的功能模塊,其可以適應不同的任務需求和數據類型,展現出強大的靈活性和可擴展性。
以“Sora”為代表的視頻生成類模型,展現出在多領域、多場景下的較大潛力和應用價值。甚至有業內人士預測,視頻生成類模型是今年人工智能賽道的主力熱點。
朱克力告訴記者,在娛樂領域,視頻生成類模型可用于自動生成電影預告片、游戲宣傳視頻等,大大節省了制作成本和時間。在廣告領域,該模型能夠根據產品特性和目標受眾快速生成定制化的廣告視頻。在教育領域,可用于制作生動有趣的教學視頻,幫助學生更好地理解和掌握知識。此外,在傳媒、體育等領域,視頻生成類模型也能實時生成高質量的視頻內容,滿足快速傳播的需求。
國內一家人工智能企業產品經理打趣道:“年初五迎財神,沒想到沒過多久迎來了‘Sora。”“Sora”的誕生直接拉升了視頻生成類模型的應用效果,具體產品落地商業化的可行性愈發顯著,這將吸引更多的市場參與者入場。
記者在某投資者互動平臺檢索發現,截至2月21日,圍繞“Sora”的相關提問已達83條,涉及傳媒、科技、健康、通信、教育、電商、文創等各類上市公司。除近兩成的上市公司回復稱“暫不涉及‘Sora或多模態AI業務”外,其余公司的回復中密集出現“加大技術創新”“適時研發并布局相關產品和服務”“密切關注發展機遇”“緊跟市場發展”等表述。
其中,芒果超媒2月19日回復投資者提問時表示,此前,公司已經組建了AIGC創新應用團隊,研發上線“AIGC HUB”等內部應用平臺,將AIGC技術廣泛應用于媒資運營、廣告投放、會員互動、視頻剪輯、內容生產等業務場景。后續,公司將積極探索文生視頻等新興AI技術在傳媒領域的落地應用與業態創新。
世紀天鴻2月20日回復稱,公司始終保持著對“ChatGPT”“Sora”等人工智能大模型發展與應用的積極關注,目前公司已結合人工智能技術推出小鴻助教、筆神作文等相關教育產品。公司將持續利用在教育領域的內容優勢與資源優勢,結合前沿技術探索人工智能在智慧教育場景的落地與應用,實現教育內容的人工智能升級,為中小學師生提供更好的產品與服務體驗。
浪潮已來,但非盲目跟風。對于行業上市公司,袁帥認為積極擁抱AI技術、創新業務模式和戰略的同時,還需要建立數據驅動的決策體系,收集和分析用戶數據、市場數據等,了解用戶需求和市場趨勢,從而制定更加精準和有效的業務策略。此外,應培養和引進相關人才,建立專業團隊,推動人工智能技術在業務中的深入應用和創新發展。隨著技術的快速發展和應用場景的拓展,相關政策和法規也正不斷完善。上市公司需要密切關注政策和法規變化,確保業務合規與可持續發展。
“Sora”縱然令人感到震撼,也帶給我們更多的思考。
數據隱私、版權問題及生成內容的真實性和可信度等問題,早在生成式模型誕生之初,就有所討論。對此,朱克力表示,其一,模型在訓練和使用過程中可能會涉及大量用戶數據,必須確保這些數據的安全和隱私不受侵犯。其二,生成的視頻內容可能涉及版權問題,需要明確使用權限和來源合法性。其三,由于模型生成的內容可能具有高度真實感,應采取措施防止其被用于傳播虛假信息或誤導公眾。這需要堅持“科技向善”,在技術設計、法律法規和道德準則等多個層面進行綜合考慮和規范。
近年來,每每人工智能領域出現技術新突破,緊隨而至的往往是那些尖銳的問題——一批人要失業了嗎、一眾企業要被淘汰了嗎?人、機并非簡單的“零和博弈”。戰略定位專家詹軍豪認為,“Sora”的誕生可能會對某些行業的從業者產生一定的沖擊,但并不會直接導致他們失業。“Sora”并不能完全取代人類制作人員的角色,因為人類制作人員在創意、情感表達等方面具有獨特的優勢。此外,“Sora”的推出將催生新的職業和就業機會。隨著人工智能技術的不斷發展,需要更多的專業人才來從事相關的研究、開發和應用工作。總體來看,可能會對一些傳統職業的從業者產生影響,但也將為人類創造更多的就業機會和發展空間。
對于可能受到直接影響的廣告傳媒、影視制作行業來說,盤古智庫高級研究員江瀚指出,大模型何嘗不能帶來更多的商業機會和創新空間呢?與其盲目地抗拒人工智能,不如積極地去理解和利用它。通過不斷學習和創新,人類可以更好地掌握人工智能的技術和應用,推動其與社會各個領域的深度融合,這才是人工智能時代真正的生存之道。
值得注意的是,人工智能時代,算力將成為關鍵生產要素。熱潮之下,我們不能忽略背后的“算力缺口”。不少海外企業和高管人士已經將目光聚焦于AI算力上。“ChatGPT之父”奧爾特曼執著于巨額的芯片投資。更有一家名為“Groq”的初創公司試圖以自研芯片在運算速度上挑戰全球GPU巨頭。
在國內,數字經濟強省浙江,正發力沖向“算力強省”。其中,作為數字經濟重鎮的杭州,深刻洞察到數字經濟加速發展時搶抓人工智能機遇的戰略意義,在降低算力成本上謀篇布局,亮出了以算力高質量發展支撐數字經濟高質量發展的雄心。在杭州市新春第一會——“深化改革、強基固本”主題年推進大會上,浙江省委副書記、杭州市委書記劉捷兩次提到“Sora”大模型。按照杭州新春第一會的部署,從加快新型算力中心建設,提供信創云和人工智能算力服務,成為打造人工智能高地的關鍵基礎設施;到構建通用算力、超算算力和邊緣算力協同發展的新型算力體系……一條綜合算力成本最低的改革路線躍然紙上。