指上生花：人工智能新賽道

2024-03-22 11:17:51張宏羽

檢察風云 2024年6期

張宏羽

“Sora”演示視頻截圖

2023年，人工智能大語言模型“ChatGPT”憑借強大的自然語言處理能力和對上下文理解的深度“爆火”，給沉寂多年的人工智能行業撕開了一道口子。彼時，奇績論壇創始人陸奇就已預測，未來大模型無處不在，是技術世界中的“全新物種”。

時下，人工智能浪潮愈發涌動，“無處不在”的預言初見端倪：2024年2月，人工智能視頻生成類模型“Sora”將技術推到了一個全新的視覺維度，其可以根據用戶輸入的提示詞，生成長達一分鐘的高清視頻，堪稱“指上生花”。在官方公布的演示視頻中，一名時尚女性走在城市街頭，從主要人物到背景人物、從遠處的建筑到近處的地面，具有極強的真實感，連臉部細節都清晰可見。

當然，“Sora”并非完美，發布者對此并不避諱，模型在準確模擬復雜場景的物理特性方面可能會遇到困難，或是無法理解具體的因果關系實例，還可能會混淆提示的空間細節，并且在處理隨時間發生事件的精確描述方面也可能存在困難……盡管如此，“Sora”的橫空出世仍被不少業內人士視為人工智能模型領域的一大里程碑。在360創始人周鴻祎看來，“Sora”只是小試牛刀，它展現的不僅僅是視頻制作能力，而是大模型對真實世界有了“理解”和“模擬”之后，會帶來新的成果和突破。

革新

相較于以往的視頻生成類模型，“Sora”甫一誕生，就展現出技術的新姿態。中國信息協會常務理事、國研新經濟研究院創始院長朱克力在接受記者采訪時表示，傳統的生成式人工智能多依賴于預定義的規則和算法來生成內容，“Sora”則引入更為先進的深度學習機制，特別是對抗網絡和自編碼器等技術。這使得“Sora”在生成內容時能夠更好地模擬人類的創造性和直覺。

對于“Sora”的顯著優勢和特點，物聯網產業專家袁帥從四個方面向記者進行了分析。一是多模態融合。“Sora”能夠同時處理文本、圖像和音頻等多種模態的數據，實現跨模態的生成。這種多模態融合的能力使得其具有全面地理解和表達信息的能力，從而生成更加豐富的視頻內容。

二是高度定制化。“Sora”能夠根據用戶的個性化需求生成定制化的視頻內容。用戶可以通過輸入文本描述自己的需求和意圖，“Sora”將這些想法迅速轉化為具體的視頻畫面，盡可能滿足用戶的個性化需求。

三是高效率與高質量。“Sora”采用了高效的生成算法和模型架構，能夠在短時間內生成高質量的視頻內容。這使得其在處理大規模數據集或實時生成任務時具有顯著的優勢。

四是可擴展性與靈活性。“Sora”的架構設計使得它易于擴展和適應不同的應用場景。通過調整模型參數和引入新的功能模塊，其可以適應不同的任務需求和數據類型，展現出強大的靈活性和可擴展性。

熱潮

以“Sora”為代表的視頻生成類模型，展現出在多領域、多場景下的較大潛力和應用價值。甚至有業內人士預測，視頻生成類模型是今年人工智能賽道的主力熱點。

朱克力告訴記者，在娛樂領域，視頻生成類模型可用于自動生成電影預告片、游戲宣傳視頻等，大大節省了制作成本和時間。在廣告領域，該模型能夠根據產品特性和目標受眾快速生成定制化的廣告視頻。在教育領域，可用于制作生動有趣的教學視頻，幫助學生更好地理解和掌握知識。此外，在傳媒、體育等領域，視頻生成類模型也能實時生成高質量的視頻內容，滿足快速傳播的需求。

國內一家人工智能企業產品經理打趣道：“年初五迎財神，沒想到沒過多久迎來了‘Sora。”“Sora”的誕生直接拉升了視頻生成類模型的應用效果，具體產品落地商業化的可行性愈發顯著，這將吸引更多的市場參與者入場。

記者在某投資者互動平臺檢索發現，截至2月21日，圍繞“Sora”的相關提問已達83條，涉及傳媒、科技、健康、通信、教育、電商、文創等各類上市公司。除近兩成的上市公司回復稱“暫不涉及‘Sora或多模態AI業務”外，其余公司的回復中密集出現“加大技術創新”“適時研發并布局相關產品和服務”“密切關注發展機遇”“緊跟市場發展”等表述。

其中，芒果超媒2月19日回復投資者提問時表示，此前，公司已經組建了AIGC創新應用團隊，研發上線“AIGC HUB”等內部應用平臺，將AIGC技術廣泛應用于媒資運營、廣告投放、會員互動、視頻剪輯、內容生產等業務場景。后續，公司將積極探索文生視頻等新興AI技術在傳媒領域的落地應用與業態創新。

世紀天鴻2月20日回復稱，公司始終保持著對“ChatGPT”“Sora”等人工智能大模型發展與應用的積極關注，目前公司已結合人工智能技術推出小鴻助教、筆神作文等相關教育產品。公司將持續利用在教育領域的內容優勢與資源優勢，結合前沿技術探索人工智能在智慧教育場景的落地與應用，實現教育內容的人工智能升級，為中小學師生提供更好的產品與服務體驗。

浪潮已來，但非盲目跟風。對于行業上市公司，袁帥認為積極擁抱AI技術、創新業務模式和戰略的同時，還需要建立數據驅動的決策體系，收集和分析用戶數據、市場數據等，了解用戶需求和市場趨勢，從而制定更加精準和有效的業務策略。此外，應培養和引進相關人才，建立專業團隊，推動人工智能技術在業務中的深入應用和創新發展。隨著技術的快速發展和應用場景的拓展，相關政策和法規也正不斷完善。上市公司需要密切關注政策和法規變化，確保業務合規與可持續發展。

思考

“Sora”縱然令人感到震撼，也帶給我們更多的思考。

數據隱私、版權問題及生成內容的真實性和可信度等問題，早在生成式模型誕生之初，就有所討論。對此，朱克力表示，其一，模型在訓練和使用過程中可能會涉及大量用戶數據，必須確保這些數據的安全和隱私不受侵犯。其二，生成的視頻內容可能涉及版權問題，需要明確使用權限和來源合法性。其三，由于模型生成的內容可能具有高度真實感，應采取措施防止其被用于傳播虛假信息或誤導公眾。這需要堅持“科技向善”，在技術設計、法律法規和道德準則等多個層面進行綜合考慮和規范。

近年來，每每人工智能領域出現技術新突破，緊隨而至的往往是那些尖銳的問題——一批人要失業了嗎、一眾企業要被淘汰了嗎？人、機并非簡單的“零和博弈”。戰略定位專家詹軍豪認為，“Sora”的誕生可能會對某些行業的從業者產生一定的沖擊，但并不會直接導致他們失業。“Sora”并不能完全取代人類制作人員的角色，因為人類制作人員在創意、情感表達等方面具有獨特的優勢。此外，“Sora”的推出將催生新的職業和就業機會。隨著人工智能技術的不斷發展，需要更多的專業人才來從事相關的研究、開發和應用工作。總體來看，可能會對一些傳統職業的從業者產生影響，但也將為人類創造更多的就業機會和發展空間。

對于可能受到直接影響的廣告傳媒、影視制作行業來說，盤古智庫高級研究員江瀚指出，大模型何嘗不能帶來更多的商業機會和創新空間呢？與其盲目地抗拒人工智能，不如積極地去理解和利用它。通過不斷學習和創新，人類可以更好地掌握人工智能的技術和應用，推動其與社會各個領域的深度融合，這才是人工智能時代真正的生存之道。

值得注意的是，人工智能時代，算力將成為關鍵生產要素。熱潮之下，我們不能忽略背后的“算力缺口”。不少海外企業和高管人士已經將目光聚焦于AI算力上。“ChatGPT之父”奧爾特曼執著于巨額的芯片投資。更有一家名為“Groq”的初創公司試圖以自研芯片在運算速度上挑戰全球GPU巨頭。

在國內，數字經濟強省浙江，正發力沖向“算力強省”。其中，作為數字經濟重鎮的杭州，深刻洞察到數字經濟加速發展時搶抓人工智能機遇的戰略意義，在降低算力成本上謀篇布局，亮出了以算力高質量發展支撐數字經濟高質量發展的雄心。在杭州市新春第一會——“深化改革、強基固本”主題年推進大會上，浙江省委副書記、杭州市委書記劉捷兩次提到“Sora”大模型。按照杭州新春第一會的部署，從加快新型算力中心建設，提供信創云和人工智能算力服務，成為打造人工智能高地的關鍵基礎設施；到構建通用算力、超算算力和邊緣算力協同發展的新型算力體系……一條綜合算力成本最低的改革路線躍然紙上。