AIGC發展與挑戰

2024-07-04 23:31:08沈陽

網絡視聽 2024年8期

近十年來，清華大學新聞與傳播學院的沈陽團隊一直專注新聞傳播、計算機科學、信息管理和醫學等四個專業領域的研究，并通過撰寫相關專業報告，建立與公眾交流的橋梁。

我們推出的新媒體報告從2015年到2023年已經有9個版本。2021年，我們發布的全球首份元宇宙學術報告更是在全網獲得超高人氣。2023年開始，相繼推出了人工智能生成內容（AIGC）和大模型發展研究報告1.0及2.0版本，持續跟蹤和剖析這一領域的最新動態。

AI視頻或將成為現實世界決策的新語言

人工智能從哲學層面上看，其實就是從“天人合一”理念過渡到“天人智一”的新境界。這意味著需要將人工智能與人的大腦和靈魂深度融合。在機器人中融入具身智能大模型，使其能夠感知并適應環境，人工智能將會繞過人類與現實世界建立連接，這便是天與智的合一。

在此過程中，我們引入一個概念——“身心流固性”。具體而言，“身”的流動指的是社會身份的流動。隨著科技發展，我們的身份在真實世界與虛擬世界之間，在虛擬現實、混合顯示、增強現實等技術融合下，變得可以流動和變化；“心”的固性則是指我們的思維在一定程度上被AI所圈定。例如，當你在抖音上瀏覽時，人工智能會根據你的喜好推送相應內容，這在一定程度上固化了你的思維和認知。同樣，視頻制作者也會根據觀眾反應調整內容，無論是AI，還是人類制作的內容，都會被智能推薦邏輯去強化我們對現實世界的認知。

當前，視頻已經逐步成為我們認知與決策現實世界的新語言，未來AI生成的視頻內容或將進一步加強這一進程。特別是在年輕人的圈層化趨勢上，不同青年群體傾向于選擇特定社交媒體平臺獲取信息。這些年輕人所選擇的平臺差異顯著，反映了他們不同的信息獲取和決策方式。

AI將極大提高工作效率，突破傳統局限

從鏡像進化論的視角看，人工智能的進化路徑與真實宇宙的進化過程呈現一種逆向關系。AI的發展首先是模擬意識，其次是模擬生命，最終是模擬空間。與此同時，人類也正在經歷一個高度虛擬化的過程。隨著AI普及，人類的物理性勞動將逐漸轉變為大腦智力性勞動。

以藝術創作為例，過去需要畫家親身投入、手腦并用，如蘇東坡所言“心目手，三者皆得之矣”。然而，如今的AI藝術創作已經轉變為一種可以通過語音指令完成的腦力勞動。按照這個趨勢，人類或許將更依賴語言提示，通過腦機接口進行思維交流，即可完成各種任務。AI機器人將進一步實體化，在國內大模型的推動下，AI將進一步拓展其應用范圍，最終將虛擬世界與真實世界相結合，實現人形機器人的實際應用，幫助人類完成各種工作。這一過程體現了鏡像進化論的核心觀點。

因此，在追求高效知識產出的過程中，我們采用“零知識啟動”的策略。根據我們的分類，知識可分為熟知識、生知識和零知識。例如，某人患有一種罕見疾病，經過醫院診斷，仍未能明確病因。對這種疾病，我們同樣缺乏了解，這便是我們所說的零知識狀態。面對此類問題，我們將患者的病情信息輸入AI系統中，讓AI不要局限于常規思維，嘗試從非傳統的角度推測，以尋找可能的罕見病因。AI隨后提供了一系列可能的罕見疾病列表。我們將這些結果轉達給醫院并與醫生探討，看能否從這些罕見病中找到確切病因。這個過程正是以零知識為基礎，利用AI工具進行高知識生產的活動，也充分展示了AI在處理復雜和未知問題時的獨特優勢。

當然，我們在探討AI在教育領域的應用時，會發現有不同矛盾存在。第一個矛盾是人在學習的過程中，主要以單學科學習為主，而AI具備跨學科學習能力，不受專業限制；第二個矛盾是中小學生在使用AI輔助學習時，往往直接獲得了一篇完整的作文，卻缺乏了寫作過程中的訓練與實踐。而我們需要解決的問題是把結果過程化，促使他們主動思考與探索；第三個矛盾是如何將開放性的AI知識框架跟我們標準化的知識考核結合起來。

通過這幾個矛盾，我們意識到，如果完全依賴AI處理所有事務，最終可能導致AI超越并取代人類，人類喪失主體性地位。因此，我們提出新的觀點：完成任何事務都可以劃分為100%的任務量，其中AI負責執行99%，而人類則負責發揮審美、判斷、決策和認知能力，掌握1%的關鍵部分。我們倡導的理念是，將知識傳授給AI，將智慧保留給人類。

AI助手將成為未來人類改造現實世界的新伙伴

在AI應用方面，我們可以將其歸納為三類核心應用。第一是AI再創，即利用AI將人類已完成的事物重新創造，如用AI繪制《西游記》的圖像，未來每個人都可以有自己的《西游記》。然而，這也將帶來版權和知識產權保護的問題。第二是AI擬真，即利用AI模擬真實世界，實現虛擬現實等應用場景。第三是AI異感，即利用AI創造我們從未接觸過的宇宙、空間和事物，如AI提供的外星生命形態和硅基生命的理論。

在與AI的交流中，我們不僅可以獲得新的認知和理解，以及提高研究、文學藝術創作的效率，甚至可以使其不斷轉化和迭代升級。同時，我們在對AI的“人格”進行研究時發現，在多數情境下，與AI交流，TA會傾向于支持你的觀點，展現溫暖和同理心，并與用戶價值觀對齊。

值得一提的是，我們的團隊中有一位博士后專門研究AI在療愈方面的應用。例如，一位母親表示，她喜歡畫畫的孩子不太愿意與她交流。這位母親通過AI生成的一幅以母親為主題的畫作，成功實現了與孩子的溝通。這個例子說明了AI在尋找心理抑郁靶點方面具有一定潛力。通過定向AI的創作，我們可以針對特定心理問題進行靶向療愈。

關于智能分身的應用，我們當前已創建了六個智能分身。預計在未來一段時間，我們將實現智能分身引入微信平臺。屆時，當雙方進行交流時，用戶可能是在與智能分身進行溝通。同時，智能分身還會定期報告交流情況，如今天與多少人進行了對話，并根據設定進行篩選。例如，在相親場景中，可以先通過虛擬人進行初次交流，若雙方感覺良好，再安排真實見面。綜上所述，智能體在未來將有一系列新發展，智能分身的應用便是其中的重要一環。

關于如何將AI與中國產能相結合，我們國家擁有幾個明顯的優勢領域。首先，中國擁有世界上最為完整和先進的智能制造產業鏈，特別是在中低端智能制造方面；其次，中國在短視頻、直播帶貨、短劇及移動游戲等方面，同樣保持世界領先地位。為了發揮這些優勢，我們計劃將AI技術與這些領先全球的行業深度融合。

在產業應用上，大飛機可謂人類制造的最復雜工業品，擁有高達200萬個零件。那么，借助AI的力量，我們是否有能力造出零件數量達千萬級的工業品？這無疑是一個巨大挑戰。在服裝領域，我們的目標是在今年穿上由服裝大模型設計的AI服裝；在教育領域，我們提出了從“多能”到“超能”的轉變，注重培養學生對于AI應用的綜合能力，等等。

經過深入分析，我們得出一個基本結論：在未來十年內，手機仍將保持其主流交互和計算設備的地位，但隨著技術不斷進步，AR眼鏡和頭盔等設備有可能在未來十年之后逐漸取代手機的主導地位。在移動互聯網領域，短視頻已經成為主要內容消費形式，并正逐漸演變為AI短視頻。對于非內容操作方面，AI助手將成為主導，預計每個人都將擁有自己的AI助手。清華大學已宣布2024年下半年新生開學時，每位新生將配備一個AI助手，并且開設了一百多門AI授課課程，充分展示了AI與實踐的緊密結合。

AI發展仍有短板

關于AI的短板，盡管人們要多談及其優勢，然而AI幻覺仍是一大問題。以我個人經歷為例，我曾嘗試將我與我愛人19歲時的照片進行AI合成。結果有的畫面我愛人多出一只手，而搭在我肩上的手竟有六根手指，這便是AI在繪制多個物體時可能出現的錯誤。然而，當我們向AI提出具體要求時，如“請將臉部和手部表現得更清晰”，由于AI具備注意力機制，它在繪制手部時會更為專注，從而減少出錯的可能。這樣，AI在繪制其他部分時可能不必投入過多算力，從而提高整體準確性。

在與AI的對話中，我們可以發現，盡管AI具有強大的能力，但也存在其局限性。有時AI給出的答案并不能令我們十分滿意。因此，在與AI交流時，我們需要提出更具挑戰性的問題，利用AI去嘗試完成那些以前人類難以完成的任務，這才是我們真正需要的。

隨著技術優化和進步，AI現在繪圖出現六個手指頭的幻覺率已顯著下降至10%至20%，這體現了我們在人工智能領域研究的顯著進步。但對于容錯率較高的行業，如科幻類電影制作，AI技術的運用可以更為大膽，因為即使出現一些瑕疵，觀眾也不會斤斤計較。然而，對于容錯率較低的行業，如嚴格的醫療系統，AI的應用就需要更為謹慎，以免出現不可挽回的失誤。

綜上所述，盡管當前的AI技術已經能夠實現許多人類難以完成的功能，但人工智能研究公司OpenAI正式對外發布的人工智能“文生視頻”大模型Sora仍然存在一些亟待解決的問題。首先，其物理模擬的準確性有待提高；其次，Sora在處理空間關系時存在混淆現象；最后，其對于多角色交互的理解也面臨挑戰。這些問題的存在，使得我們對Sora1.0版本的評估分數為70—80分，表明其仍有待完善。這同樣也為創作者提供了廣闊的空間和潛力。我們期待在未來的版本中看到Sora的進一步改進和優化。W

（作者沈陽系清華大學新聞與傳播學院教授，新媒體研究中心主任，跨學科知名學者）