
近十年來,清華大學新聞與傳播學院的沈陽團隊一直專注新聞傳播、計算機科學、信息管理和醫學等四個專業領域的研究,并通過撰寫相關專業報告,建立與公眾交流的橋梁。
我們推出的新媒體報告從2015年到2023年已經有9個版本。2021年,我們發布的全球首份元宇宙學術報告更是在全網獲得超高人氣。2023年開始,相繼推出了人工智能生成內容(AIGC)和大模型發展研究報告1.0及2.0版本,持續跟蹤和剖析這一領域的最新動態。
AI視頻或將成為現實世界決策的新語言
人工智能從哲學層面上看,其實就是從“天人合一”理念過渡到“天人智一”的新境界。這意味著需要將人工智能與人的大腦和靈魂深度融合。在機器人中融入具身智能大模型,使其能夠感知并適應環境,人工智能將會繞過人類與現實世界建立連接,這便是天與智的合一。
在此過程中,我們引入一個概念——“身心流固性”。具體而言,“身”的流動指的是社會身份的流動。隨著科技發展,我們的身份在真實世界與虛擬世界之間,在虛擬現實、混合顯示、增強現實等技術融合下,變得可以流動和變化;“心”的固性則是指我們的思維在一定程度上被AI所圈定。例如,當你在抖音上瀏覽時,人工智能會根據你的喜好推送相應內容,這在一定程度上固化了你的思維和認知。同樣,視頻制作者也會根據觀眾反應調整內容,無論是AI,還是人類制作的內容,都會被智能推薦邏輯去強化我們對現實世界的認知。
當前,視頻已經逐步成為我們認知與決策現實世界的新語言,未來AI生成的視頻內容或將進一步加強這一進程。特別是在年輕人的圈層化趨勢上,不同青年群體傾向于選擇特定社交媒體平臺獲取信息。這些年輕人所選擇的平臺差異顯著,反映了他們不同的信息獲取和決策方式。
AI將極大提高工作效率,突破傳統局限
從鏡像進化論的視角看,人工智能的進化路徑與真實宇宙的進化過程呈現一種逆向關系。AI的發展首先是模擬意識,其次是模擬生命,最終是模擬空間。與此同時,人類也正在經歷一個高度虛擬化的過程。隨著AI普及,人類的物理性勞動將逐漸轉變為大腦智力性勞動。
以藝術創作為例,過去需要畫家親身投入、手腦并用,如蘇東坡所言“心目手,三者皆得之矣”。然而,如今的AI藝術創作已經轉變為一種可以通過語音指令完成的腦力勞動。按照這個趨勢,人類或許將更依賴語言提示,通過腦機接口進行思維交流,即可完成各種任務。AI機器人將進一步實體化,在國內大模型的推動下,AI將進一步拓展其應用范圍,最終將虛擬世界與真實世界相結合,實現人形機器人的實際應用,幫助人類完成各種工作。這一過程體現了鏡像進化論的核心觀點。
因此,在追求高效知識產出的過程中,我們采用“零知識啟動”的策略。根據我們的分類,知識可分為熟知識、生知識和零知識。例如,某人患有一種罕見疾病,經過醫院診斷,仍未能明確病因。對這種疾病,我們同樣缺乏了解,這便是我們所說的零知識狀態。面對此類問題,我們將患者的病情信息輸入AI系統中,讓AI不要局限于常規思維,嘗試從非傳統的角度推測,以尋找可能的罕見病因。AI隨后提供了一系列可能的罕見疾病列表。我們將這些結果轉達給醫院并與醫生探討,看能否從這些罕見病中找到確切病因。這個過程正是以零知識為基礎,利用AI工具進行高知識生產的活動,也充分展示了AI在處理復雜和未知問題時的獨特優勢。
當然,我們在探討AI在教育領域的應用時,會發現有不同矛盾存在。第一個矛盾是人在學習的過程中,主要以單學科學習為主,而AI具備跨學科學習能力,不受專業限制;第二個矛盾是中小學生在使用AI輔助學習時,往往直接獲得了一篇完整的作文,卻缺乏了寫作過程中的訓練與實踐。而我們需要解決的問題是把結果過程化,促使他們主動思考與探索;第三個矛盾是如何將開放性的AI知識框架跟我們標準化的知識考核結合起來。
通過這幾個矛盾,我們意識到,如果完全依賴AI處理所有事務,最終可能導致AI超越并取代人類,人類喪失主體性地位。因此,我們提出新的觀點:完成任何事務都可以劃分為100%的任務量,其中AI負責執行99%,而人類則負責發揮審美、判斷、決策和認知能力,掌握1%的關鍵部分。我們倡導的理念是,將知識傳授給AI,將智慧保留給人類。
AI助手將成為未來人類改造現實世界的新伙伴
在AI應用方面,我們可以將其歸納為三類核心應用。第一是AI再創,即利用AI將人類已完成的事物重新創造,如用AI繪制《西游記》的圖像,未來每個人都可以有自己的《西游記》。然而,這也將帶來版權和知識產權保護的問題。第二是AI擬真,即利用AI模擬真實世界,實現虛擬現實等應用場景。第三是AI異感,即利用AI創造我們從未接觸過的宇宙、空間和事物,如AI提供的外星生命形態和硅基生命的理論。
在與AI的交流中,我們不僅可以獲得新的認知和理解,以及提高研究、文學藝術創作的效率,甚至可以使其不斷轉化和迭代升級。同時,我們在對AI的“人格”進行研究時發現,在多數情境下,與AI交流,TA會傾向于支持你的觀點,展現溫暖和同理心,并與用戶價值觀對齊。
值得一提的是,我們的團隊中有一位博士后專門研究AI在療愈方面的應用。例如,一位母親表示,她喜歡畫畫的孩子不太愿意與她交流。這位母親通過AI生成的一幅以母親為主題的畫作,成功實現了與孩子的溝通。這個例子說明了AI在尋找心理抑郁靶點方面具有一定潛力。通過定向AI的創作,我們可以針對特定心理問題進行靶向療愈。
關于智能分身的應用,我們當前已創建了六個智能分身。預計在未來一段時間,我們將實現智能分身引入微信平臺。屆時,當雙方進行交流時,用戶可能是在與智能分身進行溝通。同時,智能分身還會定期報告交流情況,如今天與多少人進行了對話,并根據設定進行篩選。例如,在相親場景中,可以先通過虛擬人進行初次交流,若雙方感覺良好,再安排真實見面。綜上所述,智能體在未來將有一系列新發展,智能分身的應用便是其中的重要一環。
關于如何將AI與中國產能相結合,我們國家擁有幾個明顯的優勢領域。首先,中國擁有世界上最為完整和先進的智能制造產業鏈,特別是在中低端智能制造方面;其次,中國在短視頻、直播帶貨、短劇及移動游戲等方面,同樣保持世界領先地位。為了發揮這些優勢,我們計劃將AI技術與這些領先全球的行業深度融合。
在產業應用上,大飛機可謂人類制造的最復雜工業品,擁有高達200萬個零件。那么,借助AI的力量,我們是否有能力造出零件數量達千萬級的工業品?這無疑是一個巨大挑戰。在服裝領域,我們的目標是在今年穿上由服裝大模型設計的AI服裝;在教育領域,我們提出了從“多能”到“超能”的轉變,注重培養學生對于AI應用的綜合能力,等等。
經過深入分析,我們得出一個基本結論:在未來十年內,手機仍將保持其主流交互和計算設備的地位,但隨著技術不斷進步,AR眼鏡和頭盔等設備有可能在未來十年之后逐漸取代手機的主導地位。在移動互聯網領域,短視頻已經成為主要內容消費形式,并正逐漸演變為AI短視頻。對于非內容操作方面,AI助手將成為主導,預計每個人都將擁有自己的AI助手。清華大學已宣布2024年下半年新生開學時,每位新生將配備一個AI助手,并且開設了一百多門AI授課課程,充分展示了AI與實踐的緊密結合。
AI發展仍有短板
關于AI的短板,盡管人們要多談及其優勢,然而AI幻覺仍是一大問題。以我個人經歷為例,我曾嘗試將我與我愛人19歲時的照片進行AI合成。結果有的畫面我愛人多出一只手,而搭在我肩上的手竟有六根手指,這便是AI在繪制多個物體時可能出現的錯誤。然而,當我們向AI提出具體要求時,如“請將臉部和手部表現得更清晰”,由于AI具備注意力機制,它在繪制手部時會更為專注,從而減少出錯的可能。這樣,AI在繪制其他部分時可能不必投入過多算力,從而提高整體準確性。
在與AI的對話中,我們可以發現,盡管AI具有強大的能力,但也存在其局限性。有時AI給出的答案并不能令我們十分滿意。因此,在與AI交流時,我們需要提出更具挑戰性的問題,利用AI去嘗試完成那些以前人類難以完成的任務,這才是我們真正需要的。
隨著技術優化和進步,AI現在繪圖出現六個手指頭的幻覺率已顯著下降至10%至20%,這體現了我們在人工智能領域研究的顯著進步。但對于容錯率較高的行業,如科幻類電影制作,AI技術的運用可以更為大膽,因為即使出現一些瑕疵,觀眾也不會斤斤計較。然而,對于容錯率較低的行業,如嚴格的醫療系統,AI的應用就需要更為謹慎,以免出現不可挽回的失誤。
綜上所述,盡管當前的AI技術已經能夠實現許多人類難以完成的功能,但人工智能研究公司OpenAI正式對外發布的人工智能“文生視頻”大模型Sora仍然存在一些亟待解決的問題。首先,其物理模擬的準確性有待提高;其次,Sora在處理空間關系時存在混淆現象;最后,其對于多角色交互的理解也面臨挑戰。這些問題的存在,使得我們對Sora1.0版本的評估分數為70—80分,表明其仍有待完善。這同樣也為創作者提供了廣闊的空間和潛力。我們期待在未來的版本中看到Sora的進一步改進和優化。W
(作者沈陽系清華大學新聞與傳播學院教授,新媒體研究中心主任,跨學科知名學者)