999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

作為新基礎設施的AGI:以GPT-4O等新一代生成式人工智能為例

2024-08-13 00:00:00郭全中蘇劉潤薇
新聞愛好者 2024年7期

【摘要】GPT-4o與谷歌Project Astra的相繼發布,展現出大模型交互能力的本質性提升和實用性的突破,預示著以生成式人工智能為代表的AGI將如同互聯網和人工智能一樣,成為支撐社會運行的新基礎設施,并對傳媒業的技術應用、業務實踐以及產業融合帶來全景式的影響。

【關鍵詞】GPT-4o;AGI;基礎設施;生成式人工智能;傳媒業

繼Sora文生視頻模型驚艷世界之后,2024年5月14日,OpenAI揭開了最新生成模型GPT-4o的“神秘面紗”,其強大的實時語音和視頻交互能力再次引發震撼。次日,谷歌在I/O 2024開發者大會上也發布了一系列引人注目的產品,包括最新的AI智能體Project Astra。作為新一代生成式人工智能,GPT-4o和Project Astra在技術原理、交互功能和場景落地方面均實現了新的躍升,代表著通用人工智能(AGI)發展的最新突破。隨著AI技術不斷朝著AGI演進,其廣泛的認知能力、自我進化能力以及在多樣化任務中的應用潛力,將逐步成為與互聯網、人工智能類似的社會新基礎設施。對于傳媒業來說,技術始終是驅動行業發展的動力,AGI作為新基礎設施將對傳媒業的技術應用、業務實踐以及產業融合帶來全景式的影響。

一、GPT-4O與谷歌Project Astra的新躍升

(一)從“拼接”到“原生”的多模態模型轉向

GPT-4o和Project Astra兩款產品分別代表了OpenAI和谷歌在生成式人工智能領域的最新進展。GPT-4o以其“Omni”(意為“全能”)之名,彰顯了卓越的多模態處理能力,能夠接受文本、音頻、圖像和視頻的組合輸入,并生成相應的組合輸出,在實時語音對話、情感表達及視覺交互等方面取得了顯著進步。在性能上,GPT-4o是GPT-4的第三次主要迭代,相較于GPT-4 Turbo,其在文本推理、多語言音頻處理和視覺理解方面表現出色。與OpenAI的GPT-4o類似,谷歌的Project Astra也是一款多模態生成式人工智能產品,作為一個“通用AI智能體”,其基于Gemini模型同樣展現出多模態理解和實時對話的強大性能。用戶可以借助手機攝像頭、智慧眼鏡等設備捕捉現實世界中的事物,并通過Project Astra獲得對所見內容的自然語言描述,從而實現一種全新的交互體驗。

在此之前,盡管DALL·E、Midjourney、TTS、Runway、Pika、Sora等生成式人工智能模型和產品已經能夠模擬人類實現跨模態的信息轉換,但其都是以單一功能為導向,如從文本到圖像、從語音到文本、從圖像到視頻、從文本到視頻的轉換等,用戶在不同任務之間切換時的體驗十分碎片化,并且,這些不同模態之間的信息傳遞主要依賴于大語言模型(LLM)生成的離散文本,在級聯過程中不可避免地會引入噪聲并出現傳播錯誤,同時由于缺乏整體訓練,在理解復雜且隱含的用戶指令、進行多模態生成方面能力有限。[1]例如,原先ChatGPT在與用戶進行語音模式的對話交談時,需要首先通過語音識別模型Whisper將用戶輸入的語音轉換成文字,再由GPT大模型處理文字,最后通過TTS(文字轉語音)模型輸出語音。這種由三個模型“拼接”的處理方式不僅速度慢、效率低,而且還會永久性地過濾掉語調、口音、語速、說話人數、音色、情緒等微妙的信息,同時輸出的語音缺乏抑揚頓挫和情感表現力,顯得機械感強且平淡無味。而GPT-4o和Project Astra則通過跨文本、視覺和語音的訓練,構建了一個“端到端”(end-to-end)的原生多模態大模型,實現了模型的“三合一”。這意味著所有輸入和輸出的信息均由同一個神經網絡直接處理,無需經過多個獨立模型的級聯過程,不僅極大地降低了響應的時延,還顯著提高了信息處理的準確性和連貫性,并增強了信息輸出的表現力。例如,GPT-4o能夠進行實時的語音對話,其輸出的語音既可以包含喜怒哀樂等情感元素,甚至還能模擬笑聲、唱歌和插話等豐富的情感表現。

(二)大模型交互能力的本質性提升

保羅·萊文森提出了媒介發展的“人性化趨勢”概念,認為媒介必然沿著人類傳播要求的方向進化,且媒介具有“延伸性”,其使用功能將越來越符合人類感官愉悅的要求。[2]以GPT-4o、Project Astra為代表的新一代生成式人工智能則進一步驗證了媒介進化論。正如360集團創始人周鴻祎的形象闡述,GPT賦予了AI對知識的理解能力,讓其擁有了“大腦”;GPT-4V賦予了AI視覺能力,讓其擁有了“眼睛”;GPT-4o賦予了AI看懂、聽懂和表達情感的能力,讓其擁有了“眼睛”“耳朵”和“嘴巴”。由此可見,生成式人工智能的“人性化”演進趨勢將人機交互的體驗推進到了前所未有的高度。

第一,實時視覺識別擴展了人類的視覺邊界。谷歌發布的視頻顯示,Project Astra能夠準確識別攝像頭捕捉到的物體、代碼、行為和場景等,并作出相應的解讀,與人類進行實時溝通。同樣,在OpenAI發布的視頻演示中,GPT-4o具備處理圖像分類、物體檢測和場景理解等復雜視覺任務的強大能力,用戶可以與其“視頻通話”,通過攝像頭直接解決各種問題,如解答數學題、逗弄寵物、唱生日歌和輔助視障人士等。

第二,類人對話提升了人機交互體驗的質量。一是響應速度提升使對話更加流暢。OpenAI官方數據顯示,GPT-4o針對音頻輸入的平均反應時長為320毫秒,最快可達232毫秒,相較于GPT-3.5(2.8秒)和GPT-4(5.4秒)的平均延遲,反應時間大幅縮短,與人類日常交流的時序更加契合。二是與Siri等傳統語音交互系統相比,GPT-4o不僅無需喚醒詞啟動,還能記住用戶的名字和偏好,從而無需反復輸入指令;同時更在音色、音調和表達習慣(如語氣詞)上幾乎與真人無異,甚至能夠感知并回應情緒(如開啟嘲諷模式),在情感理解和表達上取得了顯著突破。三是GPT-4o在哲學思辨、科學闡釋、工作和日常生活等領域展現出廣泛而深入的理解能力。其能夠根據場景氛圍和用戶情緒靈活調整語調和措辭,塑造了一種接近真實人際交流的互動體驗。例如,在輔助“石頭剪刀布”桌面游戲時,GPT-4o能夠勝任主持人的角色并調動游戲氛圍;在即興創作歌曲時,其不僅能夠編寫歌詞,還能即時生成旋律和諧的曲調,甚至自動進行和聲以及實現模型之間的對唱等。

GPT-4o和Project Astra在交互能力上實現了本質性的提升,包括對多維感官的識別、對復雜任務的理解、更自然的對話流暢度和感知情感的能力,標志著生成式人工智能向更加智能化和人性化方向發展邁出了重要一步。

(三)大模型實用性突破與大規模應用落地

場景落地是大模型發展的關鍵。然而,無論是ChatGPT還是國內的文心一言等大模型,盡管在技術層面上取得了一定進展,但目前主要局限于生成類場景的應用,尚未實現預期中廣泛的場景價值。以ChatGPT為例,自OpenAI在2022年11月30日發布以來,其用戶數量在短短五天內突破百萬,兩個月內迅速飆升至億級規模。可是,隨著時間的推移,這一強勁的增長勢頭并未持續。根據數據分析公司Similarweb的消息,在2023年5月ChatGPT全球總訪問量達到18億次的峰值之后,其流量增長便開始放緩[3],增長勢頭也再未恢復至先前的驚人速度。這一現象的背后,很大程度上是由于ChatGPT在場景落地方面的不足。而Sora作為文生視頻領域的技術前沿驚艷于世,目前仍處于內測階段,暫未對外開放使用,這也表明大模型從研發到實際應用的轉化過程中面臨較大困難。

GPT-4o與Project Astra有效解決了大模型的實用性問題。第一,在使用操作上,此前,用戶主要通過鍵盤輸入提示詞與AI互動,這種操作相對復雜,對于很多普通用戶來說存在較高的使用門檻。OpenAI創始人、CEO山姆·奧特曼也曾表示,提示工程(prompt engineering)只是生成式人工智能發展的過渡階段,未來將不再需要這一過程。GPT-4o和Project Astra則實現了從文字輸入到口語互動的交互方式轉變,類似于智能手機的出現徹底顛覆了基于鍵盤的操作方式,變為手指觸摸操作,AI技術也迎來了新的“iPhone時刻”。如今,用戶可以通過自然語言直接與AI進行口頭對話并獲得即時反饋,人機交互變得更加直觀和自然。由此也預示著生成式人工智能的接受度將大幅提高,更多用戶能夠真正接觸和使用AI技術,從而幫助其解決生活難題、提供娛樂和情感陪伴等。第二,在使用成本上,例如GPT-4o進一步強化了“免費+收費”的商業模式,踐行了“OpenAI創造AI,人們利用它創造新奇事物并惠及所有人”的愿景,目的在于降低用戶的使用成本,以服務于更廣大的社會公眾。此外,通過開放API接口和降低計費價格,OpenAI鼓勵并支持開發者基于GPT-4o構建多樣化的AI應用生態,從而在大模型的基礎上,真正地實現向各個細分商業場景的輸出,在教育、廣告、搜索、娛樂等各種領域更好地落地。

二、AGI何以成為基礎設施?

實現AGI不僅需要AI具備深厚的知識儲備和高度的推理能力,更關鍵的是要能夠與人進行交互。GPT-4o與Project Astra的問世代表著類人AI Agent(智能體)的雛形顯現,展現出了真正能夠為人所用的潛力,進一步拉近了人類與AGI的距離。那么,AGI是什么?AGI如何成為社會的基礎設施?AGI將帶來哪些影響?在探討這些問題之前,首先需要明確基礎設施的定義與標準,立足于理論之維與實踐之基探尋依據,并從互聯網和人工智能的演進中尋找規律,進而理解AGI作為基礎設施的合理性與必然趨勢。

(一)基礎設施的定義與標準

對于基礎設施的理解和研究通常始于技術功能,但其內涵遠不止于技術層面。[4]從字面上看,“基礎設施”由“基礎”和“設施”構成,“基礎”指的是事物發展所必需的、基本的、不可或缺的支撐要素;“設施”則是指能夠滿足社會生活需求的操作系統。在英文中,“infrastructure”對應基礎設施的概念,由前綴“infra-”(意為“在下面”)和“structure”(意為“結構”)組成,強調其作為“底層技術架構”的特性。綜合來看,本文將基礎設施定義為支撐社會運行所需的底層技術架構和操作系統。

第一,在理論層面,基礎設施需要具備以下特征:一是物質性?;A設施是由一系列中心、節點、線路和終端構成的網絡[5],是可以使貨物、思想、人員等實現空間交換的物質形式[6]。無論是電網、供水、燃氣、交通等作為物質工程的硬基礎設施,還是由信息基礎設施、融合基礎設施、創新基礎設施構成的“新基建”(新型基礎設施建設)等軟基礎設施,都是人類賴以生活和行動的物質條件,為推動經濟社會發展起到了至關重要的基礎作用。二是關系性。基礎設施不僅可以是物質層面的基礎設施建設,還可以是隱喻的深層結構。在Susan Leigh Star的研究框架中,技術、基礎設施與組織變革三者之間存在著互動關系,拓展了理解基礎設施的關系性視角[7],即基礎設施并非是孤立存在的,而是嵌入到了社會結構、配置和技術之中[8],既源自社會關系,也形塑了社會關系[9]。因此,在探討某一事物何以成為基礎設施時,還需考量其在落地過程中的物質性特征與其所處的社會環境及不同主體之間的復雜關系[10],只有其與社會實踐活動緊密相連,才能真正發揮基礎設施的作用。三是歷時性。一方面,基礎設施的建設與發展是一個逐步成熟和完善,進而基礎設施化的過程,無論是規模的擴大、功能的增強,還是技術的革新,都需要歷經時間的沉淀;另一方面,基礎設施的發展路徑還沿襲了既有的慣性[11],但這種慣性并非簡單重復過去,而是受到歷史經驗、社會慣例和文化傳統等多種因素的綜合影響,形成了相對穩定的基礎設施發展模式,為其持續發展提供結構性保障。四是公共性。隨著基礎設施的發展,其在經濟和社會進程中扮演著越來越重要的角色,提供廣泛而普遍的公共服務[12],并在整合公眾方面發揮著關鍵作用[13]。同時,基礎設施也在一定程度上構建了自下而上的權力生態,承擔了部分政府的管理職能。

第二,在實踐層面,基礎設施的建設還深受三大要素影響:一是用戶數量。根據梅特卡夫定律,網絡的價值與用戶數量的平方成正比,基礎設施作為承載社會各種資源的網絡,其高效運行依賴于用戶的廣泛參與,用戶規模越大,其發展的根基就越牢固,從而帶來更顯著的規模效應和范圍效應。二是用戶的使用頻度。如前所述,基礎設施的“設施”代表滿足社會生活需求的操作系統,許多經濟社會活動都需要依托于基礎設施來實現,因此,高頻率的用戶使用是評估基礎設施有效性的重要指標,也是衡量其功能和服務質量的重要標準。三是對用戶的影響程度。用戶的行為模式、生產和生活方式等都可能因基礎設施的進步而發生變化。例如,公共交通系統的優化和共享出行系統的興起,改變了人們的出行習慣;隨著信息化和網絡化的發展,遠程辦公、在線會議等新型工作方式逐漸成為趨勢。由此可見,基礎設施對用戶行為、觀念、習慣等的深刻影響反映了其在社會中的重要性和實際價值。

(二)互聯網、人工智能的基礎設施化演進

1.互聯網平臺化:作為“連接一切”的基礎設施

隨著互聯網技術的不斷發展,平臺的功能和作用也在逐漸擴展和深化,影響力日益凸顯,平臺化的互聯網逐步成為“連接萬物”、支撐社會發展的重要基礎設施。因此,互聯網的基礎設施化主要體現在平臺的展現形式上。

從學理角度來說,平臺被視為基礎設施的隱喻[14],在現代社會中,互聯網平臺發揮著基礎性的作用。第一,互聯網平臺的建立基于一系列互聯網相關的技術標準,如網絡基站、服務器、數據中心、互聯網協議,以及互聯網接入與輸出的終端設備等[15],這些構成了互聯網平臺的物質性基礎。第二,互聯網因其連接性、開放性和去中心化的特征,削弱了傳統權力結構中的中心節點,為不同階層和背景的個體提供了展示和互動的平臺,賦予了個體成為信息傳播主體的可能性。隨著社交媒體平臺的出現和發展,互聯網日益成為連接和維系社會關系網絡的基礎紐帶,不僅引發了社會關系維度的深刻變革,也使互聯網逐漸嵌入更廣泛的社會關系網絡中,成為社會互動的重要媒介。第三,互聯網的發展經歷了從PC互聯網到移動互聯網,再到智能互聯網的演進過程,逐步形成了相對穩定的平臺發展模式。第四,互聯網平臺正在自我構建一種龐大的生態系統,逐步融合現有的基礎設施,成為兼具信息傳遞、社會交往、公共傳播、政治溝通、產業經營等的公共空間[16]。一些超級平臺甚至憑借強大的資本、經濟與數據優勢,獲得了改造乃至創造基礎設施的權力,開始承擔起部分政府職能。[17]

而在實踐過程中,互聯網之所以能夠成為基礎設施,首先在于其擁有大體量的用戶規模。根據Statista的數據,截至2023年,全球互聯網用戶數量約為54億,覆蓋了全球三分之二的人口。其中,自2008年以來,我國一直是全球互聯網用戶數量最多的國家,這為我國互聯網的高速發展奠定了基礎。CNNIC的數據顯示,截至2023年12月,我國網民規模達到10.92億人,互聯網普及率達77.5%,其中使用手機上網的網民比例高達99.9%,互聯網在我國社會具有較高的滲透度。其次,互聯網的用戶使用頻度高。Statista的數據顯示,截至2023年第四季度,全球互聯網用戶每日平均上網時間為6小時35分鐘,其中日均使用社交媒體的時間為143分鐘。根據CNNIC發布的數據,在中國,網民的人均每周上網時長從2012年的19.9小時增加到2023年的26.1小時,可以看出互聯網在用戶日常生活中占據越來越多的時間。此外,在互聯網的影響下,人們的生產、生活和工作逐漸從線下轉移至線上,生存方式從數字化生存向數據化生存轉變[18],短視頻平臺的興起更是激發了視頻化生存的轉向,從而重塑了人們的社交和消費的觀念和行為等。

2.平臺AI化:人工智能技術平移的基礎性作用

隨著信息技術的快速發展,人工智能技術逐漸取代傳統互聯網技術成為平臺運作的基礎性技術。換言之,互聯網平臺的展現形式依然保持不變,但從互聯網向人工智能的技術平移使得當前各大互聯網平臺都朝著AI化的方向發展。

在學理角度上,第一,人工智能并非只是后臺運行的代碼和抽象的技術,相反,其與物質世界的協同交互與影響是非常深入的。一方面,AI的運行需要依賴充足的電力供應、低延遲的網絡、高性能的硬件、可靠的存儲解決方案以及大規模的數據中心等基礎性物質資源;另一方面,通過物聯網設備(如傳感器、攝像頭)收集物理世界中的數據,AI算法能夠進行數據分析和處理,進而在復雜的場景中提供精準、高效的智能化服務,如手機地圖平臺運用AI技術可以分析實時交通數據,優化交通流量,減少擁堵和事故發生的可能性。在這個過程中,數字勞動的物質網絡也被同時構建了起來[19],在平臺經濟的驅動下出現了外賣員、網約車司機等新型職業群體。第二,人工智能推動了人類社會關系的重DoVnyPKIhZR9sQThwFsYaw==構和結構的重組,實現了從機器輔助人類到人機協同、人機共生的轉變,同時虛擬與現實的界限也隨之進一步消弭,虛實交互不斷深化。第三,人工智能技術由于受到認知水平、技術水平和資金水平等多方面不足的制約,經歷了半個多世紀的持續深潛,才逐漸成為社會的底層技術。從翻譯軟件、AI圍棋模型AlphaGo,到智能推薦算法、電子設備智能助手,再到生成式人工智能的出現,AI的應用領域日益廣泛。第四,人工智能技術在互聯網平臺的廣泛應用下,正在賦能教育、醫療、交通、農業等社會各領域的數字化、智能化轉型,催生出了新理念、新用戶、新模式、新產業和新應用。在2024年《政府工作報告》中,我國將“人工智能+”行動上升為國家戰略,未來將形成“人工智能+各行各業+各應用場景”的深度融合。

在實踐角度上,無論是在線學習、遠程辦公,還是智能家居、智慧醫療等領域,人工智能正在對人類生活進行全方位滲透。自從ChatGPT問世以來,特別是新一代生成式人工智能如GPT-4o和谷歌Project Astra的推出,AI直觀易用的界面設計、高效準確的信息處理能力、自然流暢的對話體驗,必將進一步提升用戶接納度。

(三)“生產即分發”:AGI也將成為新基礎設施

自1956年在達特茅斯會議上首次提出“人工智能”概念以來,為了實現AGI的終極目標,人工智能技術經歷了專用人工智能(ANI)的經驗積累,以及AI大模型的能力涌現,奠定了技術、資金、人才等基礎條件。所謂AGI就是一個能夠執行人類所有工作,甚至超越人類能力范疇的智能系統,它不再局限于特定的任務或領域,而是擁有廣泛的認知能力、自我進化能力,并在多樣化的任務和復雜環境中展現出人類級別或更高的智能水平。[20]也就是說,AGI的最終意義是創造出一個終極智能世界[21],將成為未來的社會基礎設施。

從學理角度出發,互聯網和人工智能技術推動了互聯網平臺迅速崛起,出現了“基礎設施的平臺化”和“平臺的基礎設施化”[22],平臺成為基礎設施的主要展現形式。但是,相對于未來的AGI,則會在現有平臺基礎上衍生出“生產即分發”的新形式。具體而言,AGI基礎設施將不再局限于當前平臺的展現形式,而是進一步把現有的基礎設施化、媒介化的平臺“再中介化”。這一過程將徹底改變傳統的生產和分發流程,實現了生產之后直接分發的模式,無需依賴傳統平臺作為“中介”。例如,基于個體化模型和個性化AI進行的人機交互,生成的內容可以直接面向用戶進行分發,而不再需要經過任何中介平臺的處理。AGI通過“去中介化”及其在全面泛化的過程中具備的環境配置性、嵌入基底性、動態生成性、關系公共性、透明生態性[23]的特征,在各類復雜環境中自適應地實現更高程度的資源配置效率和用戶體驗優化。正如凱文·凱利所言:“當技術變得隱形的時候才是最強大的?!蔽磥恚珹GI會成為“看不見、摸不著、離不開”的基礎設施,深度滲透并融入社會的每一個細微脈絡之中,無縫連接并塑造社會運作的每一個層面,真正實現全面的智能化。

在具體實踐方面,有學者通過實證研究發現,用戶會下意識地將人際交往的原則和期望遷移至人智交互情境中,因此,在AI的研發與設計過程中,能力和情感的雙重兼顧尤為必要。[24]目前,GPT-4o與谷歌Project Astra已經突破了語音、聽覺和視覺感官能力的界限,展現出強大的情感理解能力,甚至能夠提供情緒價值,帶來了豐富的交互體驗。未來,AGI將可能模擬人類“眼耳鼻舌身意”六識的感知能力[25],來獲得更多的感知數據,從而帶來更加直接、自然、真實的沉浸式體驗,以更加細膩、人性化的方式融入人類社會的方方面面。雖然,目前的AI技術與真正的AGI尚存在距離,但根據ChatGPT、Sora、GPT-4o、Project Astra等引發的社會反響,可以預見,隨著AI能力的不斷提升和AI技術的日益普及,AGI的用戶群體將持續擴大,使用頻度亦將大幅度提升。

三、AGI作為新基礎設施對傳媒業的全景式重構

GPT基于背后的預訓練大語言模型,能夠對知識進行理解,表現為二維的信息處理能力;Sora作為“世界模擬器”,具備視覺感知能力,能夠對物理世界進行更加立體和直觀的認知和模擬,實現了對現實的三維理解。但是,GPT和Sora更多是在技術和底層架構上產生了影響,并沒有真正實際落地,或者說在實際操作層面仍然面臨一定難度。而GPT-4o和谷歌Project Astra在技術、性能上的躍升為大模型增加了一個全新的維度——能夠實際應用和實現場景落地,預示著AGI正在從理論走向現實,有望真正成為新的基礎設施。對于傳媒業而言,具備更為有效落地場景的AGI新基礎設施將引發行業的全景式變革。

(一)AGI將成為傳媒業的技術主導方向

隨著人工智能技術的進步,傳媒業迎來了以生成式人工智能為代表的新一輪技術革命。從ChatGPT人機對話應用程序橫空出世到Sora文生視頻大模型驚艷四方,再到GPT-4o和谷歌Project Astra的能力躍升,AGI的曙光日益顯現。盡管目前還未真正實現AGI,但自然語言處理(NLP)、機器學習等基礎性技術,以及具備泛化任務處理能力的類AGI已經在傳媒業得到廣泛應用,如撰寫新聞稿件、生成采訪提綱、翻譯文件、分析數據、優化廣告創意等,為傳媒業實現了降本增效。此外,一些媒體還積極推出傳媒垂類大模型,如人民網與百度發布的“人民網—百度·文心”、中央廣播電視總臺與上海AI實驗室聯合發布的“央視聽媒體大模型”、傳播大腦科技(浙江)股份有限公司研發的“傳播大模型”等。未來,AGI將成為傳媒業的技術主導方向,推動傳媒業在內容生產、傳播模式、營銷模式等方面的全面智能化。

(二)傳媒業務實現智能化、精細化與場景化再造

第一,在AGI的加持下,新聞生產主體泛化,形成“UGC+PGC+AIGC+AI Agent”協同生產的格局。其中,AIGC已在體育、財經報道中有所應用,通過AI自主內容創作,實現全天候、實時內容產出,提升了內容生產效率。AI Agent作為一種高級應用程序,能夠理解人類指令,并以類人的方式作出回應、互動和決策。原先的圍棋機器人AlphaGo、語音助手Siri等可被視為AI Agent的初級形態,而GPT-4o和谷歌Project Astra則具備了更高級的類人AI Agent特性,能夠與用戶進行自然、流暢、即時的互動交流,將成為全新的內容生產主體。

第二,在AGI的驅動下,新聞傳播的互動方式和場景也展現出顯著癥候。一是GPT-4o和Project Astra這種類AGI技術在人機交互方面的顯著進步,已經調整并重塑了傳媒業的新聞分發模式,即在人與機器的一問一答過程中,形成了“生產即分發”的傳播形式。具體來說,用戶通過即時語音對話和實時參與主動提出需求,AGI在時延、表達方式上能夠進行類人響應,針對性地滿足其需求,從而顛覆了傳統新聞機構“點對面”的新聞分發模式,以及依賴算法推薦而導致的內容分發同質化現象,實現了真正意義上的“點對點”傳播,滿足了個性化、精細化、“千人千面”的互動體驗[26]。二是AGI進一步深化了元宇宙新聞場景的“脫虛向實”進程。一方面,作為元宇宙最早落地的應用場景之一,以GPT-4o為代表的新一代生成式人工智能賦能虛擬數字人的類人化屬性和智能化水平,能夠克服當前一些數字人依靠幕后工作人員操控、動作和表情不自然、語音交互不流暢等不足,給予用戶更優質的體驗;另一方面,通過手機攝像頭、智慧眼鏡或數字替身,用戶可以參與沉浸式的新聞互動,新聞傳播從單一的信息傳遞轉變為多感官的綜合體驗,在一定程度上增強了新聞的現場感和真實性。

(三)產業融合與傳媒功能深度延伸

在AGI的技術語境中,傳媒業作為相對傳統的產業,需要通過與AI技術的深度融合,注入新的活力與動力。AGI作為基礎設施將延續“互聯網+跨界”的模式,推進傳媒業在產業層面的深度融合。第一,互聯網企業通常是新技術的先行者,無論是西方發達國家還是我國的互聯網企業,都在積極探索AI大模型及其相關業務,致力于實現產業智能升級,推動AGI的全面快速發展,為傳媒業的跨界融合提供了技術、人才和資金支持。第二,面對技術對傳媒業的沖擊,尤其是AGI應用下“生產即分發”的新模式,將進一步動搖媒體的用戶基礎。因此,傳媒業需要把握住AGI的機遇,將功能的“觸角”延伸至社會更多領域,如文化創意產業、教育、醫療、智慧城市、數字治理等,拓展自身的影響力。

四、結語

塞巴斯蒂安·特倫曾言:“人工智能更像是一門人文學科,其本質在于嘗試理解人類的智能與認知。”以GPT-4o、谷歌Project Astra為代表的新一代生成式人工智能賦予了AI以人類的感官,不僅在多模態處理和人機交互能力上實現了顯著突破,更在實際應用場景中展現了廣泛的實用性,代表著AGI的最新發展方向。在AI技術的演進趨勢下,AGI將逐漸成為無處不在的現象和實體,成為繼互聯網和人工智能之后的新基礎設施。然而,任何技術的發展都伴隨著挑戰,在實現AGI的過程中,諸如數據安全、隱私保護、倫理道德等問題亦不容忽視,在未來的演進過程中還需進一步跟蹤研究。

[本文為北京市社會科學基金規劃重點項目“首都互聯網平臺企業社會責任與協同治理體系研究”的階段性成果,批準號(22XCA002)]

參考文獻:

[1]Wu S,Fei H,Qu L,et al.Next-gpt:Any-to-any multimodal llm[EB/OL].https://arxiv.org/abs/2309.05519.

[2]保羅·萊文森.人類歷程回放:媒介進化論[M].鄔建中,譯.重慶:西南師范大學出版社,2016.

[3]財聯社.OpenAI放開限制!用戶無需注冊即可使用ChatGPT[EB/OL].https://finance.eastmoney.com/a/202404023031708894.html.

[4]柯小俊.“技術網絡”與“意義點位”:作為紀念碑的基礎設施研究[J].新聞大學,2023(7):86-100+120.

[5]張磊,賈文斌.互聯網基礎設施研究:元概念、路徑與理論框架[J].中國社會科學院研究生院學報,2021(5):22-32+145.

[6]Larkin B.The politics and poetics of infrastructure[J].Annual review of anthropology,2013(42)327-343.

[7]王家東.基礎設施、邊界對象與科學技術研究的人類學路徑[J].自然辯證法研究,2023,39(06):112-117.

[8]Star S L.The ethnography of infrastructure[J].American behavioral scientist,1999,43(3):377-391.

[9]張磊,賈文斌.互聯網基礎設施研究:元概念、路徑與理論框架[J].中國社會科學院研究生院學報,2021(05):22-32+145.

[10]段世昌.媒介基礎設施視角下的技術編碼研究:教育網PT站的“分享”規則及用戶實踐[J].新聞界,2020(10):81-94.

[11]張磊,賈文斌.互聯網基礎設施研究:元概念、路徑與理論框架[J].中國社會科學院研究生院學報,2021(05):22-32+145.

[12]張超義.能源網、交通網、信息網:作為媒介的網絡型基礎設施與三網融合[J].全球傳媒學刊,2023,10(05):56-70.

[13]Collier S J,Mizes J C,Von Schnitzler A. Preface:Public infrastructures/infrastructural publics[J/OL].(2016-07)[2024-05-18].https://limn.it/articles/preface-public-infrastructures-infrastructural-publics/.

[14]劉戰偉.凸顯什么?遮蔽什么?——作為隱喻的“平臺”:連接、中介與基礎設施[J].新聞記者,2022(6):54-66.

[15]束開榮.互聯網基礎設施:技術實踐與話語建構的雙重向度——以媒介物質性為視角的個案研究[J].新聞記者,2021(2):39-50.

[16]殷琦,國秋華.從靜態機構到動態功能:互聯網平臺的內涵演變與治理轉向[J].現代傳播(中國傳媒大學學報),2023,45(04):135-142.

[17]劉戰偉,劉潔.“平臺/platform”:一個概念史的溯源性研究[J].新聞與寫作,2023(8):70-82.

[18]彭蘭.“數據化生存”:被量化、外化的人與人生[J].蘇州大學學報(哲學社會科學版),2022,43(02):154-163.

[19]孫萍.如何理解算法的物質屬性:基于平臺經濟和數字勞動的物質性研究[J].科學與社會,2019,9(03):50-66.

[20]郭全中,張金熠.作為視頻世界模擬器的Sora:通向AGI的重要里程碑[J].新聞愛好者,2024(4):9-14.

[21]郭全中,袁柏林.從GPT看AGI的本質突破:傳媒業新挑戰與未來[J].新聞愛好者,2023(4):30-35.

[22]Plantin J C,Lagoze C,Edwards P N,et al.Infrastructure studies meet platform studies in the age of Google and Facebook[J].New media & society,2018,20(1):293-310.

[23]陳昌鳳,袁雨晴.智能新聞業:生成式人工智能成為基礎設施[J].內蒙古社會科學,2024,45(01):40-48.

[24]張妍,趙宇翔,吳大偉,等.人智交互情境中用戶對生成式人工智能的心智感知及反應研究[J/OL].情報理論與實踐,1-12[2024-05-18].http://kns.cnki.net/kcms/detail/11.1762.G3.20240510.1836.002.html.

[25]張詩瑤,沈陽.Sora:傳媒生態的鏡像進化與認知變革[J/OL].編輯之友,1-8[2024-05-18].http://kns.cnki.net/kcms/detail/14.1066.G2.20240419.1104.002.html.

[26]郭全中,蘇劉潤薇.大模型驅動下的傳媒再造[J].出版廣角,2024(3):4-12.

作者簡介:郭全中,中央民族大學新聞與傳播學院教授,互聯網平臺企業發展與治理研究中心主任(北京 100081),江蘇紫金傳媒智庫高級研究員(南京 211199);蘇劉潤薇,中央民族大學新聞與傳播學院碩士生(北京 100081)。

編校:王志昭

主站蜘蛛池模板: 欧美午夜视频在线| 国产精品99久久久| 中文字幕久久波多野结衣| 欧美成人第一页| 精品国产一区91在线| 99精品在线看| 色哟哟精品无码网站在线播放视频| 久草中文网| 日本成人一区| 日韩一二三区视频精品| h网站在线播放| 青青网在线国产| 啪啪免费视频一区二区| 午夜无码一区二区三区| 国产91蝌蚪窝| 黄色福利在线| 亚洲综合婷婷激情| 日韩国产无码一区| 久久性妇女精品免费| 色婷婷久久| 99视频免费观看| 国产福利免费在线观看| 亚洲一区二区无码视频| 久久久亚洲国产美女国产盗摄| 欧美yw精品日本国产精品| 国产91久久久久久| 亚洲男人的天堂在线| 99热国产在线精品99| 99久久国产综合精品女同| 九色视频一区| 午夜精品区| 免费一级毛片在线观看| 国产成人区在线观看视频| 色135综合网| 人妻精品全国免费视频| 一级看片免费视频| 欧美不卡视频在线观看| 美女一级免费毛片| 欧美亚洲国产一区| 日韩精品一区二区深田咏美 | 无码免费试看| 91娇喘视频| 亚洲区一区| 午夜毛片免费看| av在线人妻熟妇| 激情综合网激情综合| 青青操国产| 99在线免费播放| 国产微拍一区二区三区四区| 久久综合色天堂av| 色播五月婷婷| 在线欧美一区| 亚洲永久色| 亚洲人成网址| 国产激情第一页| 一级毛片中文字幕| 国产成人亚洲精品色欲AV| 中文字幕免费在线视频| 亚洲欧洲一区二区三区| 国产精品视屏| 无码中字出轨中文人妻中文中| 99视频精品全国免费品| 玖玖精品视频在线观看| 在线播放国产99re| 成年人久久黄色网站| 亚洲激情99| 欧美爱爱网| 久久久久久午夜精品| 色婷婷综合激情视频免费看| 国产精品视频第一专区| 国产一区自拍视频| 亚洲第一中文字幕| 国产一区二区三区精品久久呦| 欧美一级爱操视频| 欧美国产综合色视频| 午夜日本永久乱码免费播放片| 国产性猛交XXXX免费看| 性视频久久| 欧美色99| 亚洲精品黄| 日韩黄色精品| 亚洲午夜国产精品无卡|