陳徐毅

在優勢與挑戰并存的同時,未來強人工智能技術走向將更趨明朗,相信更多AI產品將在新的消費級領域涌現。
2022年11月,人工智能對話機器人程序ChatGPT面世引起了外界廣泛關注,因其遠高于比過去同品程序的文本反饋能力以及在理解人類提問上的優異表現,業界將之視為當前強人工智能的代表作。不到兩個月里,ChatGPT用戶數激增過億,成為史上增長速度最快的消費級應用程序。這也是繼AlphaGo問世之后出現的第二次強人工智能熱潮。
ChatGPT的亮眼表現也牽動了行業科技巨頭紛紛入局,并引發新一輪的AI備戰升級。由于谷歌搜索業務被認為受ChatGPT影響最深,谷歌公司迫于壓力倉促推出其競品Bard(一款基于LaMDA語言模型的AI對話程序),卻因其首秀意外“翻車”而導致股價大跌。與ChatGPT研發機構OpenAI早有投資關系的微軟則繼續跟進擴大投資,并高調宣布旗下搜索Bing引入ChatGPT。而國內的百度、阿里也傳出正在研發類ChatGPT的項目,網易、科大訊飛、360等也在相關領域布局涉足類ChatGPT業務。
ChatGPT的由來
ChatGPT是由人工智能實驗室OpenAI開發的一款人工智能對話工具,作為深度學習的產物,該程序基于GPT-3架構的自回歸語言模型進行強化巨量的文本學習訓練。由于是聊天機器人的產品形態,ChatGPT仍以文本交互方式與終端使用者進行自然對話,但其功能遠比此前的一般聊天智能助理強大,能夠生成自動文本,應對復雜的文字工作,自動問答、生成和調試編程語言等等,應用廣泛。
人工智能實驗室OpenAI成立于2015年,是一個目前由非營利向盈利過渡的商業組織,其創始人埃隆·馬斯克和山姆·阿爾特曼創辦動機是出于對強人工智能潛在風險的擔憂。2016年OpenAI發布了機器學習公測平臺,此后每年花費高昂資金用于訓練,直至ChatGPT發布。
發布之初,ChatGPT的表現雖然亮眼但并非臻于完美,經使用者大量測試發現,一些專業領域知識給出的反饋仍存在事實準確性參差不齊的缺陷,其模型訓練結果被認為需要進一步校正。
強人工智能應用興起與現狀
這些年,人工智能領域的分支以人工神經網絡為架構的深度學習發展迅速,這主要得益于全球云計算市場膨脹、基礎設施數量逐年擴大帶來的算力資源總量的快速上升。深度學習有賴于并行分布式計算,而并行計算的技術路線是人工智能領域近十年來得以突破瓶頸和超越以往技術形態的業界共識。
在此共識之下的成果,ChatGPT這類文本應用只是其中之一,這兩年還有AI繪畫、AI音樂,甚至AI 3D建模的出現,無不意味著有著推理和解決問題能力的強人工智能技術形態初現端倪。
比如2022年8月發布的文本生成圖像模型Stable Diffusion,它根據用戶給出的文字描述生成相應的圖像,也可以用于繪制和修補圖像。Stable Diffusion在一個公開的數據集LAION-5B上訓練模型,而LAION-5B至少包含了50億個圖像—文本數據對。除此之外,還有Disco Diffusion、Midjourney等AI繪畫工具也與之類似。
再比如可以從文本描述中生成高保真音樂的模型MusicLM。例如用戶輸入“一段吉他即興演奏搭配平靜的小提琴旋律”,MusicLM會將文本描述條件按過程和層次建立序列并建模任務,最終生成可長達幾分鐘的24kHz音頻文件。還有同樣出彩的AI 3D建模方面,但因過程復雜目前暫未出現以文字生成樣本的產品。
這些強人工智能工具由于訓練所用模型依賴海量互聯網已有數據,也面臨著著作權爭議和道德倫理方面的負面影響。由AI侵權引發的版權訴訟案件正在逐年增加,不久前代碼自動生成工具Copilot侵權案尚未落定,ChatGPT在教育界又引起論文作弊與學術道德的爭議。

強人工智能產品市場格局和未來走向
業界在經歷疫情蕭條期和元宇宙概念虛火之后,這種新形態的強人工智能產品落地確實給了市場一針強心,特別是2023年以來,人工智能概念板塊普遍景氣揚升。新的AI項目研發落地吸引著科技巨頭們紛紛入場布局,由于強人工智能項目研發所需投入的模型訓練經費高昂,它們也急需盡快獲得大型科技公司的融資和算力資源的支持。比如2017年OpenAI僅在云計算資源上就花費790萬美元,占其總支出的四分之一;而AI繪圖Stable Diffusion在亞馬遜云計算平臺上訓練共15萬個GPU小時,花費成本60萬美元。
由于新的AI產品落地時間不長,強人工智能市場仍在初期形成當中,這一波由Copilot和ChatGPT兩種新的AI產品形態帶起的風口,在當前市場格局中走在最前面的仍然是微軟。微軟于2019年7月率先投資OpenAI 10億美元,為之提供Azure云的計算訓練資源,后續取得該技術的獨家授權。2023年初微軟跟進投資第二筆據報道為100億美元資金,隨后旋即宣布旗下Bing搜索引入ChatGPT,強調集成了AI的瀏覽器Edge+搜索Bing的全新產品矩陣,旨在對谷歌互聯網業務的彎道超車。
由此可見,當前強人工智能技術初級形態以及其所代表的種種落地產品,與上一代人工智能技術相較確實令該領域的發展耳目一新,但也存在明顯需要校正的算法缺陷,以及在涉及訓練源的版權、學術道德、網絡安全等方面的批評與風險。在優勢與挑戰并存的同時,未來強人工智能技術走向將更趨明朗,相信更多AI產品將在新的消費級領域涌現。