邱元陽

2022年11月30日,OpenAI發布了其最新的聊天機器人模型ChatGPT。這一模型一經亮相就驚艷了全世界,因為它顛覆了人們對Chat(聊天)的認識,它不是簡單的知識問答和聊天、搜索,而是具有內容生產能力的AI,可以幫你寫論文、做報告,甚至寫代碼、進行程序調試……
半年過去了,ChatGPT依舊熱度不減,并在進行升級進化,儼然是一個全能的“六邊形戰士”,還產生了一大批的模仿和追隨者。
GPT全稱是“Generative Pre-Training transformer”,直譯過來就是“生成式預訓練模型”,它使用了Transformer模型來進行自我深度學習和加強學習。不同于簡單的Chat,ChatGPT是典型的AIGC(AI Generated Content,人工智能生成內容)或GAI(Generative AI,生成式AI),具有很強的內容生產能力。
AIGC被認為是繼PGC(專業生產內容)、UGC(用戶生產內容)之后的新型內容創作方式,其特點是高效的自動化生產。隨著NLG(自然語言生成技術)和AI模型的成熟,AIGC目前已經可以自動生成文字、圖片、音頻、視頻,甚至3D模型和程序代碼。
目前,AI已經從理解內容走向了自動生成內容,包括AIGC用于作畫、圖文、視頻等多類型的內容創作。當然,這其中也少不了機械的模仿和照搬,如曾經鬧出把起重機畫成鶴的笑話的文心一言,讓人懷疑其文生圖功能是中譯英后“套皮”Stable Diffusion來生成圖像,但其修正和完善之后卻又似乎是因為采用了英文標注的圖片素材。李彥宏在解釋“胸有成竹”等成語生成圖片因望文生義而尷尬時曾說,不能要求AI的各項能力都與人匹配,它不“像”人也沒什么不好,而且我們的AI還正在成長中,初級階段表現不佳也很正常,但是它會很快地進步。畢竟,就連ChatGPT這種偶像級的AI也一樣犯過一本正經地證明27是質數這樣的錯誤,GPT從1.0到4.0一路走來,也是比較漫長和曲折的。
2015年,OpenAI成立,次年推出初代GPT,2019年發布GPT-2,可以生成語言并在一定程度上準確識別語言;2020年發布GPT-3,可以生成各種類型的文本并理解文本的語義;2022年OpenAI推出的ChatGPT,正是在GPT-3模型基礎上構建的,之后又發展到GPT-3.5。如今為大家所津津樂道的,已經是GPT-4了。
人工智能的重大研究方向之一就是NLP(自然語言處理),也就是讓機器讀懂人類的語言。NLP研究有兩大方向,一個是谷歌的雙向技術,以BERT為代表;另一個就是OpenAI的自回歸技術,以GPT為代表。這兩種技術方向的競爭,背后就是谷歌與微軟的競爭。在Alpha GO之后,微軟終于靠ChatGPT扳回一局。飛速進化的ChatGPT,已經有了引領第四次工業革命的趨勢。
與以前的AI不同,ChatGPT解放的不是人的體力,而是腦力。如果它能取代人的部分工作,那么被取代的可能是腦力勞動而非體力勞動。想到這一點,不免讓人有些脊背發涼。
從程序員的角度看,他們不會相信GPT能產生智慧,因為GPT底層算法的本質就是數學概率而已。但是從用戶角度看,GPT的智能已經高得驚人,甚至到了需要叫停的地步。
計算機模型使用反向傳播算法,可以以一種完全不同于人類大腦的方式運行,在算法模型下進行海量訓練,會讓AI飛速進化。深度學習之父、圖靈獎得主杰弗里·辛頓在接受Emtech采訪中公開警告AI風險:人類終結已近在眼前。