從Chat到GTP

2023-06-07 16:31:17邱元陽

中國信息技術教育 2023年11期

邱元陽

2022年11月30日，OpenAI發布了其最新的聊天機器人模型ChatGPT。這一模型一經亮相就驚艷了全世界，因為它顛覆了人們對Chat（聊天）的認識，它不是簡單的知識問答和聊天、搜索，而是具有內容生產能力的AI，可以幫你寫論文、做報告，甚至寫代碼、進行程序調試……

半年過去了，ChatGPT依舊熱度不減，并在進行升級進化，儼然是一個全能的“六邊形戰士”，還產生了一大批的模仿和追隨者。

GPT全稱是“Generative Pre-Training transformer”，直譯過來就是“生成式預訓練模型”，它使用了Transformer模型來進行自我深度學習和加強學習。不同于簡單的Chat，ChatGPT是典型的AIGC（AI Generated Content，人工智能生成內容）或GAI（Generative AI，生成式AI），具有很強的內容生產能力。

AIGC被認為是繼PGC（專業生產內容）、UGC（用戶生產內容）之后的新型內容創作方式，其特點是高效的自動化生產。隨著NLG（自然語言生成技術）和AI模型的成熟，AIGC目前已經可以自動生成文字、圖片、音頻、視頻，甚至3D模型和程序代碼。

目前，AI已經從理解內容走向了自動生成內容，包括AIGC用于作畫、圖文、視頻等多類型的內容創作。當然，這其中也少不了機械的模仿和照搬，如曾經鬧出把起重機畫成鶴的笑話的文心一言，讓人懷疑其文生圖功能是中譯英后“套皮”Stable Diffusion來生成圖像，但其修正和完善之后卻又似乎是因為采用了英文標注的圖片素材。李彥宏在解釋“胸有成竹”等成語生成圖片因望文生義而尷尬時曾說，不能要求AI的各項能力都與人匹配，它不“像”人也沒什么不好，而且我們的AI還正在成長中，初級階段表現不佳也很正常，但是它會很快地進步。畢竟，就連ChatGPT這種偶像級的AI也一樣犯過一本正經地證明27是質數這樣的錯誤，GPT從1.0到4.0一路走來，也是比較漫長和曲折的。

2015年，OpenAI成立，次年推出初代GPT，2019年發布GPT-2，可以生成語言并在一定程度上準確識別語言；2020年發布GPT-3，可以生成各種類型的文本并理解文本的語義；2022年OpenAI推出的ChatGPT，正是在GPT-3模型基礎上構建的，之后又發展到GPT-3.5。如今為大家所津津樂道的，已經是GPT-4了。

人工智能的重大研究方向之一就是NLP（自然語言處理），也就是讓機器讀懂人類的語言。NLP研究有兩大方向，一個是谷歌的雙向技術，以BERT為代表；另一個就是OpenAI的自回歸技術，以GPT為代表。這兩種技術方向的競爭，背后就是谷歌與微軟的競爭。在Alpha GO之后，微軟終于靠ChatGPT扳回一局。飛速進化的ChatGPT，已經有了引領第四次工業革命的趨勢。

與以前的AI不同，ChatGPT解放的不是人的體力，而是腦力。如果它能取代人的部分工作，那么被取代的可能是腦力勞動而非體力勞動。想到這一點，不免讓人有些脊背發涼。

從程序員的角度看，他們不會相信GPT能產生智慧，因為GPT底層算法的本質就是數學概率而已。但是從用戶角度看，GPT的智能已經高得驚人，甚至到了需要叫停的地步。

計算機模型使用反向傳播算法，可以以一種完全不同于人類大腦的方式運行，在算法模型下進行海量訓練，會讓AI飛速進化。深度學習之父、圖靈獎得主杰弗里·辛頓在接受Emtech采訪中公開警告AI風險：人類終結已近在眼前。