□姚永嘉
對形形色色的車模、船模、航模,同學們再熟悉不過,那你是否聽說過“大語言模型”?難道語言也能變成什么模型?沒錯,那可是人工智能擅長的“絕活兒”!確切地說,這是一種人工智能技術驅動的自然語言處理工具,一種聊天機器人程序。哈哈,說到聊天機器人,你大概就能想起某些客服電話或對話框中應對自如的語言、文字了吧,那些親切的“叔叔”“阿姨”,沒準兒就是大語言模型的杰作哦。
2022 年底,美國人工智能研究實驗室OpenAI公司推出了ChatGPT 系列產品,這種大語言模型能做到與真正人類幾乎無異的交流。這個原本科幻電影里才有的技術立即引爆了世界對大語言模型的關注,掀起了一場前所未有的技術變革。如今,使用大語言模型不再是一種高深莫測的技術術語,說不定你也能用它開啟屬于自己的無限可能。
大語言模型不是生來“萬事通”,只有對你的語言、思維,對書籍、圖片、互聯網內容等進行“預訓練”,就像對人類小孩那樣,通過不斷反饋指導,甚至給它獎勵或懲罰,大語言模型才會變得越來越“聰明”,“聰明”到能對你輸入的任何問題或指令都迅速給出答案,幫你構思,幫你發揮創意,甚至幫你處理好所有相關細節。

想象一下,就算是你心愛的寵物生病了,只要你告訴大語言模型小寶貝的具體情況,它也許就能像一名經驗豐富、醫術高超的寵物醫生那樣告訴你治療方案。大語言模型是那么“博學”,無論你對歷史、科學、文化還是任何其他領域感興趣,只要向它提出問題,它都能瞬間啟動隨時更新的龐大知識庫,施展超高效率的自我學習技能,盡力給你一個準確、詳細的答案。大語言模型還是“語言專家”,無論你是在學習外語、在國外旅行還是需要與來自不同文化背景的人交流,它都能為你提供準確的翻譯服務。對同學們來說,大語言模型最吸引人的能力之一大概是生成文本,無論你是在列提綱、寫作文,還是僅僅需要一些創意靈感,“機智”的大語言模型隨時都能幫你延伸思維的觸角,簡直就是一個靈感無限的寫作小助手。
這一切的“超能力”都源于大語言模型背后高速發展的人工智能,它很樂意為人類效勞,對于各種問題持續幫助我們提供更好的答案。回想一下,我們在科幻電影中總是能聽到某個聰明的人工智能語音,回答主人公這樣那樣的問題,幫他(她)做出關鍵的判斷。未來,這樣的現實也許會通過大語言模型體現在我們每個人身上,人際關系、社會治理、智能制造……各種你想得到或想不到的應用場景都會有大語言模型的存在,更受信任的人工智能甚至有可能改變未來整個人類社會生態。
過去的客服聊天機器人,通常只能根據用戶提問,發送預先準備好的回答。應用大語言模型后,同樣的問題問兩遍,它的回答可能會完全不同,甚至會跳出想象力的邊界。這有可能為人類開啟新的創造,也有可能是“一本正經的胡說八道”,看上去非常真實和有道理,但卻會讓人踏入誤區。有一個真相頗令人意外,大語言模型雖然已經開始廣泛應用,但其實際運行機制人類卻還不是很清楚。
人類對機器的完全信任也許還要走很長的路,你得意識到,大語言模型的回答可能是錯的!那是因為大語言模型只是對已有的文本信息進行模擬和預測,目前還無法真正深入理解文本背后的含義和情感。所以,別以為有了大語言模型我們就可以“躺平”啦,學習、寫作業還得靠自己獨立完成哦。

2023 年11 月8 日,知識增強大語言模型關鍵技術在浙江烏鎮發布。
早晨的露珠,晶瑩,閃亮,我想采集起來,寫純真的童話。
廣西合浦縣廉州鎮第八小學 吳中婉
說了這么多,我估計同學們已經迫不及待地想要嘗試大語言模型了。雖說大語言模型很厲害,實際對于普通用戶來說,上手極其簡單。最常見的大語言模型的界面,都有一個輸入框,類似微信或者QQ 的聊天窗口。
我們想得到一個更優質的內容,離不開優質的提問,專業說法是“提示詞”。提示詞可以是一個問題、一個任務或者一段話的描述,是你給大語言模型的線索或者啟發,它會根據這個提示詞的信息和上下文理解,生成相應的回答。
你可以提問“貓是一種什么動物?”或者“我想寫一篇關于中國高鐵的科普文章,請給我一個提綱。”也可以嘗試提一些發散性的問題,比如“去火星要做哪些準備工作?”當提示詞輸入完畢以后,點擊“發送”按鈕,稍等片刻就可以看到完整回答啦。不過,要是你提出了包括但不限于暴力、歧視、犯罪等不懷好意的問題和請求,大語言模型就會按照預先設計的道德準則說“不”,拒絕提供有效答案。
很久以前,人類對人工智能的探索就已經開始了。在20 世紀50 年代,英國數學家阿蘭·圖靈提出了一個問題:“機器能思考嗎?”從此以后,這個問題引發了長期的爭論,人類也開始不斷探索機器智能。隨著科技的進步,新的思想和技術逐漸嶄露頭角。研究人員們開始利用深度學習神經網絡來訓練語言模型,使計算機能夠從大量的數據中學習語言的規律和特征,通過自我理解來生成文本。
雖然大語言模型誕生在西方國家,但咱們中國人也能用它來為國家富強和人們生活更美好服務。可是在中文中,詞與詞之間并沒有明顯的分隔符號,不像英文單詞之間是由空格分隔,這就給機器理解中文帶來了一定的困難。中國科學家就發明了中文分詞的方法,就像是給中文句子打上合理的斷點,把一串連續的文字分割成一個個有意義的詞語。這樣,機器就可以更好地理解中文句子的含義和結構,機器翻譯、文本分類、情感分析等任務都不在話下。
早在大語言模型成熟之前,中文分詞就已經在中文搜索引擎等應用領域中產生了重要影響。大語言模型的訓練,離不開自然語言的處理。正是中文世界對分詞的迫切需要,促進了自然語言處理的成熟,為大語言模型的進步貢獻了自己的力量。
咱們中國當然也得擁有自己的大語言模型,那可是一個不能被外國“卡脖子”的關鍵技術。目前,我國已把大語言模型建設列為國家科技基建的重要內容,把它作為產業數字化的重要推動者和參與者,不斷提升相關技術水平,拓展應用場景。中國的科技公司也在奮起直追,全球首個大語言模型ChatGPT 發布后不到一年的時間,阿里巴巴“通義千問”,華為“盤古”,訊飛“星火認知”,百度“文心一言”,騰訊“混元”以及各科研機構的大語言模型紛紛發布。就像計算機誕生后迅速取代了人類大量繁重勞動,大語言模型的問世加上中國人的智慧,也許會為未來人類的創造開拓難以想象的空間。
(本文在創作過程中得到技術專家朱峰老師的幫助,在此表示感謝。)
夜晚的沙漠一片漆黑,如此靜謐。此時,我仿佛身處太空,周圍是漫天繁星。我閉上眼,用心聆聽,仿佛可以聽見幾千年來在這片沙漠上發生的無數滄桑故事與歷史變遷。
浙江余姚市第一實驗小學 符振南