史佳慶 宋瑞

7 月6 日,上海2023 世界人工智能大會達闥展位,人形機器人進行“千手觀音”表演(王翔/ 攝)
7月8日下午,“伯奇杯”2023年佛山市數字化應用技術職業技能競賽“人工智能訓練師”賽項閉幕。經過初賽和決賽的角逐,60名選手從來自86家單位的245名選手中脫穎而出,贏得“人工智能訓練師”職業工種的榮譽。
根據人工智能訓練師國家職業技能標準(2021年版)的定義,人工智能訓練師是指“使用智能訓練軟件,在人工智能產品使用過程中進行數據庫管理、算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業的人員”。
“人工智能訓練師的出現是人工智能快速發展的結果。”360集團AI產品經理葛燦輝接受《瞭望東方周刊》采訪時表示,從早期給機器進行準確率評估、為機器準備學習樣本、糾正機器錯誤,到將部分人類智慧、情感注入人工智能大模型,讓機器理解人的指令,并對其進行價值觀引導……人工智能訓練師正在讓機器越來越有人性。
在武漢光庭信息技術股份有限公司的辦公樓里,一名人工智能訓練師正在對自動駕駛特殊場景的圖片進行標注,比如打傘的行人、非正常停放的機動車、帶雨棚的電動車等。隨后,訓練師用特定的文字、數字等數據,將標記的圖片結合,再用人工智能算法分析道路中影響車輛行駛的相關實體。
“通過對人工智能暫時識別不了的數據進行標注、回灌、反復‘喂養,人工智能的算法智商可有效提高。”該公司數據驅動研發實驗室主任郝江波告訴《瞭望東方周刊》,人工智能訓練師類似于教師,要把學生(人工智能)不會的題目找出來,告訴他準確的答案,然后不斷去訓練他。

2021 年10 月20 日,郝江波在上汽集團第四屆汽車新四化技術高峰論壇講解《數據驅動開發的思考與探索》
以自動駕駛中感知部分的人工智能為例,人工智能訓練師需要了解感知識別的類型、給予模型充足的基礎數據訓練、檢測模型在哪些場景下“看不清”,有針對性地搜集、標注好這些典型數據,給模型訓練;與此同時,人工智能訓練師還要研究智能化標注平臺,讓價值數據的挖掘和標注實施更為高效。
郝江波舉了個例子:“比如,當高速道路上的剎車印記覆蓋了白色車道線,車的橫向控制就容易發生錯誤(即無法保持居中直行),車會往一側偏離。在這種情況下,人工智能訓練師就要對有剎車印記的車道線重新標注,讓算法識別此類特殊場景,確保車輛安全行駛。”
除了自動駕駛領域,醫療領域也有了人工智能訓練師。
“請問你是患者本人還是家屬呢?現在哪里不舒服?”
“頭疼。”
“請問頭痛有多長時間了?”
“2周。”
“請問頭痛的程度如何?”
“中度。”
……
電腦屏幕上,顯示的是一段醫生與病人之間的對話文本。
“這款人工智能產品名為‘左手醫生,除了能把醫患對話一鍵生成為病歷,還可以為病人提供診前信息采集、診后疾病管理等服務。”北京左醫科技有限公司產品研發負責人彭彧告訴《瞭望東方周刊》,這樣看似簡單的功能,背后都是人工智能訓練師日復一日的訓練。
葛燦輝從事人工智能訓練相關工作已有10年,目前在360集團負責大模型的策略評估、產品規劃以及應用等。
在他看來,與需要通過代碼讓計算機執行指令的軟件工程師不同,人工智能訓練師更側重為計算機準備學習的語料、樣本和示例,同時糾正計算機的錯誤。在此過程中,計算機需要自主學習完成指令。
“打個比方,軟件工程師告訴計算機該怎么做,計算機必須精準執行指令;而人工智能訓練師則是創造條件讓計算機自主學習該怎么做,讓其朝著目標自己學習改善。”葛燦輝認為,人工智能訓練師不僅是訓練模型,更重要的是激發模型的潛能。
今年5月,2023第七屆世界智能大會在天津舉辦。在360集團的展臺前,參觀者輸入“夏日旅游方案”,“360智腦”幾秒鐘就能列出多種旅游“思路”;追問“天氣太熱,推薦夏日旅游好去處”,系統還會“進一步思考”,推薦詳細地點,重新優化之前給出的答復。

武漢光庭信息技術股份有限公司工作人員研發智能網聯汽車智能化標注平臺,對算法不斷優化,保障無人駕駛車輛正常可用
“用戶提問越精確,越能夠得到貼近的回答。這離不開人工智能訓練師在幕后大量的文本提取和提示詞標注工作。”葛燦輝說,人工智能訓練師有大量的對齊工作(對齊,指要求AI系統的目標和人類的價值觀與利益一致),通過對指令輸出結果進行標注和糾正,不斷強化和監督機器學習。目前,該集團已經有上百個人工智能訓練師。
據介紹,“360智腦”大模型基于提示詞進行預測,而人工智能訓練師的工作就是讓機器以可以處理的方式學習人類指令,“了解”人類的思維方式和價值判斷,再以人類可以接受和處理的方式輸出。通過大量提示詞,人工智能訓練師要挖掘出大模型的隱藏知識,規范模型的輸出,從而激發出大模型的隱藏知識。
葛燦輝稱,隨著生成式人工智能時代來臨,大模型向百業千行滲透,增量需求不斷釋放,人工智能訓練師的崗位需求會越來越大,未來發展前景非常廣闊。
每次出門,付聰總會在耳朵上戴一個大“耳環”。
付聰是騰訊天籟實驗室人工智能訓練師,他戴的“耳環”其實是一個測試版的助聽器——“耳環”里的聲音各式各樣,有呼呼的噪聲,有尖銳刺耳的吵鬧聲……這些經過助聽器放大后產生的噪聲,是很多佩戴助聽器的聽障人士長期面臨的困擾。
而付聰和他的團隊正在嘗試利用算法設計、通過人工智能技術“訓練”數據模型,讓助聽器更加“智慧”地降低噪聲,讓聽障人群聽得清、聽得懂、聽得舒服。
“助聽器數據模型很小,因此需要針對不同場景進行優化,很多場景充滿挑戰。”付聰解釋說,比如,一個聽障人士在餐廳吃飯,周圍有很多人說話,他想跟對面的人聊天,四周聲音特別嘈雜,作為一個聽力正常的人都可能聽不清楚,更何況一個有聽力障礙的人?
“這就需要人工智能訓練師把有用的聲音提取出來,降低噪聲。”他稱,科技向善,離不開人情味。
人工智能訓練師在對人工智能進行訓練時,如何讓人工智能更有“人情味”?在彭彧看來,至少可以從三方面著手。
“據測算,中國人工智能領域人才缺口高達500 萬人。上海市2025年需求40 萬,而目前本地高校相關專業在校生規模為4 萬。” 在2023 世界人工智能大會人工智能人才專場高峰論壇上,復旦大學黨委書記裘新給出一組數據,點明人工智能行業對人才的渴求。
首先,要加強人工智能對人類當前真實需求和情感表達,即上下文語境的理解能力。
其次,要加強人工智能回復時的人情味。以醫療場景為例,人工智能需要解答的不僅是患者的生理問題,還有心理上的訴求。
“當患者剛剛被診斷出糖尿病,應該如何溝通?”彭彧告訴《瞭望東方周刊》,作為一名醫生,可能會考慮到三點:先緩解患者情緒,再出治療方案,最后給出飲食和運動的建議。
“那么,作為人工智能訓練師,就需要參照真實的醫生反應,構造一個相對優質的輸出答案,通過上千條或者上萬條輸入輸出的數據,讓人工智能反復地訓練、吸收、學習。”他說。
第三,要應用前沿的技術提升人工智能的能力。比如,左醫自研的醫療垂類大語言模型“左醫GPT”,通過大模型賦能醫療場景中的人工智能應用,不僅拓展了醫療智能產品的應用范圍,亦在需要人機交互的場景中實現了更好的擬人化。
“在自動駕駛的場景中,富有‘人情味的人工智能則會根據特定駕駛人的行為做出學習。”郝江波稱,比如,針對更為謹慎的司機,人工智能會給出更大的跟車處理,超越卡車時會有意避讓等等,讓駕駛人的駕乘和心理得到更好體驗,感到陪伴自己駕駛的不是機器,而是“機器人”。
人工智能產業欣欣向榮,離不開政策的支持引導。
近年來,中國發布了《促進新一代人工智能產業發展三年行動計劃(2018-2020年)》等多項政策文件,各地也相繼出臺有關措施,支持引導人工智能產業發展。
2020年2月25日,人工智能訓練師作為新職業被納入國家職業分類目錄。2021年,人力資源和社會保障部發布該職業的國家職業技能標準。
中國電子信息產業發展研究院副總工程師安暉表示,我國人工智能技術的商業化應用,擁有其他國家難以企及的規模優勢。目前,我國人工智能已廣泛應用于城市管理、金融、零售等諸多領域。隨著人工智能技術應用進程加快與程度加深,市場對人工智能人才的需求呈現井噴式增長。
“據測算,中國人工智能領域人才缺口高達500萬人。上海市2025年需求40萬,而目前本地高校相關專業在校生規模為4萬。”在2023世界人工智能大會人工智能人才專場高峰論壇上,復旦大學黨委書記裘新給出一組數據,點明人工智能行業對人才的渴求。
“智能化是社會發展的必然方向。長期來看,人工智能訓練師可能會像軟件開發工程師一樣普遍。”安暉稱,人工智能訓練師這一職業形態,能夠實現傳統工種的技術提升,還能夠支持遠程辦公、兼職辦公等靈活的辦公形式,這給了從業人員相對靈活的時間,吸引了部分人群對此職業的認可。
中國數實融合50人論壇智庫專家、國研新經濟研究院創始院長朱克力表示,人工智能訓練師作為一項有著一定技術門檻和操作技能要求的新職業,會遇到一些發展中的問題,亟須用市場化法治化手段,因勢利導順勢而為,厚植新職業發展沃土。
“作為一名人工智能訓練師,最大的挑戰在于如何收集到優質的數據集,除了可衡量評估標準外,還需要滿足數據集的多樣性;其次,就是對項目的評估標準,面向客戶使用時必須是既有幫助又能保障安全的。”彭彧告訴《瞭望東方周刊》。
“在某些領域,人工智能的回答還不夠深入;在涉及最新理念和實踐方面,人工智能的回答還不夠前沿;在生動化、擬人化的文字傳遞方面,人工智能的回答還不夠靈活。”郝江波表示,這都是人工智能訓練師要解決的問題。
“未來已來,我們唯有積極擁抱和適應人工智能對人類工作和生活帶來的變革。”郝江波說。