999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藏在人工智能背后的縣城工人

2023-06-08 14:30:59林石
記者觀察 2023年5期
關鍵詞:人工智能

林石

近期,全世界都在談論ChatGPT將帶來顛覆性的技術革命,但在人工智能產(chǎn)品卷起巨浪的時候,從肯尼亞、烏干達再到印度、中國,水下還有一群不被看見的“人工智能訓練師”,在簡陋的工作環(huán)境下,以最簡單的技能,與最前沿的技術產(chǎn)生了聯(lián)系。

A服務人工智能

在2021年版的《人工智能訓練師國家職業(yè)技能標準》中,對該職業(yè)的能力特征描述是“具有一定的學習能力、表達能力、計算能力;空間感、色覺正常”,普遍受教育程度寫的是“初中畢業(yè)”。言外之意,這是一份幾乎零門檻的職業(yè)。

年過50歲的郭梅原本在山西當?shù)氐拿旱V上班。離開煤礦之后,她長時間找不到工作,最后成為數(shù)據(jù)標注基地中的一名員工,每天要拉兩千個以上的框。

除了“拉框”,人工智能訓練師李杰也會接到語音標注的項目,通常是甲方采集到的不同地域、不同人群的語音,李杰必須戴上耳麥,仔細地辨認出每一個聲音的含義。這些聲音被李杰一一轉(zhuǎn)錄成準確的文字,有時還需要打上說話人的性別、情緒等更細分的標簽,最后教會人工智能模型理解人類的語言,用于智能客服、智能音箱、地圖導航等產(chǎn)品中。

人工智能的三大基石是數(shù)據(jù)、算力與算法,數(shù)量越多、質(zhì)量越高的數(shù)據(jù),往往越能夠訓練出更“聰明”的模型。人工智能的主流方向是深度學習。在過去,由人來告訴機器,貓身上都有哪些特征,機器根據(jù)這些特征判斷一個物體是不是貓;深度學習則是通過“喂養(yǎng)”大量不同貓的圖片,機器就能自行歸納出貓的特征。這就需要大量經(jīng)人工標注的圖片,可以說,有多少智能,就得付出多少人工。

這種數(shù)據(jù)標注要求特別多,“框框不能超過也不能小于,更不能漏點,一出錯誤驗收不合格就得重新拉”。這些數(shù)據(jù)的最大流向是用于自動駕駛的機器學習,要確保駕駛安全,通常需要提供數(shù)以百萬計的標注數(shù)據(jù)對人工智能加以訓練——背后則是無數(shù)在電腦前點擊鼠標、敲擊鍵盤的“李杰們”。

B互聯(lián)網(wǎng)版富士康

數(shù)據(jù)標注產(chǎn)業(yè)的誕生最早可以追溯到2005年。當時,著名計算機視覺專家、人工智能專家朱純松從美國回到了故鄉(xiāng)湖北鄂州,創(chuàng)辦了蓮花山研究院,籌建據(jù)稱是當時世界上最早的大數(shù)據(jù)標注團隊。

在深度學習成為人工智能主流之后,日益增長的互聯(lián)網(wǎng)大數(shù)據(jù)成為了人工智能的最好養(yǎng)分。據(jù)統(tǒng)計,全球每年生產(chǎn)的數(shù)據(jù)量將從2016年的16.1ZB猛增至2025年的163ZB,其中80%~90%都是原始數(shù)據(jù)。這些在經(jīng)過清洗和標注后,變成標準化格式數(shù)據(jù),才能被人工智能所理解。

作為勞動密集型產(chǎn)業(yè),數(shù)據(jù)標注企業(yè)更多地選在一二線城市之外的地區(qū)落地,地方政府無論是為了扶貧或是搭上互聯(lián)網(wǎng)的順風車,都能與互聯(lián)網(wǎng)公司們一拍即合。

2018年,位于太原的山西轉(zhuǎn)型綜合改革示范區(qū)就與百度達成合作,打造了號稱“全國范圍內(nèi)人員和產(chǎn)值規(guī)模最大的單體數(shù)據(jù)標注基地”,基地占地面積超1萬平方米,已經(jīng)引進了至少35家數(shù)據(jù)標注公司,超過2000名數(shù)據(jù)標注員。

在新疆和田,有4000人在當?shù)氐臄?shù)字經(jīng)濟產(chǎn)業(yè)園從事數(shù)據(jù)標注工作,和田地區(qū)更是拋出了“數(shù)據(jù)標注產(chǎn)業(yè)之都”和10萬人數(shù)據(jù)標注就業(yè)基地的目標。

在河南,數(shù)百家數(shù)據(jù)標注公司從無到有;在濟南,山東第一個數(shù)據(jù)標注基地已經(jīng)容納了1500名“人工智能訓練師”;在新三板上市的數(shù)據(jù)堂,也在保定、合肥分別建立了容納數(shù)百名數(shù)據(jù)標注員同時工作的基地。

雖然數(shù)據(jù)標注員身上的標簽是“互聯(lián)網(wǎng)民工”“賽博流水線”,但對于絕大多數(shù)身在其中的人而言,—個互聯(lián)網(wǎng)版的富士康已經(jīng)是當下不可多得的選擇。

C“教會徒弟,餓死師傅”

當數(shù)據(jù)標注成為“風口”,淘金者也隨之而來。

2017年,周華偶然在朋友口中得知,做數(shù)據(jù)標注能賺錢,剛剛創(chuàng)業(yè)失敗的他決定再賭一把。他找來合作伙伴,采購電腦、確定場地,又迅速地招聘了一批學歷不高、相關工作經(jīng)驗也不豐富的數(shù)據(jù)標注員,緊鑼密鼓地接單。

此時的數(shù)據(jù)標注產(chǎn)業(yè)趕上了人工智能創(chuàng)業(yè)潮。根據(jù)前瞻產(chǎn)業(yè)研究院統(tǒng)計,數(shù)據(jù)標注公司從2014年開始不斷增加,并在2017年達到高峰,當年數(shù)據(jù)標注相關融資事件達到9起,到2021年4月,已經(jīng)有18家公司獲得融資,投融資事件39起。

數(shù)據(jù)標注行業(yè)有三種不同的公司,一種是大型互聯(lián)網(wǎng)公司內(nèi)部的數(shù)據(jù)標注部門,處理公司內(nèi)部的數(shù)據(jù);一種是像數(shù)據(jù)堂這類有自己基地的數(shù)據(jù)標注公司,他們有獨立承接訂單的能力,甚至外包給第三方;數(shù)量最多的則是以工作室形態(tài)存在的小公司,他們通常只能在眾包平臺上接單,或者接第三方中介公司轉(zhuǎn)過來的層層分包的訂單——在平臺上,他們或被稱為“公會”“團隊”。周華的工作室便屬于最后一種,當時主要依賴百度眾測的平臺訂單,平臺上會分發(fā)各類任務,在行業(yè)內(nèi)稱為“放題”,包括數(shù)據(jù)采集、圖片標注、文本標注等。

同樣和他一樣撞上風口的,還有當時還是創(chuàng)業(yè)公司的星塵數(shù)據(jù)。星塵數(shù)據(jù)的創(chuàng)始人章磊,在華爾街、硅谷工作10年,2017年回國時,他本想繼續(xù)在投資領域創(chuàng)業(yè),嘗試打造一個投研機器人——通過對大量公司年報、招股書等金融文檔的學習,輔助投資人決策。當時國內(nèi)的數(shù)據(jù)標注往往只能機械化地完成客戶需求,這種“新穎”的數(shù)據(jù)標注要求,業(yè)內(nèi)難以實現(xiàn)。章磊卻看到了機會。

他創(chuàng)辦的星塵數(shù)據(jù)早在2018年1月就完成1000萬元人民幣的Pre-A輪融資,在去年8月又完成了5000萬人民幣的A輪融資,如今更多是做“數(shù)據(jù)標注平臺”的生意——他們會去竟標大公司給出的數(shù)據(jù)標注訂單,再分包給類似一些小型的“數(shù)據(jù)工廠”。

2005年成立的海天瑞聲,在此次生成式人工智能風潮中更是“賺麻了”。這家在業(yè)內(nèi)以語音數(shù)據(jù)標注著稱的公司,2021年在科創(chuàng)板成功上市,今年1月以來,股價從每股60元左右暴漲到了每股超過200元。

畢竟對于國內(nèi)眾多研發(fā)人工智能的大廠而言,基礎的數(shù)據(jù)標注是剛需,卻不可能永遠自己來做。那么只要有訂單,無論是周華這樣的工作室,還是海天瑞聲、星塵數(shù)據(jù)這樣的大公司,都能賺個盆滿缽滿。

如今,隨著GPT-4和文心一言的陸續(xù)出場,人工智能正“升級換代”,數(shù)據(jù)標注行業(yè)也伴隨著新的變化。人工智能研究者們已經(jīng)開始嘗試向機器“喂養(yǎng)”未標注的數(shù)據(jù)與部分標注數(shù)據(jù),亦即“半監(jiān)督學習”,而不依賴于人工標注的自監(jiān)督學習與數(shù)據(jù)標注,也在業(yè)界開始出現(xiàn)實踐。

特斯拉目前正在開發(fā)的計算機Dojo,就采用自監(jiān)督學習技術,用于訓練人工智能模型,對數(shù)據(jù)標注的需求正越來越低。去年6月底,美國加州圣馬特奧縣的特斯拉辦公室,多名特斯拉員工在一次會議中被告知他們被裁員了,最終被裁員的200人中,大多數(shù)都是數(shù)據(jù)標注員。

騰訊、阿里、字節(jié)跳動等一眾大廠,也都在研發(fā)自監(jiān)督學習的算法,甚至有些數(shù)據(jù)標注公司也都已經(jīng)有60%內(nèi)容來自于機器的自動化標注。

李杰聽過一個說法,數(shù)據(jù)標注員是“人工智能的老師”,是他和同事們?nèi)諒鸵蝗盏睦蚪虝巳斯ぶ悄芾斫馊祟愂澜纭5麖臎]想過,當人工智能時代真正到來的那一天,取代他們的,恰恰會是自己曾經(jīng)的學生。

摘編自微信公眾號“藍字計劃”

猜你喜歡
人工智能
我校新增“人工智能”本科專業(yè)
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業(yè)
基于人工智能的電力系統(tǒng)自動化控制
人工智能,來了
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: WWW丫丫国产成人精品| 色噜噜综合网| 国产福利免费观看| 色综合久久久久8天国| 中文字幕色站| 亚洲综合专区| 国产噜噜噜视频在线观看 | 国产呦视频免费视频在线观看| 777午夜精品电影免费看| 亚洲综合久久成人AV| 国产免费高清无需播放器| 她的性爱视频| 欧美成人午夜视频免看| 国产尹人香蕉综合在线电影 | 婷婷色一二三区波多野衣| 午夜福利视频一区| 国内丰满少妇猛烈精品播| 国产精品蜜芽在线观看| 日韩123欧美字幕| 久久伊人操| 亚洲一区二区三区中文字幕5566| 不卡午夜视频| 国产成人欧美| 国产又黄又硬又粗| 国产亚洲欧美在线中文bt天堂| 综合亚洲网| 毛片久久网站小视频| 青青青伊人色综合久久| 天堂网亚洲综合在线| 亚洲床戏一区| 97在线公开视频| 亚洲AV无码乱码在线观看代蜜桃| 亚洲性视频网站| 久久天天躁狠狠躁夜夜2020一| 亚洲精品第一页不卡| 香蕉网久久| 激情五月婷婷综合网| 久久一日本道色综合久久| 国产精品视频免费网站| 国内熟女少妇一线天| 久久www视频| 亚洲人成网站色7799在线播放| 欧美精品xx| 伊人大杳蕉中文无码| 毛片网站在线看| 国产黄在线免费观看| 97国产在线视频| 日韩二区三区| 九色视频线上播放| 国产福利一区视频| 久久久久久国产精品mv| 国产免费羞羞视频| 久久综合色88| AV网站中文| 色网在线视频| 91精品小视频| 亚洲国产精品日韩av专区| 啊嗯不日本网站| 国产打屁股免费区网站| 国产在线专区| 欧美国产日韩另类| 韩国v欧美v亚洲v日本v| 在线视频精品一区| 九九九久久国产精品| 亚洲成人免费在线| 国产乱码精品一区二区三区中文 | 亚洲一级毛片免费看| 日韩毛片免费视频| 亚洲AⅤ综合在线欧美一区| 在线中文字幕日韩| 久久狠狠色噜噜狠狠狠狠97视色 | 国产欧美综合在线观看第七页| 美女内射视频WWW网站午夜| 天堂岛国av无码免费无禁网站| 亚洲天堂视频在线免费观看| 呦视频在线一区二区三区| 在线国产资源| 精品一区二区三区自慰喷水| 欧美色香蕉| 日本国产精品| 91色在线视频| 日本欧美午夜|