周小琪 梁文雪

河南郟縣東邊一個建材廣場的三層,這些天,來了500個長了眼袋的人。他們被輪流帶進了臨時搭的攝影棚里——一個光線昏暗、不到30平方米的小房間。
有人指引他們坐在椅子上,面朝一部被固定在三腳架上的手機,手機和眼袋者之間的距離是25厘米,不能多,也不能少。每次開拍前,一名長著老實憨厚方臉的員工都會掏出卷尺,仔細再量一遍。
方臉員工叫張凱。量完距離后,他需要用5部像素不同的手機拍攝這些有眼袋的人。
這項工作名為“數據采集”。采集而來的照片、語音等,進行“數據標注”后,將會提供給人工智能企業,作為機器的學習資料。這些資料能教計算機分辨車輛、廚具等不同的物體,讓它們像人一樣,去認識大千世界。
去年夏天,張凱要重新找工作養家,一家名為“千機數據”的公司正好在招人,人力主管向他介紹說,公司主要做“數據標注”,簡單來說就是給圖片上的物體拉框框,只要會用電腦就能干。工資保底2000元,多勞多得。
他被安排在一個有電腦的工位上。領導傳來幾百張廚房、餐廳的圖片。張凱需要做的是:把圖片上的碗、碟、杯子、筷子等餐具都框出來,然后選好屬性、分好類。拉對一個框能賺4分錢。
張凱覺得很新奇——把這些鍋碗瓢盆框出來能干嗎?但初來乍到,他沒好意思多打聽。
第一天上班,張凱費勁拉了幾百個框。他不熟悉規則,比如,三個堆在一起的碗,是應該一起拉一個框,還是分開拉三個框?
一周后,他已經熟練到每天能拉幾千個框,掙100多塊錢了。時間久了,張凱看什么都帶框,看到家里廚房的鍋碗瓢盆,他第一反應是,框框應該從哪個角度拉?拉多大比較合適?
才來三個月,張凱就開始挑戰難度更高的3D全景圖。工作了大半年,張凱已經是公司最優秀的員工之一,但他依舊沒問過,拉這些框是為了什么?
“數據標注”的工作干了一年,張凱開始接手新任務“數據采集”。
他的第一項采集任務就是拍攝有眼袋的人。
一開始,張凱完全分不清眼袋、臥蠶和黑眼圈。在他看來,它們都是堆在下眼瞼的皮膚組織,只有喜歡熬夜或者上了年紀的人才會有。
為了這次拍攝任務,張凱仔細研究了很多張照片,終于搞明白這三者的區別:眼袋呈倒三角形,浮腫而松弛;臥蠶是橢圓形的,比眼袋小很多,笑的時候才明顯;黑眼圈則是烏黑色的、平坦的,不會像眼袋和臥蠶一樣凸出來。
拍攝前,張凱少不了回答被拍攝者的質疑。有人問:“照片上有我們的正臉,你們會不會拿來做違法的事?要是把它們用來刷臉支付怎么辦?”
張凱給出解釋:“大街上那么多攝像頭,如果拍幾張照片就能用來刷臉支付的話,走在路上是不是也不安全?”“我們公司是正規的,幾百號人,合作的都是大企業,你就放心吧。”
創辦“千機數據”之前,公司CEO劉洋鋒也很少聽說“人工智能”這個詞,上中專時他學計算機,畢業后從事的工作卻都跟計算機不沾邊。后來,劉洋鋒和兩個發小湊在一起,準備創業。去年,一個偶然的機會,他們在網上看到一個轉讓的“數據標注”的單子。他不明白“數據標注”是干什么的,直到在一個網頁看到這段話:
“要理解數據標注,得先理解AI其實是部分替代人的認知功能。我們學習認識蘋果,需要有人拿著一個蘋果告訴你,這是一個蘋果。類比機器學習,我們要教它認識一個蘋果,給它一張蘋果的圖片,它是完全不知道的。我們得先有蘋果的圖片,上面標注著‘蘋果兩個字,然后機器通過學習了大量圖片的特征來認識蘋果。”
劉洋鋒懂了。他把“蘋果”的例子講給發小聽,他們都覺得“這事兒能成”。
三個人湊了10萬元,在縣城租下一間30平方米的單間,拉回20臺價值1000多塊的二手電腦,然后通過微信群和朋友圈招了十幾個員工。
乘著“人工智能”的東風,劉洋鋒接的單子越來越多,短短幾個月,公司就擴張到一整層3000平方米,可以容納數百名員工,還在鄭州、許昌、平頂山等地開設了分公司。
對張凱和千機數據的其他普通員工來說,他們現在采集、標注的數據,和穿過的珠子、壓過的電池片沒有什么不同,都是流水線上的一個部件。
昔日流水線上的工人,成了教“人工智能”認識世界的第一位老師,把認知事物的經驗濃縮進一張張圖片中以后,他們對人工智能也開始有了更敏銳的感知。
2019年6月,張凱第一次坐上了高鐵。進高鐵站時,張凱拿著身份證和高鐵票,經過一道需要人臉識別的閘機,攝像頭對著他的臉掃描了幾秒鐘后,顯示“請通過”。他突然想到,以前做標注時做過人臉標點,會不會應用在了這上面?
“科技如果發展得太快,會淘汰掉很多東西”,張凱擔心,機器會取代掉那些流水線上的工人,他們都會失業。但他又覺得,像自己這樣做數據采集和標注的工人,很難被替代。“畢竟機器還要通過我們來學習。”
劉洋鋒也思考過這個問題。他把人工智能產業比作了一個人,“算法工程師他們負責的是大腦,而我們負責的是四肢”,二者都不可或缺。他們公司采集、標注好的數據,要經過一套特定的算法加工,才能喂給機器,算法是人工智能中最核心的部分。
劉洋鋒也擔憂,畢竟“承接的都是重復性的工作”。為了防止被淘汰,劉洋鋒開始把業務向高端化、專業化轉移。
在劉洋鋒過去的人生中,人工智能神秘、新奇且遙不可及。而短短兩年,他就發現,“萬物皆可AI”。比如,視頻軟件錄制時的美顏功能要靠人工智能,加特效要靠人工智能,給用戶推送的內容也要靠人工智能。
公司接了很多無人駕駛的項目,劉洋鋒常幻想,有朝一日能買一輛無人駕駛汽車,坐進車里,動動嘴,把目的地告訴系統,然后倒頭大睡,車子便把自己送到目的地。
“那一天一定不會太遠。”
(白坤摘自2019年8月21日《新京報》,梁效誠圖)