□ 關不羽
優步公司在英國又“攤上大事”了。這事大致上是這樣的:公司要求員工把自拍照上傳到人事系統,與系統存儲的參考照片進行匹配。如果匹配不成功,那么系統會提示員工實時自拍,并面臨解雇風險。而員工一旦被解雇,也將面臨被自動吊銷其私人出租司機和車輛執照的處罰。這樣的倒霉事在兩位優步前員工身上發生。
這本來是一起普普通通的勞資糾紛。但是,英國工會可不會那么輕易放過這樣的機會,訴訟的理由中赫然出現了“種族歧視”。
因為據一些技術人員和相關組織稱,“面部識別系統……天生就有缺陷,對有色人種進行識別時準確度會變得很差”。涉及“種族”,事件性質立刻升級到“種族歧視”的高度了,技術問題升級為政治問題,敏感度倍增。
其實,人工智能面部識別系統對有色人種的識別精度不佳,不是新問題。2015 年,谷歌就鬧過笑話。一名黑人軟件開發人員在Twitter 上說,谷歌照片服務把他和一個黑人朋友的照片打上了“大猩猩”的標簽。當時也有一些“進步”組織和人士借機發難,指責谷歌“種族歧視”。但“進步”的谷歌不大可能是故意為之。最終的“受害者”可能是猩猩,因為谷歌的應對措施是把“猩猩”和其他靈長類動物的標簽移除了,“猩猩”在“谷歌宇宙”中成了“查無此人”的黑戶。
比起2015 年的谷歌,優步可能就沒那么幸運了。一則“種族問題”的敏感度遠遠超過了2015年;二則涉及勞資糾紛,索賠的想象空間巨大。就在2021 年10 月5 日,因“旗下工廠存在種族歧視問題”,美國舊金山法院判決某電動汽車廠商向前黑人員工賠付1.37 億美元。
那么,到底人工智能的識別誤差能不能被視為“種族歧視”呢?這就涉及誤差產生的原因。眾所周知,人工智能是在特定模型下自我學習形成算法的,訓練模型所依據的數據集和模型本身的設計都有可能帶來偏差。數據集和模型本身哪怕只是出現了人力難以察覺的細微偏差,人工智能的海量運算也會將其放大到失真的程度。這樣的問題在現有的技術條件下并不罕見。2013 年谷歌人工智能預測流感暴發就“大翻車”了,預測數據比實際數據高了兩倍。原因是經媒體報道后,很多沒得流感的人也搜索了相關內容,導致人工智能的誤判。
造成“有色人種面部識別率誤差大”的技術因素甚至更為單純——光學現象。2015 年“黑猩猩標簽”事件后,技術人員分析發現,識別錯誤率最高的不是非裔,而是亞裔(黃種人)女性,識別錯誤率高達20%。而“黑人”的識別錯誤率為5%——此處的“黑人”并不局限于所謂“非裔”,而是純粹意義的深膚色,也包括印度裔、拉丁裔等等。
造成這一現象的原因其實不難理解,亞裔女性的膚色普遍偏白,不僅比亞裔男性白,甚至可能比大部分白人更白,更高的反光度造成了面部成像的對比度下降,造成了識別度偏低。而“黑人”的膚色偏黑,吸收了更多的光,同樣造成了識別困難。其實,理解這一現象不需要高深的知識,日常生活經驗就夠了。觀察各類攝像頭監視畫面里就可以發現,膚色更黑和更白的人,面部細節會更模糊一些。

這一純粹的光學難題,人工智能很難完全克服,確實存在技術局限性。但是,沒有理由認為這是人為設置的“歧視”。硅谷沒有理由專門為難亞裔女性,卻“放過”亞裔男性。也不會刻意針對“黑人”——在硅谷,深膚色的印度裔可是優勢人群。更何況人為降低人工智能的面部識別精度,對這些企業的商業利益毫無幫助。
當然,不可否認,人工智能技術確實會產生“歧視”。2014年亞馬遜開始建立人工智能程序,以審查求職者的簡歷,以實現自動化招聘功能。但是,一年之后亞馬遜就放棄了這一嘗試,因為他們發現“AI 不喜歡女性”。這種差別對待當然符合“歧視”的標準定義,但是這種“歧視”恰恰是因為“過于真實”才造成了麻煩。亞馬遜有很多崗位是對體力有一定要求的,男性確實比女性強壯,因此AI 計算形成了性別偏好。這到底算不算AI 犯錯了呢?
引入人工智能自動招聘是為了提高效率,AI 確實做到了。但是,這種真實的效率改進,卻因“性別歧視”的敏感性而擱淺。復雜的人類社會中,真相并不總是受到歡迎,AI 沒有學到這最重要的一課。
如果是護士、教師等女性優勢崗位也用人工智能自動招聘,出現“重女輕男”的結果,又會如何?多半是波瀾不驚,甚至成為一段佳話。這種微妙的心態,或許已經超出了AI 的理解能力。
歸根結底,圍繞“人工智能”的是是非非再復雜,也是技術問題,不應將其政治化、意識形態化。即使存在技術局限,那就改進技術,而不是揮舞“歧視”的政治大棒去限制和扼殺。如果因此導致人工智能學會撒謊,那更是危險的傾向。