□ 文/丁立新
人臉識別,隨著技術的應用和普及,已經走入了每一個人的生活中,從最常見的手機人臉解鎖,到酒店刷臉、金融刷臉、火車站刷臉等等,一時間,似乎人臉識別已經到了無所不能的地步。實際上,對于人臉識別的應用,因為認識深度的不同,不同的人有著不同的態度,有些人將人臉識別神話,有些人對人臉識別的不準確性存在巨大的恐懼。在人工智能發展的如火如荼的今天,需要以客觀的態度看待人臉識別,就必然需要認清人臉識別在應用中的技術難點,并從產品、工程、解決方案等多角度理解人臉識別的應用。
一般來說,人臉識別被分為主動識別和被動識別。
張張嘴、搖搖頭,這是金融核驗最典型的方式,也是最成熟的主動識別方式。通過在線的智能分析,完成1:1的高精度核驗,同時完成了配合式的真人核驗,能夠節省大量人工核驗的工作,節約柜臺排隊辦理業務的時間。
但是,這樣的核驗方式的體驗較差,對于所處場合的環境要求高,要求的配合度較高,效率較低;考慮金融核驗應用的頻度不高,這種方式仍然有較長的生命力。
金融核驗的本質在于證明“鏡頭前你是不是真的你”,這一類的1:1的人員核驗,結合配合式的活體檢驗,以及嚴格的場景要求,是人臉識別的最佳場景。除此以外的一些應用,往往會面臨更大的困難。
通俗的分解一下人臉的屬性,人臉是可見的、有表情變化的、有年齡變化的、有可能被遮擋的、有光線影響的。由于其核心的屬性是視覺可見的,所以,人臉識別需要光,同時也懼怕光。
早期普遍采用的近紅外人臉識別技術,利用高強度的近紅外補光將鏡頭前的人臉打亮,由于人眼對紅外光的不可見特性,在提升識別效果的同時,不會對人眼造成任何影響。近紅外人臉識別,逐漸成為室內小庫容人臉識別的主要方式。
但是,由于紅外識別太依賴于近紅外補光技術,在室外的太陽光下,由于太陽全光譜的影響,近紅外對于人臉的補光無法對人臉的紅外成像向室內那樣清晰穩定。所以,面臨室外的應用和大庫容的應用,開始廣泛使用可見光識別方法。
可見光人臉識別,基于可見光下的彩色成像,圖像效果好,像素高,特征點足夠多,采用可見光算法的識別,往往可以達到萬級別的庫容,并且支持高達95%以上的識別率。
可見光識別優勢非常明顯,但是,對于圖像采集系統的依賴也更強,需要更高感光的圖像傳感器,夜間黑暗場景下過高的白光補光也可能引起人眼的不適;相比依賴近紅外補光的紅外識別,可見光的識別基本上沒有距離的要求(只要光線足夠,可以通過鏡頭的焦距彌補),對于室外的應用,要比紅外識別具有更好的適應性,但是,仍然無法避免太陽本身進入畫面所產生的超高寬動態場景。 但是,仍然是最佳的識別方式。
通過大光圈鏡頭、高感光sensor、高性能芯片等硬件的綜合作用,同時,用于室外,需要考慮防水、防塵、高濕、高溫、極低溫的多種場景適應性,同時,有需要保證精準的人臉識別。綜合性的產品化能力,是考驗室外人臉門禁的核心命題。甚至用于速通門場景的全露天門禁,將產品化的要求推到了新的高度。
門禁是主動、配合式的核驗,為了通過核驗而進門,人們可以摘下墨鏡、湊近、正臉配合。被動式核驗,由于各類安全管控的需要,逐漸成為新的人臉識別熱點方向,由于其非配合性,甚至是故意躲避的特點,被動式人臉識別的高準確率和低誤報率,一直是各大安防廠家的追逐的制高點。
非配合式核驗,除了高精度的算法外,更講究的是相機的架設位置、角度、鏡頭焦段、補光等。
安防行業流傳這一句話,三分產品七分安裝,雖然聽上去有些夸張,但從工程上讓每一個被動式人臉抓拍相機發揮最大的效用是一門學問。
宇視科技首創的3D工程仿真技術,精確模擬桿高、角度、焦距、鏡頭等,減少在實際場景勘點的工作量,提升工作效率。自應用以來,讓城市每一個角落的相機更清晰準確的工作,這就是工程性帶來的好處。

▲圖1 工程化仿真設計圖
2018年9月28日晚,張學友經典巡回演唱會在河北奧體中心舉行,宇視科技人臉識別系統部署在場館及周邊重點區域,秒級識別布控系統中的黑名單人員并觸發報警,協助警方快速抓獲3名網上在逃人員,實現了演唱會追逃的“十連殺”!安防廠家在這場戰役中取得了最大的曝光度,體現了安防行業的算法水平和產品方案能力。
在中國,對于作奸犯科者,自古以來流傳的老話是“寧可錯殺一千,不可放過一個”,安排大量的侍衛挨個仔細盤查,必然可以將每一個罪犯繩之以法。但是,在現今的社會,如何在不經意間,利用高科技手段完成高精度預警,安保人員進行針對性盤查,這才是文明社會的主流,也是其中的難點。
人臉本身并不是天然具備將其數字化的方法,當代的深度學習通過建立模型和訓練,模擬了人類記憶和識別人臉的方法。
約克大學的Rob Jenkins博士曾經做過一個專門的研究,第一次確定了人類可以記住的面孔數量——平均達到驚人的5000張臉,不同的人記錄的人臉數量分布在1000到10000之間。對于人類而已,上萬張人臉的記憶,已經是絕大多數人類的極限了。
計算機科學,把所有事物轉化為二進制進行記錄,對于人臉通過建模,也是針對每一張人臉進行記錄,經歷模型的升級、樣本的訓練,可以逐步提升計算機認識人臉的水平,但是,受著模型、芯片和樣本的限制,從幾百張人臉的識別到幾萬張人臉的準確識別,基于目前的水平,很難持續快速的發展。
與之矛盾的是,在人臉識別的持續熱度下,更多大庫容、高精度要求的領域開始呼喚人臉識別技術的融入。
地鐵刷臉乘車就是一個典型的案例。
深圳地鐵,通過本地APP的注冊人數約661萬人,其中每天約有100萬人次的使用量。假定目前頂級的人臉識別算法,對于萬人臉庫的識別準確率有99.5%,那么,如果采用人臉識別來實現扣費乘車,那每天都有數萬人被識別錯誤,是一場災難。如果解決這個問題?
先來認清刷臉乘車的核心需求,是希望采用人臉識別技術,提高效率,提升安全性,減少高峰期的擁堵。
如果直接面對661萬注冊人員,那么,任何人都會覺得茫然。需要分解。
第一,地鐵內會出現哪幾類人?
首先是工作人員,每個站內少量的本地工作人員,加上總公司的輪崗人員,總人數不搞錯千人;
然后是65歲以上人群,不需要買票,只需要通過刷身份證和人臉,完成年齡核驗和本人核驗;
接著對普通乘客,可分為通勤乘客和單次乘客。
對于單次乘客,可提前通過身份證與支付寶的綁定,采用人證比對核驗過閘,信用支付;
對于通勤乘客,通過設定特定的通勤時間和通勤站點,完成通勤人員刷臉過閘。
綜上,如果提高通勤乘客的使用體驗和效率是目前可以處理的重點。
第二,通勤乘客的人臉識別如何控制識別精度;
由于地鐵不同站點的特點,其客流量差異較大。我們假定一個兩個地鐵中轉站,進站客流和出站客流日均在5萬人次。
有幾種方法進行進一步的分流:
有效時段預約法;
通勤人員一般具有規律的上下班時間,通過限定有效的通行時間,可大幅度減少同一時段內的人員底庫數量;
入口編號通行法;
對于大型站點,人流量極大的,可以在一排閘機上編號,對于預約通道區分單號和雙號,進一步把人員庫數量減半;
進出站點匹配法;
不管如何,如果做單次識別就確認信用支付,那么一次誤識就會導致支付異常;然而,通過進、出站點的匹配,做雙重校驗,原本1‰的誤識,就變成了百萬分之一,可極大幅度減少支付異常;單次識別錯誤導致的收費損失,需要不斷的算法優化提升;
預約名額限定法;
最后一招,根據運營的情況,結合實際的預約人數,為了將錯誤識別控制在一定比例之下,可通過名額限制預約人數,確保識別率。
第三, 刷臉記錄留存3個月,可確保異常支付數據隨時可查詢和回溯。
本文只是通過問題分解,描述了一種地鐵刷臉應用的可行性。不代表任何已運行的地鐵應用方式。通過行業理解,把大批量人員分解為小批量,把大庫容分解為小庫容,用綜合解決方案把不可能變為可能。

▲圖2 地鐵業務模型分解圖
人臉識別技術本身,還需要更多的時間發展和完善,更優的模型、海量的樣本訓練、更出色的處理芯片,將人臉的年齡變化、喜怒的變化都更精準的識別。與此同時,在未來很長一段時間內,優秀的產品化能力,工程能力和綜合性的解決方案,都是決定人工智能成敗的核心因素。每一個都不可或缺。