蘇州農業職業技術學院 顧敬源
AI技術在安防領域中的應用及發展分析
蘇州農業職業技術學院 顧敬源
當下最火熱的AI(Artificial Intelligence)技術,早已經在安防領域中應用,并成為該領域中不可或缺的技術,如車牌自動識別技術、人臉識別技術、火災預警技術等等.AI技術之所以能最先在安防領域提前普及的原因主要有如下三點:
安防關乎人身財產安全,社會"剛需"較強;
安防應用對信息處理的實時性要求較高,必須由在最短的時間內完成判決;
安防領域產生海量視頻數據,遠超過人類手動處理能力,必須由計算機自動化完成;
AI技術快速、準確的自動判決能力恰好與社會對安防的"剛需"無縫結合起來,因此AI技術最先在安防領域應用和普及.本文先分析當前AI技術在安防領域應用方式,隨后展望下一步AI技術在安防領域發展的方向.
如圖1所示,目前主流安防領域主要采用攝像頭+數據庫+服務器的架構實現視頻信息分析和處理.前端攝像頭采集實時圖像信號,然后將圖像信號上傳到專用圖像數據庫,最后使用大型服務器沖數據庫中調出視頻信號進行分析,AI算法幾乎全部在服務器中完成,如人臉識別算法、數字識別算法等等.這種架構的好處是不需要更改現有的硬件設備,便可以快速的在原有硬件平臺基礎上通過擴容服務器硬件或軟件算法來實現智能算法升級.目前,有許多視頻處理智能算法的初創公司,提出各有特色的基于服務器的視頻算法,并成功的應用在各領域中.

圖1 當前安防信息處理流程
但是,由于這種架構原本并非為AI技術設計,使用通用服務器上的軟件來替代專用硬件,執行效率不高,無法實時處理海量視頻數據.特別是前端攝像頭采集的視頻信號向著高清或4K高分辨率方向發展,數據量幾乎成指數形式增長,而服務器處理能力和網絡傳輸能力僅以線性形式增長,導致視頻處理能力后端跟不上前端需求.以4K25P攝像機為例,每幀視頻分辨率為4096x2160、幀率25P、采樣率8bit,未壓縮的原始碼率為4096x2160x25x8 =1.648Gbps,采用常規JPEG編碼壓縮算法能將原始碼率壓縮到原來的三分之一,這樣壓縮后的有效碼率約500Mbps,故每臺攝像機每天產生視頻量:500x3600x24/8 = 5273GB.目前每臺服務器支撐約100臺前端攝像頭,這樣數據庫每天新增514TB海量存儲空間,服務器每秒處理49Gbps的信號.作為對比,市面上暢銷的高配置版本iPhone X智能手機容量為128GB,1臺4K25P攝像機1天產生的視頻需要41臺高配置版本iPhone X來存儲,也即該攝像機工作35分鐘產生的視頻即可填滿1臺高配置版本iPhone X全部存儲空間.顯然,當前技術條件下很難在可接受的成本下實現這種規模的視頻信號處理.
為應對海量視頻信號實時處理的需求,業界普及認為應將視頻壓縮、智能算法等功能從服務器前移到攝像機中完成.如圖2所示,這種分布式技術架構不但能有效減少對信號傳送帶寬、服務器計算能力的需求,而且能有效縮短反饋控制信號延時,極大的提高視頻信號的實時處理能力.這種架構中,服務器僅用于加工好的視頻信號調取、回放等簡單應用,對服務器計算能力要求不高.例如,前端攝像機通過內置的AI算法,分析出工作場景中有盜竊發生,內置AI算法會自動將攝像機聚焦到犯罪分子的面部,提取面部信息并發生給服務器處理,服務器根據這些加工好的面部信息與數據庫對比,能快速定位、識別犯罪分子的身份.該過程幾乎無任何延時,而且有前端攝像機主動發起預警和現場信息收集,輔助管理者快速解決案件,該系統甚至可以根據犯罪現場的情景自動發出警報聲,阻止或遲滯犯罪行為繼續進行,將人身財產損害降至最低.而傳統架構中,攝像機將視頻信號上傳到數據庫,然后再由服務器被動調取視頻并處理,最后服務器將分析后的指令下傳給攝像機,這套流程極其緩慢,未等服務器做出反應,犯罪分子早已逃離現場了.從這個典型案例中,分布式架構相對于傳統架構的優勢能很好的體系出來.

圖2 分布式安防信息處理流程
分布式架構已經獲得業界普遍認可,現在爭論比較多的是如何將AI技術集成到攝像機中.目前,常見的有三個方案:GPU方案,FPGA方案和ASIC方案.
GPU(Graphic Process Unit)方案是指使用NVIDIA或AMD成熟的商用GPU軟硬件平臺,完成視頻識別等AI算法.這種方案最為成熟,GPU廠家提供完整的硬件和軟件開發平臺,甚至完整的AI參考算法,視頻處理廠商僅需要在此基礎上進行二次開發即可快速開發出自己的產品,并推向市場,當前市場上炒的火熱的硬件開發商多是采用這種方案.但GPU畢竟不是為AI算法而設計硬件平臺,加之其他硬件廠家嚴重依賴于GPU廠商的底層支持,這必然導致這些廠家缺乏原始創新,進一步發展的空間不大.ADAS(Advanced Driver Assistant System)是自動駕駛技術中的核心,主流供應商多采用NVIDIA Tesla開發平臺,并加入自家改進的視頻處理算法和決策算法,形成各有特色、百家爭鳴的自動駕駛技術.該領域市場占有率第一的以色列公司Mobileye的產品線中也有基于GPU平臺的產品,但該公司今后的重心遷移到在與ST或INTEL合作開發專用硬件平臺上.
FPGA(Field Programmable Gate Array)方案是指視頻廠家將自家算法在FPGA上實現,這種方案較GPU方案靈活度大大增加,廠家需要自行開發底層硬件和底層軟件接口,有能力在硬件上對AI算法進行加速和優化,使得AI算法達到更好得效果.FPGA主要供應商Xilinx和Altera也順應這股AI潮流,不留余地的為自家產品提供更強大的支持AI算法的功能,如更多的邏輯單元、更強大的神經元IP,并推出眾多標準參考設計,拉低新用戶開發的技術門檻.但是FPGA器件價格昂貴、功耗高,這兩個固有確定限制了FPGA方案只能以定制的方式應用在較少的場景,很難大規模推廣普及.該方案也有諸如Facebook、Microsoft等巨頭等忠實擁護者,最為知名的是Facebook正基于FPGA平臺開發自家智能算法,試圖賦予機器人察言觀色的"感情"功能,并已經取得不俗的成果.
ASIC(Application Specific Integrated Circuit)方案是指將AI算法以專用芯片的形式實現,這種方案是軟件算法的硬件實現,最能忠實的反映出AI算法想要達到的效果,是最有前景的方案.雖然ASIC方案前期投資巨大且風險很高,但是一旦內置AI算法攝像機大規模普及,ASIC方案的成本會被迅速拉低,為開發者帶來巨大的收益.更重要的是ASIC方案是最適合做產品差異化戰略,是來開與競爭對手距離的最好選擇.基于此,GOOGLE公司率先推出TPU智能算法芯片,旨在智能算法尚未普及前確立自己的領導地位,其他公司(如INTEL)也積極加入這場決定未來的開發熱潮中.GOOGLE內部測試后宣稱他們的初代TPU處理能力是GPU的10倍以上,經過迭代后的TPU計算能力絕對會給整個行業帶來顛覆性的沖擊.我們依然記得GOOGLE的Alpha圍棋團隊秒殺人類頂級旗手帶來的心里震撼,更為震撼的是幾年后智能算法的硬件平臺不是超級計算機,而是指甲大小的ASIC上的智能算法就能完成這個壯舉,甚至完成人類無法完成的高級智力活動,例如高度抽象的數學難題、復雜的蛋白質分子結構解析等等.
當前上述三種方案從技術上將各有千秋、旗鼓相當,開發者根據應用場景的不同可以選擇合適的方案.但是,三種方案都尚未取得突破性的進展,各種AI算法仍舊基于神經元單元,通過訓練得到適合某種應用的專用神經網絡,達到智能識別和判決的目的.AI算法的強大程度直接取決于神經元的數量和算法模型.算法模型大致成熟的前提下,三種方案中只有ASIC方案可以經濟地持續增加神經元數量,而且能將功耗控制在可接受水平,并非常合適大規模普及應用,這也是業界看好ASIC方案的主要原因.2~3年后,ASIC方案的優勢便會體現出來,并拉開與其他兩個方案的差距,業界會出現1~2家AI專用ASIC芯片巨頭.
國內外安防領域的主要廠商也不甘落后,積極投身于AI算法和硬件開發中.我們可以看到市面上已各種帶有的人臉識別、指紋識別、數字識別、語音識別等智能功能的電子系統.如安防領域大廠霍尼韋爾(Honeywell)推出工業企業管理集成平臺HUS提供統一身份認證、設備信息管理、預警報警處理、數字矩陣切換、矢量電子地圖、雙向語音對講、集中或本地圖像存儲、設備參數調整等管理功能,滿足當前工業企業的跨區域、大規模各種需求,支持未來集成到不同部門信息管理系統之中.該系統將圖像數字化后直接提供高層決策管理系統來利用,也可以通過高級管理功能實現對重要位置、關鍵通道的監控功能,甚至決策功能,從而達到雙向的信息溝通能力、廣范圍的資源共享、提高工業自動化程度.可以預測我們未來會有更多、更智能、更廉價的智能產品應用到日常生活中.但是,在這些應用的背后仍需要核心算法和核心硬件的支持,安防廠家不能再步入智能手機廠家的后塵,核心部件掌握在他人之手,缺乏議價權和發言權.在AI應用大爆發的前夜,不做噱頭宣傳、不炒作概念,而是靜下心來腳踏實地的研究開發基礎算法和硬件的開發,把控核心器件,在AI供應鏈中占據有利的上游地位.推動科技進步的同時,也為企業獲取可觀的利潤,真正的實現企業和社會共贏.
當前,國內安防企業和整個AI領域的高科技企業整理技術水平依舊大幅落后與國外同行.為能與國外財力、人力、技術儲備雄厚的大公司同臺競技,國內企業應該像70年代的日本半導體行業那樣,由管理部門和國內大公司牽頭締結產業聯盟,各個公司合理協作分工,分別攻克不同難題,成果共享.避免形成全而不強、大而不強、各自為戰、相互拆臺的混亂局面.克服這些問題后,擁有世界第一需求市場和濃厚的創新環境的中國,定會在AI時代有所作為,AI在安防中的應用定會引領全球的發展,讓全世界的同行刮目相看.
顧敬源(1984-),男,江蘇鹽城人,中級職稱,實驗師,現供職于蘇州農業職業技術學院,研究方向是多媒體設備的維護.