匡曉紅,湯 丹
(湖南警察學院 計算機科學技術系,湖南 長沙410138)
步態識別是最近幾年興起的新研究領域,作為一種遠距離非接觸式的身份識別技術,與虹膜、指紋等生物特征身份識別技術不同,步態識別技術具有不受距離影響,具有非接觸性、難以偽裝、受環境影響小等特征[1]。美國、日本、瑞士和國內的一些大學和研究機構都展開了相關研究,而且都側重于步態特征提取模型和識別算法的研究,但由于缺乏通用的步態數據庫及其規模限制,當前對識別算法性能的研究也只是處于起步階段。在國內,中科院自動化研究所完成了CASIA步態數據庫的建設[2],而且取得了令人鼓舞的成果,但國內當前步態數據庫都是小樣本的,一般局限于幾個至幾十個人,算法的適應性和實用性都會受到影響。HNPG (HuNan police gait database)步態特征數據庫管理系統的目的就是建立一個大樣本的通用特殊人群[3]步態數據基礎支撐平臺,項目得到了湖南省科技計劃項目及公安部應用創新項目的支持,作為步態識別應用研究的基礎數據管理支撐平臺,現在系統已經采集了120個人正面、側面和45°的3個視角1440個圖像序列,系統數據量達18G。
作為一個開放式的基礎平臺,HNPG步態特征數據庫管理系統采用基于J2EE的多層結構,各個層之間相互獨立,并且底層向上一層提供接口和相應的數據基礎。自下至上可分為基礎設施層、數據資源層、應用支撐層、應用層和展現層[4],如圖1所示。

圖1 系統架構
基礎設施層主要包括網絡、服務器、存儲等IT基礎設施,是系統的物理基礎。
數據資源層是系統的基礎數據層,主要包括結構化數據和非結構化數據[5]兩部分。結構化數據包括數據規則庫、個人基礎信息數據庫、步態特征數據庫、用戶數據庫、系統日志等數據庫。非結構化數據主要來自視頻文件、圖片序列、二值化圖片和文件等。
應用支撐層主要封裝了一系列公共組件,為應用層提供各種通用服務,如信息發布服務、編碼規則轉換、流程控制服務、識別算法接口管理、文件管理等,它能有效地簡化應用系統的設計和實現,同時也能夠保證系統良好的開放性和擴展能力。
應用層主要集中在實際的業務資源管理和業務動作、業務事件的處理邏輯上,實現系統的業務功能,提供個人基本信息管理、數據采集管理、圖片預處理、步態查詢與識別、識別算法管理、步態展現和用戶管理等應用功能。
展現層:展現層是用戶能夠看到的系統展示頁面,用戶通過該層根據權限進行系統操作和功能訪問,由于采用B/S架構,展現層主要是瀏覽器。
整個系統采用平臺化的思想進行構建,采用成熟的分層和組件化開發方式,保證了系統的擴展性。系統架構支持分布式部署,保證系統部署的靈活性。
建立一個大樣本的步態數據基礎支撐平臺,步態基礎數據采集和加工是至關重要的一環。為了對數據質量進行有效地控制和管理,需要先進行數據規范設計,并在保證數據規范的基礎上,對數據采集、加工過程等方面進行科學管理,從而保障數據的準確性、完整性、一致性、可用性和安全性[6]。
步態數據庫中存在大量的個人信息,還有海量的非結構化的視頻文件、圖片序列文件、二值化圖片文件等數據。隨著數據量的增加,數據管理也越來越復雜。作為一個開放式的步態數據管理平臺,有必要設計一套數據規范,用來規定數據定義和處理標準與規范。步態特征數據庫中,制定了如下數據規范:
(1)文件命名規范
文件命名規范如圖2所示。
步態數據庫中的數據包括文件夾、視頻文件、圖片序列文件、二值化圖片文件命名采用統一的規范。文件共28位長,由個人ID號、姓名、拍攝角度、運動方向、文件類型和文件序號組成。命名規范如下:
個人ID號:采用身份證號碼作為個人唯一標識,個人ID為18位長。
姓名:采用中文命名,長度為4位。
拍攝角度:指拍攝與人行進的角度,長度為1位,分為側面、正面和45°這3種。
C:表示側面拍攝;
Z:表示正面拍攝;
X:用表示45°拍攝。
運動方向:長度為1位。
當拍攝角度為側面和45°時,0表示從左至右,1從右至左;

圖2 文件命名規范
當拍攝角度為正面時,0表示正面行進,1表示反面行進。
文件類型:長度為1位,其中:
V:表示視頻文件;
P:表示圖片序列文件;
D:表示文件夾;
E:表示二值化圖片文件。
文件序號:長度為3位,按照先后順序從000-999進行自動順序編號。
(2)視頻數據源
視頻文件格式:AVI;
分辨率:640*480;
時長:步態運動是一種周期性的運動,視頻時長要達到6個步態周期。
(3)步態圖像序列和二值化圖片數據
采樣頻率:100ms
圖片格式:JPG
分辨率:640*480
步態數據采集加工流程如圖3所示。

圖3 步態數據采集加工流程
(1)將人的步態通過數碼攝像機拍攝形成步態視頻數據源,文件格式為AVI(640*480),要求每個行程6個步幅、往返2個行程、每個行程兩次。此外,采集的步態數據一方面會受環境 (光照變化、背景或者運動噪音干擾、自身生理條件、衣著、是否攜帶包裹等)的影響,另一方面又與拍攝角度[7]相關,因此,本項目對人的步態數據從正面、側面和45°角分別采集,以提高數據適用性。
(2)將視頻數據源AVI文件通過圖片預處理分解成步態圖像序列文件,文件格式為JPG,圖片大小640*480,數據采樣頻率為100ms。
1)將步態圖像序列數據進行二值化處理,生成步態圖形數據。
2)步態圖形數據直接入庫。另一方面,可由步態圖形數據進行步態特征提取,獲取步態特征數據,然后將步態特征數據入庫。
3)個人基本數據錄入或導入,形成個人基本數據,個人基本數據與步態圖形和步態特征數據通過個人ID號 (身份證號碼)進行關聯。
(1)視頻數據采集 數據采集目標:視頻數據源采用數碼攝相機 (CCD分辨率1000萬)分別從側面、正面和45°角進行數據采集。為保證步態數據的識別率,要求每個行程要至少采集6個步幅周期,為了提高步態特征值可靠性,每個行程要采集兩次數據。步態視頻數據源采集如圖4所示。

圖4 步態視頻數據源采集
(2)步態圖像序列數據 工具:采用PotPlayer或GOMPlayer工具,對視頻數據源文件進行步態圖像序列采集;每100ms采集一張步態圖像 (jpg),一個視頻源 (avi)文件根據時長會對應一系列的步態圖像序列數據,如圖5所示。
(3)二值化圖片:將步態圖像序列數據,通過綜合利用間接差分法、迭代法、最大方差比方法等圖像預處理[8]算法進行二值化,得到二值化圖片,如圖6所示。二值化圖片可以作為步態分析和識別的基礎數據。

系統用例模型[9]描述了系統的功能需求,如圖7所示,系統主要提供步態信息查詢、步態識別、步態分析、步態識別算法管理、個人基本信息管理、步態數據管理和API接口管理步態數據基本管理功能。

圖7 系統用例模型
步態信息查詢:提供通過步態特征、姓名和個人身份證等查詢方式,為用戶提供快速查詢個人基本信息、步態視頻、圖像序列和二值化圖片等信息。
步態識別:通過從步態識別算法庫中選擇相應識別算法,進行源數據和目標數據選擇,并進行步態識別。識別結果直接可以通過外部接口直接提供給其他外部系統。
步態分析:通過選擇源數據,按照指定識別算法進行步態分析,分析的結果形成步態特征數據庫。
個人信息維護:為系統管理員提供個人信息管理維護功能,主要對個人的基本信息、步態數據目錄管理、步態特征信息進行管理和維護工作。
步態源數據維護:為系統管理員提供步態視頻、圖像序列和二值化圖片等步態源數據的入庫、維護和管理功能。
由于本系統存在大量的非結構化數據如視頻、圖片文件,因此在本項目采用面向對象的數據庫模型[10]設計,通過將關系數據庫管理系統 (Oracle 10g)和操作系統 (Windows vista)中的文件系統相結合,實現對非結構化數據的管理。主要方法是,若關系型數據表中的某個字段的屬性是非結構化數據,則以存放非結構化數據的文件名代替,這樣數據庫管理系統不負責非結構化數據本身的存儲分配,它管理的只是非結構化數據的引用,對非結構化數據的控制只能通過操作系統、文件系統和應用程序來實現。這種方法雖然效率低,但方法簡單、容易實現。系統數據模型如圖8所示。
作為一個步態識別的基礎數據平臺,系統要有足夠的開放性,以便向其他外部研究和應用系統 (步態分析、步態識別系統)提供統一的接口。由于Web service技術有很好的封裝性,集成性,數據傳輸透明性[11],框架穩定性,而且技術發展也比較成熟,因此本項目使用Axis[12]技術開發的Web service[13]接口來解決異構造成的項目間復雜性和依賴性。Web service以Web應用程序的形式駐留在應用服務器上的Web service容器中,其他應用系統或客戶機都可以啟動常規HTTP會話與本系統進行交互。
系統部署在局域網環境中,共有4臺PC服務器,包括兩臺數據庫服務器進行雙機熱備,文件服務器、WEB和應用服務器各一臺,所有服務器均采用Windows 2003操作系統,數據庫為Oracle 10g,WEB服務采用Apache。

圖8 系統數據模型
數據量方面,按照數據規范及加工流程,數據采集人員 (10人)通過近半年的時間,采集加工了120個人3個視角1440個圖像序列,系統數據量達18G,目前系統數據量仍以每年10G的數據量在遞增。此外,系統的數據采集規范、樣本數量、步態數據清晰度、平臺開放性等指標都超過了其他國內步態數據庫,并且為相關公司和研究機構的步態識別手機應用和算法研究提供了數據服務。
系統的創新點在于如下幾個方面:
(1)數據采集加工方面,建立了一套整完整的步態數據采集、加工和處理的規范體系,有利于提高數據的一致性、可用性,保證了步態數據的質量。系統加工后的二值化圖片分辨率要遠高于CASIA步態數據庫。此外,系統數據采集環境要求不高,完全可以依托于公共場所 (機場、車站、廣場等)已有的視頻監控設備[14],無需進行數據采集部分的投資,從而有效利用數據資源。
(2)數據管理方面,通過統一的數據管理模型,提供了較強的數據擴展能力,已經收集了120人,近18G的步態數據,能夠在較短的時間內,形成上千人,上萬個序列大樣本的步態基礎數據庫,能夠為步態識別研究、應用提供可靠的數據支撐。
(3)數據應用方面,采用平臺化的方式,提供了統一的應用接口,便于實現與向外部研究和應用系統的對接和集成,并且適合于網絡發布和資源共享。
(4)國內當前步態數據庫都是小樣本的,一般局限于幾個至幾十個人,算法的適應性和實用性都會受到影響。本項目建設的大樣本步數據庫,已經形成了成熟的數據采集、加工和管理模式,能夠較好、較快地建設大樣本的步態數據庫,大大增強各種步態識別算法的評估和驗證的可靠性,實現資源共享,加速步態識別技術的實際應用進程。
HNPG步態特征數據庫管理系統的開發設計分為預研和數據規范制定、總體設計、基礎數據采集和處理、應用開發、系統測試和試運行等階段。通過3年多的研究,系統基本形成了一個開放的基礎步態數據平臺,并且在統一的基礎框架之下,可以逐步按照現有的管理模式不斷增加數據采集量,從而形成具有特色的大樣本、多步態特征的基礎數據庫。目前,系統已經收集了120人,近18G的步態數據,而且數據量以每年10G的速度遞增。由于系統研究的重點不在步態識別,而在于步態基礎數據的管理,因此系統可以作為步態識別的基礎支撐平臺,通過規范的海量數據支持,可以大大提高步態識別和人體運動分析領域[15]算法驗證的有效性。此外,由于采用開放的接口體系,也可以方便的實現與外部研究應用系統對接,提供可靠的步態數據支持。同時本系統形成的面向對象的多媒體數據管理模型,也為其他生物特征識別數據庫如虹膜、指紋、人臉、聲紋等數據提供了參考模型。
[1]YE Bo,WEN Yu-mei.Survey of gait-based human identity recognition techniques [J].Journal of Computer Applications,2005,25 (11):2577-2580 (in Chinese).[葉波,文玉梅.基于步態的人身份識別技術綜述 [J].計算機應用,2005,25(11):2577-2580.]
[2]YU Shiqi,TAN Daoliang,TAN Tieniu.A Framework for evaluating the effect of view angle,clothing and carrying condition on gait recognition [C].Hong Kong,China:Proc of the 18'th International Conference on Pattern Recognition,2006.
[3]XU Zhu-yu.Practice and thinking of public security organs of social management innovation [J].Policing Studies,2011,196 (2):15-17 (in Chinese).[徐珠寶.公安機關社會管理創新的實踐與思考 [J].公安研究,2011,196 (2):15-17.]
[4]YU Dong-jin,RUAN Hong-yong.General framework of profession software supporting rapid development [J].Computer Engineering,2009,35 (20):2312-2314 (in Chinese).[俞東進,阮紅勇.支持快速開發的行業軟件通用框架 [J].計算機工程,2009,35 (20):2312-2314.]
[5]TIAN Wanpeng,WANG Jianmin.A pay-as-you-go framework for unstructured data modeling based on their features [C].The 27th National Database Conference of China,2010 (in Chinese).[田萬鵬,王建民.一種基于特征的非結構化數據演化管理建??蚣?[C].NDBC第27屆中國數據庫學術會議,2010.]
[6]TANG Dan,FAN Qiang,KUANG Xiao-hong.Labor and social security resource database system based on DB trichotomy method [J].Computer Engineering and Design,2009,30(7):1664-1667 (in Chinese).[湯丹,范強,匡曉紅.基于三庫分離技術的勞動保障資源數據庫系統 [J].計算機工程與設計,2009,30 (7):1664-1667.]
[7]GAO Haiyan,RUAN Qiuqi.A gait recognition method based on front-view [J].CAAI Transactions on Intelligent Systems,2011,6 (2):119-125 (in Chinese).[高海燕,阮秋琦.正面視角的步態識別 [J].智能系統學報,2011,6 (2):119-125.]
[8]MING Ying,JIANG Jingjue.Background modeling and moving-objects detection based on Cauchy distribution for video sequence [J].Acta Optica Sinica,2008,28 (3):587-591(in Chinese).[明英,蔣晶玨.基于柯西分布的視頻圖像序列背景建模和運動目標檢測 [J].光學學報,2008,28 (3):
587-591.]
[9]JI Zhen-yan.UML system design and analysis applications[M].Beijing:People Post Press,2009 (in Chinese).[冀振燕.UML系統分析設計與應用案例 [M].北京:人民郵電出版社,2009.]
[10]XU Hong-bo,HAO Zhong-xiao.The normalization theory and algorithm in OODB design [J].Journal of Harbin University of Science and Technology,2005,10 (1):29-30 (in Chinese).[徐紅波,郝忠孝.OODB設計中的范式理論及求解算法 [J].哈爾濱理工大學學報,2005,10 (1):29-30.]
[11]LIN Tong,SHU Zhen-cai.Web services based integration of remote heterogeneous databases [J].Journal of Beijing Polytechnic University,2005,32 (2):210-212 (in Chinese).[林彤,舒真才.基于Web Services的異地異構數據庫的集成[J].北京工業大學學報,2005,32 (2):210-212.]
[12]Apache software foundation [EB/OL].http://axis.apache.org/,2009.
[13]SHEN Li-min,LU Fu-jun,LI Feng.Web service recommendation model oriented enterprise information system integration[J].Computer Integrated Manufacturing Systems,2011,17(1):185-188 (in Chinese).[申利民,呂福軍,李峰.面向企業信息系統集成的Web服務推薦模型 [J].計算機集成制造系統,2011,17 (1):185-188.]
[14]LIU Xiangfeng,ZHOU Hang.Gait recognition technology and application in video surveillance [J].Video Engineering,2011,35 (1):31-35 (in Chinese).[劉相鋒,周航.步態識別技術及其在視頻監控中的應用 [J].電視技術,2011,35 (1):31-35.]
[15]ZHAO Yong-wei,ZHANG Er-hu,LU Ji-wen.Gait recognition via multiple features and views information fusion [J].Journal of Image and Graphics,2009,14 (3):388-393 (in Chinese).[趙永偉,張二虎,魯繼文,等.多特征和多視角信息融合的步態識別 [J].中國圖象圖形學報,2009,14(3):388-393.]