沈伯瑋
(中央司法警官學院 河北省保定市 071000)
在監獄的日常管理中,獄警對監舍的巡檢工作不僅繁瑣,而且危險性較高。目前,監獄系統主要通過布置大量攝像頭獲取監獄中的場景信息,從而進行輔助監控和報警工作。隨著機器人、無人駕駛等技術的不斷進步,通過智能巡檢機器人對監獄進行自動巡檢,能夠代替獄警的巡檢工作,及時發現監獄的異常情況和潛在的隱患,提升監獄的安全性以及信息化程度。因此,無論從提高巡檢效率、安全性,還是減輕獄警工作量、釋放勞動資源的角度出發,對監獄智能巡檢機器人的研究是具有長遠意義的。
在監獄系統中,主要的監控手段是通過在關鍵區域布置攝像頭進行監控,依托定制化的監控平臺,以及各類監控系統軟件,實現視頻顯示,重點錄制等功能。此類系統通常包含一個監控指揮中心以及多個分控中心,指揮中心負責整體的調度以及所有數據的收集處理,分控中心則是監控某個監區,并將數據上傳到指揮中心,從而實現協調管理。監控中心一般需要配備幾名專職獄警,時刻對視頻畫面進行監控。由于警力有限,以及長時間工作導致人的疏忽,通過人來監控存在較大難度。在巡檢方面,大多數監獄目前仍是人工巡檢,由獄警直接到各個監區進行現場巡視,這種方式會帶來很大的工作量,并且存在一定風險。在某些智慧監獄中,也在隔離網、獄墻等周界布置軌道,將攝像頭安裝在軌道上,通過攝像頭沿軌道自主行走,從而實現周界的自動巡視警戒,目標追蹤、異常警報等。但是,軌道機器人因為軌道位置的限制,在巡檢上也存在一定局限性。在此背景下,為了提升工作效率,降低人力成本,代替監獄干警完成監區巡檢工作,及時發現人員異常情況,具有較高智能化的輪式巡檢機器人必將在巡檢中發揮重要作用。
從需求角度分析,監獄巡檢機器人主要是代替獄警完成日常的監控巡檢作用。因此,要求機器人要具備一定的程度的抗震動以及外部強力沖擊的功能。機器人的整體機械結構要充分牢固。同時,在此基礎上,為了更高精度地控制機器人,巡檢機器人也應盡量小巧、靈活,并且沒有可以直接徒手拆卸的零件,防止罪犯直接拆卸進而進行犯罪行為。同時,巡檢機器人還應當具備一定的識別功能,可以對罪犯進行監控,包括事故檢測,人員數量識別,罪犯定位等。并且巡檢機器人還要有躲避障礙物、自主導航定位,報警等基本功能。基于上述的需求分析,監獄智能巡檢機器人系統架構圖如圖1所示。

圖1:系統框圖
巡檢機器人主要包含環境感知模塊,定位模塊,路徑規劃模塊、行為預測模塊、決策控制模塊等。下面對每個模塊的功能和實現方式做出詳細分析。
環境感知模塊主要是通過攝像頭,激光雷達等傳感器,獲取周圍環境信息,通過目標檢測算法,識別出場景當中的各類物體,包括地面、靜態物體、動態物體。目前,基于視覺的環境感知較為成熟,通過深度學習等技術實現目標識別檢測。但機器視覺算法受光照影響較大,且單目相機不易獲取物體的深度信息,進而難以確定物體空間位置,因此在某些場景或夜間,需要結合激光雷達數據進行感知。激光雷達通過旋轉向四周發射激光,通過接收激光來測距,一般分為單線和多線,單線激光雷達采集到的是平面點云,只能獲取物體較少的特征。多線激光雷達可以采集三維點云,能夠提供更多的特征,因此一般采用多線激光雷達來進行環境感知。除了普通的攝像頭或激光雷達,也有采用深度相機來獲取周圍環境信息。因為具有深度信息,同時也有顏色信息,所以深度相機在某些場景也有很好的應用。
在監獄中,巡檢機器人需要能夠定時地查看監區宿舍的狀態,能夠清點監區內的人數,這就需要機器人具備識別犯人的功能。可以借助攝像頭采集圖像信息,通過人臉識別或人體識別算法,檢測出犯人數量。同時,需要機器人可以檢測出犯人的異常行為,并及時報警。該功能可以通過感知模塊識別人體上的關鍵點,從而獲取人體的肢體信息,進而識別罪犯的動作,通過大量的罪犯行為數據以及深度學習等算法,分析出肢體動作所代表的含義,以此來提醒獄警可能存在的危險。
定位模塊主要是解決“我在哪”的問題,即使得機器人知道自己所在的位置。機器人定位通常采用激光雷達或攝像頭以及里程計、IMU 等多傳感器融合定位。監獄機器人主要是進行不間斷的巡檢工作,需要機器人能實現高精度的定位,從而是得機器人能在指定位置進行相關工作。因此,定位技術是監獄機器人需要重點研究的技術。
目前我們的手機等工具使用較多的是基于GPS 的定位方式,但需要在較為空曠的環境下,該方式才能有較好的定位效果。在監獄宿舍,通常均為封閉環境,因此機器人采用基于差分GPS 的定位方式不適合。目前也有部分機器人采用相對定位的方式,即通過里程計、IMU 等傳感器獲取機器人的速度、角速度、加速度等數據,再通過積分的方式求取機器人相對起始時刻所在地點的相對位置。但是隨著時間的推移,這種方式存在較大的累計誤差,并且只能獲取相對位置,無法得到機器人在地圖中的絕對位置,因此不適用于監獄巡檢機器人。絕對定位通常是基于高精度地圖的定位。首先,需要建立監獄巡檢區域的地圖。根據不同的定位技術,可以建立二維平面柵格地圖或者是三維點云地圖。考慮到成本以及監獄內的環境,可以讓機器人搭載單線激光雷達,然后在監獄內繞行一圈,通過SLAM 算法建立監獄巡檢區域的平面柵格地圖。在已有地圖的基礎上,可通過多傳感器融合定位的方式,實現機器人的自主巡檢。定位模塊具體方案如下:巡檢機器人在行走過程中,首先通過里程計、IMU 獲取機器人的速度,加速度,角速度信息,采用積分的方式,獲得當前時刻相對上一時刻的相對位姿變換,通過此變換矩陣,得到機器人的粗略位置。再通過激光雷達獲取的數據與已經建立的柵格地圖進行匹配,得到精確絕對位置。只有較高精度的定位模塊,才能使機器人精確定位自身所在地圖中的具體位置,才能更好地實現其他模塊的功能。
路徑規劃是當確定起點和終點后,在已知地圖上尋找一條無碰撞、能夠安全到達的目的地的有效路徑。比如,在使用某些地圖APP 時,當輸入起點和終點后,軟件會規劃出一條最優路徑,方便用戶規劃路線。在監獄中,具體的環境信息是已知的,可以建立完整的環境地圖,機器人需要完成巡檢工作,則要根據起始位置和終點位置規劃出一條路徑。該路徑可以是人為規定好的路徑,機器人按照設定好的路徑巡檢,也可以是通過路徑規劃算法得到的路徑。路徑規劃通常有兩個步驟:建立包含各類障礙物等信息的環境地圖;在環境地圖中通過合適的搜索算法,找到一條巡檢的最優全局路徑。該路徑對機器人起到導航作用,巡檢機器人會按照確定的路徑,從起始位置移動到終點位置。在全局路徑的基礎上,在行進過程中,也要根據場景中的各種障礙物,進行局部路徑規劃,從而使機器人可以更加順暢地沿既定軌跡行走。
行為預測模塊主要是根據物體前一段時間的運動軌跡,預測物體未來某些時刻的運動軌跡。例如機器人在監獄巡檢的過程中,發現前方有行人,為了能更好地躲避行人或是進行其他操作,需要對行人的運動軌跡或動作有一定的預測,從而可以提前規劃出一條比較合適的軌跡,或提前做出應急反應。
通過感知模塊,機器人可以檢測到周圍的物體,包括物體的位置信息,物體的速度,姿態等。這些數據都可以看作瞬時的靜態數據。根據這些數據,再結合一定的客觀物理規律,可以對物體進行行為預測。對于人的行為預測,既包含了人的移動方向,也包括人移動的速度變化等。常用的行為預測方法包括基于運動學模型的軌跡預測以及基于大數據的深度學習技術進行預測。通過行為預測,可以提高決策控制的穩定度和舒適度。
決策控制模塊,就是將環境感知模塊獲取的周圍環境信息,定位模塊獲取的位置信息,行為預測模塊對物體的預測運動軌跡以及路徑規劃模塊設定的路徑信息結合起來,在這些信息的基礎上,對機器人做出最合理的決策與控制,從而確定機器人采用何種行駛模式。比如遇到獄警或罪犯時,是應該停車等待,還是躲避繞行,或是跟隨人行駛。行為決策確定后,再將其轉換成具體的控制指令,來對機器人進行實際的控制操作,使得機器人盡可能地遵循規劃的軌跡行駛,實現速度和轉向的改變。
決策算法主要包括基于規則的決策算法以及基于深度學習的端到端決策算法。基于規則的決策算法主要是根據各類不同場景,直接控制機器人做出不同的響應。即通過“If-Then”的形式對決策系統進行設計。這種方法適用于簡單場景的決策控制,優點是設計簡單,易實現。但是監獄系統場景較為復雜,只通過這種決策方法很難覆蓋所有場景。基于深度學習的端到端算法就是通過大量的規則、案例或是場景特征數據進行決策系統訓練,建立網絡模型,從而使得機器人能根據具體場景做出最合適的決策。但是該種方式也存在“黑箱”問題,即決策過程不透明,在運行過程中出現的問題難以定位到具體原因,并且十分依賴數據的準確性及充分性。因此,可以采用深度學習結合貝葉斯網絡的方式,可以在一定程度上處理未知的極端情況。
巡檢機器人在巡檢過程中,獄警需要收到實時上傳的視頻信息,報警信息等,同時也需要對機器人發生相關指令,因此需要開發一款用于監獄干警與機器人交互的客戶端軟件。
該后臺監控系統需具備以下功能:通過該軟件可以遠程控制巡檢機器人的運行,可以啟動和關閉機器人巡邏;可以遠程查看機器人實時上傳的監控視頻;可以查看監舍中罪犯的人數及每個人的詳細個人信息,可以接收巡檢機器人的報警信息,監控視頻分析結果;可以遠程人工接管機器人;可以制定機器人的巡邏路線,實現遠程調度。
巡檢機器人的發展十分迅速,并且已經在很多行業、場景得到應用。監獄巡檢機器人當前還處于起步階段,尚未得到廣泛應用。但在監獄中,傳統的人工巡檢存在勞動強度高,危險系數高,工作效率低等問題。隨著技術的不斷進步,監獄巡檢機器人必將成為獄內使用最為有效的巡檢工具,不僅可以實現自動巡檢、報警,還能實現人數清點,實時反饋等功能。從而改善了監獄勞動資源不足的現狀,因此監獄機器人具有廣闊的應用前景。