鄭閔譚渝,胡興華,徐藝梅,張婷婷,陳興輝
(1.重慶市沙坪壩區公路養護中心,重慶 400000;2.重慶交通大學交通運輸學院,重慶 400074)
傳染性疫情的發生會對經濟社會發展造成較大沖擊,2019 年12 月新冠疫情爆發以來,給各地社會經濟運行、群眾生產生活造成較大影響[1-3]。而當前疫情密接尋找方法和流程通常是通信管理部門借助手機信令定位描繪病例14 天行動軌跡[4-5],該方法仍舊存在受限于當事人的記憶和口述、缺少精確的時間段統計、手機信令定位的精度有限[6-7]的痛點。
基于WiFi-藍牙探針技術在出行軌跡的提取以及軌跡重構[8-11]、人群密集區域邊界識別[12-14]、特定區域的人流情況并定位[15-18]等方面已有探索,疫情防控中WiFi-藍牙探針數據的使用能優化密接鏈人群尋找方法,可較大程度提高(次)密接人群識別尋跡的自動化、精準化程度,但目前未開展研發利用。因此擬針對疫情下公共場所密接識別問題,利用WiFi-藍牙探針數據,開展基于WiFi-藍牙探針數據的疫情密接尋跡技術研究。
基于IEEE 802.11 協議的WiFi 探針是采用無線局域網技術實現對于開啟或連接WiFi 的設備進行采集,采集原理:無線訪問接入點(Access Point,AP)會周期性地向四周發送信標幀(Beacon),通知周圍的WiFi 設備如手機、筆記本電腦等;WiFi 設備也會周期地發送探測幀(Probe),其中包含該WiFi 設備的MAC 地址、信號強度以及時間戳等信息。當AP檢測到WiFi 設備傳送的Beacon 幀,即記錄WiFi 設備傳送的信息。因此,在WiFi 探針區域內打開或連接WiFi,則可收集WiFi 設備信息,且記錄生成數據文本,包括WiFi 設備MAC 地址和數據抓取的日期和時間等基礎信息。藍牙探針與WiFi 探針原理類似,具備集成使用條件。
一個設備有藍牙MAC 和WiFi MAC,其MAC 地址長度一般為48 位,每個制造商必須確保它所制造的每個設備都具有相同的前三個字節以及不同的后三個字節,保證每個設備MAC 地址具有唯一的標識特性。
WiFi-藍牙探針為數據采集設備實時抓取移動設備WiFi 與藍牙MAC 地址,將初步獲取的MAC 地址進行數據過濾,從而存儲有效的MAC 地址至服務器,如圖1 所示。

圖1 系統設計原理圖
在醫院上報疫情確診患者的MAC 地址后,服務器標記(次)密接人群移動終端設備MAC 地址;一方面為所有移動終端用戶提供密接自查服務,另一方面所設WiFi-藍牙探針識別到(次)密接人群移動終端設備MAC 地址時,由報警模塊發出警告,以保證公共場所的衛生安全。
當所述監測區域或設備內的MAC 地址全部消失后,存儲在先有效的MAC 地址;在所述監測區域或設備內的MAC 地址全部消失后,新的MAC 地址進入監測區域或設備內后,按所述的密接人群識別方法重新開始執行,且不覆蓋之前數據。在一些實例中,所述MAC 地址數據存儲有效期為14~30 天,超過30 天的數據可以清除或予以覆蓋。
為保證收集監測區域的MAC 地址有效設置了數據保留規則。
對于營運車輛這類移動對象,行駛路線周邊的MAC 地址都可能被檢測獲取,這些MAC 地址是無用干擾數據,因此需要對初步獲取的MAC 地址進行數據過濾,從而存儲有效的MAC 地址;同時為保證收集監測區域或設備內所有的MAC 地址存儲于服務器中設置數據保留規則(以較復雜的公交數據過濾為例):
1)實時收集公交的WiFi-藍牙探針數據,將WiFi-藍牙探針數據存儲于服務器節點中,服務器節點對WiFi-藍牙探針數據進行統計,在某一時刻t1,存儲的若干MAC 地址記為s1,如式(1):
2)在(t1+Δt)(其中Δt不超過公交在任意兩個公交站之間的行程時間)時刻,在服務器中存儲的若干MAC 地址記為s2,如式(2):
3)服務器對探針數據進行篩選過濾不符合MAC 地址,數據保留規則:MAC 地址在服務器中的次數達到設定閾值(2 次以上),且任意連續兩次出現的時間之差不超過2 h:取ni=s1?s2,則保留的MAC地址便記為ni;
4)公交進站點前存儲過濾后的MAC 地址與獲取時間戳,匹配到相應站點ID 號mi中,記為(mi,ni);公交出站點后重新統計MAC 地址,不覆蓋之前數據。通過過濾完后的有效MAC 地址,再進行站點ID匹配,從而精準的確定密接人群。
網約車、出租車過濾規則與公交車類似,而超市、廣場等固定地點無需進行過濾,可將探測獲得的數據全部存儲。
基于MD5 消息摘要算法映射特性,可以實現以下目標:
1)判斷傳輸的數據是原始的、未經篡改的;
2)防止直接看到明文。數據庫存儲時可存儲MAC 地址對應的MD5 值。這樣即使發生數據泄露,不法分子得到數據庫的數據的MD5 值,也無法知道真實的MAC 地址;
3)唯一標識。服務器對獲取的每一個MAC 地址用MD5 算法產生摘要信息并做好記錄,產生對應的“數字簽名”,防止設備持有人抵賴。
因此,擬采用MD5消息摘要算法進行數據加密。
以城市公交車為實驗場所,進行基于WiFi-藍牙探針數據的疫情密接鏈尋跡技術研究。所提實驗設計思路如圖2 所示。

圖2 實驗設計思路圖
在城市公交車內頂部中心安裝WiFi-藍牙探針設備,實時采集乘客MAC 地址,經上述過濾規則處理后存儲至服務器。當出現確診患者時,面向所有移動終端用戶開放密接自查,并由中心處理器標記密接乘客,若再次識別則觸發報警模塊。
實驗對象為隨身攜帶移動端設備,設備信息如圖3所示。

圖3 實驗設備MAC地址
按照實驗設計,車載探針設備抓取數據如圖4-5所示,包含Frame 源MAC(移動設備MAC)、Frame 目的MAC(AP)、Frame 類別、信道、RSSI 信號強度(最小值為“-100”,值越大表示發射設備離探針越近)以及時間戳、目的MAC 地址。圖5 所示為抓取數據經處理獲取的結構化表格數據。
圖中,除了標記的實驗設備MAC 地址,還存在探針抓取的無效數據,使用2.1 節所述的過濾規則,獲取最終數據。如圖6 所示,最右側一列為經2.2 節數據加密方法獲得的源MAC 哈希值。
若出現確診患者,在上報患者MAC 地址后基于Pthon 語言設計了查找目標MAC 程序,可快速查找出對應的目標MAC 地址和時間戳。

圖4 探針抓取數據

圖5 數據表格化

圖6 有效數據集
輸出結果如下:
基于以上實驗分析,該系統具有五個優勢與三個微創新點。
優勢:1)隱私性:在保障個人隱私的前提下采集非敏感信息MAC 地址,用于識別用戶行為,避免了傳統手機信令數據的敏感性缺陷;2)真實性:通過識別與確診者的密接行為,匹配密接者的手機MAC 地址,確定密接者數量和具體特征;3)及時性:通過識別MAC 地址發出警報,識別具體密接者及次密接者,阻止其再次出行并建議其進行醫學檢測;4)靈活性:探針系統識別數量可調整,當超過閾值后,系統報警提示以免疫情傳播;5)大樣本性:移動終端基本均具備WiFi 和藍牙功能,可為該系統的應用提供大樣本空間,提升識別的精確度。
微創新點:1)密閉空間潛在疫情傳播鏈精準自動化識別管理創新?;诿荛]空間移動終端用戶設備的MAC 地址,采用探針技術對密接人群進行自動化識別,實現了數據的自動采集、自動匹配和自動預警等功能,不僅可識別密接人群,更可實現自動化尋跡,甚至為多級傳播鏈的識別提供了自動化手段,識別結果更加精確,檢測效率更加高效,可為疫情防控提供有力支撐。2)低成本高可靠度的移動終端大數據應用創新。該系統通過與移動終端大數據技術相結合,實現了對密接人群的高效精準識別。在識別過程中,不受天氣等異常環境的影響,且系統的成本費用較低,具有較好的推廣應用價值。3)隱私保護下的交通物聯網尋跡技術創新。從疫情安全角度出發、基于交通物聯網技術,定位目標在公共場所中的蹤跡以及接觸人群。僅針對用戶進出記錄進行統計,數據僅存留一定期限,數據安全符合GB/T 22239-2019 信息安全技術網絡安全等級保護基本要求的二級要求,既保護了個人隱私,同時也實現了對密接人群軌跡的動態監測。
通過在營運車輛、站臺、室外廣場、超市等公共場所等車輛內安裝WiFi-藍牙探針,并實時獲取移動終端設備MAC 地址,經WiFi-藍牙探針數據獲取及篩選、患者確診后尋找(次)密接鏈、(次)密接人群再次識別警報等步驟實現對密接人群動態監測,優化了疫情防控中的(次)密接鏈尋找方法,高效精準的識別(次)密接鏈,從而盡快確定目標群體。此外,可進一步通過設置WiFi-藍牙探針檢測閾值,實時監測密閉場所人數,從而滿足疫情防控要求下的人數限制。由于該項技術需要用戶開啟手機WiFi 或藍牙,而對于未開啟手機WiFi 和藍牙的用戶便不能采集其信息。因此,該系統在數據獲取方面存在一定的不足之處,考慮采用多源數據融合的方式進一步提高識別的精準程度。