聶圣東,劉 嫻,武帥文
(江西理工大學 土木與測繪工程學院,江西 贛州 341000)
2016年2月,今日頭條發起了“頭條尋人”公益項目。字節跳動提出“互聯網+”在公益事業方面所具有的效果巨大這一說法。更是提出了“信息公益”這一理念,將信息作為公益事業的起點;公益事業發起與信息,更借用信息作為載體,提高公益事業的效率與價值。只有立足于信息技術的優勢,才能促進尋人尋親項目的實施[1]。本系統基于GIS 技術的尋親大數據分析方法的互聯網+公益尋親系統結合了Web 端和移動端的技術,充分發揮互聯網在社會資源配置中的優化和集成作用,將互聯網信息技術與公益進行融合對接,介入人口失蹤問題,針對性的解決了以往尋人方式途徑單一、效率不高、尋回失蹤人口成功率較低等問題[2]。Web 端主要是實現尋親基礎數據的獲取、歸類、分析、可視化,記憶尋找、在線交流等功能。移動端是基于微信公眾號模式進行二次開發,主要實現的是尋親隨手拍、即時尋找、預警消息推送、尋找路線推送、在線交流等功能。
我們通過網絡爬蟲這個程序,根據既定的目標,選擇性訪問與目標相關的網頁鏈接,獲取有效信息。尋親數據來源于網絡上的傳統尋親網站,這里以“寶貝回家”為例[3]。我們使用基于.Net 的第三方類庫HtmlAgilityPack 對寶貝回家的數據進行爬取。從寶貝回家獲取的失蹤位置數據是以地址格式存儲的,我們需要將其重新編碼,使地址信息轉化為更為直觀的經緯度坐標信息。將爬取的批量地址編碼后的數據導入ArcSDE 空間數據庫當中,并在ArcMap DeskTop 中進行展示(見圖 1)。
(1)尋親大數據的時空集聚性分析。依據時間和地理位置對尋親大數據做時空集聚性分析,在地圖中構建熱力圖,分析出尋親的熱點區域。基于GIS 技術的尋親大數據分析方法采用heatmap.js 進行實時熱點圖的構建,heatmap.js 可以使用canvas 畫出來一張漂亮的heatmap。

圖1 算法流程圖
(2)時空關系的尋親大數據關聯分析方法。對從尋親網絡中獲取的尋親數據進行分析,對尋親雙方信息中的基本信息、時間、空間、特征、進行算法匹配,再通過記憶地圖匹配推薦出相似的尋找人,其算法流程如圖2 所示。
a.初級匹配,首先處理尋親大數據中的基本信息,通過信息與描述相比較,進行篩選。
b.權重匹配,對失蹤地點、籍貫、特征關鍵詞進行權重匹配。利用GIS 技術,通過對輸入的信息與系統中的數據進行匹配,距離與權重成正相關。然后再通過對特征關鍵詞進行檢索,再與系統中的詞庫進行對比,關鍵詞的出現頻率的高低決定權重大小。
c.記憶匹配,尋親的父母可以將孩子丟失的時間信息與空間信息數據上傳到系統中來,然后系統會進行信息的自動比對,然后通過初級匹配和權重匹配,系統會推薦一份相似度較高的列表可供用戶查看尋找。
(3)尋親大數據影像識別方法。系統中搜集了數十萬張尋親照片,我們通過影像識別技術對尋親大數據中的照片做智能匹配,推薦出相似度較高的圖片。使用的人臉識別系統是由Face++提供的,該系統通過提取圖片的面部特征,包括面部表情、年齡、性別、眼睛、鼻子等在臉部的位置信息,然后上傳至服務器,然后服務器會把這些面部特征以及標識通過json 數據響應,與尋親父母提供的照片相比對,相識度達到一定高度即認為是同一人。
(4)即時尋親最優尋找路徑推薦。為了在web 端實現即時尋找路線推薦這一功能,我們使用ArcGIS Server 發布復雜的空間運算模型,對服務區路網進行分析,以章貢區路網為例,將其路網的網絡數據集作為基礎,以兒童的失蹤時間為判定條件,分析出在黃金救援時間內以步行、騎行、開車能到達的位置,然后再將分析所得的路線結果推送給該服務區內的志愿者,讓其加入即時尋親。
系統主要實現了如下功能:
(1)家尋寶貝。系統中使用的人臉識別系統是由Face++提供的,使用關鍵點檢測技術,精準定位人臉的大小、特點、表情等特征,可以自動識別出照片中的人臉身份[4]。通過1:N 人臉識別技術,可以實現尋親過程中的照片識別。并建立大數據平臺,尋親父母和被拐兒童都可以根據自己的記憶信息在系統中根據數據庫中的數據進行時空關系匹配,得到結果列表,有助于被拐多年的人員找到親人。
(2)微信即時尋親。該功能主要利用微信公眾號的形式,在微信公眾號中設置了尋親指南、即時尋親、關于我們等三個功能欄。涵蓋了防范措施、尋親技巧、找回故事等常規公益網站的宣傳內容以及基于GIS 技術的家長和志愿者的即時尋親功能。
(3)后臺管理。即時尋親監控平臺是對微信端的即時尋親的家長和志愿者的監控,這里是以贛州市章貢區為例進行分析監控,右側區域依次有預警區域、查看志愿者、查看信箱、解除預警功能。

圖2 記憶尋親算法流程圖
繼電影《親愛的》之后,由劉德華主演的電影《失孤》再度喚起人們對打拐問題的關注,一個兒童丟了,就是一個家庭崩塌的開始,再加上傳統的尋親社會關注度低,尋親渠道少,群眾參與度不高等問題,極大地降低了尋回丟失兒童的幾率[5]。本系統是基于互聯網+GIS 技術的公益尋親系統,以智能手機為主要平臺,通過網絡爬蟲獲取當前網絡上失蹤和尋找信息,并采用地理信息空間技術對這些數據進行可視化管理,構建失蹤人員的時空數據庫,在此基礎上,建立基于時空關系的失蹤與找尋匹配模型,提高匹配的精準性。未來,還可以嘗試利用大數據等現代互聯網技術對公益開展更深層次的改造,共同構建一個和諧、美好、充滿愛心的社會。