聶圣東,劉 嫻,武帥文
(江西理工大學(xué) 土木與測(cè)繪工程學(xué)院,江西 贛州 341000)
2016年2月,今日頭條發(fā)起了“頭條尋人”公益項(xiàng)目。字節(jié)跳動(dòng)提出“互聯(lián)網(wǎng)+”在公益事業(yè)方面所具有的效果巨大這一說法。更是提出了“信息公益”這一理念,將信息作為公益事業(yè)的起點(diǎn);公益事業(yè)發(fā)起與信息,更借用信息作為載體,提高公益事業(yè)的效率與價(jià)值。只有立足于信息技術(shù)的優(yōu)勢(shì),才能促進(jìn)尋人尋親項(xiàng)目的實(shí)施[1]。本系統(tǒng)基于GIS 技術(shù)的尋親大數(shù)據(jù)分析方法的互聯(lián)網(wǎng)+公益尋親系統(tǒng)結(jié)合了Web 端和移動(dòng)端的技術(shù),充分發(fā)揮互聯(lián)網(wǎng)在社會(huì)資源配置中的優(yōu)化和集成作用,將互聯(lián)網(wǎng)信息技術(shù)與公益進(jìn)行融合對(duì)接,介入人口失蹤問題,針對(duì)性的解決了以往尋人方式途徑單一、效率不高、尋回失蹤人口成功率較低等問題[2]。Web 端主要是實(shí)現(xiàn)尋親基礎(chǔ)數(shù)據(jù)的獲取、歸類、分析、可視化,記憶尋找、在線交流等功能。移動(dòng)端是基于微信公眾號(hào)模式進(jìn)行二次開發(fā),主要實(shí)現(xiàn)的是尋親隨手拍、即時(shí)尋找、預(yù)警消息推送、尋找路線推送、在線交流等功能。
我們通過網(wǎng)絡(luò)爬蟲這個(gè)程序,根據(jù)既定的目標(biāo),選擇性訪問與目標(biāo)相關(guān)的網(wǎng)頁鏈接,獲取有效信息。尋親數(shù)據(jù)來源于網(wǎng)絡(luò)上的傳統(tǒng)尋親網(wǎng)站,這里以“寶貝回家”為例[3]。我們使用基于.Net 的第三方類庫HtmlAgilityPack 對(duì)寶貝回家的數(shù)據(jù)進(jìn)行爬取。從寶貝回家獲取的失蹤位置數(shù)據(jù)是以地址格式存儲(chǔ)的,我們需要將其重新編碼,使地址信息轉(zhuǎn)化為更為直觀的經(jīng)緯度坐標(biāo)信息。將爬取的批量地址編碼后的數(shù)據(jù)導(dǎo)入ArcSDE 空間數(shù)據(jù)庫當(dāng)中,并在ArcMap DeskTop 中進(jìn)行展示(見圖 1)。
(1)尋親大數(shù)據(jù)的時(shí)空集聚性分析。依據(jù)時(shí)間和地理位置對(duì)尋親大數(shù)據(jù)做時(shí)空集聚性分析,在地圖中構(gòu)建熱力圖,分析出尋親的熱點(diǎn)區(qū)域。基于GIS 技術(shù)的尋親大數(shù)據(jù)分析方法采用heatmap.js 進(jìn)行實(shí)時(shí)熱點(diǎn)圖的構(gòu)建,heatmap.js 可以使用canvas 畫出來一張漂亮的heatmap。

圖1 算法流程圖
(2)時(shí)空關(guān)系的尋親大數(shù)據(jù)關(guān)聯(lián)分析方法。對(duì)從尋親網(wǎng)絡(luò)中獲取的尋親數(shù)據(jù)進(jìn)行分析,對(duì)尋親雙方信息中的基本信息、時(shí)間、空間、特征、進(jìn)行算法匹配,再通過記憶地圖匹配推薦出相似的尋找人,其算法流程如圖2 所示。
a.初級(jí)匹配,首先處理尋親大數(shù)據(jù)中的基本信息,通過信息與描述相比較,進(jìn)行篩選。
b.權(quán)重匹配,對(duì)失蹤地點(diǎn)、籍貫、特征關(guān)鍵詞進(jìn)行權(quán)重匹配。利用GIS 技術(shù),通過對(duì)輸入的信息與系統(tǒng)中的數(shù)據(jù)進(jìn)行匹配,距離與權(quán)重成正相關(guān)。然后再通過對(duì)特征關(guān)鍵詞進(jìn)行檢索,再與系統(tǒng)中的詞庫進(jìn)行對(duì)比,關(guān)鍵詞的出現(xiàn)頻率的高低決定權(quán)重大小。
c.記憶匹配,尋親的父母可以將孩子丟失的時(shí)間信息與空間信息數(shù)據(jù)上傳到系統(tǒng)中來,然后系統(tǒng)會(huì)進(jìn)行信息的自動(dòng)比對(duì),然后通過初級(jí)匹配和權(quán)重匹配,系統(tǒng)會(huì)推薦一份相似度較高的列表可供用戶查看尋找。
(3)尋親大數(shù)據(jù)影像識(shí)別方法。系統(tǒng)中搜集了數(shù)十萬張尋親照片,我們通過影像識(shí)別技術(shù)對(duì)尋親大數(shù)據(jù)中的照片做智能匹配,推薦出相似度較高的圖片。使用的人臉識(shí)別系統(tǒng)是由Face++提供的,該系統(tǒng)通過提取圖片的面部特征,包括面部表情、年齡、性別、眼睛、鼻子等在臉部的位置信息,然后上傳至服務(wù)器,然后服務(wù)器會(huì)把這些面部特征以及標(biāo)識(shí)通過json 數(shù)據(jù)響應(yīng),與尋親父母提供的照片相比對(duì),相識(shí)度達(dá)到一定高度即認(rèn)為是同一人。
(4)即時(shí)尋親最優(yōu)尋找路徑推薦。為了在web 端實(shí)現(xiàn)即時(shí)尋找路線推薦這一功能,我們使用ArcGIS Server 發(fā)布復(fù)雜的空間運(yùn)算模型,對(duì)服務(wù)區(qū)路網(wǎng)進(jìn)行分析,以章貢區(qū)路網(wǎng)為例,將其路網(wǎng)的網(wǎng)絡(luò)數(shù)據(jù)集作為基礎(chǔ),以兒童的失蹤時(shí)間為判定條件,分析出在黃金救援時(shí)間內(nèi)以步行、騎行、開車能到達(dá)的位置,然后再將分析所得的路線結(jié)果推送給該服務(wù)區(qū)內(nèi)的志愿者,讓其加入即時(shí)尋親。
系統(tǒng)主要實(shí)現(xiàn)了如下功能:
(1)家尋寶貝。系統(tǒng)中使用的人臉識(shí)別系統(tǒng)是由Face++提供的,使用關(guān)鍵點(diǎn)檢測(cè)技術(shù),精準(zhǔn)定位人臉的大小、特點(diǎn)、表情等特征,可以自動(dòng)識(shí)別出照片中的人臉身份[4]。通過1:N 人臉識(shí)別技術(shù),可以實(shí)現(xiàn)尋親過程中的照片識(shí)別。并建立大數(shù)據(jù)平臺(tái),尋親父母和被拐兒童都可以根據(jù)自己的記憶信息在系統(tǒng)中根據(jù)數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行時(shí)空關(guān)系匹配,得到結(jié)果列表,有助于被拐多年的人員找到親人。
(2)微信即時(shí)尋親。該功能主要利用微信公眾號(hào)的形式,在微信公眾號(hào)中設(shè)置了尋親指南、即時(shí)尋親、關(guān)于我們等三個(gè)功能欄。涵蓋了防范措施、尋親技巧、找回故事等常規(guī)公益網(wǎng)站的宣傳內(nèi)容以及基于GIS 技術(shù)的家長(zhǎng)和志愿者的即時(shí)尋親功能。
(3)后臺(tái)管理。即時(shí)尋親監(jiān)控平臺(tái)是對(duì)微信端的即時(shí)尋親的家長(zhǎng)和志愿者的監(jiān)控,這里是以贛州市章貢區(qū)為例進(jìn)行分析監(jiān)控,右側(cè)區(qū)域依次有預(yù)警區(qū)域、查看志愿者、查看信箱、解除預(yù)警功能。

圖2 記憶尋親算法流程圖
繼電影《親愛的》之后,由劉德華主演的電影《失孤》再度喚起人們對(duì)打拐問題的關(guān)注,一個(gè)兒童丟了,就是一個(gè)家庭崩塌的開始,再加上傳統(tǒng)的尋親社會(huì)關(guān)注度低,尋親渠道少,群眾參與度不高等問題,極大地降低了尋回丟失兒童的幾率[5]。本系統(tǒng)是基于互聯(lián)網(wǎng)+GIS 技術(shù)的公益尋親系統(tǒng),以智能手機(jī)為主要平臺(tái),通過網(wǎng)絡(luò)爬蟲獲取當(dāng)前網(wǎng)絡(luò)上失蹤和尋找信息,并采用地理信息空間技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行可視化管理,構(gòu)建失蹤人員的時(shí)空數(shù)據(jù)庫,在此基礎(chǔ)上,建立基于時(shí)空關(guān)系的失蹤與找尋匹配模型,提高匹配的精準(zhǔn)性。未來,還可以嘗試?yán)么髷?shù)據(jù)等現(xiàn)代互聯(lián)網(wǎng)技術(shù)對(duì)公益開展更深層次的改造,共同構(gòu)建一個(gè)和諧、美好、充滿愛心的社會(huì)。