999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

知識(shí)圖譜在公共安全方面的應(yīng)用

2018-02-27 13:29:44邱瑞朱振華
電腦知識(shí)與技術(shù) 2018年35期

邱瑞 朱振華

摘要:通過分析現(xiàn)有的知識(shí)圖譜技術(shù),結(jié)合現(xiàn)有公安業(yè)務(wù)場(chǎng)景,利用公安海量數(shù)據(jù)構(gòu)建基于公安大數(shù)據(jù)的公安行業(yè)知識(shí)圖譜。通過使用基于圖數(shù)據(jù)庫的混合存儲(chǔ)技術(shù),從而實(shí)現(xiàn)分布式知識(shí)圖譜混合存儲(chǔ)、設(shè)計(jì)面向公安行業(yè)的知識(shí)圖譜查詢語言以及查詢方法,實(shí)現(xiàn)知識(shí)圖譜的有效更新和快速查詢,最后介紹了知識(shí)圖譜在公安行業(yè)的應(yīng)用。

關(guān)鍵詞:公安大數(shù)據(jù);知識(shí)圖譜;圖數(shù)據(jù)庫

中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? 文章編號(hào):1009-3044(2018)35-0196-04

Abstract: By analyzing the existing knowledge map technology and combining with the existing public security business scene, the knowledge map of public security Based on the large data of public security is constructed. By using the mixed storage technology Based on graph database, we can realize the mixed storage of distributed knowledge atlas, design the query language and method of knowledge atlas for public security industry, and realize the effective updating and fast query of knowledge atlas. Finally, we introduce the application of knowledge map in public security industry.

Key words: Public Security big data; knowledge map; graph database

1 概述

互聯(lián)網(wǎng)信息搜索是人們獲取信息的重要方式之一。以谷歌為代表的搜索引擎公司利用知識(shí)圖譜為詞語賦予豐富的語義信息,建立與現(xiàn)實(shí)世界實(shí)體的關(guān)系,幫助用戶更快找到并理解信息。

隨著公共安全案件的復(fù)雜性加深,簡(jiǎn)單的數(shù)據(jù)檢索功能已經(jīng)無法滿足當(dāng)前的公安業(yè)務(wù)需求,公安海量數(shù)據(jù)無法被用戶快速解讀,且無法被表達(dá)為的數(shù)字化知識(shí)。知識(shí)圖譜技術(shù)的出現(xiàn)為公安大數(shù)據(jù)環(huán)境下的人員分析方法提供了一種有效技術(shù)手段。知識(shí)圖譜可以融合多種數(shù)據(jù)源豐富數(shù)據(jù)語義信息,并且可以結(jié)合推理得到的隱含信息為用戶提供服務(wù)。公安大數(shù)據(jù)的知識(shí)圖譜在團(tuán)伙挖掘和案件分析方面結(jié)合特定的業(yè)務(wù)模型將在實(shí)戰(zhàn)方面有較強(qiáng)的應(yīng)用優(yōu)勢(shì)。

本文將在基于知識(shí)圖譜的介紹之上,通過對(duì)公安行業(yè)知識(shí)圖譜的搭建流程進(jìn)行了深入的研究,使用基于圖數(shù)據(jù)庫的混合存儲(chǔ)技術(shù),從而實(shí)現(xiàn)分布式知識(shí)圖譜混合存儲(chǔ)、快速查詢。最后,介紹了基于知識(shí)圖譜的公安業(yè)務(wù)的分析研判應(yīng)用。

2 知識(shí)圖譜理論

2.1 知識(shí)圖譜介紹

知識(shí)圖譜的最重要的數(shù)據(jù)來源之一是以維基百科、百度百科為代表的大規(guī)模知識(shí)庫,這些知識(shí)庫包含了大量結(jié)構(gòu)化的知識(shí),可以高效地轉(zhuǎn)化到知識(shí)圖譜中。此外,也可以利用互聯(lián)網(wǎng)的海量知識(shí)來構(gòu)建知識(shí)圖譜。知識(shí)圖譜數(shù)據(jù)來源主要包括:

1) 大規(guī)模知識(shí)庫。大規(guī)模知識(shí)庫以詞條作為基本組織單位,詞條與現(xiàn)實(shí)生活的實(shí)體一一對(duì)應(yīng)。維基百科收錄超過3300萬詞條,各大公司和機(jī)構(gòu)還發(fā)布了各類大規(guī)模知識(shí)庫,如谷歌收購的Freebase、德國(guó)萊比錫大學(xué)發(fā)起的DBpedia項(xiàng)目、德國(guó)馬克斯普朗克研究所發(fā)起的YAGO項(xiàng)目等均包含超過千萬個(gè)實(shí)體及千億條關(guān)系。此外,還有領(lǐng)域?qū)<艺淼念I(lǐng)域知識(shí)庫。

2) 互聯(lián)網(wǎng)鏈接數(shù)據(jù)。國(guó)際萬維網(wǎng)組織W3C在2007年發(fā)起了開放互聯(lián)數(shù)據(jù)項(xiàng)目(Linked Open Data,LOD)。LOD以RDF(Resource Description Framework)形式在Web上發(fā)布各種開放數(shù)據(jù)集,RDF利用 (實(shí)體1, 關(guān)系, 實(shí)體2) 的三元組來描述實(shí)體間的關(guān)系。目前世界各機(jī)構(gòu)已經(jīng)基于LOD標(biāo)準(zhǔn)發(fā)布數(shù)千個(gè)數(shù)據(jù)集,包含數(shù)千億RDF三元組。

3) 互聯(lián)網(wǎng)網(wǎng)頁文本數(shù)據(jù)。研究者致力于從海量的、無結(jié)構(gòu)的互聯(lián)網(wǎng)抽取結(jié)構(gòu)化信息,如華盛頓大學(xué)Oren Etzioni教授提取的“開放信息抽取”(open information extraction,OpenIE)項(xiàng)目,以及卡耐基梅隆大學(xué)Tom Mitchell教授主導(dǎo)的“永不停止的語言學(xué)習(xí)”(never-ending language learning, NELL)項(xiàng)目。

4) 多數(shù)據(jù)源的知識(shí)融合。多維度的數(shù)據(jù)來源進(jìn)行知識(shí)圖譜構(gòu)建并非孤立進(jìn)行,同時(shí)多來源數(shù)據(jù)的融合提高抽取知識(shí)的可信性。在商用知識(shí)圖譜構(gòu)建過程中,需要實(shí)現(xiàn)多數(shù)據(jù)源的知識(shí)融合。以谷歌最新發(fā)布的Knowledge Vault (Dong, et al. 2014) 技術(shù)為例,其知識(shí)圖譜的數(shù)據(jù)來源包括了文本、DOM 樹、HTML、RDF數(shù)據(jù)等信息來源。知識(shí)融合主要包括實(shí)體融合、關(guān)系融合和實(shí)例融合。現(xiàn)實(shí)中的實(shí)體往往有多個(gè)名稱,我們需要將這些不同名稱規(guī)約到同一個(gè)實(shí)體下,在這樣多對(duì)多對(duì)應(yīng)關(guān)系中,研究實(shí)體融合是非常重要的攻克技術(shù)難點(diǎn)。

2.2 知識(shí)圖譜的主要技術(shù)

公安行業(yè)的大規(guī)模知識(shí)圖譜的構(gòu)建與應(yīng)用需要多種智能信息處理技術(shù)的支持,其中主要技術(shù)包括。

1) 實(shí)體鏈指(Entity Linking),我們將實(shí)體和實(shí)體的背景介紹相互關(guān)聯(lián)的這種做法就是建立了鏈接關(guān)系,因而也被稱為實(shí)體鏈指。實(shí)體鏈指的主要任務(wù)包括實(shí)體識(shí)別(Entity Recognition)與實(shí)體消歧(Entity Disambiguation)。實(shí)體識(shí)別旨在從文本中發(fā)現(xiàn)實(shí)體,最常見的是包括人名、地名、機(jī)構(gòu)名等三類實(shí)體,實(shí)體鏈接可以在文本、圖像、社交媒體等數(shù)據(jù)與實(shí)體之間進(jìn)行關(guān)聯(lián)。實(shí)體消歧是指利用實(shí)體名稱存在的上下文,分析實(shí)體出現(xiàn)在該位置的概率大小。

2) 關(guān)系抽取(Relation Extraction),實(shí)體關(guān)系抽取是構(gòu)建知識(shí)圖譜最重要的數(shù)據(jù)來源方式之一。常見的信息抽取方法采用“自舉”思想,通過對(duì)“模板生成實(shí)例抽取”的流程不斷進(jìn)行迭代直至收斂。我們還可以將所有關(guān)系看作分類標(biāo)簽,把關(guān)系抽取轉(zhuǎn)換為對(duì)實(shí)體對(duì)的關(guān)系分類問題。關(guān)系抽取作為知識(shí)圖譜構(gòu)建的核心技術(shù),影響著知識(shí)圖譜的知識(shí)數(shù)量、質(zhì)量。關(guān)系抽取是知識(shí)圖譜領(lǐng)域中的熱點(diǎn)問題,有很多挑戰(zhàn)性問題亟須解決。

3) 知識(shí)推理(Knowledge Reasoning),推理能力是人類智能的重要特征,能夠從已有知識(shí)中發(fā)現(xiàn)隱含知識(shí)。推理往往需要相關(guān)規(guī)則的支持,如從“配偶”+“女性”推理出“妻子”。知識(shí)推理可以用于發(fā)現(xiàn)實(shí)體間新的關(guān)系。如根據(jù)“母親+母親=>外祖母”的推理規(guī)則,如果兩實(shí)體間存在“母親+母親”的關(guān)系模型,判斷它們存在類型“外祖母”的關(guān)系。

4) 知識(shí)表示(Knowledge Representation) ,在計(jì)算機(jī)中如何對(duì)知識(shí)圖譜進(jìn)行表示與存儲(chǔ),是知識(shí)圖譜構(gòu)建與應(yīng)用的重要課題。如“知識(shí)圖譜”字面所表示的含義,人們往往將知識(shí)圖譜作為復(fù)雜網(wǎng)絡(luò)進(jìn)行存儲(chǔ),網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)帶有實(shí)體標(biāo)簽,而每條邊帶有關(guān)系標(biāo)簽。基于這種網(wǎng)絡(luò)的表示方案,知識(shí)圖譜的相關(guān)應(yīng)用任務(wù)往往需要借助于圖算法來完成。

3 公安知識(shí)圖譜

公安部門沉淀了海量結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù),包括了案件數(shù)據(jù)、軌跡類數(shù)據(jù)、基礎(chǔ)類、背景類數(shù)據(jù)以及其他類數(shù)據(jù),積累了如110接處警、案件筆錄數(shù)據(jù)等高價(jià)值非結(jié)構(gòu)化數(shù)據(jù)。目前公安部門將“知識(shí)圖譜技術(shù)”納入公安機(jī)關(guān)發(fā)展規(guī)劃,已開始嘗試引入“知識(shí)圖譜”解決業(yè)務(wù)系統(tǒng)預(yù)測(cè)預(yù)警的問題。

公安部門可以利用知識(shí)圖譜技術(shù),圍繞文本挖掘和快速檢索、高維可視、數(shù)據(jù)預(yù)測(cè)等新需求,打造一個(gè)具有數(shù)據(jù)分析處理、數(shù)據(jù)挖掘能力的基于知識(shí)圖譜的人員關(guān)系分析服務(wù)平臺(tái)。

3.1 公安知識(shí)圖譜的搭建流程

對(duì)于公安業(yè)務(wù)數(shù)據(jù)量持續(xù)增大和數(shù)據(jù)源種類增多的挑戰(zhàn),本文提出了公安業(yè)務(wù)任務(wù)驅(qū)動(dòng)的知識(shí)圖標(biāo)識(shí)、管理技術(shù)。用來支撐公安行業(yè)數(shù)據(jù)的管理和維護(hù),實(shí)現(xiàn)公安數(shù)據(jù)的高效檢索、數(shù)據(jù)挖掘任務(wù),同時(shí),構(gòu)建屬于公安大數(shù)據(jù)相關(guān)的知識(shí)圖譜庫,開展公安行業(yè)的多源異構(gòu)的數(shù)據(jù)關(guān)聯(lián),支撐面向圖譜的高效匹配和關(guān)聯(lián)檢索應(yīng)用。

公安行業(yè)的知識(shí)圖譜的搭建流程應(yīng)考慮四點(diǎn):

第一,公安行業(yè)的多源異構(gòu)數(shù)據(jù)組織形式。通過數(shù)據(jù)采集系統(tǒng),平臺(tái)可匯集公安多警種、社會(huì)信息、政府其他委辦局等多源數(shù)據(jù),數(shù)據(jù)平臺(tái)圍繞以“人、地、物、事、組織”中心的基礎(chǔ)信息和“吃、住、衣、行、網(wǎng)、像”等為中心的活動(dòng)軌跡,整合出系統(tǒng)所需的基礎(chǔ)信息庫、主題信息庫、軌跡信息庫、人員關(guān)系庫等各類數(shù)據(jù)資源庫,為公安業(yè)務(wù)的分析研判提供了數(shù)據(jù)支撐。

第二,公安業(yè)務(wù)知識(shí)圖譜數(shù)據(jù)關(guān)聯(lián)推斷技術(shù)。為了解決多源異構(gòu)公安數(shù)據(jù)的不一致、不完整等問題,本文通過知識(shí)圖譜的構(gòu)建技術(shù),提升多源異構(gòu)數(shù)據(jù)知識(shí)表示、推理與數(shù)據(jù)挖掘能力。針對(duì)圖譜增強(qiáng)的知識(shí)化實(shí)體理解技術(shù),開展多源輔助信息關(guān)聯(lián),支持面向公安知識(shí)圖譜的高效檢索、匹配應(yīng)用技術(shù)。

第三,公安業(yè)務(wù)數(shù)據(jù)的有效組織技術(shù):主要研究抽象語義的關(guān)聯(lián)、數(shù)據(jù)源屬性分類和識(shí)別,實(shí)現(xiàn)在公安警務(wù)人員緊缺的情況下的公安數(shù)據(jù)的增量拓展,實(shí)現(xiàn)對(duì)多源數(shù)據(jù)的標(biāo)記、解讀、預(yù)測(cè)預(yù)警等預(yù)處理。公安業(yè)務(wù)實(shí)體關(guān)系主要包括:預(yù)測(cè)實(shí)體對(duì)之間的關(guān)系,挖掘特定關(guān)系的實(shí)體對(duì),開放式實(shí)體關(guān)系抽取。

第四,知識(shí)圖譜構(gòu)建技術(shù):知識(shí)獲取方面。知識(shí)圖譜構(gòu)建需從多種信息源獲取實(shí)體或概念,以及他們之間的關(guān)聯(lián)關(guān)系。知識(shí)抽取細(xì)分為實(shí)體、屬性、關(guān)系、分類等識(shí)別與抽取。知識(shí)更新主要解決知識(shí)的更新問題,用以體現(xiàn)知識(shí)的變化對(duì)知識(shí)圖譜中所存儲(chǔ)知識(shí)的影響。知識(shí)融合主要是進(jìn)行實(shí)體識(shí)別,即給定不同數(shù)據(jù)源中的實(shí)體,判斷其是否指向同一個(gè)真實(shí)世界實(shí)體。知識(shí)融合過程中,要準(zhǔn)確識(shí)別待合并知識(shí)與知識(shí)庫中已有知識(shí)相重復(fù)或相矛盾的部分,采取適當(dāng)?shù)拇胧┻M(jìn)行處理,以保證知識(shí)庫中的知識(shí)是一致性。

3.2 圖數(shù)據(jù)庫設(shè)計(jì)原理

相對(duì)于關(guān)系數(shù)據(jù)庫來說,圖形數(shù)據(jù)庫善于處理大量復(fù)雜、互連接、低結(jié)構(gòu)化的數(shù)據(jù)。當(dāng)數(shù)據(jù)規(guī)模大到一定程度時(shí),如何對(duì)其進(jìn)行高效計(jì)算即成為迫切需要解決的問題。對(duì)于大規(guī)模圖數(shù)據(jù),如支付寶的好友關(guān)系已經(jīng)形成超過1800億節(jié)點(diǎn)和4400億邊的巨型圖,傳統(tǒng)的單機(jī)處理方式已經(jīng)無法處理如此龐大的數(shù)據(jù)量,必須采用由大規(guī)模機(jī)器集群構(gòu)成的并行圖數(shù)據(jù)庫。

在處理圖數(shù)據(jù)時(shí),其內(nèi)部存儲(chǔ)結(jié)構(gòu)往往采用鄰接矩陣或鄰接表的方式,在大規(guī)模并行圖數(shù)據(jù)庫場(chǎng)景下,鄰接表的方式更加常用,大部分圖數(shù)據(jù)庫和處理框架都采用了這一存儲(chǔ)結(jié)構(gòu)。常見的圖數(shù)據(jù)庫包括Neo4J、FlockDB、InfoGrid、AllegroGraph等圖數(shù)據(jù)庫,這類數(shù)據(jù)庫非常適合用于社交網(wǎng)絡(luò)。

為了更有效地解決大規(guī)模圖上的計(jì)算問題,需要設(shè)計(jì)擴(kuò)展性較好的圖數(shù)據(jù)庫。為達(dá)到反應(yīng)實(shí)社會(huì)關(guān)系的,基于公安業(yè)務(wù)構(gòu)建的圖數(shù)據(jù)庫中的數(shù)據(jù)規(guī)模很可能在千億、萬億乃至更多記錄級(jí)別以上,而在這樣規(guī)模的圖數(shù)據(jù)上進(jìn)行計(jì)算,現(xiàn)有的計(jì)算引擎或數(shù)據(jù)處理架構(gòu)面臨以下難題。

普遍流行的大都是以離線批處理計(jì)算框架和內(nèi)存迭代式計(jì)算引擎為代表的大數(shù)據(jù)計(jì)算框架。以MapReduce為主的離線批量計(jì)算框架和以Spark為主的內(nèi)存迭代式技術(shù)框架各自有著不同的特點(diǎn)和應(yīng)用場(chǎng)景。越來越大的數(shù)據(jù)量給離線批量處理帶來了極大的計(jì)算資源的消耗,并且消耗了更多的能源成本,而內(nèi)存迭代式計(jì)算引擎需要更高配置的機(jī)器,消耗更多的機(jī)器內(nèi)存,極可能導(dǎo)致內(nèi)存溢出而使得計(jì)算任務(wù)失敗。

原生圖存儲(chǔ)技術(shù)是專為業(yè)務(wù)系統(tǒng)的性能和擴(kuò)展性設(shè)計(jì)搭建的。其優(yōu)點(diǎn)是在遍歷查詢時(shí)性能優(yōu)勢(shì)很大,但查詢快的代價(jià)是一些非遍歷類查詢會(huì)比較困難,而且還要占用巨大的內(nèi)存。為了提高對(duì)大量數(shù)據(jù)的計(jì)算速度,并減少分析計(jì)算時(shí)間,在已有計(jì)算引擎的基礎(chǔ)上,本文結(jié)合了圖計(jì)算、圖挖掘、圖分析的先進(jìn)技術(shù),重構(gòu)并實(shí)現(xiàn)了更高效的圖數(shù)據(jù)存儲(chǔ)框架。新的數(shù)據(jù)庫框架要能夠?qū)τ?jì)算的中間結(jié)果進(jìn)行保存,只對(duì)增量數(shù)據(jù)進(jìn)行計(jì)算,以便降低資源和能源消耗,加速分析結(jié)果的產(chǎn)出。

3.3 基于公安知識(shí)庫的業(yè)務(wù)模型

基于公安知識(shí)圖譜的推理和研判是警務(wù)人員在研判業(yè)務(wù)模型的研究重點(diǎn)。知識(shí)圖譜中的關(guān)系模型的設(shè)計(jì)是以人的真實(shí)活動(dòng)為依據(jù)的。參與活動(dòng)的主體通過各種社交構(gòu)成的社交網(wǎng)絡(luò)關(guān)系。大范圍、長(zhǎng)時(shí)空的系列活動(dòng)、重點(diǎn)區(qū)域等都是犯罪活動(dòng)的幾個(gè)關(guān)鍵要素,需要在構(gòu)建模型時(shí)重點(diǎn)關(guān)注和研究,在實(shí)際分析業(yè)務(wù)模型的構(gòu)建后,通常采用一些圖算法來開展人員關(guān)系的關(guān)系分析和研判,進(jìn)而發(fā)現(xiàn)潛在的關(guān)系。

首先,按照不同業(yè)務(wù)模型,警務(wù)人員把匯集的各類型數(shù)據(jù)進(jìn)行數(shù)據(jù)分類處理,形成基于不同數(shù)據(jù)類別的業(yè)務(wù)主題域模型庫。隨著異構(gòu)數(shù)據(jù)的增加及業(yè)務(wù)研判模型的不斷拓展,公安知識(shí)庫的主題模型也將不斷增加。業(yè)務(wù)系統(tǒng)初期建設(shè)過程中,公安知識(shí)庫形成了以自然人、地域、物品、案事件、重點(diǎn)組織為中心的五大類主題模型。

其次,采用綜合圖譜模式匹配技術(shù),在違法犯罪行為記錄的事件、組織記錄的模式檢索中,借助基于關(guān)聯(lián)子結(jié)構(gòu)、子模式的匹配技術(shù),可以構(gòu)建頻繁結(jié)構(gòu)索引,以實(shí)現(xiàn)突破傳統(tǒng)關(guān)鍵詞技術(shù)的檢索模式,支持基于復(fù)雜時(shí)間、行為軌跡、人員背景的檢索任務(wù),支撐多種公安研判業(yè)務(wù)的開展。在多維度、大范圍的公安數(shù)據(jù)獲取、融合、去重等處理后,利用知識(shí)圖譜技術(shù),優(yōu)化公安數(shù)據(jù)的表示,提高公安數(shù)據(jù)概況、索引設(shè)計(jì)、數(shù)據(jù)分發(fā)等重要操作的效率,提升知識(shí)圖譜的語義知識(shí)表示能力。

最后,為實(shí)現(xiàn)多源異構(gòu)公安各類數(shù)據(jù)的動(dòng)態(tài)管理,提升實(shí)時(shí)響應(yīng)能力,要采用多維異構(gòu)數(shù)據(jù)源的快速關(guān)聯(lián)技術(shù)。通過多源異構(gòu)數(shù)據(jù)的關(guān)聯(lián)技術(shù),對(duì)公安大數(shù)據(jù)進(jìn)行擴(kuò)展延伸、關(guān)系抽取、關(guān)系重建,進(jìn)而擴(kuò)展公安知識(shí)圖譜。

4 公安知識(shí)圖譜技術(shù)應(yīng)用

利用知識(shí)圖譜技術(shù),通過強(qiáng)大的檢索引擎技術(shù),圍繞人員關(guān)系分析、快速檢索、多維可視、大數(shù)據(jù)預(yù)測(cè)等新需求,打造一個(gè)具有數(shù)據(jù)分析處理、數(shù)據(jù)挖掘能力的基于知識(shí)圖譜的人員關(guān)系分析服務(wù)平臺(tái),在以下幾個(gè)方面,實(shí)現(xiàn)公安大數(shù)據(jù)價(jià)值的挖掘與利用,滿足用戶的自定義業(yè)務(wù)需求。

4.1 人物關(guān)系梳理

公安警務(wù)人員通過將危害公共安全事件、案件筆錄等文本數(shù)據(jù)導(dǎo)入程序中,然后利用知識(shí)圖譜技術(shù)對(duì)涉案的人物關(guān)系進(jìn)行梳理,快速整理并繪制出直觀的人物關(guān)系圖譜。另一方面,可以對(duì)同種類型的案件不同人員的筆錄進(jìn)行串聯(lián)案件分析,從而獲取更加直觀的人物關(guān)系圖譜,輔助發(fā)現(xiàn)隱含的人員背景關(guān)系。還可以通過自然語言描述的方式錄入人物之間直觀的人員關(guān)系,如“小王的母親是王大娘,王大娘與張姐是老鄉(xiāng)”,在人員關(guān)系描述性的文字錄入以后,基于公安大數(shù)據(jù)的知識(shí)圖譜會(huì)生成與之相對(duì)應(yīng)的人物關(guān)系圖。

4.2 挖掘潛在關(guān)系人

通過知識(shí)圖譜對(duì)短信、微信、QQ數(shù)據(jù)等網(wǎng)絡(luò)社交數(shù)據(jù)分析,挖掘出違法犯罪人員的關(guān)系人情況,并形成相應(yīng)的人物關(guān)系圖,進(jìn)而發(fā)掘潛在的違法犯罪關(guān)系人。公安人員通過對(duì)公安多維度數(shù)據(jù)的分析,能夠開闊公安案件分析的視角,進(jìn)而挖掘出危害公共安全的潛在線索,如某部門利用知識(shí)圖譜技術(shù)通過對(duì)某網(wǎng)絡(luò)違法人員分析進(jìn)行分析,將某網(wǎng)絡(luò)違法人員的生活關(guān)系人納入監(jiān)控中,從而挖掘出更為完整的關(guān)系人員圖譜,甚至發(fā)現(xiàn)潛在的違法關(guān)系人。

4.3 案件分類及分析

利用知識(shí)圖譜中的文本大數(shù)據(jù)分析、語義深度學(xué)習(xí)技術(shù),通過分析案情文本的特征,系統(tǒng)能夠?qū)崿F(xiàn)根據(jù)案件內(nèi)容自動(dòng)分類的功能。如將公安案件數(shù)據(jù)導(dǎo)入程序,程序會(huì)自動(dòng)將案件進(jìn)行分類。在經(jīng)過對(duì)案件分類細(xì)化的基礎(chǔ)上,可以實(shí)現(xiàn)對(duì)案情趨勢(shì)的監(jiān)控,短時(shí)間提高對(duì)案件的掌控能力。同時(shí),利用知識(shí)圖譜技術(shù)對(duì)案情描述、筆錄記錄等文本信息進(jìn)行分析,提煉多種案件的作案手法、手段等特征,并據(jù)此達(dá)到對(duì)不同類型案件串并分析的能力。

4.4 特定群體發(fā)現(xiàn)

在搭建公安知識(shí)圖譜的基礎(chǔ)上,納入公安多方面多維度的數(shù)據(jù)資源,消除公安不同部門之間的數(shù)據(jù)壁壘,打通公安各警種數(shù)據(jù)交換通道。利用知識(shí)圖譜推理分析技術(shù),能夠從大量的文本數(shù)據(jù)中分析、推理出特定的關(guān)注群體,如聚眾上訪、鄉(xiāng)村留守等群體,分析出更有價(jià)值的信息,幫助公安辦案提供更有價(jià)值的線索。

4.5 人物特性分析

利用知識(shí)圖譜可以對(duì)特定人物進(jìn)行人員背景分析,首先是針對(duì)不明身份人員,通過人員的網(wǎng)絡(luò)數(shù)據(jù)分析,獲取該人性別、年齡、經(jīng)濟(jì)情況等人員背景信息,并逐步縮小確認(rèn)人員身份的工作范圍;再次,針對(duì)已知人員,通常公安大數(shù)據(jù)的知識(shí)圖譜技術(shù)分析該人的網(wǎng)絡(luò)數(shù)據(jù)和公安數(shù)據(jù),進(jìn)而分析并預(yù)測(cè)該人的家庭情況、社交關(guān)系、隱藏關(guān)系人情況、活動(dòng)特征等特性。

4.6 熱點(diǎn)輿情發(fā)現(xiàn)

公安警務(wù)人員利用公安知識(shí)圖譜技術(shù),通過對(duì)互聯(lián)網(wǎng)輿情數(shù)據(jù)、高訪數(shù)據(jù)分析挖掘,及時(shí)獲取當(dāng)前大眾輿論信息、群眾熱點(diǎn)信息,并將預(yù)測(cè)結(jié)果推送至手持警務(wù)終端設(shè)備,讓警務(wù)人員對(duì)大眾熱點(diǎn)進(jìn)行重點(diǎn)監(jiān)控,排查治安安全隱患,降低違法犯罪事件的發(fā)生,保障人民生命和財(cái)產(chǎn)的安全。

5 結(jié)論

研究表明,基于公安大數(shù)據(jù)的知識(shí)圖譜技術(shù)能夠提升公安業(yè)務(wù)的處理能力。知識(shí)圖譜數(shù)據(jù)庫是機(jī)器大腦中的知識(shí)庫、人工智能發(fā)展的基礎(chǔ)設(shè)施,使用基于圖數(shù)據(jù)庫的混合存儲(chǔ)技術(shù)實(shí)現(xiàn)大規(guī)模知識(shí)圖譜的數(shù)據(jù)存儲(chǔ)和查詢計(jì)算系統(tǒng),能夠直觀展示數(shù)據(jù)間的直接、間接關(guān)聯(lián)。知識(shí)圖譜數(shù)據(jù)庫的多維度圖譜存儲(chǔ)、多元化檢索,更易于上層系統(tǒng)實(shí)現(xiàn)復(fù)雜的公安業(yè)務(wù)模型及人員關(guān)系的研判推理。

知識(shí)圖譜技術(shù)在公共安全方面的實(shí)用價(jià)值主要體現(xiàn)在以下三點(diǎn):

1) 知識(shí)圖譜重構(gòu)公安大數(shù)據(jù)資源,提升了公安大數(shù)據(jù)價(jià)值。通過對(duì)公安現(xiàn)有數(shù)據(jù)的分類結(jié)構(gòu),按照人物、地點(diǎn)、時(shí)間、案件(事件)、物件、機(jī)構(gòu)等幾個(gè)公安開展業(yè)務(wù)的核心要素,重構(gòu)公安大數(shù)據(jù)資源體系,構(gòu)建核心要素之間的關(guān)聯(lián)網(wǎng)絡(luò),使已有數(shù)據(jù)的發(fā)揮更大價(jià)值。

2) 幫助警察破案,提高辦事效率,降低時(shí)間和人力成本。公安大數(shù)據(jù)知識(shí)圖譜技術(shù)能夠幫助公安業(yè)務(wù)人員分析案事件信息,提取涉案的相關(guān)人物關(guān)系,分析并繪制相關(guān)人物的關(guān)系圖譜,幫助公安警務(wù)人員理清案件的前因后果,發(fā)現(xiàn)案件的關(guān)鍵線索,提高案件偵破的效率。

3) 可以優(yōu)化警力的配置,降低案發(fā)數(shù)量。公安大數(shù)據(jù)知識(shí)圖譜技術(shù),能夠展示警情發(fā)生的時(shí)間和地理空間的分布規(guī)律,利用“熱點(diǎn)識(shí)別模型”能夠快速識(shí)別出近幾天以來,警情案件突然高發(fā)的關(guān)鍵地點(diǎn)和時(shí)間區(qū)段,指導(dǎo)公安機(jī)關(guān)優(yōu)化警力調(diào)配,為企業(yè)、社區(qū)和居民營(yíng)造良好的周邊環(huán)境。

參考文獻(xiàn):

[1] 郝久月, 樊志英, 汪寧,等. 基于知識(shí)圖譜的警用安保機(jī)器人大數(shù)據(jù)分析技術(shù)研究[J]. 警察技術(shù), 2018(3):17-19.

[2] 李棟科. 基于大數(shù)據(jù)的智慧公安系統(tǒng)研究與應(yīng)用[J].網(wǎng)絡(luò)與信息安全學(xué)報(bào),2016,2(12),:63-68.

[3] 漆桂林,高桓,吳天星. 知識(shí)圖譜研究進(jìn)展[J].情報(bào)工程,2017,3(1):4-25.

[4] 郭琳,翟社平,高山. 知識(shí)圖譜中的語義推理算法[J].計(jì)算機(jī)與現(xiàn)代化,2017(12):71-76.

[通聯(lián)編輯:唐一東]

主站蜘蛛池模板: 欧美国产日韩在线观看| 欧美亚洲激情| 国产91全国探花系列在线播放| 97青草最新免费精品视频| 国产亚洲高清视频| 国产大片喷水在线在线视频| 亚洲天堂免费| 久久不卡国产精品无码| a级毛片免费看| 无码一区中文字幕| 毛片在线播放a| 亚洲黄色视频在线观看一区| 国产理论一区| 亚洲成a人在线播放www| 97视频免费在线观看| 欧美精品二区| 国产91av在线| 色网站在线免费观看| 国产导航在线| 国产成人亚洲精品蜜芽影院| 亚洲天堂区| 国产免费人成视频网| 中文字幕精品一区二区三区视频| 亚洲香蕉久久| 久久国产拍爱| 国产免费久久精品99re丫丫一| 亚洲成年网站在线观看| 天天色天天综合网| 国产亚洲高清视频| 手机在线国产精品| 欧美福利在线观看| 日本草草视频在线观看| 国产福利在线免费观看| 1级黄色毛片| 高清久久精品亚洲日韩Av| 国产黄在线免费观看| 婷婷开心中文字幕| www.亚洲天堂| 国产在线日本| 亚洲人成人伊人成综合网无码| 亚洲精品成人7777在线观看| 一级做a爰片久久毛片毛片| 欧美成人一级| 18禁黄无遮挡网站| 欧美成人午夜视频| 国产黑丝视频在线观看| 国产一级二级三级毛片| 国产黄网永久免费| 国产一级毛片yw| 国产精品污视频| 在线观看网站国产| 黄色网页在线观看| 狂欢视频在线观看不卡| 亚洲国产综合自在线另类| 国产免费怡红院视频| 免费又爽又刺激高潮网址| 欧美一级色视频| 久久国产精品影院| 国产99免费视频| 免费va国产在线观看| 成人国产精品一级毛片天堂| 三上悠亚在线精品二区| 福利一区三区| 国产麻豆精品在线观看| 国产精品视频猛进猛出| 国产亚洲一区二区三区在线| 欧美日韩久久综合| 国产成人无码Av在线播放无广告| 国产欧美日韩资源在线观看| 丝袜无码一区二区三区| 国产精品网址在线观看你懂的| 69国产精品视频免费| 国产肉感大码AV无码| 亚洲人成网线在线播放va| 日韩欧美国产中文| 成人一区专区在线观看| 欧美精品1区2区| 无码丝袜人妻| 欧美激情视频二区三区| 国产精品19p| 在线观看国产精品第一区免费| 中文字幕在线看|