摘要:現(xiàn)階段,我國各類公安信息系統(tǒng)在警察數(shù)據(jù)處理與訊問中發(fā)揮著至關(guān)重要的作用,但由于缺乏深層次的數(shù)據(jù)挖掘技術(shù)以及分析能力。因此,通過深入挖掘刑事風險模型中的決策與公安出入境數(shù)據(jù)中的關(guān)聯(lián)性規(guī)則,應當不斷探索與提取具有價值的規(guī)則和知識,從而為決策者提供重要的參考資料。
關(guān)鍵詞:數(shù)據(jù)挖掘;公安信息;關(guān)聯(lián)規(guī)則;技術(shù)應用
數(shù)據(jù)挖掘可以從大型數(shù)據(jù)庫中提取隱含的、具有潛在價值的預測知識,并根據(jù)其概念、規(guī)則和模式及時解決各種預測問題。因此,數(shù)據(jù)挖掘技術(shù)已廣泛應用在各行各業(yè)當中,但在公安行業(yè)中應用研究方面相對較少。伴隨著經(jīng)濟社會與科學技術(shù)的迅速發(fā)展,違法犯罪向著動態(tài)化、智能化與高科技方面全面發(fā)展,具有時代性特征的新犯罪手法日益顯著,比如網(wǎng)絡犯罪。怎樣將數(shù)據(jù)挖掘技術(shù)應用在公安行業(yè)中,及時發(fā)現(xiàn)全新關(guān)聯(lián)規(guī)則以及提高高效執(zhí)法和迅速反應能力,預防與打擊犯罪行為手段,已經(jīng)成為公安行業(yè)值得思考的重要問題,同時也是公安行業(yè)向著信息化建設發(fā)展的全新方向。
一、數(shù)據(jù)挖掘技術(shù)簡介
數(shù)據(jù)挖掘技術(shù)主要從大型數(shù)據(jù)庫中提取人類感興趣的知識,其知識包含著隱含的及潛在的具有價值的信息,而提取的知識主要表現(xiàn)為基本概念、規(guī)律、模式與規(guī)則等方面。因此,數(shù)據(jù)庫管理系統(tǒng)用于存儲數(shù)據(jù),以及機器學習方法用于分析數(shù)據(jù),能夠充分挖掘出大量數(shù)據(jù)背后所隱含的知識,并將兩者之間進行結(jié)合全面促進數(shù)據(jù)挖掘技術(shù)的產(chǎn)生。數(shù)據(jù)挖掘?qū)儆诮徊嫘耘c綜合性較強的學科,其主要涉及機器學習、模式識別、歸納思維、數(shù)據(jù)可視化以及高性能計算等各方面。
截止在當前,最為常見的數(shù)據(jù)挖掘任務共歸納為分類、估計、預測、關(guān)聯(lián)規(guī)則、聚類、描述以及建立簡檔等六個方面。其中分類、估計與預測前三方面需要完成定向數(shù)據(jù)挖掘任務,其目的為及時發(fā)現(xiàn)特定目標具有的變量值,同時關(guān)聯(lián)規(guī)則與聚類屬于非定向數(shù)據(jù)挖掘任務,其目的為在不限定目標變量情況下對數(shù)據(jù)結(jié)構(gòu)進行揭示與展示,最后建立簡檔既可能為定向數(shù)據(jù)挖掘任務,又可能為非定向數(shù)據(jù)挖局任務。與此同時,在數(shù)據(jù)實際挖掘過程中,其需要從以下方面深入挖掘數(shù)據(jù)問題:1)選擇準確合適數(shù)據(jù),2)創(chuàng)建模型集,3)修復數(shù)據(jù)問題,4)建立與評估模型,5)評估結(jié)果并重新開始。通過對數(shù)據(jù)挖掘基本流程進行反復訓練與進行,能夠展示出數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,并對其技術(shù)進行優(yōu)化及趨近。
二、數(shù)據(jù)挖掘技術(shù)在公安領(lǐng)域信息中的應用
(一)決策樹在犯罪風險行為中的應用
決策樹作為數(shù)據(jù)挖掘技術(shù)的分類算法,其是以實際案例為基礎的歸納學習算法,也是組無次序與無規(guī)則事例,正所謂,推理出的決策樹主要表示著分類規(guī)則,這種算法主要利用樹形結(jié)構(gòu)表現(xiàn)出決策集合,通過對數(shù)據(jù)集的分類而產(chǎn)生規(guī)則。與此同時,樹的每個節(jié)點都表示著屬性測試,其分支表示著測試的結(jié)果,每片樹葉代表著類別。所以在實際建樹過程中,需要采用剪枝方式剪去數(shù)據(jù)中的獨立點,其中決策樹最為常見的算法為ID3算法,基于信息內(nèi)容的決策分類算法,根據(jù)實際屬性選擇實際案例類別,同時該算法的核心是對決策樹各個層次的節(jié)點屬性進行選擇和分類,以確保未知數(shù)據(jù)分類的真實性以及準確性。除此之外,據(jù)實際調(diào)查分析,在實際生活中,按照公安工作經(jīng)驗能夠得出,年齡在犯罪程度分析屬于不可缺少的重要因素,其與模型結(jié)論之間存在著偏差,所以需要根據(jù)數(shù)據(jù)挖掘技術(shù)及先進算法保障其改善并完全適應公安領(lǐng)域的實際工作。
(二)關(guān)聯(lián)規(guī)則在公安出入境管理中的應用
關(guān)聯(lián)規(guī)則挖掘主要在大量數(shù)據(jù)中深入挖掘具有價值描述數(shù)據(jù)聯(lián)系的有關(guān)知識。以啤酒-尿布經(jīng)典案例為背景,當男性顧客購買尿布時,百分之三十至百分之四十男性也會購買啤酒。因此,按照常規(guī)思維模式分析,尿布和啤酒之間沒有沖突,所以利用數(shù)據(jù)挖掘技術(shù)對交易數(shù)據(jù)進行綜合分析,能夠正確揭示出其具有的價值規(guī)律。與此同時,根據(jù)實際調(diào)查分析,各類留學生主要是30歲以下的大學畢業(yè)生,受過高等教育以及有著較高的學歷,渴望達到許多發(fā)達國家的教育水平。以美國為例,由于部分學生在留學之前會參加GRE考試,而美國大學的錄取通知書往往在中國春節(jié)前后才正式發(fā)放,這也就意味著只有學生拿到錄取通知書之后才能夠申請辦理護照,但同時,每年三月份與四月份為處境旅游高峰期,這時留學生辦理出境的受理窗口總是人滿。所以這就需要深入挖掘公安出入境數(shù)據(jù),得到具有價值的規(guī)律,保障公安能夠給廣大人民群眾提供優(yōu)質(zhì)服務,從而在最大程度上為科學合理安排公安警力提供重要保障及科學依據(jù)。
三、數(shù)據(jù)挖掘技術(shù)在公安領(lǐng)域應用中的未來展望
由于當前公安業(yè)務信息系統(tǒng)具有分散與復雜性基本特點,其管理層面決策具有著廣度與深度。因此,在正式實踐過程中,需要充分利用數(shù)據(jù)倉庫以及數(shù)據(jù)挖掘技術(shù)對公安信息系統(tǒng)進行優(yōu)化,并在各方面得到有效進展與突破。
(一)交通管理的決策
交通管理作為城市管理需要解決的重點問題,伴隨著城市道路與車輛的迅速增多,傳統(tǒng)人工勞動式交通崗亭指揮已難以適應當今社會交通管理工作的需求。因此,建立健全交通管理情況數(shù)據(jù)倉庫,能夠采用數(shù)據(jù)挖掘技術(shù)以及OLAP技術(shù),對城市道路路面情況及車輛交通流量方面進行實時監(jiān)測,制定科學合理有效對策,徹底解決城市道路交通的阻塞問題,進而將其當作城市道路交通管理研究的重要方向。
(二)警力安排的決策
怎樣預防與制止突發(fā)事件的發(fā)生已經(jīng)成為各級公安機關(guān)需要考慮的重要問題之一,同時如何合理安排公安警力也需要慎重思考。因此,在當今社會治安多變的環(huán)境下,不僅需要保障社會秩序,還需要保障警力不會出現(xiàn)浪費的情況,并減少無效功勞等方面的重點工作。
(三)消防調(diào)度決策
消防工作具有很強的時間觀念,其消防調(diào)度也具有很強的科學性與合理性。因此,在消防人員、消防車輛配置以及水資源安排過程中,需要對城市道路最佳路線選擇方式等方面提供可靠及可深入挖掘的信息內(nèi)容。
結(jié)束語:綜上所述,在經(jīng)濟社會迅速發(fā)展過程中,充分利用數(shù)據(jù)倉庫及數(shù)據(jù)挖掘技術(shù)在公安領(lǐng)域中應用,全面實現(xiàn)信息資源共享以及綜合利用,發(fā)揮出數(shù)據(jù)挖掘技術(shù)優(yōu)勢,發(fā)現(xiàn)其信息數(shù)據(jù)隱含著內(nèi)在聯(lián)系價值以及關(guān)聯(lián)性規(guī)則,進而為公安信息工作提供優(yōu)質(zhì)服務。與此同時,數(shù)據(jù)挖掘技術(shù)屬于新興科學,其主要適合應該用在公安犯罪分析與犯罪行為中,并成為公安工作現(xiàn)實性斗爭的實際需求。基于此,文章主要全面分析數(shù)據(jù)挖掘技術(shù)在公安領(lǐng)域的應用優(yōu)勢及作用,針對存在的問題進行簡要分析,以實際案例為背景,充分發(fā)揮分類規(guī)則算法在公安行業(yè)實際工作中的作用及重要性,對其進行深入研究與探討,從而在最大程度上保障數(shù)據(jù)挖掘技術(shù)以及分類規(guī)則算法廣泛應用在各行各業(yè)當中。
參考文獻:
[1]魏文燕,呂鑫,高琰.挖掘技術(shù)在公安領(lǐng)域案件分析中的應用[J].湖南警察學院學報,2020,29(03):98-104.DOI:10.14097/j.cnki.5392/2020.21.052.
[2]高毅超,王凡,郭晶.數(shù)據(jù)挖掘技術(shù)在公安領(lǐng)域中的應用概況[J].湖南學院,2020,35(07):182-185.DOI:10.16808/j.cnki.issn1003-7705.2020.07.075.
[3]郭亮山.淺談數(shù)據(jù)挖掘技術(shù)在公安領(lǐng)域中的應用[J].福建警察學院學報,2021(04):32-36.
作者簡介:韓宇,男,1982年出生,本科,高級程序員、項目經(jīng)理,研究方向:聯(lián)網(wǎng)技術(shù)開發(fā)、運維等。