胡素夢
黑龍江大學法學院,黑龍江 哈爾濱 150080
熱點分析是根據歷史犯罪數據,確定犯罪率較高的地區。這一分析的理論假設是犯罪會發生在犯罪發生過的地方。在熱點分析中,熱點的范圍需要進行權衡,如果范圍過大,可能會導致分析結果無法應用,如果范圍過小,就可能會漏掉一些相關的地點。只有在一個較為合理的范圍內,數據才能得到充分的運用。
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法。回歸分析的運用非常廣泛。與熱點分析不同,回歸分析除了歷史犯罪數據之外,會用到更多的相關數據。這里的犯罪數據不僅局限于公安機關的大數據,其他司法機關、國家安全機關、政府機關等的數據都可以應用到基于大數據的犯罪預測回歸分析中,曾有研究將“天氣狀況”作為變量,探討其對犯罪的影響。
隨著計算機計算速度的加快,能夠在短時間內處理大量的數據,使用超線性回歸的數據挖掘得以發展。數據挖掘并沒有單一的核心技術,相反,數據挖掘應該被看作是從大量數據中提取信息的一套工具。數據挖掘中使用的具體計算技術取決于被分析數據的性質。在犯罪預測中,通常會選擇大量的變量,用極其復雜的算法進行預測,這種方法被叫做“黑盒模型”,雖然運算所用時間很長,但比簡單的方法更加準確。
風險地形分析包括一系列技術:首先要試圖識別有助于犯罪風險的地理特征。其次,基于如何對犯罪風險進行預測給定位置的距離就是這些風險誘發特征。從警務人員的角度來看,風險地形模型的輸出將會在性質上與熱點方法的定性相同:都強調在不久的將來有可能遭受高額犯罪的地區。風險地形建模是一種分類方法,它根據地理特征描述了一個地區的犯罪風險。[1]
基于大數據的犯罪預測,可以用于驗證犯罪學理論。也可以豐富犯罪學理論。對于犯罪學理論,與其說是挑戰,不如說是發展的機遇。
美國已經把這些方法運用在了預測警務中,結果十分令人滿意。在孟菲斯市區,一個名為“藍色粉碎(Blue CRUSH)”的項目,為警察局提供報告,這一項目幫助當地警局更好地分配警力資源,至今為止,孟菲斯市區的犯罪率下降了26%。[2]2011年,明尼蘇達州的警局投資建立了一個情報中心,這一情報中心利用微型熱點的方法進行犯罪于此,據報道,這種資源進一步增強了城市認識和應對重大事件的能力。預測警務的成功離不開犯罪預測的支撐。
在我國,北京市懷柔公安局自2013年起,開始運行“犯罪數據分析和趨勢預測系統”懷柔,這套系統共收錄了1.6萬余件犯罪案件數據,通過標準化分類后導入系統數據庫,同時采用地圖標注,將懷柔分成16個警務轄區,抓取4700余個犯罪空間坐標實施空間網格編號,通過多種預測模型,自動預測未來某段時間、某個區域可能發生犯罪的概率以及犯罪的種類。
基于大數據的犯罪預測的發展方興未艾,十分具有生命力,它的優勢是十分顯著的。首先,基于大數據的犯罪預測有助于我們理解現在和預見未來的風險。傳統的犯罪預測,依靠研究者或者警察的經驗判斷,而人的經驗判斷難免會受到自身偏見的影響。基于大數據的犯罪預測,可以免除這些偏見的影響,也可以驗證以往的經驗是否正確。其次,諸多進行犯罪預測的方法可以進行組合,相互驗證,尋找最優解,這能使預測的結果更加精確,以便于更好地指導實踐。最后,這種犯罪預測具有便捷高效的特點,利用大數據技術可以提高犯罪預測的準確性,綜合考慮各個因素的相關性,多角度預測犯罪,并且主動進行干預,進而實現犯罪的預防。
大數據作為一項新興的技術,仍然有很大的發展空間。對于大數據的熱潮,我們要有一個科學審慎的態度。首先,通過大數據的犯罪預測不能直接判斷因果關系,如果要尋找因果關系,仍然需要大量的人力來進行分析。其次,基于大數據的犯罪預測,在某種程度上威脅了個人隱私和個人自由,這需要在數據來源和數據保護上多做努力。最后,在大數據的犯罪預測研究中,非常容易出現“受限于研究結果”“執迷數據”的傾向[3],有一些信息是不容易被量化的,在研究中,必須要注意到那些信息,將大數據運用于犯罪預測中,并不是為了數據而數據,而是要以犯罪預測理論為依托,將大數據進行合理的加工利用,這樣才能使大數據變成強大的武器。