牟小彬,李睿麟,程衛國
?
基于決策樹分析的激光打印文件黑色墨跡量化分析研究
牟小彬,李睿麟,程衛國
(上海市公安局,上海 200083)
摘要:目的 研究利用圖像掃描分析系統量化分析激光打印文件黑色墨跡的方法,優選可用于打印機種類區分的量化參數。方法 使用圖像掃描分析系統,采用每英寸800像素點的分辨率,對市場上9個主流品牌18種型號共18臺激光打印機360頁打印樣本的面積、周長、灰度等特征進行整幅測量。通過決策樹C4.5算法建立數學模型,對測量所得參數值進行數據分析。結果 發現閾值分別設置為80、117、128、160時,測量所得的29項參數116組測量數值中閾值為128的中位灰度值,閾值為80的灰度眾數值,閾值為117、最小測量面積為1的字塊面積標準差,閾值為80的面積比值,閾值為160、最小測量面積為1的字塊面積標準差,閾值為80的中位灰度值,閾值為80、最小測量面積為1的字塊圓度標準差,閾值為128的對稱分布值,閾值為117的面積比值,閾值為160的中位灰度值,閾值為117、最小測量面積為1的字塊圓度平均值等11組參數組合能夠將樣本正確區分。結論 不同種類激光打印機打印樣本在上述11組參數所衡量的灰度、面積、圓度、打印墨跡數量等特征及特征的組合上存在差別,通過量化方法區分激光打印機打印樣本具有可行性。
關鍵詞:文件檢驗;激光打印;量化分析;決策樹
激光打印文件的量化分析檢驗一直是個難點。不同種類激光打印機由于制造工藝的差異,打印文件在墨跡的灰度、打印線條的粗細和粗糙程度、筆畫周圍散落墨粉點的數量等方面存在差別,如何通過量化的方法表現這些特征的差異,以區分不同種類的激光打印機打印文件,成為亟待解決的問題。……