999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

可見-近紅外高光譜圖像技術(shù)快速鑒別激光打印墨粉

2017-06-01 11:29:34猛,思*,
發(fā)光學(xué)報(bào) 2017年5期
關(guān)鍵詞:分類方法模型

劉 猛, 申 思*, 王 楠

(1. 文件檢驗(yàn)鑒定公安部重點(diǎn)實(shí)驗(yàn)室(中國(guó)刑警學(xué)院), 遼寧 沈陽(yáng) 100035;2. 浙江警察學(xué)院 刑事科學(xué)技術(shù)系, 浙江 杭州 310053; 3. 司法部司法鑒定科學(xué)技術(shù)研究所, 上海 200063)

可見-近紅外高光譜圖像技術(shù)快速鑒別激光打印墨粉

劉 猛1,2, 申 思1,2*, 王 楠3*

(1. 文件檢驗(yàn)鑒定公安部重點(diǎn)實(shí)驗(yàn)室(中國(guó)刑警學(xué)院), 遼寧 沈陽(yáng) 100035;2. 浙江警察學(xué)院 刑事科學(xué)技術(shù)系, 浙江 杭州 310053; 3. 司法部司法鑒定科學(xué)技術(shù)研究所, 上海 200063)

為了使用快速、無損的方法區(qū)分激光打印文件使用的墨粉種類,利用高光譜成像技術(shù)結(jié)合化學(xué)計(jì)量法對(duì)6種激光打印墨粉的光譜數(shù)據(jù)進(jìn)行建模和種類鑒別的研究。利用可見-近紅外高光譜成像儀采集400~1 000 nm波段內(nèi)的光譜數(shù)據(jù),采用Savitzky Golay 平滑、標(biāo)準(zhǔn)化、多元散射校正和標(biāo)準(zhǔn)正態(tài)變量變換4種方法分別對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,而后分別建立隨機(jī)森林(RF)、K最近鄰(KNN)、支持向量機(jī)(SVM)、偏最小二乘判別分析(PLS-DA)和簇類獨(dú)立軟模式(SIMCA)模型,進(jìn)而實(shí)現(xiàn)激光打印墨粉的種類鑒別。利用準(zhǔn)確率、拒識(shí)率和誤識(shí)率3個(gè)指標(biāo)作為模型評(píng)價(jià)標(biāo)準(zhǔn)。實(shí)驗(yàn)結(jié)果顯示,SVM和PLS-DA模型的效果最佳,準(zhǔn)確率為100%,拒識(shí)率和誤識(shí)率為0。基于可見-近紅外高光譜成像技術(shù)可以實(shí)現(xiàn)激光打印墨粉的快速種類鑒別。

高光譜圖像; 墨粉種類鑒別; 化學(xué)計(jì)量法; 支持向量機(jī); 偏最小二乘判別分析

1 引 言

近年來,計(jì)算機(jī)技術(shù)和電子化辦公的全面推廣大大提升了打印文件在社會(huì)生活中的使用頻率,刑事案件與民事糾紛中涉及打印文件的情況也與日俱增。印刷技術(shù)的不斷發(fā)展致使偽造打印文件的成本明顯降低,仿真程度卻逐步提升,鑒別難度也不斷增大。因此,偽造打印文件的案件數(shù)目不斷攀升,造假的對(duì)象包括商業(yè)合同、銀行票據(jù)、證件門票等,對(duì)社會(huì)經(jīng)濟(jì)活動(dòng)造成極大的危害。

激光打印墨粉的種類鑒別是變?cè)煳募蛡卧煳募z驗(yàn)的主要方法之一,也是近年來文件檢驗(yàn)學(xué)者的研究熱點(diǎn)。許可等[1]利用激光顯微拉曼光譜儀對(duì)30種激光打印墨粉進(jìn)行區(qū)分,最終將其分為5大類。張清華等[2]采用主成分分析和系統(tǒng)聚類法對(duì)31種墨粉的紅外光譜進(jìn)行聚類分析與建模,基于前兩個(gè)主成分的墨粉樣本聚類效果明顯,同時(shí)在第三主成分方向上黑白與彩色激光墨粉樣本獲得良好的區(qū)分。羅儀文等[3]使用激光剝蝕電感耦合等離子體質(zhì)譜剝蝕墨跡并檢測(cè)18種元素的信號(hào),將24個(gè)樣品區(qū)分為15類,區(qū)分率為94.6%。上述文獻(xiàn)雖已取得了相應(yīng)成果,但大都是把墨粉分為若干個(gè)大類,無法做到細(xì)致、精確的區(qū)分。

高光譜圖像技術(shù)集光譜檢測(cè)和圖像檢測(cè)于一體,再結(jié)合化學(xué)計(jì)量法,能夠全面而有效地分析光譜信息,目前已經(jīng)廣泛應(yīng)用于農(nóng)產(chǎn)品和食品檢測(cè)[4-7]等諸多領(lǐng)域。至于文件檢驗(yàn)領(lǐng)域,已經(jīng)有國(guó)外學(xué)者發(fā)表了相關(guān)成果。

Brauns運(yùn)用傅里葉變換的高光譜圖像進(jìn)行添改文件檢驗(yàn),準(zhǔn)確識(shí)別了紅、黑、藍(lán)三色圓珠筆書寫的添改字跡[8]。Gal等[9]運(yùn)用可見-紅外高光譜儀對(duì)19種不同牌型號(hào)的黑色噴墨墨水進(jìn)行種類鑒別,使用主成分分析法提取光譜特征,并根據(jù)第一、二主成分權(quán)重將墨粉分為幾個(gè)大類。Khan等[10]指出常規(guī)的主成分分析法在油墨光譜種類鑒別方面的應(yīng)用效果不夠理想,因此在此基礎(chǔ)上提出了改進(jìn)后的稀疏主成分分析法,用于區(qū)分藍(lán)色、黑色圓珠筆油墨,準(zhǔn)確率較常規(guī)的主成分分析提高了15%。

由此可知,當(dāng)前雖然已經(jīng)有學(xué)者利用高光譜圖像技術(shù)鑒別打印墨粉的種類,但僅使用了主成分分析法提取光譜特征,并沒有結(jié)合化學(xué)計(jì)量法,實(shí)驗(yàn)結(jié)果也不夠精確。因此本文運(yùn)用高光譜圖像技術(shù),結(jié)合化學(xué)計(jì)量法,嘗試對(duì)6種激光打印墨粉進(jìn)行種類鑒別,獲得了較為精確的分類結(jié)果。

2 材料與方法

2.1 材料

我們收集了市場(chǎng)常見的3個(gè)品牌共計(jì)6種不同型號(hào)的激光打印機(jī),均隨機(jī)配置原裝黑色硒鼓或墨盒,打印機(jī)和墨粉型號(hào)見表1,統(tǒng)一使用銀河瑞雪80 g/m2復(fù)印紙,黑白打印。設(shè)計(jì)包含中文、數(shù)字和標(biāo)點(diǎn)符號(hào)的樣本文檔,每臺(tái)激光打印機(jī)需打印30份該文檔作為實(shí)驗(yàn)樣本。為保證樣本的隨機(jī)性和連續(xù)性,樣本的收集工作分6次完成,每次每臺(tái)打印機(jī)打印5份樣本,每批樣本的打印間隔為一周,歷時(shí)5周,共收集到180張實(shí)驗(yàn)樣本。

表1 激光打印機(jī)信息列表

2.2 高光譜圖像數(shù)據(jù)采集

高光譜圖像采集系統(tǒng)主要包括可見-近紅外成像光譜儀(HyperSpec VNIR)、CCD鏡頭、150 W鹵素?zé)艉途€性控制臺(tái)。光譜范圍為400~1 000 nm,光譜分辨率為1.23 nm,共計(jì)488個(gè)波段;掃描次數(shù)為20次,曝光時(shí)間為4 ms,線性控制臺(tái)移動(dòng)速度為3.72 mm/s。

為了消除系統(tǒng)光源強(qiáng)度分布不均勻造成的噪聲和暗電流噪聲,需要對(duì)光譜數(shù)據(jù)進(jìn)行黑白標(biāo)定[11]。采集標(biāo)定白板的反射光譜W和暗電流反射光譜D,帶入公式(1):

(1)

其中I是原始數(shù)據(jù),R為標(biāo)定后的高光譜數(shù)據(jù)。完成黑白標(biāo)定后,從每一份樣本中提取尺寸為450 mm×490 mm的感興趣區(qū)(ROI),并利用掩膜分割前景(文字)和背景(白紙)圖像,僅提取ROI內(nèi)文字部分的平均光譜曲線,即為該樣本的墨粉光譜曲線。每類墨粉有30份樣本,其中25份作為訓(xùn)練集數(shù)據(jù),5份作為預(yù)測(cè)集數(shù)據(jù),最終得到150個(gè)訓(xùn)練集數(shù)據(jù),30個(gè)預(yù)測(cè)集數(shù)據(jù)。

2.3 光譜預(yù)處理

正式開始高光譜數(shù)據(jù)分析之前,還應(yīng)考慮實(shí)驗(yàn)樣本表面不均引起的散射現(xiàn)象、暗電流和儀器噪聲引起的光譜曲線不重復(fù)現(xiàn)象和基線漂移現(xiàn)象,以及不同樣本成分之間相互干擾引起的背景因數(shù)和多重共線性等無用信息對(duì)光譜曲線的影響[12]。為了達(dá)到較好的種類鑒別模型,需要使用光譜預(yù)處理技術(shù)消除以上不良影響。本文利用Unscrambler 9.7 (CAMO, Norway)軟件,對(duì)樣本的光譜曲線分別進(jìn)行了Savitzky Golay 平滑(S.G Smooth)、標(biāo)準(zhǔn)化(Normalize)、多元散射校正(MSC)和標(biāo)準(zhǔn)正態(tài)變量變換(SNV)4種預(yù)處理,具體結(jié)果和性能比較見下文。

2.4 建模方法

針對(duì)實(shí)驗(yàn)樣本的光譜數(shù)據(jù),分別建立隨機(jī)森林模型(Random Forest, RF)[13-15]、K最近鄰模型(K-Nearest Neighbor, KNN)[16]、支持向量機(jī)模型(Support Vector Machine, SVM)[17-19]、偏最小二乘判別分析模型(Partial Least Square-discrimination Analysis, PLS-DA)[20]和簇類獨(dú)立軟模式模型(Soft independent modeling of class analogy, SIMCA)[21-22]。其中,PLS-DA算法在SIMCA-P 11.5 (Umetrics AB)軟件中實(shí)現(xiàn),其他算法通過 Matlab R2010 (Mathworks, USA)平臺(tái)中的自編代碼實(shí)現(xiàn)。

3 實(shí)驗(yàn)結(jié)果與討論

3.1 光譜數(shù)據(jù)預(yù)處理

光譜數(shù)據(jù)預(yù)處理的方法有許多,但是針對(duì)不同的光譜采集對(duì)象和建模方法,各種預(yù)處理方法的效果也不盡相同。本文選擇S.G Smooth、MSC、SNV和Normalize 4種預(yù)處理方法,分別對(duì)樣本的光譜數(shù)據(jù)進(jìn)行預(yù)處理操作。

出于優(yōu)化模型性能的目的,我們使用選定的5種建模方法,分別依據(jù)未經(jīng)預(yù)處理的原始光譜數(shù)據(jù)和4種預(yù)處理方法處理后的數(shù)據(jù)建模,將分類結(jié)果的準(zhǔn)確率作為評(píng)價(jià)標(biāo)準(zhǔn)。具體數(shù)據(jù)記錄于表2,每列的最大值加粗顯示。

表2 光譜數(shù)據(jù)預(yù)處理方法的性能比較

對(duì)于RF、KNN和SIMCA 3種模型,光譜數(shù)據(jù)的預(yù)處理能夠在不同程度上優(yōu)化分類結(jié)果:MSC和SNV的原理近似,二者處理后的數(shù)據(jù)均取得了相同的結(jié)果;Normalize方法與SNV的區(qū)別在于前者是基于光譜陣列來對(duì)一組光譜進(jìn)行處理,而后者是基于光譜陣行對(duì)一條光譜進(jìn)行處理,大多數(shù)情況下,后者的效果更好。

但是對(duì)于SVM和PLS-DA分類器,原始光譜數(shù)據(jù)的分類結(jié)果明顯優(yōu)于MSC、SNV和Normalize處理后的數(shù)據(jù)而稍遜于S.G Smooth方法,該方法是以上兩種分類器的最佳預(yù)處理方法。

總之,對(duì)于不同的分類器,光譜數(shù)據(jù)是否需要預(yù)處理、適合哪種預(yù)處理方法等問題,答案均不一致。因此應(yīng)普遍嘗試各種預(yù)處理方法,用以構(gòu)造性能最佳的分類模型。

3.2 模型的建立與評(píng)價(jià)標(biāo)準(zhǔn)

3.2.1 隨機(jī)森林模型的建立

隨機(jī)森林的基本思想是基于Bootstrap法每次隨機(jī)抽取相同數(shù)量的樣本,構(gòu)成n個(gè)訓(xùn)練集S1,S2,…,Sn,分別對(duì)應(yīng)生成n棵決策樹C1,C2,…,Cn,每棵樹都從M維輸入數(shù)據(jù)中隨機(jī)選取m(m?M)維數(shù)據(jù),確定最佳分裂點(diǎn)。每棵樹盡可能地生長(zhǎng),最終采用投票制決定分類結(jié)果。在該模型建立過程中,通過計(jì)算袋外錯(cuò)誤率(Out-of-bag error)確定生成樹的數(shù)量n=50;m的取值通常是M的因數(shù),通過遍歷法發(fā)現(xiàn),m=69時(shí)模型效果最佳。

3.2.2KNN模型的建立

KNN算法認(rèn)為如果一個(gè)樣本在特征空間中的k個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別。因此,k值的確定是建模的核心問題。由于該算法的運(yùn)算速度較快,因此同樣選擇了遍歷法,k=5時(shí)獲得最佳模型。

3.2.3SVM模型的建立

SVM算法在解決非線性、小樣本及在高維模式識(shí)別中表現(xiàn)出特有優(yōu)勢(shì),近年來受到諸多關(guān)注,也在不斷發(fā)展。對(duì)于非線性問題,需要借助核技巧,通過一個(gè)非線性變換將輸入空間對(duì)應(yīng)于特征空間,使得輸入空間中的超曲面模型對(duì)應(yīng)于特征空間中的超平面模型,從而在特征空間中求解線性支持向量機(jī)就可以完成分類[23],此時(shí)的優(yōu)化函數(shù)為:

(2)

(3)

(4)

其中K(xi,xj)是核函數(shù);C是懲罰因子,用于實(shí)現(xiàn)算法復(fù)雜度和錯(cuò)分樣本的比例的折中。常用的核函數(shù)包括線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)以及Sigmoid核函數(shù),每個(gè)核函數(shù)都有核參數(shù)g。SVM模型的優(yōu)劣,直接取決于懲罰參數(shù)C和核參數(shù)g的選擇。本文采用了網(wǎng)格搜索法[24],初步搜索范圍是:

(5)

其中k∈[-5,20],l=[3,-20],結(jié)合V重交叉驗(yàn)證,尋找最佳參數(shù)。實(shí)驗(yàn)結(jié)果證明,確定各類核函數(shù)的最佳參數(shù)后,線性核函數(shù)的分類效果明顯優(yōu)于其他核函數(shù),相應(yīng)的參數(shù)為C=220,g=2-4。

3.2.4 PLS-DA模型的建立

PLS-DA算法是基于PLS方法建立的樣本分類變量與光譜特征間的回歸模型。首先按照樣本實(shí)際類別特征賦予校正集樣本的分類變量值,再利用PLS回歸方法對(duì)校正集樣本的光譜與樣本對(duì)應(yīng)的分類變量進(jìn)行回歸分析,建立光譜特征與分類變量間的PLS模型。對(duì)于K類分類問題,每個(gè)樣本的判別結(jié)果包含K個(gè)0~1之間的數(shù)值,對(duì)應(yīng)每個(gè)類別;待分類樣本屬于判別結(jié)果大于閾值cut-offvalue的類。由此可知,預(yù)測(cè)集樣本的判別結(jié)果并非只有一類,也可能同時(shí)被歸為多個(gè)類別,或不屬于任何類別,這類模型被稱為多類方法根據(jù)實(shí)驗(yàn),cut-offvalue取值0.5時(shí),模型R2Y值為0.957,Q2值為0.849,說明模型的吻合度和預(yù)測(cè)能力都達(dá)到較高的水平。

圖1PLS-DA三維分布圖。(a)全部樣本的PC1、PC2、PC3分布圖;(b)S1、S5樣本的PC1、PC2、PC3分布圖;(c)S2、S3、S4樣本的PC1、PC2、PC4分布圖。

Fig.1PLS-DA3Dscatterplots. (a)ScatterplotsonPC1,PC2andPC3ofallthesamples. (b)ScatterplotsonPC1,PC2andPC3ofS1andS5. (c)ScatterplotonPC1,PC2andPC4ofS2,S3andS4. (Multi-classesmethod)。

圖1是PLS-DA模型的三維權(quán)重分布圖,其中半透明圓球?yàn)槟P偷?5%置信區(qū)間。圖1(a)是全部樣本在PC1-PC3方向上的分布,大致分為3簇:S6、S1-S5、S2-S3-S4。S6樣本的分布稍顯零散,部分樣本處于置信區(qū)間外,但仍與其他樣本的距離較遠(yuǎn),不妨礙樣本的種類區(qū)分。由圖1(a)可知,3簇樣本間的距離較遠(yuǎn),容易區(qū)分。若坐標(biāo)系中僅顯示S1和S5樣本,結(jié)果見圖1(b),可知二者基本可被區(qū)分,但有個(gè)別S5樣本混入S1區(qū)域內(nèi),可能造成混淆。圖1(c)是S2、S3、S4樣本在PC1、PC2和PC4上的分布,3類樣本基本可以被區(qū)分,但是S2與S3分類邊界稍模糊,可能造成混淆。

3.2.5SIMCA模型的建立

SIMCA方法也是多類方法,基本原理是針對(duì)每個(gè)類進(jìn)行獨(dú)立的主成分分析,采用交叉驗(yàn)證的預(yù)測(cè)殘差平方和(PRESS)值選擇主成分,建立主成分回歸模型,然后依據(jù)模型對(duì)未知樣本分類。實(shí)驗(yàn)證明,顯著性水平(Significancelevel)為10%時(shí),模型效果達(dá)到最佳。

圖2 各主成分模型間的距離。(a)各模型與P1模型的距離;(b)各模型與P2模型的距離。

Fig.2DistancebetweenPCAmodels. (a)DistancewithmodelP1. (b)DistancewithmodelP2.

圖2是各類墨粉的主成分模型之間的距離,可視為不同種墨粉之間的區(qū)分度,數(shù)值越大說明二者越容易區(qū)分。圖2(a)以S1模型為參照,可知S4與S1之間差別最大,但S5和S1的距離較小;圖2(b)以S2模型為參照,可知與S2最接近的模型是S3。比較圖1和圖2,可以發(fā)現(xiàn)二者表達(dá)的信息可以相互印證。

3.2.6 模型評(píng)價(jià)標(biāo)準(zhǔn)

基于以上5種模型,我們選擇準(zhǔn)確率(Accuracy)、拒識(shí)率(Falserejectrate)和誤識(shí)率(Falseacceptrate)作為模型評(píng)價(jià)依據(jù)。準(zhǔn)確率是通過判別模型將預(yù)測(cè)集中a類樣本準(zhǔn)確判別為a類的概率,拒識(shí)率是未能將a類樣本判別為a類的概率,誤識(shí)率是將其他類樣本錯(cuò)誤識(shí)別成a類的概率。其中準(zhǔn)確率越接近100%,拒識(shí)率和誤識(shí)率越接近0,模型的性能越好。

3.3 激光打印墨粉光譜數(shù)據(jù)分類結(jié)果

為了建立墨粉光譜曲線與墨粉種類之間的關(guān)系,我們分別建立了RF、KNN、SVM、PLS-DA和SIMCA模型,并運(yùn)用準(zhǔn)確率、拒識(shí)率和誤識(shí)率3個(gè)參數(shù)分析判別結(jié)果。前文提到每類墨粉采集了30份光譜數(shù)據(jù)樣本,每次建模時(shí)都從中隨機(jī)抽取25份作為建模集,剩余5份作為預(yù)測(cè)集。照此方案,5種分類算法均運(yùn)行40次,所有結(jié)果的平均值作為該方法分類能力的體現(xiàn),具體數(shù)據(jù)記錄于表3。

RF、KNN和SVM均屬于單一類別(Single-class)分類器,錯(cuò)誤分類的樣本既是被拒識(shí),又是被誤識(shí),因此拒識(shí)率等于誤識(shí)率。通過表3的數(shù)據(jù)可知,RF模型的準(zhǔn)確率雖已達(dá)到90%,但仍是5種分類模型中表現(xiàn)最差者。KNN模型性能略優(yōu)于RF,但是不如SVM和PLS-DA——準(zhǔn)確率均為100%,而且拒識(shí)率和誤識(shí)率均為0。

PLS-DA和SIMCA作為多類模型,拒識(shí)率和誤識(shí)率則不一定相同。比較二者的分類結(jié)果,可知雖然SIMCA的準(zhǔn)確率較之RF和KNN有顯著提高,但是誤識(shí)率與RF相同。這與SIMCA的建模方法有關(guān)——對(duì)于多維數(shù)據(jù),不同類別的子空間非常接近,形成不必要的重疊(Overlapping),導(dǎo)致一個(gè)樣本被同時(shí)判定為幾類墨粉。

錯(cuò)分樣本原本歸屬的類別與分類器給出的類別為易混淆墨粉類別。表3中的記錄說明RF、KNN和SIMCA分類器錯(cuò)分的樣本均集中在S1-S5和S2-S3之間,與PLS-DA模型和SIMCA模型展示的結(jié)果吻合,更進(jìn)一步說明了以上兩組樣本的高光譜數(shù)據(jù)特征較為接近,區(qū)分難度大于其他種類。其中S1、S2和S3均是佳能LBP系列打印機(jī)原裝墨粉,而S5是惠普5100原裝墨粉。由此可知不同品牌的激光打印墨粉也有可能具備相似的光譜屬性,因此在文件檢驗(yàn)鑒定工作中,打印機(jī)品牌不足以也不應(yīng)該作為區(qū)分墨粉種類的依據(jù)。

表3 激光打印墨粉光譜預(yù)測(cè)集分類結(jié)果

4 結(jié) 論

利用高光譜圖像技術(shù),結(jié)合化學(xué)計(jì)量法,能夠有效完成激光打印墨粉的種類鑒別。通過高光譜成像儀提取400~1 000nm波段的光譜信息,并據(jù)此建立了RF、KNN、SVM、PLS-DA和SIMCA統(tǒng)計(jì)模型,取得了較為理想的分類結(jié)果。比較分析結(jié)果表明,SVM和PLS-DA模型的效果最佳,準(zhǔn)確率為100%,拒識(shí)率和誤識(shí)率為0;SIMCA、KNN和RF的效果依次變差。

為了最大程度地優(yōu)化分類模型,建模之前需要通過實(shí)驗(yàn)確定是否需要進(jìn)行光譜數(shù)據(jù)預(yù)處理以及應(yīng)當(dāng)選擇何種預(yù)處理方法。

對(duì)于成分接近、光譜屬性相似的激光打印墨粉,利用高光譜數(shù)據(jù)分類時(shí)仍有可能出現(xiàn)混淆的現(xiàn)象,該問題的解決方法有待進(jìn)一步探索。

[1] 許可, 梁魯寧, 連園園. 線聚焦顯微激光拉曼光譜技術(shù)區(qū)分激光打印墨粉 [J]. 中國(guó)司法鑒定, 2011(2):27-30. XU K, LIANG L N, LIAN Y Y. Classification toners of laser printers with micro Raman spectroscopy [J].Chin.J.ForensicSci., 2011(2):27-30. (in Chinese)

[2] 張清華, 楊旭, 羅儀文, 等. 紅外光譜結(jié)合化學(xué)計(jì)量學(xué)方法在激光打印原裝黑色墨粉分析中的應(yīng)用研究 [J]. 中國(guó)司法鑒定, 2014(5):28-33. ZHANG Q H, YANG X, LUO Y W,etal.. Analysis of original black toner of laser printers by infrared spectroscopy coupled with chemometrics [J].Chin.J.ForensicSci., 2014(5):28-33. (in Chinese)

[3] 羅儀文, 徐徹, 張清華, 等. LA-ICP-MS對(duì)激光打印原裝黑色墨粉元素成分的分析 [J]. 中國(guó)司法鑒定, 2015(1):27-32. LUO Y W, XU C, ZHANG Q H,etal.. Discrimination of original black toner by laser ablation inductively coupled plasma mass spectrometry [J].Chin.J.ForensicSci., 2015(1):27-32. (in Chinese)

[4] 馮愈欽, 吳龍國(guó), 何建國(guó), 等. 基于高光譜成像技術(shù)的長(zhǎng)棗不同保藏溫度的可溶性固形物含量檢測(cè)方法 [J]. 發(fā)光學(xué)報(bào), 2016, 37(8):1014-1022. FENG Y Q, WU L G, HE J G,etal.. Detection method of soluble solid of jujube at different preservative temperature based on hyper-spectral imaging technology [J].Chin.J.Lumin., 2016, 37(8):1014-1022. (in Chinese)

[5] 劉燕德, 鄧清. 基于高光譜成像技術(shù)的臍橙葉片的葉綠素含量及其分布測(cè)量 [J]. 發(fā)光學(xué)報(bào), 2015, 36(8):957-961. LIU Y D, DENG Q. Measurement of chlorophyll distribution in navel orange leaves based on hyper-spectral imaging technique [J].Chin.J.Lumin., 2015, 36(8):957-961. (in Chinese)

[6] 吳龍國(guó), 何建國(guó), 劉貴珊, 等. 基于NIR高光譜成像技術(shù)的長(zhǎng)棗蟲眼無損檢測(cè) [J]. 發(fā)光學(xué)報(bào), 2013, 34(11):1527-1532. WU L G, HE J G, LIU G S,etal.. Non-destructive detection of insect hole in jujube based on near-infrared hyperspectral imaging [J].Chin.J.Lumin., 2013, 34(11):1527-1532. (in Chinese)

[7] 鮑一丹, 陳納, 何勇, 等. 近紅外高光譜成像技術(shù)快速鑒別國(guó)產(chǎn)咖啡豆品種 [J]. 光學(xué) 精密工程, 2015, 23(2):349-355. BAO Y D, CHEN N, HE Y,etal.. Rapid identification of coffee bean variety by near infrared hyperspectral imaging technology [J].Opt.PrecisionEng., 2015, 23(2):349-355. (in Chinese)

[8] BRAUNS E B, DYER R B. Fourier transform hyperspectral visible imaging and the nondestructive analysis of potentially fraudulent documents [J].Appl.Spect., 2006, 60(8):833-840.

[10] KHAN Z, SHAFAIT F, MIAN A. Automatic ink mismatch detection for forensic document analysis [J].PatternRecognit., 2015, 48(11):3615-3626.

[11] EDELMAN G J, GASTON E, VAN LEEUWEN T G,etal.. Hyperspectral imaging for non-contact analysis of forensic traces [J].ForensicSci.Int., 2012, 223(1-3):28-39.

[12] RINNAN ?, VAN DEN BERG F, ENGELSEN S B. Review of the most common pre-processing techniques for near-infrared spectra [J].TrACTrendsAnalyt.Chem., 2009, 28(10):1201-1222.

[13] BREIMAN L. Random forests [J].Mach.Learn., 2001, 45(1):5-32.

[14] BREIMAN L, CUTLER A. Random forests [EB/OL]. (2004-06-06) [2016-04-15]. http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm.

[15] LIAW A, WIENER M. Classification and regression by random forest [J].RNews, 2002, 2-3:18-22.

[16] GUO G D, WANG H, BELL D,etal..KNNModel-basedApproachinClassification[M]. Berlin Heidelberg: Springer, 2003:986-996.

[17] DEVOS O, RUCKEBUSCH C, DURAND A,etal.. Support vector machines (SVM) in near infrared (NIR) spectroscopy: focus on parameters optimization and model interpretation [J].Chemom.Intell.Labor.Syst., 2009, 96(1):27-33.

[18] BELOUSOV A I, VERZAKOV S A, VON FRESE S J. A flexible classification approach with optimal generalisation performance: support vector machines [J].Chemom.Intell.Labor.Syst., 2002, 64(1):15-25.

[19] SANTOS F, GUYOMARC'H P, BRUZEK J. Statistical sex determination from craniometrics: comparison of linear discriminant analysis, logistic regression, and support vector machines [J].ForensicSci.Int., 2014, 245:204.e1-e8.

[20] BARKER M, RAYENS W. Partial least squares for discrimination [J].J.Chemom., 2003, 17(3):166-173.

[21] WOLD S. Pattern recognition by means of disjoint principal components models [J].PatternRecognit., 1976, 8(3):127-139.

[22] MUEHLETHALER C, MASSONNET G, ESSEIVA P. Discrimination and classification of FTIR spectra of red, blue and green spray paints using a multivariate statistical approach [J].ForensicSci.Int., 2014, 244:170-178.

[23] 李航. 統(tǒng)計(jì)學(xué)習(xí)方法 [M]. 北京: 清華大學(xué)出版社, 2012:116. LI H.StatisticalLearningMethod[M]. Beijing: Tsinghua University Press, 2012:116. (in Chinese)

[24] HSU C W, CHANG C C, LIN C J. A practical guide to support vector classification [EB/OL].(2016-05-19) [2016-06-26]. http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf.

劉猛(1988-),男,山東東平人,碩士,助教,2014年于中國(guó)公安大學(xué)獲得碩士學(xué)位,主要從事物證鑒定方面的研究。

E-mail: liumeng@zjjcxy.cn王楠(1988-),女,福建福州人,碩士,工程師,2013年于華東政法大學(xué)獲得碩士學(xué)位,主要從事文件檢驗(yàn)和痕跡檢驗(yàn)方面的研究。

E-mail: wangn@ssfjd.cn申思(1989-),女,河南開封人,碩士,助教,2011年于中國(guó)刑事警察學(xué)院獲得碩士學(xué)位,主要從事文件檢驗(yàn)鑒定方面的研究。

E-mail: shengsi@zjjcxy.cn

Rapid Identification of Black Toner Variety by Visible and Near Infrared Hyperspectral Imaging Technology

LIU Meng1,2, SHEN Si1,2*, WANG Nan3*

(1.KeyLaboratoryofTheQuestionedDocumentExamination(ChinaCriminalPoliceUniversity),MinistryofPublicSecurityofChina,Shenyang100035,China;2.DepartmentofForensicScience,ZhejiangPoliceCollege,Hangzhou310053,China;3.InstituteofForensicScience,MinistryofJustice,PRC,Shanghai200063,China)

In order to develop rapid and non-destructive method for identification of laser printer toner, six kinds of black toner were identified rapidly by combining hyperspectral imaging technique and five kinds of statistical learning method. Method: a visible and near-infrared hyperspectral imaging system covering the spectral range of 400-1 000 nm was set up to capture hyperspectral images of toner samples. Savitzky Golay smooth, normalize, multiple scatter correction and standard normal varite were applied as preprocessing method. After that, five statistical learning methods, including Random Forest (RF), K-nearest Neighbor (KNN), Support Vector Machine (SVM), Partial Least Square-discriminant analysis (PLS-DA) and Soft Independent Modeling of Class Analogy (SIMCA) were applied to establishment of discriminant models based on the full spectra. The properties of discriminant models were compared and valued by three parameters, precision, false reject rate (FRR) and false accept rate (FAR). Result: Among all discriminant models, the SVM and PLS-DA model show the best identification result, the precision is 100%, FRR and FAR are both 0. Conclusion: black toner could be identified by visible and near-infrared hyperspectral imaging technique combined with statistical learning method rapidly.

hyperspectral imaging; toner identification; statistical learning method; SVM; PLS-DA

1000-7032(2017)05-0662-07

2016-11-09;

2016-12-15

文件檢驗(yàn)鑒定公安部重點(diǎn)實(shí)驗(yàn)室(中國(guó)刑事警察學(xué)院)課題(2015KFKT09); 浙江警察學(xué)院校局合作項(xiàng)目(2016XJY014)資助 Supported by Key Laboratory of The Questioned Document Examination(China Criminal Police University), Ministry of Public Security of China(2015KFKT09); School and Bureau Cooperation Program of Zhejiang Police College(2016XJY014)

O433.4; DF794.2

A

10.3788/fgxb20173805.0662

*CorrespondingAuthors,E-mail:shengsi@zjjcxy.cn;wangn@ssfid.cn

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
用對(duì)方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 国产成人免费观看在线视频| 国产三级毛片| 日本人妻一区二区三区不卡影院| 欧美翘臀一区二区三区| 亚洲天堂日韩在线| 无码日韩人妻精品久久蜜桃| 精品伊人久久大香线蕉网站| 午夜精品国产自在| 久久综合成人| 久久精品视频亚洲| 亚洲综合色婷婷| 亚洲成人一区在线| 欧洲亚洲欧美国产日本高清| 国模视频一区二区| 中文字幕日韩视频欧美一区| 国产一区二区色淫影院| 欧美精品1区2区| 国产地址二永久伊甸园| 欧美不卡视频在线| 亚洲一道AV无码午夜福利| yy6080理论大片一级久久| 国产免费观看av大片的网站| 国产第一页屁屁影院| 亚洲精品成人福利在线电影| 强奷白丝美女在线观看| 国产成人高清在线精品| 精品成人一区二区三区电影 | 亚洲国产精品国自产拍A| 免费高清a毛片| 中文字幕欧美日韩高清| 91黄色在线观看| 直接黄91麻豆网站| 美女黄网十八禁免费看| 91免费观看视频| 国产精品男人的天堂| 亚洲欧洲自拍拍偷午夜色无码| 在线观看91香蕉国产免费| 国产后式a一视频| 九九九精品成人免费视频7| 欧美中文一区| 日韩精品一区二区深田咏美| 亚洲第一成网站| 精品無碼一區在線觀看 | 亚洲av无码专区久久蜜芽| 欧美精品在线视频观看| 99精品伊人久久久大香线蕉 | 香蕉蕉亚亚洲aav综合| 国产99视频在线| 免费在线成人网| 99免费视频观看| 国产精品va免费视频| 亚洲国产在一区二区三区| 奇米精品一区二区三区在线观看| 欧美色综合网站| 亚洲a级在线观看| 亚洲欧美日韩成人高清在线一区| 97久久超碰极品视觉盛宴| a亚洲视频| 麻豆国产精品一二三在线观看| 中文字幕无线码一区| 强乱中文字幕在线播放不卡| 青青青伊人色综合久久| 2021国产精品自产拍在线| 成人午夜视频网站| 久久久久亚洲av成人网人人软件| 日韩无码视频播放| 四虎亚洲精品| 亚洲AV电影不卡在线观看| 国产一级毛片网站| 美女被操91视频| 思思热在线视频精品| 欧美日韩国产高清一区二区三区| 2021天堂在线亚洲精品专区| 国产午夜一级淫片| 91在线中文| 国产成人久久777777| 91九色国产在线| 日韩在线欧美在线| 九色综合伊人久久富二代| 最新无码专区超级碰碰碰| 久久亚洲精少妇毛片午夜无码| 一区二区三区在线不卡免费|