楊 爽
隨著科技的發(fā)展,在電子設(shè)備上書(shū)寫(xiě)電子簽名筆跡的現(xiàn)象日益增多,電子簽名筆跡的檢驗(yàn)鑒定也逐漸出現(xiàn)在司法鑒定領(lǐng)域。近年來(lái)法庭科學(xué)領(lǐng)域的學(xué)者們一直在嘗試將人工智能、化學(xué)計(jì)量學(xué)等領(lǐng)域與法庭科學(xué)結(jié)合,人臉識(shí)別、語(yǔ)音識(shí)別、指紋識(shí)別等技術(shù)均得到了發(fā)展[1~2],應(yīng)用其他領(lǐng)域已經(jīng)成熟的技術(shù)已成為了法庭科學(xué)領(lǐng)域一種新的趨勢(shì)。相較于DNA、指紋而言筆跡穩(wěn)定性較差,原因在于書(shū)寫(xiě)過(guò)程由手、臂構(gòu)成書(shū)寫(xiě)機(jī)制,他們不可能像機(jī)器那樣精準(zhǔn)的復(fù)制[3],這就導(dǎo)致筆跡檢驗(yàn)人員很難精確地抓住特征變化的范圍、幅度,僅依靠主觀評(píng)斷出具鑒定意見(jiàn),缺少客觀的價(jià)值評(píng)價(jià)做支撐,從而致使筆跡檢驗(yàn)在法庭證據(jù)證明力方面處于爭(zhēng)議[4~6]。鑒于電子簽名的書(shū)寫(xiě)壓力曲線較化學(xué)領(lǐng)域的光譜圖相似,本文通過(guò)提取壓力峰值走向,進(jìn)一步采用動(dòng)態(tài)時(shí)間規(guī)整(DTW)對(duì)多次書(shū)寫(xiě)壓力曲線進(jìn)行規(guī)整,采用SVM探究同一人書(shū)寫(xiě)電子簽名筆跡壓力的穩(wěn)定性、摹仿電子簽名筆跡壓力特點(diǎn)和變化規(guī)律,利用模式識(shí)別方法探究電子簽名筆跡的人身識(shí)別。
(一)動(dòng)態(tài)時(shí)間規(guī)整DTW算法(Dynamic Time Warping)。在時(shí)間序列中,兩條書(shū)寫(xiě)壓力曲線的長(zhǎng)度大部分是不相等的,利用歐幾里得、馬氏距離等方法是無(wú)法求得有效的兩個(gè)時(shí)間序列之間的相似性的。動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)是一個(gè)典型的優(yōu)化問(wèn)題,它用滿足一定條件的時(shí)間規(guī)整函數(shù)描述待測(cè)模板和目標(biāo)模板的時(shí)間上的關(guān)系,求解兩模板匹配時(shí)累計(jì)距離最小所對(duì)應(yīng)的規(guī)整函數(shù)。
(二)支持向量機(jī)(Support Vector Machine,SVM)。支持向量機(jī)(Support Vector Machine,SVM)是一種監(jiān)督學(xué)習(xí),根據(jù)特有的方式對(duì)數(shù)據(jù)進(jìn)行分類的廣義線性分類器,原本只適用于二分類,后來(lái)發(fā)展為多分類,其決策邊界是對(duì)學(xué)習(xí)樣本求解的最大邊距超平面。
(一)實(shí)驗(yàn)工具。和冠(Wacom)數(shù)位手寫(xiě)板;Microsoft Excel;Matlab2020;聯(lián)想臺(tái)式電腦。
(二)樣本制作。選取21歲到29歲的30名志愿者為研究對(duì)象,在Wacom數(shù)位手寫(xiě)板上書(shū)寫(xiě)電子簽名。由10名書(shū)寫(xiě)者書(shū)寫(xiě)自己的簽名筆跡,并將10名書(shū)寫(xiě)人進(jìn)行編號(hào)(W1~W10)每名志愿者均在平穩(wěn)的心情下在安靜的環(huán)境書(shū)寫(xiě)自己的簽名40份,共400份,由20名從事文件檢驗(yàn)專業(yè)的書(shū)寫(xiě)者進(jìn)行摹仿,每?jī)擅驹刚呔毩?xí)摹仿一人簽名,練習(xí)被摹仿簽名的特征穩(wěn)定后,每名練習(xí)摹仿者書(shū)寫(xiě)20份簽名,共400份,共計(jì)400份真實(shí)簽名,400份偽造簽名。
(一)實(shí)驗(yàn)可行性分析。書(shū)寫(xiě)過(guò)程由手、臂構(gòu)成書(shū)寫(xiě)機(jī)制,他們不可能像機(jī)器那樣精準(zhǔn)的復(fù)制,即使在書(shū)寫(xiě)條件相同的情況下同一人多次書(shū)寫(xiě)電子簽名的壓力曲線也不可能完全一致。本文對(duì)1名書(shū)寫(xiě)者進(jìn)行10次重復(fù)性檢驗(yàn),得出書(shū)寫(xiě)者的壓力曲線圖,通過(guò)圖1可以看出10次重復(fù)性實(shí)驗(yàn)結(jié)果良好,譜圖的峰數(shù)、峰位、峰強(qiáng)基本相同,表明可以用書(shū)寫(xiě)壓力這一特征來(lái)達(dá)到對(duì)書(shū)寫(xiě)人的檢驗(yàn)鑒定。
圖1 同一人多次書(shū)寫(xiě)簽名壓力曲線圖
已有多位學(xué)者證明,不同人書(shū)寫(xiě)同一簽名的壓力曲線走向是不同的。
(二)峰值提取及DTW算法應(yīng)用。由于原始書(shū)寫(xiě)壓力曲線含有較多的冗余特征信息,曾提到提取壓力曲線的峰值走向作為特征效果更好,因此本文首先提取壓力的峰值走向,如圖2(a)所示為原始?jí)毫η€走向示意圖,圖2(b)為提取壓力峰值后的壓力曲線示意圖。
圖2 (a)書(shū)寫(xiě)壓力曲線示意圖 圖2 (b)書(shū)寫(xiě)壓力曲線峰值走向示意圖
由于書(shū)寫(xiě)習(xí)慣的非絕對(duì)穩(wěn)定性,獲得的電子簽名之間具有一定的差異,時(shí)間維度上的長(zhǎng)度也大多不一致,正如圖1所示,而模式識(shí)別技術(shù)的應(yīng)用需要不同樣本之間的特征維度相同,基于算法研究電子簽名鑒定的主要問(wèn)題在于如何解決時(shí)間序列長(zhǎng)度不一致的電子簽名之間的比較,動(dòng)態(tài)時(shí)間規(guī)整(DTW)算法通常被用來(lái)解決該問(wèn)題,因此本文采取DTW做動(dòng)態(tài)時(shí)間規(guī)則,將不同時(shí)序長(zhǎng)度的壓力曲線規(guī)整為時(shí)序長(zhǎng)度相同的壓力曲線,如圖3(a)所示,兩條壓力曲線在重疊操作的情況下,時(shí)序長(zhǎng)度是不同的,曲線1的時(shí)間維度要多余曲線2的時(shí)間維度,在經(jīng)過(guò)動(dòng)態(tài)時(shí)間規(guī)整(DTW)后,如圖3(b)所示,兩條曲線根據(jù)最優(yōu)路徑映射,已經(jīng)在時(shí)間維度上長(zhǎng)度相同,可供后續(xù)的模式識(shí)別技術(shù)。
圖3 (a)動(dòng)態(tài)時(shí)間規(guī)整前兩條壓力曲線 圖3 (b)動(dòng)態(tài)時(shí)間規(guī)整后兩條壓力曲線
(三)構(gòu)建SVM模型。本文采用SVM作為數(shù)據(jù)的分類模型,在實(shí)驗(yàn)開(kāi)始前,通過(guò)預(yù)實(shí)驗(yàn)權(quán)衡了4種核函數(shù)(線性核函數(shù)、多項(xiàng)式核函數(shù)、sigmoid核函數(shù)以及徑向基核函數(shù))下簽名樣本的分類識(shí)別準(zhǔn)確率,結(jié)果表明徑向基核函數(shù)(RBF)做為SVM模型的核函數(shù)時(shí)模型分類識(shí)別率最高,因此本文選用RBF作為SVM模型的核函數(shù)(回歸精準(zhǔn)度設(shè)置為0.1,懲罰系數(shù)C設(shè)置為0.1,規(guī)范化參數(shù)設(shè)置為15,RBF伽馬值設(shè)置為0.1)。
SVM為多維度特征空間上間隔最大的線性分類器,SVM是多維數(shù)據(jù)空間中構(gòu)建一個(gè)超平面對(duì)兩類數(shù)據(jù)進(jìn)行區(qū)分,最終將兩類數(shù)據(jù)的區(qū)分劃分為一個(gè)凸二次規(guī)劃問(wèn)題的求解。SVM原本是一種二分類的模型,為了解決多分類的任務(wù),我們將源數(shù)據(jù)基進(jìn)行拆分,將多分類任務(wù)拆成單獨(dú)的二分類任務(wù),然后對(duì)多個(gè)二分類的結(jié)果進(jìn)行集成,以獲得最終的多分類結(jié)果,常見(jiàn)的拆分?jǐn)?shù)據(jù)集方法有一對(duì)一法、一對(duì)多法。一對(duì)多法通常會(huì)存在兩個(gè)詬病,即一個(gè)樣本可能同時(shí)屬于多個(gè)類以及一個(gè)樣本可能不屬于任何一個(gè)類。相反,一對(duì)一法可以恰好的解決這種問(wèn)題,本文的目的是為了多簽名筆跡的真?zhèn)舞b別,因此本文數(shù)據(jù)集采用一對(duì)一法。
為了驗(yàn)證峰值提取的有效性,本文將采取兩種壓力曲線預(yù)處理方式:一是將原始?jí)毫η€進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整(DTW),貼上標(biāo)簽導(dǎo)入SVM模型識(shí)別(將此分類模型記為Q1);二是將原始?jí)毫η€進(jìn)行峰值提取,然后進(jìn)行動(dòng)態(tài)時(shí)間規(guī)整(DTW),貼上標(biāo)簽導(dǎo)入SVM模型分類識(shí)別(將此分類模型記為Q2)。
實(shí)驗(yàn)結(jié)果如表1所示,可以看出Q2模型整體的分類識(shí)別效果要好于Q1模型,因此峰值提取結(jié)合DTW-SVM模型可以做到識(shí)別書(shū)寫(xiě)人,最高準(zhǔn)確率可達(dá)到87.2%,魯棒性較好。
表1 實(shí)驗(yàn)結(jié)果
本文針對(duì)電子簽名的書(shū)寫(xiě)壓力動(dòng)態(tài)特征,提出了一種基于DTW-SVM的真?zhèn)魏灻R(shí)別模型,經(jīng)實(shí)驗(yàn)表明,原始?jí)毫η€結(jié)合DTW-SVM模型的識(shí)別效果不好,最高為70.1%,在對(duì)壓力曲線作出峰值提取后,再利用DTW-SVM進(jìn)行分類,識(shí)別10位書(shū)寫(xiě)人的效果較好,最高可達(dá)到87.2%,取得的效果較好,可以為筆跡鑒定提供,減少了鑒定人的主觀性分析以及可能帶來(lái)的錯(cuò)誤,盡可能的進(jìn)行客觀評(píng)價(jià),客服了筆跡鑒定單一依靠主觀性的問(wèn)題,但是考慮到司法鑒定的嚴(yán)謹(jǐn)性,應(yīng)用計(jì)算機(jī)到筆跡鑒定領(lǐng)域的技術(shù)在不能做到像DNA那樣能夠幾乎完全正確得出結(jié)論的前提下,仍需要筆跡鑒定人員作為主體,將計(jì)算機(jī)作為輔助筆跡鑒定人員的工具,由此才能取得較為正確的鑒定結(jié)果。