魏寧霞, 張耀宏, 張華, 劉莉莉
(國網(wǎng)寧夏電力有限公司,寧夏,銀川 750000)
為了順應(yīng)時(shí)代形勢與科技的發(fā)展,一種新型審計(jì)環(huán)境模式——數(shù)字化審計(jì)應(yīng)時(shí)而生。其通過計(jì)算機(jī)與網(wǎng)絡(luò)對需要審計(jì)的企業(yè)相關(guān)信息進(jìn)行訪問與調(diào)用[1]。數(shù)字化審計(jì)以審計(jì)為目標(biāo),主要包括計(jì)算機(jī)輔助以及信息化風(fēng)險(xiǎn)防控兩種審計(jì)類型[2]。數(shù)字化審計(jì)具有數(shù)據(jù)中心與審計(jì)分析平臺兩個(gè)模塊,數(shù)據(jù)中心是審計(jì)人員對需要審計(jì)企業(yè)的初始數(shù)據(jù)初步獲取后,依據(jù)相關(guān)機(jī)構(gòu)與法律法規(guī)對該數(shù)據(jù)展開儲存與變換,之后審計(jì)人員可經(jīng)專屬通道進(jìn)入分析平臺,分析評估并審查審計(jì)信息獲取最終結(jié)果[3]。為了實(shí)現(xiàn)良好的審計(jì)信息應(yīng)用,黃志剛等[4]以機(jī)器學(xué)習(xí)為基礎(chǔ)對企業(yè)財(cái)務(wù)信息進(jìn)行識別,杜瑞忠等[5]采用DDCT表設(shè)計(jì)了一種多副本的審計(jì)策略,但是審計(jì)信息來源較為復(fù)雜,常有海量審計(jì)圖像存在,需要識別獲取圖像內(nèi)審計(jì)信息[6],為此,本文提出利用深度學(xué)習(xí)的圖像文字識別技術(shù)識別審計(jì)圖像中文字。
大量審計(jì)信息是數(shù)字化審計(jì)開展的基礎(chǔ),數(shù)字化審計(jì)的整體框架如圖1所示。

圖1 數(shù)字審計(jì)系統(tǒng)框架
圖1中,整合的數(shù)字審計(jì)界面向用戶提供了數(shù)據(jù)分析、審計(jì)、審批等一站式服務(wù),完成信息流和數(shù)據(jù)流之間的交互。其采用了分工合作的審計(jì)模式,通過分析審計(jì)項(xiàng)目開展過程中的全樣本數(shù)據(jù),封閉重復(fù)推送符合疑點(diǎn)的數(shù)據(jù)、反映現(xiàn)場檢查情況。通過大數(shù)據(jù)平臺呈現(xiàn)數(shù)字化審計(jì)結(jié)果,其具有較好的穩(wěn)定、開放以及擴(kuò)展效果,儲存無限制。大數(shù)據(jù)挖掘分析內(nèi)部數(shù)字化審計(jì)數(shù)據(jù)并利用爬蟲技術(shù)在網(wǎng)絡(luò)上得到的審計(jì)相關(guān)數(shù)據(jù),通過接入層預(yù)處理數(shù)據(jù)后傳入數(shù)據(jù)存儲計(jì)算層,利用數(shù)據(jù)服務(wù)子層挖掘數(shù)字化審計(jì)信息內(nèi)部存在的聯(lián)系,匹配可疑審計(jì)數(shù)據(jù)特征,經(jīng)中間服務(wù)層協(xié)議解析后反饋至審計(jì)應(yīng)用層,為用戶提供服務(wù)。
1.2.1 圖像預(yù)處理
為提高審計(jì)圖像質(zhì)量,通過小波變換分解審計(jì)圖像濾除噪聲影響[7]。去噪步驟如下。
步驟1:首次N層小波變換審計(jì)圖像,軟閾值濾波1-N層小波系數(shù),消除加性噪聲n(i,j),獲取審計(jì)圖像灰度n1(i,j)r(i,j),得到:
R(i,j)=n(i,j)+n1(i,j)r(i,j)
(1)
其中,審計(jì)圖像R的像素為(i,j),存在噪聲的審計(jì)圖像為R(i,j),噪聲模型為n(i,j)、n1(i,j),審計(jì)圖像原始信息為r(i,j)。
步驟2:利用審計(jì)圖像同乘性噪聲之間的獨(dú)立性對數(shù)計(jì)算完成加性噪聲過濾的審計(jì)圖像[8],變更乘性噪聲為加性噪聲,得到:
log2(n1(i,j)r(i,j))=log2(n1(i,j)+log2(r(i,j)))
(2)
當(dāng)審計(jì)圖像灰度等于0時(shí),令n1(i,j)r(i,j)與limε→0*相加,得到n1(i,j)r(i,j)+ε>0,ε為噪聲。
步驟3:N層小波分解log2(n1(i,j)R(i,j)),得出1-N層小波系數(shù),對其進(jìn)行軟閾值處理[9],濾除與噪聲log2(n1(i,j))相對應(yīng)的小波系數(shù),得出與log2(r(i,j))相對應(yīng)的小波系數(shù),重建完成去噪的小波系數(shù)log2(r(i,j))。
步驟4:指數(shù)運(yùn)算log2r(i,j),得到復(fù)原審計(jì)圖像r(i,j)。預(yù)處理原始待分割審計(jì)圖像后得到高質(zhì)量待分割圖像,結(jié)合基于Canny算子的邊緣檢測與區(qū)域分割技術(shù)分割審計(jì)圖像[10]。利用M、N描述基于Canny算子,得到:
(3)
設(shè)審計(jì)圖像中的像素點(diǎn)為(x,y),利用算子M、N求解預(yù)處理后的審計(jì)圖像像素梯度和方向,得到:
(4)
(5)
1.2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像文字識別
通過卷積神經(jīng)網(wǎng)絡(luò)可以對審計(jì)圖像中的文字信息進(jìn)行自動提取,經(jīng)過少量參數(shù)訓(xùn)練就能完成目標(biāo)文字精準(zhǔn)識別。通過特征提取層提取審計(jì)圖像內(nèi)的文本特征,將所提取特征送入全連接層。利用其所含卷積核提取審計(jì)圖像文字特征,經(jīng)下采樣層累積卷積結(jié)果,得出下采樣結(jié)果即審計(jì)圖像文字特征映射圖。卷積神經(jīng)網(wǎng)絡(luò)卷積操作公式為
(6)
其中,l、x、c以及b分別表示層數(shù)、計(jì)算數(shù)值、卷積核以及加性偏置,i、j、Mj分別表示特征映射圖的內(nèi)部點(diǎn)、編號以及圖集。下采樣公式為
(7)
其中,φ與down分別表示乘性偏置以及加法處理采樣框內(nèi)像素。下采樣操作后通過全連接網(wǎng)絡(luò)判定所提取審計(jì)圖像文字特征,全連接層由前向傳播和反向傳播組成,標(biāo)準(zhǔn)結(jié)果與實(shí)際輸出偏差通過前向傳播獲取,設(shè)其樣本誤差公式:
(8)

誤差變化率公式如下:
(9)
其中,u與b分別表示節(jié)點(diǎn)輸入以及偏置向量。
不同的卷積核可獲取審計(jì)圖像目標(biāo)的不同文字特征映射圖,保證審計(jì)圖像的唯一和尺度不變。
通過基于Relief算法的多特征融合方法改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)識別結(jié)果。為了保持原有審計(jì)圖像樣本分類狀態(tài),在利用Relief算法選擇圖像文字多特征前,設(shè)定好移動間隔形式,再訓(xùn)練n個(gè)樣本的特征,完成多特征融合,提高了改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)圖像文字識別的精確度。
利用假設(shè)的間隔迭代權(quán)值,為了讓決策面移動的距離達(dá)到最大,在保持目前樣本分類狀況的情況下,假定間隔形式如下。
(10)
其中,E(x)、L(x)分別表示x的同類、非同類最近鄰點(diǎn)。Relief算法選擇審計(jì)圖像文字多特征過程如下。
定義m×n維數(shù)矩陣,存儲n個(gè)樣本特征,將待訓(xùn)練的第i個(gè)樣本的N個(gè)特征存放在第i列中;定義不同維數(shù)特征初始權(quán)值wj為0,j=1,2,…,N。第j個(gè)特征樣本的訓(xùn)練過程為
定義訓(xùn)練樣本、不同樣本特征的總數(shù)分別為n、N,并且從1~n、1~N之間循環(huán)選取i、j值,迭代權(quán)值得到:
(11)
其中,Y、S分別為抽取樣本xi同類型、不同類型的樣本集合。至此完成了圖像文字的多特征融合,從而提高了識別結(jié)果的精確度。
為檢測本文所研究審計(jì)圖像文字識別技術(shù)的有效性,進(jìn)行實(shí)驗(yàn)驗(yàn)證。目前沒有真實(shí)發(fā)票數(shù)據(jù)集,因此我們在現(xiàn)實(shí)中收集了部分增值稅發(fā)票圖像。由于條件有限,我們在網(wǎng)絡(luò)各圖庫中搜集發(fā)票圖像。為了保證圖像的質(zhì)量,剔除了難以辨別的圖像,最終收集到了256張合格的發(fā)票圖像,作為此次實(shí)驗(yàn)的數(shù)據(jù)集。并按照7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。
神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)設(shè)置batch_size為64,通道數(shù)設(shè)為3,全連接層數(shù)量設(shè)置為32個(gè),學(xué)習(xí)率設(shè)置為0.0005,dropout設(shè)置為0.2,可以防止過擬合的情況。設(shè)置小波變換的重復(fù)周期為0.01,Canny算子的閾值為500。
以峰值信噪比為指標(biāo)評價(jià)本文方法的濾波效果,PSNR值越高代表濾波降噪性能越好。在測試集中,隨機(jī)選取10幅發(fā)票圖像,用于驗(yàn)證識別效果。實(shí)驗(yàn)結(jié)果如圖2所示。

圖2 10幅審計(jì)圖像的PSNR值
通過圖2可以看出,本文方法對10幅實(shí)驗(yàn)審計(jì)圖像實(shí)施濾波降噪處理的PSNR值均較高、波動較小,平均值為23.21,可見本文方法的濾波降噪效果較好,且濾波性能較為穩(wěn)定。
以Mean IU(分類準(zhǔn)確度均值)作為評價(jià)指標(biāo)測試能量函數(shù)各項(xiàng)比例α、β對本文方法的審計(jì)圖像分割效果的影響,實(shí)驗(yàn)結(jié)果如圖3描述。

圖3 不同項(xiàng)比例的mean IU值結(jié)果
通過圖3可以看出,當(dāng)能量函數(shù)中α、β的比例為0.3、0.5時(shí),其mean IU值最高,此時(shí)圖像分割結(jié)果最優(yōu),能獲得較為理想的審計(jì)圖像分割效果。
本文方法經(jīng)多次學(xué)習(xí)訓(xùn)練后,其平均適應(yīng)度值與網(wǎng)絡(luò)訓(xùn)練絕對誤差結(jié)果見圖4。

圖4 平均適應(yīng)度變化與網(wǎng)絡(luò)訓(xùn)練絕對誤差
分析圖4可得,隨著迭代次數(shù)的增加,本文方法的平均適應(yīng)度值在迭代次數(shù)滿足20次的要求訓(xùn)練次數(shù)后趨于平穩(wěn),網(wǎng)絡(luò)收斂步數(shù)為5,說明本文方法具有較好的平均適應(yīng)度,網(wǎng)絡(luò)收斂速度較快,可利用較小的迭代次數(shù)實(shí)現(xiàn)文字信息識別,識別精度高。
隨機(jī)抽取其中一張稅收發(fā)票圖像,運(yùn)用本文方法對其圖像內(nèi)有效信息進(jìn)行識別,結(jié)果如圖5、表1所示。

表1 圖像文字識別結(jié)果

(a) 原始稅收發(fā)票圖像
結(jié)合圖5、表1可以看出,本文方法能夠精準(zhǔn)識別審計(jì)圖像中的文字信息,所識別信息清晰,可有效為后續(xù)數(shù)字化審計(jì)服務(wù)提供較好的數(shù)據(jù)基礎(chǔ)。
為提升數(shù)字化審計(jì)數(shù)據(jù)的全面性與審計(jì)結(jié)果的精準(zhǔn)性,研究了基于深度學(xué)習(xí)圖像識別技術(shù)的審計(jì)圖像文字識別方法,通過提升審計(jì)圖像質(zhì)量,精準(zhǔn)識別有效的審計(jì)文字信息,數(shù)字化審計(jì)的可靠性得到提升。