楊靜雅
(中建絲路建設投資有限公司,陜西,西安 710000)
目前大多數企業仍然利用人工的方式錄入電子財務報銷入賬憑證,這種工作方式的效率主要是由工作人員的業務熟練程度決定的,人力成本較大[1-2]。為了提高企業的工作效率,需要對電子財務報銷入賬憑證錄入方法進行分析和研究。
王凱麗等[3]提出基于二維局部二值模式的電子財務報銷入賬憑證錄入方法,該方法基于LBP特征圖,引入LBP模式和滑動窗口統計會計財務報銷入賬憑證中的上下文信息,獲得2DLBP特征,將其輸入支持向量機中,完成電子財務報銷入賬憑證的分類錄入,該方法在特征提取過程中沒有消除信息中存在的噪聲,受噪聲干擾憑證錄入所用時間較長,存在錄入效率低的問題。譚潔帆等[4]提出基于卷積神經網絡的電子財務報銷入賬憑證錄入方法,該方法將電子財務報銷入賬憑證通過卷積神經網絡映射到歐幾里得空間中進行編碼,利用采樣方法構建數據集,并對其進行平衡化處理,通過CSSVM分類算法對憑證賦予對應的代價因子,實現電子財務報銷入賬憑證的分類錄入,該方法沒有消除信息之間存在冗余,降低了電子財務報銷憑證錄入的精準度。孫勁光等[5]提出基于概率圖模型的電子財務報銷入賬憑證錄入方法,該方法將電子財務報銷入賬憑證劃分為5個區域,在概率圖模型分類方法理論的基礎上通過Softmax分類層和5個分類子網絡構建憑證分類模型,完成電子財務報銷入賬憑證的分類錄入,該方法獲取的特征信息不準確,降低了電子財務報銷入賬憑證錄入的完整度。
為了解決上述方法中存在的問題,提出電子財務報銷入賬憑證自動錄入方法,在電子化智能填單系統中,提取錄入電子財務報銷入賬憑證中的文字信息,在財務管控系統中錄入提取的文字信息,獲得管控單據。通過Gabor濾波器對錄入數據進行降噪和去冗處理,提高了財務報銷入賬憑證錄入的效率、錄入精準度和錄入完整度。
電子財務報銷入賬憑證自動錄入方法設計一個Gabor濾波器組,對電子財務報銷入賬憑證圖像進行濾波,二維Gabor函數在時域中屬于高斯函數調制的復數正弦函數[6-7],在時域中通過式(1)描述二維Gabor函數的一般形式,
(1)
式中,(x′,y′)代表時域坐標旋轉結果,σx、σy代表尺度參數,γ代表高斯函數對應的橫縱比,φ代表尺度參數,f代表Gabor函數余弦部分中的頻率。
二維Gabor函數根據坐標軸旋轉的傅里葉變換法在電子財務報銷入賬憑證圖像頻域中通過式(2)進行描述,
(2)
式中,(u′,v′)代表頻域坐標旋轉結果,e代表濾波系數。
應對不同的空間方向和頻率,將錄入的電子財務報銷入賬憑證圖像分解為若干個濾波圖像,采用Gabor變換對電子財務報銷入賬憑證圖像ζ(x,y)進行變化[8],獲得式(3),
r(x,y)=g(x,y)*ζ(x,y)
(3)
式中,*描述的是卷積運算。
分析式(3)可知,通過計算f、γ、σ、θ可以確定Gabor濾波器對電子財務報銷入賬憑證圖像進行濾波的計算式。并通過式(4)確定參數f、σ,

(4)
式中,f代表濾波器對應的中心頻率。
濾波器通常情況下存在幾個濾波,在本文中,區分電子財務報銷入賬憑證圖像的基礎是濾波之間存在的信號響應關系[9],通過式(5)選擇憑證圖像的離散旋轉角度,
(5)
式中,n代表旋轉角度,θl代表第l個角度。
電子財務報銷入賬憑證自動錄入方法采用Gabor能量描述電子財務報銷入賬憑證圖像的紋理特征,如式(6),
(6)
式中,rζ,f,θ,0、rζ,f,θ-(1/2)π為相互對稱的濾波。
將濾波后的電子財務報銷入賬憑證圖像的S型調制轉變為正方形調整[10],如式(7),
(7)
在實際中,Gabor濾波效果會受到紋理特征起伏變化的影響,包括玫瑰斑、偽紋理等噪聲的引入,為了解決上述問題,對Gabor濾波輸出的電子財務報銷入賬憑證圖像進行Gauss低通濾波處理,如式(8),
(8)
式中,σs代表高斯窗口函數對應的標準差。
為了改善電子財務報銷入賬憑證分類的效果,提高運算效率,降低特征維數,需要對憑證數據進行特征提取。采用順序向前搜索算法將平均入賬憑證J-M距離作為指標實現特征提取,平均J-M距離如式(9),

(9)
式中,JM代表平均距離,pi、pj代表類別i和類別j對應的先驗概率,JMij代表類別i和類別j之間存在的J-M距離,Bij代表B氏距離,Mi、Mj分別代表i和類別j對應的樣本均值向量,Vi、Vj代表類別i和類別j對應的矩陣樣本別方差,n代表類別總數。根據上述計算,提取電子財務報銷入賬憑證特征,為實現憑證自動錄入做基礎。
為實現憑證自動錄入,通過支持向量機在高維解空間中構造一個可以劃分兩類,并使間隔最大的最優線性分類面,構建憑證自動錄入決策函數。
通過式(10)描述憑證自動錄入線性判別函數,
g(x)=w·x+b
(10)
分類面為g(x)=0,設xi代表輸入向量,yi代表分類標記值,當分類標記值為1時表示屬于,當分類標記值為-1時表示不屬于。
通過帶約束條件的極值問題代替線性分類問題,解決原有憑證自動錄入無法實現最優線性路徑的問題,如式(11),

(11)
在上述過程的基礎上建立Lagrange方程,如式(12)。
(12)
利用式(13)對參數b和參數w求偏導,

(13)
支持向量即為取值不為零的ai,建立憑證自動錄入決策函數,如式(14),
(14)
式中,(x·xi)代表核函數,描述的是x和xi之間的相似度,針對非線性變換φ(x),重新構建憑證自動錄入決策函數,如式(15)。
(15)
將提取的特征輸入上述憑證自動錄入決策函數中,完成電子財務報銷入賬憑證分類和自動錄入。
為了驗證電子財務報銷入賬憑證自動錄入方法的整體有效性,需要對電子財務報銷入賬憑證自動錄入方法進行測試,本次測試采用Matlab R2013a軟件,在聯想ThinkStation P310 64位Windows旗艦版操作系統上實現,選用某公司的電子財務報銷費用作為實驗數據。分別采用電子財務報銷入賬憑證自動錄入方法(方法1)、基于二維局部二值模式的電子財務報銷入賬憑證錄入方法(方法2)和基于卷積神經網絡的電子財務報銷入賬憑證錄入方法(方法3)進行測試,將錄入效率、錄入精準度、錄入完整度作為測試指標。
(1)錄入效率
錄入效率測試結果如圖1所示。

圖1 錄入效率測試結果
分析圖1可知,在多次迭代中方法1錄入電子財務報銷入賬憑證所用的時間均在10 s以下,采用方法2和方法3在多次迭代中錄入電子財務報銷入賬憑證所用的時間均高于15 s。通過上述對比分析可知,方法1錄入電子財務報銷入賬憑證所用的時間最少,這是因為方法1在特征提取過程中采用Gauss低通濾波器消除噪聲等干擾信息,縮短了特征提取所用的時間,進而縮短了電子財務報銷入賬憑證所用的時間,提高了方法1的錄入效率。
(2)錄入精準度
錄入精準度測試結果如圖2所示。

圖2 錄入精準度測試結果
通過圖2可知,方法1的錄入精度在多次迭代中均在80%以上,遠遠高于方法2和方法3的錄入精準度,因為方法1通過Gabor濾波器對待錄入的憑證數據進行降噪和去冗處理,消除了特征之間存在的冗余和干擾,提高了電子財務報銷入賬憑證錄入的精準度。
(3)錄入完整度
錄入完整度測試結果如圖3所示。
對圖3中的數據進行統計分析可知,方法1在多次迭代中錄入的電子憑證報銷入賬憑證的完整度均在90%以上,方法2和方法3在多次迭代中錄入的電子憑證報銷入賬憑證的完整度在70%附近波動,根據測試結果可知,方法1的電子賬務報銷入賬憑證錄入完整度較高,因為方法1采用順序向前搜索方法在多通道的濾波特征圖像中提取憑證數據特征,將J-M距離作為評價指標,實現特征空間的優化,提高了電子賬務報銷入賬憑證的完整度。

圖3 錄入完整度測試結果
記賬憑證的源頭經濟業務隨著信息化水平的提高逐漸向電子化流轉,人工記賬逐漸被計算機記賬代替。使用計算機記賬方式可以從日常繁雜的會計核算中解放財務人員,同時解決了業務流程和會計流程的分離問題,實現會計的管理、監督職責。目前電子財務報銷入賬憑證錄入方法存在錄入效率低、錄入精準度低和錄入完整度低的問題。提出電子財務報銷入賬憑證自動錄入方法,提取電子財務報銷入賬憑證的特征,根據特征對其進行分類,完成電子財務報銷入賬憑證的自動錄入,解決了目前方法中存在的問題。