[摘要] 為適應(yīng)商業(yè)銀行稽核中心的需要,以O(shè)CR技術(shù)為基礎(chǔ),設(shè)計(jì)了一套事后稽核系統(tǒng),可以完成銀行票據(jù)掃描、識(shí)別和查詢功能,并能夠?qū)⑻崛〉钠睋?jù)信息存入銀行源數(shù)據(jù)庫(kù),實(shí)現(xiàn)銀行柜臺(tái)業(yè)務(wù)的自動(dòng)勾兌稽核。該系統(tǒng)可以極大提高商業(yè)銀行的稽核效率,節(jié)省大量的人力和物力成本。
[關(guān)鍵詞] 銀行稽核 金融票據(jù) 字符識(shí)別
一、引言
近年來,隨著我國(guó)金融業(yè)計(jì)算機(jī)應(yīng)用水平的不斷提高,金融電子化得到了長(zhǎng)足的發(fā)展,但稽核手段和內(nèi)控制度的建設(shè)相對(duì)滯后。現(xiàn)有的集中稽核工作沿襲了傳統(tǒng)手工稽核方式,需要對(duì)票據(jù)憑證二次錄入,這項(xiàng)工作幾乎占整個(gè)稽核工作量的一半以上。并且由于銀行原始票據(jù)檔案資料只有一份,無法實(shí)現(xiàn)共享。存放于檔案庫(kù)中的紙質(zhì)票據(jù)不易保存,查詢起來也非常困難。這些因素在數(shù)據(jù)大集中的商業(yè)銀行中尤其突出,成為制約稽核工作的瓶頸。
針對(duì)稽核工作中的票據(jù)管理問題,本文借助于目前日益成熟的光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù),設(shè)計(jì)開發(fā)出一套商業(yè)銀行事后稽核系統(tǒng),能夠批量掃描各種銀行業(yè)務(wù)票據(jù),自動(dòng)識(shí)別票據(jù)上的印刷和手寫字符,建立票據(jù)信息庫(kù)。并能夠?qū)⑵睋?jù)信息與銀行業(yè)務(wù)系統(tǒng)的流水信息進(jìn)行核對(duì),實(shí)現(xiàn)核算業(yè)務(wù)的自動(dòng)稽核功能。該系統(tǒng)可以極大提高商業(yè)銀行的稽核效率,節(jié)省大量人力和物力成本。
二、系統(tǒng)功能
現(xiàn)階段商業(yè)銀行事后稽核業(yè)務(wù)大多數(shù)采用手工監(jiān)督或手工與計(jì)算機(jī)并行的處理方式,即各地中心支行所轄機(jī)構(gòu)網(wǎng)點(diǎn)將產(chǎn)生的各種票據(jù)在當(dāng)天封包后,于次日或規(guī)定時(shí)間內(nèi)送至省會(huì)或地市中心支行事后稽核中心,由事后稽核中心的工作人員按業(yè)務(wù)發(fā)生的流水號(hào)整理票據(jù),人工審核票據(jù)信息。然后按業(yè)務(wù)流水號(hào),手工或者錄入微機(jī)勾兌流水。審核完畢后,下發(fā)會(huì)計(jì)差錯(cuò)檢查通知,將票據(jù)裝訂入庫(kù)保存。
本系統(tǒng)不僅需要完成上述傳統(tǒng)手工方式下的稽核業(yè)務(wù),還應(yīng)該發(fā)揮計(jì)算機(jī)處理票據(jù)的優(yōu)勢(shì),提高稽核效率,降低票據(jù)處理成本。總的來說,本系統(tǒng)的主要功能包括:
1.批量掃描各種銀行票據(jù)。
2.應(yīng)用OCR技術(shù),自動(dòng)提取票據(jù)信息,存入票據(jù)信息庫(kù);分揀出無法識(shí)別的票據(jù),由工作人員手工補(bǔ)充錄入票據(jù)信息。
3.勾兌票據(jù)信息和業(yè)務(wù)流水記錄,輸出業(yè)務(wù)審核清單。
4.將一定數(shù)量的票據(jù)圖像自動(dòng)刻錄成光盤保存在光盤庫(kù)中;光盤庫(kù)系統(tǒng)能夠根據(jù)需要讀出指定光盤號(hào)的內(nèi)容。
5.以C/S模式在Internet上和局域網(wǎng)內(nèi)提供票據(jù)、稽核結(jié)果查詢。
三、系統(tǒng)流程及結(jié)構(gòu)設(shè)計(jì)
1.系統(tǒng)流程。商業(yè)銀行事后稽核系統(tǒng)的使用者是稽核中心工作人員,以及各種查詢?nèi)藛T。系統(tǒng)的輸入包括各支行的票據(jù)封包和稽核人員補(bǔ)充錄入的票據(jù)信息,系統(tǒng)輸出結(jié)果包括稽核結(jié)果清單、票據(jù)信息庫(kù)、票據(jù)光盤庫(kù)、稽核信息庫(kù)和光盤索引庫(kù)。該系統(tǒng)的主要工作流程包括:
(1)銀行稽核中心接收到各支行的票據(jù)封包,由檢查人員審核票據(jù)的批次,以及票據(jù)的完整性,然后在系統(tǒng)中添加票據(jù)接收記錄。
(2)票據(jù)交給掃描工作站,由掃描人員將票據(jù)批量掃描。稽核系統(tǒng)根據(jù)系統(tǒng)內(nèi)的票據(jù)模板,分類識(shí)別票據(jù)信息,存入票據(jù)信息庫(kù)。對(duì)無法識(shí)別的票據(jù),輸出票據(jù)流水號(hào)清單,由工作人員根據(jù)票據(jù)圖像,補(bǔ)充錄入票據(jù)信息。
(3)一個(gè)批次的票據(jù)掃描完畢后,系統(tǒng)從票據(jù)信息庫(kù)中提出新記錄,與業(yè)務(wù)流水庫(kù)中的記錄進(jìn)行勾兌審核,輸出發(fā)生錯(cuò)誤的業(yè)務(wù)記錄清單,同時(shí)存入稽核信息庫(kù)。對(duì)不能識(shí)別的票據(jù),工作人員在補(bǔ)充錄入之后,可以手工啟動(dòng)勾兌審核。
(4)勾兌完畢后,光盤庫(kù)系統(tǒng)檢查票據(jù)信息庫(kù),如果已經(jīng)到達(dá)刻錄容量,啟動(dòng)光盤庫(kù)系統(tǒng)的刻錄模塊,將記錄保存在光盤上,同時(shí)刪除票據(jù)信息庫(kù)中的記錄。光盤庫(kù)系統(tǒng)為新的光盤生成光盤索引,保存在光盤庫(kù)系統(tǒng)中。
(5)在銀行稽核中心內(nèi)部局域網(wǎng)內(nèi),以C/S模式提供票據(jù)信息查詢服務(wù)。客戶端查詢模塊發(fā)出查詢請(qǐng)求,服務(wù)器端查詢光盤庫(kù)系統(tǒng)和票據(jù)信息庫(kù),返回查詢結(jié)果。在Internet上,考慮到銀行業(yè)務(wù)的安全性,只提供稽核結(jié)果查詢。各支行可以在網(wǎng)上查詢最近的稽核情況。
2.系統(tǒng)結(jié)構(gòu)。系統(tǒng)可以分成票據(jù)封包登記模塊、掃描識(shí)別模塊、手工補(bǔ)錄模塊、業(yè)務(wù)審核模塊、光盤刻錄模塊、光盤管理模塊、查詢服務(wù)模塊、票據(jù)查詢模塊、稽核結(jié)果查詢模塊和用戶管理模塊。各模塊的具體功能為:
(1)票據(jù)封包登記模塊,在票據(jù)檢查工作站運(yùn)行。稽核中心收到各支行的票據(jù)封包后,檢查人員需要在該模塊中登記票據(jù)的來源銀行、流水號(hào)的起止范圍,以及票據(jù)的完整情況,數(shù)據(jù)存入票據(jù)信息庫(kù)中。
(2)掃描識(shí)別模塊,在掃描工作站運(yùn)行。掃描人員將一個(gè)批量的票據(jù)放入文檔掃描儀內(nèi),該模塊從掃描儀讀取票據(jù)圖像,使用OCR技術(shù)和系統(tǒng)內(nèi)的票據(jù)模板,識(shí)別票據(jù)上的信息,存入票據(jù)信息庫(kù)。對(duì)本批次不能識(shí)別的票據(jù),在票據(jù)信息庫(kù)中注明,然后輸出不能識(shí)別的票據(jù)流水號(hào)清單。一個(gè)批次的票據(jù)掃描識(shí)別完畢后,由該模塊向業(yè)務(wù)審核工作站發(fā)出審核請(qǐng)求,并調(diào)用光盤刻錄模塊。
(3)手工補(bǔ)錄模塊,在手工補(bǔ)錄工作站上運(yùn)行。在稽核中心當(dāng)前掃描識(shí)別工作之后,工作人員啟動(dòng)該模塊,依次查看每張無法識(shí)別的票據(jù)圖形,手工錄入票據(jù)的信息,存入票據(jù)信息庫(kù),同時(shí)清除對(duì)應(yīng)記錄上的標(biāo)記。工作人員退出該模塊后,由該模塊向業(yè)務(wù)審核工作站發(fā)出審核請(qǐng)求,并調(diào)用光盤刻錄模塊。
(4)業(yè)務(wù)審核模塊,在業(yè)務(wù)審核工作站運(yùn)行。該模塊被調(diào)用后,從票據(jù)信息庫(kù)中查詢出還未審核的票據(jù)記錄,應(yīng)用業(yè)務(wù)稽核規(guī)則,審核業(yè)務(wù)流水庫(kù)中的記錄。對(duì)票據(jù)和業(yè)務(wù)流水庫(kù)中不符的記錄,輸出錯(cuò)誤清單,并將稽核結(jié)果存入稽核信息庫(kù)。
(5)光盤刻錄模塊,在光盤刻錄工作站上運(yùn)行。該模塊被調(diào)用后,從票據(jù)信息庫(kù)中查詢出信息完整的票據(jù)記錄,如果已經(jīng)達(dá)到規(guī)定數(shù)量,則啟動(dòng)光盤庫(kù)開始刻錄光盤。自動(dòng)為新光盤編號(hào),并在光盤索引庫(kù)中添加光盤信息。
(6)光盤管理模塊,在光盤管理工作站運(yùn)行。該模塊與光盤庫(kù)連接,可以瀏覽光盤庫(kù)的數(shù)據(jù),查看光盤使用情況。
(7)查詢服務(wù)模塊,在查詢服務(wù)器上運(yùn)行。該模塊能夠處理局域網(wǎng)上查詢工作站查詢票據(jù)信息的請(qǐng)求,以及Internet服務(wù)器查詢稽核結(jié)果的請(qǐng)求。對(duì)查詢票據(jù)信息的請(qǐng)求,首先查詢光盤索引庫(kù)確定票據(jù)信息的位置,然后查詢光盤庫(kù)和票據(jù)信息庫(kù),返回查詢結(jié)果。對(duì)查詢稽核結(jié)果的請(qǐng)求,直接查詢稽核信息庫(kù),然后返回查詢結(jié)果。
(8)票據(jù)查詢模塊,在查詢工作站上運(yùn)行。該模塊是局域網(wǎng)內(nèi)查詢票據(jù)信息的客戶端,功能是接收用戶輸入的查詢請(qǐng)求,發(fā)送給查詢服務(wù)模塊,顯示返回的查詢結(jié)果。
(9)稽核結(jié)果查詢模塊。該模塊由動(dòng)態(tài)網(wǎng)頁(yè)組成,運(yùn)行在Internet上客戶的瀏覽器上。用戶在網(wǎng)頁(yè)上填寫查詢條件,向稽核中心局域網(wǎng)上的Internet服務(wù)器發(fā)出查詢請(qǐng)求。Internet服務(wù)器調(diào)用查詢服務(wù)模塊,然后將查詢結(jié)果返回給用戶。
(10)用戶管理模塊。各工作站都需要運(yùn)行該模塊,其功能是管理用戶權(quán)限和驗(yàn)證用戶權(quán)限。
上述模塊均分布在銀行稽核中心的局域網(wǎng)和Internet上,組成一個(gè)分布式系統(tǒng),兼有C/S模式和B/S模式。系統(tǒng)的網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。
四、系統(tǒng)實(shí)現(xiàn)
1.硬件設(shè)備。硬件設(shè)備中,票據(jù)檢查工作站、手工補(bǔ)錄工作站、查詢工作站、光盤管理工作站和用戶管理工作站可以使用普通微機(jī),業(yè)務(wù)審核工作站、查詢服務(wù)器和Internet服務(wù)器需要使用中高檔服務(wù)器設(shè)備。
掃描工作站除需要一臺(tái)微機(jī)外,還需要連接一臺(tái)高效的文檔掃描儀。文檔掃描儀是系統(tǒng)工作瓶頸之一,其進(jìn)紙槽容量不應(yīng)低于100頁(yè),日掃描量不應(yīng)低于5000頁(yè)。在目前市場(chǎng)上,可以適用的成熟產(chǎn)品主要有柯達(dá)i820/i830/i840掃描儀系列、富士通高速文檔掃描儀系列和佳能高速文檔掃描儀系列等。
另外,系統(tǒng)還需要一臺(tái)光盤庫(kù),用于刻錄和管理光盤。光盤庫(kù)應(yīng)該具有換盤速度快、支持跨盤檢索、支持網(wǎng)絡(luò)無縫的數(shù)據(jù)刻錄等功能。光盤庫(kù)一般配置有多臺(tái)驅(qū)動(dòng)器,可以是只讀CD/DVD-ROM驅(qū)動(dòng)器,也可以是CD-R/DVD-R刻錄機(jī),或者是DVD-RAM可擦寫驅(qū)動(dòng)器。系統(tǒng)訪問光盤庫(kù)時(shí),自動(dòng)換盤機(jī)構(gòu)首先將驅(qū)動(dòng)器中的光盤取出并放置到盤架上的指定位置,然后再?gòu)谋P架中取出所需的光盤并送入驅(qū)動(dòng)器中。自動(dòng)換盤機(jī)構(gòu)(機(jī)械手)的換盤時(shí)間為秒級(jí)。
2.核心軟件技術(shù)。本系統(tǒng)的核心是票據(jù)掃描識(shí)別技術(shù),目前國(guó)內(nèi)外已經(jīng)對(duì)印刷體和手寫體字符的識(shí)別展開了廣泛的研究。銀行票據(jù)雖然規(guī)格不一,但是票據(jù)種類有限,并且每種票據(jù)的格式非常統(tǒng)一,因此可以為每種票據(jù)建立一個(gè)模板,對(duì)票據(jù)中的待識(shí)別區(qū)域采用不同的切分方法實(shí)現(xiàn)對(duì)字符較為準(zhǔn)確、快速的切分,從而保證整個(gè)識(shí)別模塊的識(shí)別性能和速度。
在識(shí)別票據(jù)信息之前,首先對(duì)待識(shí)別票據(jù)圖像進(jìn)行預(yù)處理,然后根據(jù)存在的模板文件對(duì)待識(shí)別票據(jù)進(jìn)行票據(jù)類型識(shí)別,找到票據(jù)對(duì)應(yīng)的模板。然后進(jìn)行待識(shí)別區(qū)域的定位,對(duì)待識(shí)別區(qū)域進(jìn)行字符切分,切分結(jié)果送入字符識(shí)別單元進(jìn)行單個(gè)字符的識(shí)別。
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請(qǐng)以PDF格式閱讀原文。