摘要:隨著信息化技術(shù)的發(fā)展,高校審計(jì)面臨著海量文本數(shù)據(jù)資料的挑戰(zhàn),而傳統(tǒng)的數(shù)據(jù)處理方法和工具對文本信息的適用性不足。本文立足高校審計(jì)應(yīng)用,以Python語言為例,以合同審計(jì)為應(yīng)用場景,探討文本處理技術(shù)實(shí)現(xiàn)路徑,助力提升高校審計(jì)工作質(zhì)效。
關(guān)鍵詞:文本處理技術(shù);高校審計(jì);應(yīng)用探索
中圖分類號:G4文獻(xiàn)標(biāo)識碼:Adoi:10.19311/j.cnki.16723198.2024.16.087
0引言
隨著高校經(jīng)濟(jì)和業(yè)務(wù)活動的發(fā)展,高校審計(jì)領(lǐng)域面臨著海量文本數(shù)據(jù)的挑戰(zhàn)。根據(jù)相關(guān)文獻(xiàn)數(shù)據(jù),高校超過80%的數(shù)據(jù)是以非結(jié)構(gòu)化、半結(jié)構(gòu)化的文本形式存在的,如合同文本、科研報(bào)告、會議紀(jì)要、工作總結(jié)以及信息系統(tǒng)中的日志、OA流轉(zhuǎn)文件、網(wǎng)站新聞等紙質(zhì)或電子文檔。這些數(shù)據(jù)都是審計(jì)資料的一部分,其中蘊(yùn)含的信息價(jià)值能夠轉(zhuǎn)化為審計(jì)線索和證據(jù)。近年來,基于文本數(shù)據(jù)分析的大數(shù)據(jù)審計(jì)方法逐漸受到關(guān)注,通過信息抽取方法從非結(jié)構(gòu)化文檔中提取關(guān)鍵信息,進(jìn)行結(jié)構(gòu)化存儲和程序化稽核,能極大提升審計(jì)效率,有效降低審計(jì)風(fēng)險(xiǎn)。
1文本信息處理在審計(jì)中面臨的難點(diǎn)
(1)缺乏標(biāo)準(zhǔn)化審計(jì)方法。面對文本數(shù)據(jù),傳統(tǒng)審計(jì)更多的是實(shí)行人工分析方法,采用瀏覽識別、輔助觀察以及審核等審計(jì)手段,高度依賴審計(jì)人員的差異化個(gè)體能力、經(jīng)驗(yàn)和工作耐心,缺乏完善的數(shù)據(jù)采集、存儲、處理、分析、校驗(yàn)等審計(jì)流程和統(tǒng)一標(biāo)準(zhǔn)的審計(jì)方法,審計(jì)人員在海量數(shù)據(jù)中獲得有價(jià)值的信息、搜尋風(fēng)險(xiǎn)線索變得較為困難,數(shù)據(jù)利用難度較高,影響審計(jì)目標(biāo)的實(shí)現(xiàn)。……