張晶, 康鵬, 戴艷, 楊新敏, 李磊
(1.國網甘肅省電力公司, 甘肅, 蘭州 730030;2.國網甘肅省電力公司檢修公司, 甘肅, 蘭州 730050)
審計是國家對單位財務信息的重要監督和統計制度,隨著大數據和信息處理技術的發展,采用信息化的特征分析和系統設計方法來實現審計的信息化管理和數據查詢,提高審計過程的可靠性和有效性。數字化審計系統數據的查詢技術研究是實現信息化審計管理系統底層數據庫設計的關鍵技術,通過數字化審計系統數據查詢優化設計,建立數字化審計系統數據的融合和特征聚類模型,采用智能化的信息管理和模糊數據聚類技術,實現數字化審計系統數據快速查詢和信息融合,提高數字化審計系統數據查詢和監測能力。數字化審計系統數據快速查詢方法研究在審計系統優化設計中具有重要意義[1-2]。
對數字化審計系統數據快速查詢的設計方法主要是通過分析數字化審計系統數據的相關性特征,結合融合聚類方法,實現數字化審計系統數據快速查詢。傳統方法中,文獻[2]提出一種基于模糊匹配的審計證據獲取方法,首先通過引入位置參數改進外存倒排索引結構,并采用非對稱查詢模式自適應地選擇待匹配數據,實現審計大數據表格公共字段的快速模糊匹配,保證了算法在大數據下的運行效率,其次在公共字段匹配基礎上,對字段內數據進一步進行相似性判斷,從而發現相似審計舞弊數據,獲得審計證據。文獻[3]提出改進粒子群優化算法的數據庫查詢優化方法,構建數字化審計系統數據快速查詢的語義本體結構模型,采用相關特征分析,實現數字化審計系統數據快速查詢。但是以上兩種方法在數字化審計系統數據查詢的過程中,數據查詢的尋優能力較差,導致查詢時間較長,降低了數字化審計系統數據查準率[4]。
針對以上方法存在的問題,本文提出基于蟻群優化的數字化審計系統數據快速查詢方法。首先對采集的數字化審計系統數據進行預處理[5],在最優變異度約束下,提取數據特征,然后采用蟻群算法進行數據查詢的尋優控制,實現數據快速查詢,最后進行仿真測試分析,展示了本文方法在提高數字化審計系統數據快速查詢能力方面的優越性能。
為了實現基于蟻群優化的數字化審計系統數據快速查詢,采用分布式鏈路節點跟隨識別的方法實現對數字化審計系統數據采集和存儲結構分析,結合壓縮感知和分段融合的方法,分析數字化審計系統數據的分塊存儲結構模型,引入Block塊匹配結構,通過數據集的位置標定和窗口函數分析,實現對數字化審計系統數據的高維特征匹配和信息融合處理[6],本文引入了一個工作窗口機制,得到數字化審計系統數據的分塊存儲結構模型如圖1所示。

圖1 數字化審計系統數據的分塊存儲結構模型
根據上述數字化審計系統數據的分塊存儲結構模型,實現對數字化審計系統的底層數據庫融合,構建數據的空間數據發布模型,根據數據特征空間匹配結果,實現數據的線性跟蹤控制,基于查詢關鍵詞與歷史查詢數據的匹配性[7-8],實現對數字化審計系統數據搜索和匹配,得到數字化審計系統數據的線性跟蹤控制模型,如圖2所示。

圖2 線性跟蹤控制模型
根據圖2所示的數字化審計系統數據的線性跟蹤控制模型,假設Gc表示數字化審計系統數據庫的關聯譜特征分布的有向圖G1和G2的交集,在有向圖G1和G2的傳輸鏈路節點中,分析數字化審計系統數據庫的鄰域空間A,B和C的共同節點,當數字化審計系統數據的存儲空間屬于G1和G2[9-10]。計算有向圖G1、G2語義模糊特征分布域Sr,通過對采集的數字化審計系統數據進行非線性樣本重組,得到非線性相關匹配集的計算公式為
(1)
式中,n(G1)和n(G2)分別表示數字化審計系統數據庫分布有向圖G1和G2中的查詢節點數目,n(G1∩G2)表示數字化審計系統數據的交叉語義分布集。在數字化審計系統數據存儲的公共結點中,通過語義融合,采用模板匹配和線性規劃設計的方法進行數字化審計系統數據降維處理[11-13],得到降維輸出為

(2)

構建數字化審計系統數據的特征重構模型,形成數字化審計系統數據特征分布的語義相似度σ:
σ=SC*(a+[n(G1)-n(G2)]*Sr)
(3)
式中,a表示數字化審計系統數據的相鄰特征匹配系數。當Sr=0時,數字化審計系統數據特征分布的語義相似度σ取決于SC*a。數字化審計系統數據的相鄰特征匹配系數a表示為
(4)
式中,n(GC)表示在有限域Gc中查詢到的數字化審計系統數據的主題詞數量,ε表示數字化審計系統數據的模糊度辨識參量,mGC(G1),mGC(G2)分別表示數字化審計系統數據分布域G1、G2的關聯規則特征分布集。采用蟻群尋優的方法進行數字化審計系統數據查詢過程中的速度vi和位置收斂控制xi,得到數字化審計系統數據查詢的蟻群尋優的過程目標控制函數f表示為
(5)
式中,γ2表示為數字化審計系統數據查詢的蟻群尋優全局極值位置,當γ2越小,數字化審計系統數據查詢的相似度水平越高。由此得到數字化審計系統數據查詢最大和最小閾值控制參數ximax和ximin。由此得到數字化審計系統數據在區間(-1,1)之間的解釋控制變量cxi:
(6)

(7)
利用數字化審計系統數據特征的差異性實現信息融合,提高數字化審計系統數據的檢測和特征識別能力。
在上述數字化審計系統數據降維處理和數據特征提取的基礎上,采用蟻群算法進行數據查詢的尋優控制。首先根據蟻群個體的差異性實現對數字化審計系統數據查詢的異常特征判斷,提取數字化審計系統數據的可靠性文本結構特征量,并對文本結構特征量進行加窗處理,窗函數形式為
(8)
式中,N(t)表示數字化審計系統數據的關聯語義特征分辨率。采用多尺度平移控制的方法,建立數字化審計系統數據檢測模型,得到語義關聯度為
(9)
式中,數字化審計系統數據分布的模糊度點集滿足UT=U-1。采用蟻群尋優的方法,得到數字化審計系統數據挖掘的覓食環境參數分布模型,根據蟻群覓食環境擬合,構建數字化審計系統數據查詢的環境特征分布式融合檢測模型,得到播散信息素規則函數:
(10)

在模糊聚類中心采用蟻群優化算法對數字化審計系統數據的快速檢索和識別,根據特征提取和聚類分析結果,在全局最優解約束進化下,得到螞蟻完成一次循環后的局部核函數表達式為
(11)

(12)
(13)
式中,vt表示數字化審計系統數據查詢的速度,xt表示t時刻的時間尺度,c1表示數字化審計系統數據查詢聚類的空間規劃系數,α1和α2是[0,1]之間的隨機數。通過獲取全部新產生的全局最優解,實現對數字化審計系統數據的快速查詢,得到查詢實現過程如圖3所示。

圖3 數字化審計系統數據查詢實現過程
為了驗證本文方法在實現數字化審計系統數據快速查詢中的應用性,采用MATLAB進行仿真實驗分析。實驗中選取數字化審計系統數據的采樣樣本集為3 600,訓練樣本數為240,對數字化審計系統數據采集的延遲率為0.46,數據采樣的頻率為13.5 kHz,實驗對象中抽取數字化審計系統數據樣本數分別為80、120、200、340、…、1 550,每個數字化審計系統數據樣本含有1 000個實驗數據。
根據上述參數設定,分別采用文獻[3]提出的審計大數據下模糊匹配審計證據獲取方法、文獻[4]提出的改進粒子群優化算法的數據庫查詢優化方法和本文提出的基于蟻群優化的數字化審計系統數據快速查詢方法,對數字化審計系統數據查詢時延進行比較分析,比較結果如圖4所示。

圖4 數字化審計系統數據查詢的時延對比
分析圖4得知,采用本文方法進行數字化審計系統數據查詢,隨著數據量的增加,數據查詢時延逐漸增大,但本文方法的查詢時延較文獻[2]提出的審計大數據下模糊匹配審計證據獲取方法、文獻[3]提出的改進粒子群優化算法的數據庫查詢優化方法的查詢時延短。
測試文獻[2]提出的審計大數據下模糊匹配審計證據獲取方法、文獻[3]提出的改進粒子群優化算法的數據庫查詢優化方法和本文提出的基于蟻群優化的數字化審計系統數據快速查詢方法的數字化審計系統數據查詢的最優解,得到測試結果見表1。

表1 數字化審計系統數據查詢性能對比
分析表1中的數據得知,本文方法進行數字化審計系統數據查詢的尋優能力較好,且查詢時間最短,說明本文方法的數字化審計系統數據快速查詢效率較高。
為了進一步驗證本文方法的有效性,對文獻[2]提出的審計大數據下模糊匹配審計證據獲取方法、文獻[3]提出的改進粒子群優化算法的數據庫查詢優化方法和本文提出的基于蟻群優化的數字化審計系統數據快速查詢方法的數字化審計系統數據查準率進行比較分析,比較結果如圖5所示。

圖5 數據查準率對比結果
根據圖5可知,本文方法的數字化審計系統數據查準率最高可達100%,而文獻[3]提出的審計大數據下模糊匹配審計證據獲取方法和文獻[4]提出的改進粒子群優化算法的數據庫查詢優化方法的數字化審計系統數據查準率最高只有68%和80%,本文方法的數字化審計系統數據查準率比文獻方法好,說明本文方法的數字化審計系統數據查詢效果較佳。
本文提出基于蟻群優化的數字化審計系統數據快速查詢方法。引入Block塊匹配結構,通過數據集的位置標定和窗口函數分析,實現對數字化審計系統數據的高維特征匹配和信息融合,采用模板匹配和線性規劃設計的方法進行數字化審計系統數據降維處理,采用蟻群尋優的方法進行數字化審計系統數據查詢過程中的速度和位置收斂控制,獲取最優解,實現對數字化審計系統數據的快速查詢。仿真實驗分析得知,本文方法進行數字化審計系統數據查詢的時間開銷較短,查準率較高。