徐軍
(上海開放大學普陀分校,上海 200062)
在財務系統的日常運行中,傳統的財會人員需要完成核算、報表審查與分析等多種工作。但這些工作通常存在功能較少的缺點[1-4],難以滿足日益增長的管理需求。為避免系統的這一缺點,充分挖掘財務系統的多元化價值,國內外較多的科技公司進行了大量的嘗試[5-7]。其中,2000-2010 年期間,華為與中興等國內科技公司首次嘗試建立了全球的財務共享服務中心,從而降低財務的管理成本與業務效率[8-10]。隨著人力資源成本的快速升高,以及云計算與大數據等新型技術的出現,工程款與勞務費等多種財會工作占據了大量的資源與成本,直接導致財務管理成本的不斷攀升。
為了盡量降低財務系統的管理成本,同時更加精確地判別與預測賬戶風險,通過引入流程自動化技術與人工神經網絡算法,該文實現了大量機械重復性工作的自動執行,同時完成了賬戶風險的科學判別與預測。文中利用K-means 聚類算法[11-16],對大量的財務數據樣本進行了學習與分類,進一步優化了財務系統的工作執行策略,盡量規避人工風險評價的主觀性與片面性。
通常財務共享系統是以多種互聯網技術為底層部件,以規范性與程序性為處理業務原則,降低重復性勞動與人為主觀判斷行為的新型財務服務中心,其基本結構如圖1 所示。

圖1 財務共享系統基本結構圖
流程自動化是一種基于大數據的軟件自動化技術,該技術適用于財務共享系統,其主要原因在于以下幾個特征:
1)流程自動化技術是一種在電腦桌面運行的自動化軟件。該技術屬于軟件領域之內的機器人技術,能夠完成機械重復與規則明確的自動軟件運行。
2)流程自動化技術具有遠超人工的精確度與工作效率。在維持數據處理速度與精確度的前提下,流程自動化技術具有全天候及不間斷的工作能力,尤其適合大規模的企業財務運營。
3)流程自動化技術是基于非侵入式的外掛式軟件。其通過模擬用戶的基本操作,完全不影響用戶的操作軟件架構。其執行周期較短,且易于非專業人士理解。
4)流程自動化技術具有低成本與低風險的特征。其無需人工干預,只要合理地設定執行規則,相應的執行過程就不會發生錯誤,且提供高可靠性的流程檢查。
文中利用流程自動化技術,實現了多種高重復性的流程執行,包括開票流程執行、自動對賬、收款核銷與信用管理等。以開票業務為例,其詳細工作流程如圖2 所示。

圖2 開票自動化的工作流程圖
在20 世紀40 年代,為構建神經元的數學模型,國外的學術界提出了具有大規模并行處理能力的人工神經網絡算法。通過模擬神經元細胞的工作過程,神經網絡算法可以自動衡量與評價企業財務賬戶的風險情況,其實現一般可分為4 個步驟,其詳細內容如下。
1)初始化:神經網絡算法需要完成多個參數的設計與初始化,這些參數主要包括輸入層、輸出層與隱含層的神經元數目及其權重。其中,輸入層的神經元數目由樣本指標數量決定,輸出層的神經元數目由數據類型決定,其權重可通過隨機數、學習率與傳遞函數共同決定。
2)正向傳播:利用輸入層的數據與權重值,執行相應的線性變換,利用傳遞函數,即可獲取隱藏層多個神經元的值。再經過隱藏層的反復運算,可以得到輸出層神經元結果。
3)計算擬合值與輸出之間的誤差:擬合值與輸出層神經元之間存在一定的差異,這一步需要精確地計算該項誤差,從而進一步對該神經網絡算法的參數進行調整。
4)反向傳播:利用梯度下降法,對誤差函數進行優化,獲取神經網絡算法中隱藏層的最優權值。
根據神經網絡算法的4 個關鍵步驟,文中制定了適用于財務系統的算法執行流程,如圖3 所示。

圖3 神經網絡算法的實現流程圖
在神經網絡算法的執行階段,財務系統風險評價需要利用數學統計模型和神經網絡算法進行較為精確的判別和分類,從而衡量多個企業的財務風險,實現應收賬款的流動性。在該算法的執行過程中,數據集還存在一定數量的噪聲樣本,增加了神經網絡算法的執行難度,降低了該算法的最終結果質量。
通過含噪數據樣本的多輪訓練,系統能夠提取出輸入層、隱含層與輸出層之間的多種權重矩陣。利用這些權重矩陣,系統即可自動判別多個客戶的財務現狀,同時獲得其財務現狀與多項指標之間的非線性關系。通過詳細的分析驗證可知,在企業財務風險評估方面,神經網絡算法具有較好的可行性。
在機器學習中,聚類算法負責從設定的角度搜集與分類數據,常用的算法主要有K-means 聚類、均值漂移聚類、基于密度聚類、高斯混合模型聚類、凝聚層次聚類與團體檢測等算法。其中,K-means 聚類算法是目前應用范圍最廣的聚類算法之一,由于具有簡潔的執行原理、較優的運行效果與較低的實現難度,該算法被廣泛應用于數據處理、模式識別與數據挖掘等新興領域。
假設d維樣本數據集是待分類的數據集,其n個簇分別由F1,F2,…,Fn表示,其中心數據點分別為c1,c2,…,cn,且(1 ≤i≤n)。其中,ki是簇Fi中數據點的數量,x表示簇Fi中的某個數據點。一般而言,令Ob表示聚類算法的目標函數,其數學表達式如式(1)所示。

其中,dij(ci,xj)表示數據簇Fi中某個數據點xj到數據中心點ci之間的歐式距離,即衡量每個數據點到數據中心點之間的歐式距離之和。此時,目標函數值Ob越小,簇類的分布就越緊湊。當目標函數Ob達到最小值時,其相對應的聚類方法則達到最優狀態。
利用K-means 聚類算法的基本原理和目標函數,文中制定了財務系統所使用聚類算法的具體步驟,其具體內容如下。
1)從d維樣本數據集中選取n個初始的數據中心點,分別使用c1,c2,…,cn表示。
2)以c1,c2,…,cn為中心點,對數據集進行劃分,其遵循原則:令i,l=1,2,…,n,j=1,2,…,ki且l≠i;若dij(ci,xj) 4)若?i∈{1,2,…,n},均成立,或者算法的迭代輪數超過最大允許迭代次數,則結束算法執行,輸出數據中心點結果,形成最終簇;否則,令第s+1 輪的數據中心點結果作為新簇,跳轉至2)繼續執行。 5)輸出數據集的聚類結果。 根據以上步驟,K-means 算法需要執行多輪迭代。其具體迭代流程,如圖4 所示。 圖4 K-means聚類算法的具體執行流程 為了驗證流程自動化技術、神經網絡與K-means聚類算法的有效性與可行性,基于實際的財務系統,文中對這些技術進行了必要的仿真與分析。需要說明的是,由于流程自動化技術與神經網絡算法被綜合運用于K-means算法的執行過程中,所以該文并沒有單獨對前者進行仿真,而是直接對K-means算法進行仿真與分析。在具體仿真過程中,文中隨機選取了某企業379項財務數據,利用K-means算法,對這些數據樣本進行了科學的分類和變量分析,其主要步驟如下: Step1:通過分析系統的多種變量,分析企業財務現狀是否滿足變量分析的前提; Step2:針對多種變量的統計結果,提取相應的風險相關變量,利用神經網絡算法進行變量提取運算; Step3:根據神經網絡算法的運行結果,解釋多種變量的實際現狀; Step4:計算各個變量的多項觀測分數。 通過執行以上Step1~Step4 的相關步驟,得到的結果如圖5、圖6 所示。 圖5 K-means算法執行步驟示例 圖6 K-means聚類算法的執行結果 由圖5、圖6 可知,文中提出的K-means 算法準確地完成了財務賬戶數據的處理與分析,與現有財務系統對接方便,有效實現了財務賬戶風險的評級、判斷與預測,具有較好的可行性與有效性。對于未來財務系統的設計與分析,該文所提出的技術具有一定的借鑒與參考價值。 通過綜合利用流程自動化技術、神經網絡算法與K-means 聚類算法,文中提出了企業財務賬戶的風險管理技術,實現了高重復性流程的自動執行,賬戶風險的準確評價、判別與預測。然而,文中所提技術實現的功能仍比較單一,例如:該文的K-means 算法仍未能全面實現財務系統中供應商的賬戶分類、判別與預測,將在未來的研究中完善這一問題。
5 仿真結果與分析


6 結束語