陳波 田進 劉健 陳宇齊
在大數據時代,人工智能將推進會計在信息輸入環節實現全面的智能化和自動化,在數據輸出環節提供更具個性化和智能化的信息表達,以高度契合使用者的會計信息需求。會計的行業格局與業務范式由此將深度改變(涂建明、曹雅琪,2017)。這種改變是不可避免的,其路徑和影響程度是值得研究的問題。
能行可計算性是在某種精確化基礎上所定義的精確概念。當前,人工智能發展到機器學習(強化學習)階段,主流可實現應用依然是基于西蒙的邏輯主義——基于對問題的精確模型,建立搜索空間,以邏輯形式化、概率形式化和決策論形式化為主要特征——其計算機語言底層邏輯即能行可計算性。因此,對會計核算的能行可計算性進行研究,有助于理解人工智能對會計的改變。
張寅生(2016)認為,計算是一個步驟(有順序的操作)的集合,算法是可機械執行的過程的表述,計算的本質首先是算法的實現,實現邏輯上預期的目的,即函數的映射。不論從理論還是從實務來看,會計核算都是有順序操作的集合。余秉堅(1999)將會計核算的過程界定為:設置賬戶和賬簿、復式記賬、填制和審核憑證、登記賬簿、成本計算、財產清查和編制會計報表等。與所有的計算同理,會計核算也需遵從其內生邏輯。
會計核算是一種認識過程。唐星齡(2006)認為從現代會計的一般狀況來看,會計起著語言般的作用。會計準則是會計語言的語法。葛家澍認為,考慮會計是國際通用的商業語言,而會計規范作為這種特殊“語言”的語法,也在國際上形成了一定的通用形式,那就是會計準則。會計核算是由會計人員完成的用會計語言(會計概念)摹寫特定主體經濟行為并把握其運動規律的過程。代金宏(2007)認為,會計概念的抽象和概括功能才能使會計實踐簡單化和程序化,是會計概念間的這種由此及彼、環環相扣的聯系才能規劃和設計出有效的會計循環的流程。會計術語規則決定了會計信息系統可以采用析取和合取方法從特定環境中抽取信息,實現經營數據向會計數據的轉換。王艦(2014)進一步將會計術語規則推演為編碼規則。他認為,會計人員憑借自身對會計數據的感知,利用編碼對原始憑證進行會計數據的提取,制作出記賬憑證,實現非結構化數據的結構化處理和業務信息到會計數據的轉變,完成對經濟業務的反映,最終利用計算機完成基本的會計業務操作。
語言和數字都是符號系統,符號計算是可以機械執行的。喬姆斯基(2008)證明語言計算可以用圖靈機實現,喬姆斯基語法等同于圖靈機,所有的高級程序語言都遵從喬姆斯基語法。每行高級語言代碼都對應一個有限狀態自動機,一段代碼就是若干有限狀態自動機按照一定的計算結構嵌套在一起,由此,代碼實現計算,代碼與存儲、通訊的結合構成人工智能的基礎。
綜上所述,會計核算作為一種語言使用和語法(會計準則)運用過程,其一旦可以用高級程序語言表述,那么,其就是能行可計算的。
按照會計準則規定,會計核算的實質是會計要素的確認、計量和披露。以程序結構來看,會計核算是包含了順序結構、分支結構和循環結構的復雜結構。運用C語言的for、if、switch case等語句可以將會計核算表述如下:
(一)會計核算整體結構的能行可計算
//復式記賬、填制憑證
For (int i=0;i〈= 感 知 單 元 總數;i++)
{ switch(感知())
{
Case ‘經濟利益流出’:經濟利益流出核算();
Break;
Case ‘經濟利益流入’:經濟利益流入核算();
Break;
Default : 人工處理();
}
}
If (today is ending of month)
{
資產減值();
損益結轉();
}
//登記賬簿
For (int i=0;i〈= 當日新增憑證號;i++)
{
登記賬簿();
}
//編制報表
If (today is ending of month/quarter/year)
{
編制會計報表();
}
按照計算結構,可以將會計核算過程和細節全部重新表述。這種表述是根據感知的結果進行判斷、分支和執行。感知結果與分支和執行之間是逐項枚舉的,會計核算也因此具有能行可計算的。也即是說,只要能夠感知企業活動的經濟意義,就可以遵循相應會計準則規定完成會計核算。顯然,準確的感知結果是會計核算公允性、真實性和完整性的基礎。
(二)會計感知過程不滿足能行可計算性
感知是信息加工過程,感知的結果通常以數據形式表現。會計工作的感知對象是企業活動所涉及的資源變動及其過程,用數據來表達企業活動,感知結果是一組實體和一系列事件所反映的關于企業(系統)狀態的數據集合。為便于運用會計術語規則進行析取和合取,以會計概念的種屬關系建立感知單元的e-r關系,并在實體中植入相應算法函數,實現感知結果到會計信息抽取過程。
1.構造感知函數
(1)確定自變量和因變量。一項交易或事項所涉及的會計屬概念包括但不限于:票證、交易標的、支付工具、組織架構、合同責任、管理意圖、商業實質、法規遵循、關聯方關系、與其他交易或事項的關系。為使其能夠計算,應當構造相應的會計屬概念及其組合與會計處理或分錄的映射關系。在構造出的函數關系中,會計屬概念是“自變量”,相應的會計處理或分錄是“因變量”。
(2)確定自變量定義域和輸出值域。計算是根據自變量取值不同,按照函數映射關系,進行取值的過程。為此,須對各會計屬概念的種差進行編碼,構造出各會計屬概念的定義域;同時,將各種會計處理和分錄進行編碼,構造出相應的輸出值域。
(3)確定定義域與值域的映射關系。按照會計準則規定,建立定義域編碼與輸出值域編碼的析取、合取或互蘊規則,從而完成感知函數的構造。
2.感知函數的更新和運行
(1)函數更新
函數更新包括自變量和因變量的增刪、定義域和值域的廣延、邏輯(析取、合取或互蘊)規則的修改和增刪。函數的更新是自我意識的體現,只有當機器產生意識涌現后才可能實現。意識涌現已經超出本文的討論范圍,不再討論。
(2)自變量賦值
對自變量進行賦值,是感知函數運行的核心。自變量賦值的準確性決定了感知結果的準確性。自變量賦值的不同,不僅確定了交易或事項的會計分類,更重要的是確定了交易或事項在會計陳述(摹寫)中的因果關系。“有借必有貸,借貸必相等”不僅僅是一項謂語運算,更重要的是資產價值與權利價值關系的會計判斷,是企業活動——資金運動內涵因果關系的反映。感知函數本身是不能判斷自變量賦值的正確性的,函數只是在遵循邏輯規則得出預期的結果,其本身不知道結果是否正確及其含義。因此,需要另外的方法或手段對感知函數的自變量賦值。
在傳統會計核算中,這項工作是由會計人員完成的。如果將此項工作交由機器完成,那么機器應當完成至少兩個步驟的工作:一是原始資料到會計種概念的計算,即標注;二是會計種概念到會計屬概念的計算。第一步驟是第二步驟的基礎,第一步驟出錯,必然導致第二步驟出錯。
第一項工作涉及到文字識別、圖形識別等。文字識別也就是自動語言處理(Natural Language Processing, NLP)。文字識別是人工智能最重要,也是最艱難的方向。自然語言處理從規則計算到統計算法模型,經過幾十年的發展已經取得非常可觀的成果。但是自然語言處理的已有成果(算法和學習系統)在會計核算應用仍然存在以下問題尚待解決:
一是無法構造強化學習的獎賞函數。機器學習通常被分為無監督學習、有監督學習和強化學習。強化學習是介于無監督學習和有監督學習之間,是模仿生物在適應環境過程的進化過程中采用的方法。張文旭(2018)認為只有強化學習的無模型學習方式才是超越人類水平的關鍵。完整強化學習系統包括策略、獎賞函數和值函數,其中,值函數是一個累計回報函數。按照強化學習系統的要求,為使此系統完成學習,必須對每一學習策略結果給出獎賞,由此建立策略與累計回報值的關系。當運用強化學習系統完成原始資料到會計種概念的轉換時,由于會計核算的公允性、真實性和完整性過于抽象概括,無法據此寫出精確的獎賞函數。錯誤的獎賞函數必然得到錯誤的累計回報,進而得出錯誤的策略。
二是無法計量強化學習結果誤差的經濟影響。即使能夠寫出精確的獎賞函數,確定了強化學習系統,但無法確定能夠設計出足夠優美的神經網絡,使梯度下降算法的殘差為零,所構造出的強化學習系統不能確保不得出錯誤的策略。由此,強化學習系統的結果誤差產生的經濟影響不能被其自身準確計量。
三是訓練樣本量不足。按照切比雪夫不等式,為使強化學習結果趨近于期望值,需要提供一定的樣本給強化學習系統;而且樣本量越大,訓練結果越好。但從企業活動實踐的常識來看,越重要的事項,發生的次數越少,且淹沒在大量的不重要事項中,強化學習系統極可能忽視這種差別,將其視為可容忍誤差。
四是隨著企業活動的改變,強化學習過程無法收斂。強化學習的前提假設是在一個馬爾科夫鏈中完成學習,任何策略都可以在有限步數內以概率1到達最終狀態。一個企業的活動可以被抽象為若干馬爾科夫鏈,這使得強化學習系統學習過程非常長,更為重要的是企業活動不會一成不變,這將導致強化學習過程極可能無法收斂。
漠視以上每一項都不能保證會計核算的公允性、真實性和完整性,或者不能合理估計保證程度。強行使用這樣“帶病”的人工智能完成會計核算,是有損會計倫理的。
綜上所述,會計核算是可以按照計算原理重新構造,但是構造出的會計核算計算結構在運用過程中,還有更基礎的問題——如何進行感知函數自變量賦值和如何進行感知函數更新尚待解決。在現階段乃至今后很長一段時間,這些問題仍需要人工完成。會計學科的整體人工智能化需要大量的會計科研人員、從業人員共同累計數據、篩選規則、建立制度。
對同樣的原始文件或者資料,正確的標注應當只有一個,錯誤的標注則有無窮個。發現、整理和歸納錯誤標注的特征及其影響,將有助于評估企業活動固有風險和控制風險,發現會計假設與經營活動邏輯不自洽的跡象。找出風險點和風險信息組合,予以改進,將有益于提高企業活動效率和會計核算水平。
而且,不可否認,會計準則也存在不完備性。傳統方式下,對會計準則不完備性的理解和掌握,通過會計人員的經驗予以表現和傳承。人工智能的應用,可以通過對會計準則的可計算性仿真和推理,枚舉會計準則不完備性的具體表征,使得會計人員有的放矢地運用會計判斷,提高會計信息的可比性。
因此,當會計核算機器學習系統被定義為一個企業活動的規范信息陳述模擬器,其可能遭遇的會計倫理問題和無法克服的技術難題,將迎刃而解。因此,現階段人工智能在會計核算的應用路徑為:“仿真模擬——試錯——發現潛在問題”。
假設:企業行為均可以歸屬到某項合同行為;每項合同行為都對應一項作業;每項作業的執行必然引起企業資源和義務的變動。
企業會計基本準則要求企業應當如實反映符合確認和計量要求的各項會計要素及其他相關信息,保證會計信息真實可靠、內容完整。企業會計具體準則將“可靠地計量”作為確認交易或事項的前置條件,計量是標準的測量,是在可測空間里完成的測量。界定會計信息測度空間是會計信息質量的重要基礎工作。
在現代社會,合約建構了企業的環境和行為。企業生存在一個由法律上約束性和法律上非約束性的責任交織在一起的網絡中,企業自愿或者被迫進入這個網絡,履行合約責任。企業活動所需的資金、設備設施、技術、人力資源等資源由合約界定;企業活動的目的和過程如銷售、提供勞務、投資等,乃至企業活動形成的義務如售后承諾、薪酬激勵、資金利息等亦由合約決定。合約還確定了企業活動對法律法規的遵循關系。
合同具有規范的體裁。《合同法》第十二條規定合同的內容一般包括八項條款,以及合同還具有編號等其他慣例。合同的規范性使得在企業內合同之間的“交、并、差”運算是封閉的,比如銷售合同與采購合同的差是空集,銷售合同與采購合同的交集是非貨幣資產交換合同或者售后回購合同,銷售合同與采購合同的并集則構成企業生產或經營的過程;發行債務工具合同和購買金融資產合同的差是空集,這兩項合同的交集是回購式資產證券化合同;發行債務工具合同和購買金融資產合同的并集則構成企業投資和籌資的過程。合約的表現形式——合同,因具備普遍性、規范性、可計算性和有限性,使其成為描述企業會計信息測度空間的一個視角。
雖然合同種類眾多,以會計準則中“經濟利益的流入或流出和義務的產生與否”為標準對合同類別進行劃分,企業合同種類可分為流入無義務、流入有義務、流出無義務、流出有義務四類;而合同過程可分為準備、簽約、執行、終止四個階段。由此,合同種類及其過程構成了企業會計信息的可測系,即合同空間。合同空間是合同類型(Y軸)和合同過程(X軸)的結構空間,合同空間中的一個交叉區域是一個合同事件集合;多個合同事件集合疊加成企業活動。在每個合同事件集合中可以繼續引入其他標準(比如會計屬概念和種概念),對合同種類和過程繼續細分、歸類。只要合同分類標準是有限的,通過有限次迭代后,企業活動可以被結構化。

圖1 模擬器的構成
合同的可計算性和有限性為智能化會計核算提供了基礎。在合同空間中,一旦某個合同事件條件滿足,則啟動一系列會計處理。這種基于條件的反射以“if then”形式寫入代碼中,從而實現機械執行。當合同類型的組合(交、并集)出現多樣性,如前所述,銷售合同與采購合同的交集是非貨幣資產交換合同或者售后回購合同;兩者的區別在于交易標的是否指向同一標的,則用“switch-case”語句。通 過“if then” 與“switch-case”的多層嵌套,建立合同組合事件與會計處理之間的一一映射關系。
根據上述假設,模擬器的構成如圖1所示。
(1)采集器。按照資源-作業-義務建立感知單元組;以合同行為與會計循環的關系建立通訊架構。采用隨機發生器,對感知單元進行隨機賦值。
(2)標注器。各會計概念的發生額可由下式獲得:

(3.2)
其中,t為時間。
以上方程都是謂語形式,故是可計算的。
(3)薄記系統。在特定主體內,薄記有確定分類和確定因果兩部分組成。其中,確定分類的偽代碼如下:
While (m〈合同事件總數)
{按照合同事件的維度,求交集。
將交集賦值給某個會計概念。
將此會計概念余額與所有感知單元余額比較;
相符,則記錄并存儲會計概念值、會計概念和交集組合的關系、此交集的形式。
}
確定因果關系的公式如下:

其中,t表示時間。
以上方程組是謂語形式,故是可計算的。
確定因果關系的偽代碼如下:
While (△entropy(報表項目)〉=最小熵增設定值){
While (l〈財產要求權屬性分類總數){
While (s〈會計科目范圍屬性分類總數){
按照會計科目范圍的維度,求會計概念交集。
將交集賦值給某個會計科目。
按照財務要求權屬性,求會計科目交集。
If (資產科目發生額合計==會計科目合計數) then exit
記錄并存儲資產科目、資產科目與會計科目的關系、會計科目與會計概念的關系。
}
}
}
(4)列報系統。根據薄記系統的結果和會計報表列報規則,得出財務報告。
由于本模擬器的輸入是隨機生成的,因此,最終的累計回報函數采用信息熵增函數形式。這樣的設置使系統具有完整的邏輯。在仿真時,在最小熵增值的設定取決于計算工具的能力。模擬器中涉及合同事件、會計概念、會計科目、財產要求權均以相應的表格形式予以實現,構成模擬器的專家系統部分。
本文以一家總分店式架構(共有5戶門店)美容連鎖企業為對象,根據其活動特征,按照上述原理搭建其經營活動模擬器。在隨機仿真運行時,很快發現了該企業的信息流分類標準和最小信息集、最小經營過程集和最小會計核算集;并且找到208個風險點。并按照模擬結果為其提供相應的咨詢整改建議。
由于應用目標對象的規模較小、經營業務與相應會計核算不復雜,可能導致該項應用的推廣價值有限。但也正因此,使得將人工智能運用到企業仿真模擬的嘗試,得到了完整的驗證。通過此次應用,筆者也找到了系統擴展的邏輯,并進一步加深理解了企業會計的內在邏輯:會計仍是最簡潔的企業信息分類標準和陳述工具。

綜上所述,主要的結論有:
一是由于感知函數的映射關系、定義域和值域都是預先設定的。高素質的會計人員是會計核算算法模型的制定者和更新者,即使在機器擁有自我意識后,會計判斷與價值觀的聯系不會改變,高素質會計人員也將是會計價值觀的守護者。
二是人工智能的引入,使得會計作假的層次更加豐富,這一方面要求會計人員為此必須加強商業倫理、會計價值觀和會計準則的學習。另一方面需要審計人員提高審計工作的針對性,分別就算法邏輯層、規則層、變量層、變量取值范圍等人工智能系統提出相應的審計策略。
三是人工智能作為企業信息規范陳述模擬器,以會計核算和會計準則對企業活動進行規范陳述,可以為企業經營者決策提供有力的支撐。人工智能是企業經管人員的可靠助手,這可能是目前人工智能在會計領域最可行的應用路徑。