班妙璇
摘?要:隨著大數(shù)據(jù)時代到來,企業(yè)每天面臨海量數(shù)據(jù),如何從海量數(shù)據(jù)中篩選出有價值的財務(wù)數(shù)據(jù),并對其進(jìn)行針對性的篩選分析,最終得出有效的分析預(yù)測結(jié)果以支持企業(yè)運營決策成為財務(wù)部門的重點工作。此背景下,Python成為新型財務(wù)數(shù)據(jù)分析工具的首選,它語法簡潔清晰,可以高效的進(jìn)行財務(wù)數(shù)據(jù)挖掘、清洗和分析,實現(xiàn)財務(wù)數(shù)據(jù)自動化和可視化。本文以Python技術(shù)為視角,研究其在財務(wù)數(shù)據(jù)分析中的具體應(yīng)用,對于優(yōu)化和提升企業(yè)財務(wù)分析能力有一定的借鑒作用。
關(guān)鍵詞:Python;財務(wù)數(shù)據(jù)分析;大數(shù)據(jù)
中圖分類號:F27?????文獻(xiàn)標(biāo)識碼:A??????doi:10.19311/j.cnki.16723198.2023.12.020
0?引言
信息技術(shù)加速經(jīng)濟(jì)快速發(fā)展,同時使得各種經(jīng)濟(jì)數(shù)據(jù)呈幾何倍數(shù)增長,當(dāng)今社會迎來了數(shù)據(jù)大爆炸時代。而數(shù)據(jù)已然成為國家基礎(chǔ)戰(zhàn)略性資源,大數(shù)據(jù)正日益對全球生產(chǎn)、流通、分配、消費活動以及經(jīng)濟(jì)運行機(jī)制和國家治理能力等產(chǎn)生重要影響。從企業(yè)財務(wù)層面來看,企業(yè)從各種渠道獲取的財務(wù)信息日漸繁雜,如何從大量未經(jīng)處理的數(shù)據(jù)中篩選出有用信息,并有效利用數(shù)據(jù)信息指導(dǎo)和提升企業(yè)運營效果已經(jīng)成為財務(wù)部門的重點工作。在眾多的數(shù)據(jù)分析工具中,Python包含了豐富而強大的標(biāo)準(zhǔn)庫和第三方庫,能夠輕松完成財務(wù)數(shù)據(jù)挖掘、清洗,實現(xiàn)數(shù)據(jù)可視化和自動化等功能;最為關(guān)鍵的一點在于Python的語法簡潔、清晰,實現(xiàn)了無計算機(jī)背景的財務(wù)人員通過培訓(xùn)也能輕松掌握該編程語言的應(yīng)用,因此Python正被越來越多的應(yīng)用于財務(wù)領(lǐng)域。
1?Python在企業(yè)財務(wù)數(shù)據(jù)分析中應(yīng)用的優(yōu)勢
1.1?在處理海量數(shù)據(jù)、進(jìn)行復(fù)雜邏輯運算方面,Python效率遠(yuǎn)高于傳統(tǒng)財務(wù)分析工具Excel
過去,對于專業(yè)的財務(wù)人員來說Excel是必備的財務(wù)工具,可以方便實現(xiàn)數(shù)據(jù)計算和數(shù)據(jù)可視化。但Excel只適用于數(shù)據(jù)量不大、數(shù)據(jù)以數(shù)值為主,且較為簡單的邏輯計算的數(shù)據(jù)處理。隨著大數(shù)據(jù)時代的到來,每天海量數(shù)據(jù)紛至沓來,我們需要更為強大的數(shù)據(jù)處理工具來進(jìn)行數(shù)據(jù)處理。Python可以對多張報表靈活切換、分組、聚合、索引和排序,并且能嵌套使用各種函數(shù),還可以通過pandas接收各種類型數(shù)據(jù),并快速進(jìn)行數(shù)據(jù)操作、實現(xiàn)數(shù)據(jù)聚合和透視,具有靈活的時間序列功能等。
1.2?Python可以輕松實現(xiàn)自動化
運用Python可以輕松實現(xiàn)對Excel、word、PPT、PDF的批量操作。例如運用Python可以方便的處理Excel表格數(shù)據(jù),對表格數(shù)據(jù)進(jìn)行讀取、寫入、批量修改格式等。同時,在財務(wù)工作中我們要經(jīng)常寫一些工作總結(jié)和分析報告等,通過Python可以對word和PPT文檔進(jìn)行批量讀寫和生成。隨著電子發(fā)票的普及,很多企業(yè)都會涉及通過電子郵件收取發(fā)票,倘若每日發(fā)票傳送量較大,財務(wù)人員可以通過編輯Python代碼可以實現(xiàn)自動化收取,省去大量重復(fù)的日常工作,提升工作效率。
此外,Python中的數(shù)據(jù)操作和數(shù)據(jù)分析代碼還可以保存為腳本,自動處理重復(fù)性任務(wù)。當(dāng)財務(wù)人員寫好一個Python腳本后,可以將其用于所有相似的Excel文檔的處理。
1.3?Python可以方便實現(xiàn)數(shù)據(jù)可視化
Python在數(shù)據(jù)可視化圖表展示方面非常靈活。數(shù)據(jù)可視化的重要作用在于通過圖表和圖形方式將數(shù)據(jù)信息以更為直觀的方式呈現(xiàn)給決策者和數(shù)據(jù)使用者,讓數(shù)據(jù)使用者能更快速準(zhǔn)確的讀取數(shù)據(jù)內(nèi)的核心信息,以進(jìn)行有效決策。Python工具在數(shù)據(jù)可視化方面有很多功能強大的庫,比如Pyecharts。與Excel等軟件自帶現(xiàn)成的數(shù)據(jù)可視化功能相比,其最大好處在于更靈活、能更好地適應(yīng)個性化、特殊化需求。Python的其他庫,如plotly和D3可以將數(shù)據(jù)可視化作成交互式圖表和圖形,這些圖表和圖形比Excel自帶的圖表和圖形更具創(chuàng)意和視覺效果。
1.4?運用Python可以靈活創(chuàng)建個性化財務(wù)模型,進(jìn)行分析預(yù)測
雖然在傳統(tǒng)財務(wù)應(yīng)用中,Excel也可以創(chuàng)建部分財務(wù)模型,進(jìn)行財務(wù)分析、決策和預(yù)測的工作。但是Excel的財務(wù)模型數(shù)量有限,而且對于比較復(fù)雜的模型構(gòu)建是沒有辦法實現(xiàn)的。Python正好可以彌補傳統(tǒng)財務(wù)分析軟件的不足,首先Python是一門編程語言,可以根據(jù)財務(wù)工作需要構(gòu)建多數(shù)據(jù)、多維度復(fù)雜的財務(wù)分析預(yù)測模型,提高分析的精準(zhǔn)度以滿足日益激烈的市場競爭。其次,Python的強大之處還在可以直接使用人工智能和機(jī)器學(xué)習(xí)的庫,生成對應(yīng)的分析和預(yù)測模型,這是傳統(tǒng)財務(wù)分析軟件難以企及的方面。
2?Python在企業(yè)財務(wù)數(shù)據(jù)分析中應(yīng)用現(xiàn)狀和面臨的難點分析
2.1?Python在企業(yè)財務(wù)數(shù)據(jù)分析中應(yīng)用現(xiàn)狀
筆者通過問卷調(diào)查、微信QQ訪談等方式調(diào)查了廣西區(qū)內(nèi)數(shù)十家各類型企業(yè)(包括大型國企、外資、中小民營、小微企業(yè)等),發(fā)現(xiàn)在廣西區(qū)內(nèi)全方面應(yīng)用Python進(jìn)行財務(wù)分析決策的企業(yè)幾乎沒有,僅有極少部分企業(yè)內(nèi)部的個別財務(wù)人員自學(xué)Python后運用該軟件進(jìn)行財務(wù)工作的改進(jìn),如編寫Python代碼實現(xiàn)電子電子發(fā)票的自動收取以代替人工下載;通過Python進(jìn)行多報表數(shù)據(jù)的聚合、篩選和排序,自動生成新的目標(biāo)報表等。由此看來,Python在財務(wù)領(lǐng)域的實際應(yīng)用還很少,更多的應(yīng)用在于提高工作效率的財務(wù)輔助功能,而Python的核心功能——進(jìn)行有效的財務(wù)決策和預(yù)測并未得到有效利用。
2.2?Python在企業(yè)財務(wù)數(shù)據(jù)分析中應(yīng)用面臨的難點和原因
通過Python在財務(wù)領(lǐng)域應(yīng)用現(xiàn)狀調(diào)查得知其應(yīng)用范圍和應(yīng)用的深度及廣度都是非常有限的,深入挖掘其應(yīng)用中面臨的難點和原因,主要有以下幾點。
2.2.1?Python學(xué)習(xí)難度大,掌握Python應(yīng)用技能的財務(wù)人員嚴(yán)重缺乏
我們都知道人才是第一生產(chǎn)力,目前財務(wù)領(lǐng)域的現(xiàn)狀是大量財務(wù)人員習(xí)慣了傳統(tǒng)的用友、金蝶等財務(wù)軟件,而不愿意跳出舒適圈學(xué)習(xí)的新的財務(wù)技能。另一方面,Python屬于編程語言,雖然相對于其他編程語言來說更簡潔、易懂,但是也要求很高的邏輯思維能力,對于非計算機(jī)背景的人員而言還是存在較大的挑戰(zhàn),因此導(dǎo)致很多財務(wù)人員因畏難情緒而不愿意主動學(xué)習(xí)。缺乏掌握Python技能的財務(wù)人員自然沒辦法令該技術(shù)在財務(wù)領(lǐng)域中普及應(yīng)用。
2.2.2?政府、會計行業(yè)和企業(yè)層面缺乏對于Python在財務(wù)應(yīng)用的引導(dǎo)規(guī)劃和支持
目前雖然Python培訓(xùn)在社會中掀起一輪又一輪的熱潮,但更多的是培訓(xùn)機(jī)構(gòu)自我吆喝的買賣。Python在財會領(lǐng)域中應(yīng)用的研究和培訓(xùn)更多也是局限于高校和培訓(xùn)機(jī)構(gòu),而沒有實實在在深入企業(yè)領(lǐng)域進(jìn)行實際應(yīng)用。從政府層面和會計協(xié)會來看,在Python應(yīng)用方面也沒有有效的引導(dǎo)和支持,使得該應(yīng)用難以得到有效的普及推廣。而企業(yè)層面更傾向于用現(xiàn)有財務(wù)軟件自帶的分析工具,對新鮮事物關(guān)注度不足。因此下一步要想使得該軟件能實際應(yīng)用于企業(yè)財務(wù)分析決策,必須加強校企合作,掌握該技術(shù)的高校科研人員深入企業(yè)一線,將該技術(shù)實際應(yīng)用于企業(yè)財務(wù)決策,并取得良好的實踐效果才有助于該軟件的推廣應(yīng)用。
3?Python在企業(yè)財務(wù)數(shù)據(jù)分析中的應(yīng)用過程
3.1?數(shù)據(jù)導(dǎo)入
數(shù)據(jù)導(dǎo)入是財務(wù)數(shù)據(jù)分析的第一步,在進(jìn)行數(shù)據(jù)導(dǎo)入之前,需先將數(shù)據(jù)分析中最常用的工具包Numpy、Pandas、Matplotlib等先導(dǎo)入Python。Numpy是Python生態(tài)系統(tǒng)中數(shù)據(jù)分析、機(jī)器學(xué)習(xí)和科學(xué)計算的主力軍,它可以實現(xiàn)對數(shù)組的數(shù)學(xué)運算、邏輯判斷、排序、篩選、統(tǒng)計運算等功能。Pandas可以接收各種數(shù)據(jù)類型——從csv文件和文本文件到Excel文件、SQL數(shù)據(jù)庫等,能快速進(jìn)行數(shù)據(jù)聚合和透視等操作。Matplotlib主要是應(yīng)用于圖表繪制,幫助實現(xiàn)數(shù)據(jù)可視化。在數(shù)據(jù)導(dǎo)入環(huán)節(jié),我們根據(jù)不同的數(shù)據(jù)特征選擇工具包,如果是數(shù)組,則選擇Numpy;若是其他數(shù)據(jù)類型則選擇Pandas。
3.2?數(shù)據(jù)提取
在數(shù)據(jù)分析工作中,我們要分析的數(shù)據(jù)可能包含大量的缺失值、大量噪聲,或者因為錄入錯誤導(dǎo)致異常點存在,這樣就需用到數(shù)據(jù)清洗。所謂數(shù)據(jù)清洗是對各種“臟”數(shù)據(jù)進(jìn)行對應(yīng)的方式處理,得到標(biāo)準(zhǔn)、干凈的、連續(xù)的數(shù)據(jù),供統(tǒng)計分析使用。在進(jìn)行數(shù)據(jù)清洗提取過程中,常用到的工具包是Pandas,Pandas內(nèi)置的map(?)函數(shù)、apply(?)函數(shù)、applymap(?)等函數(shù)可以實現(xiàn)提取功能。
3.3?數(shù)據(jù)整理
數(shù)據(jù)整理主要是指數(shù)據(jù)的連接與合并,以及分組聚合。在利用Python處理財務(wù)數(shù)據(jù)時,我們根據(jù)實際情況可能需要將多個報表合并或者連接在一起分析數(shù)據(jù),這時候可以通過Pandas的聚合函數(shù)如mean(?)、sum(?)、count(?)等函數(shù)實現(xiàn)。分組聚合主要是利用Pandas自帶的pivot_table(?)函數(shù)實現(xiàn)數(shù)據(jù)從長表改成寬表。通過數(shù)據(jù)整理功能可以更好的篩選出有效數(shù)據(jù)。
3.4?數(shù)據(jù)轉(zhuǎn)換,模型選擇
這個階段是數(shù)據(jù)分析中實現(xiàn)財務(wù)分析預(yù)測的關(guān)鍵步驟,在這個階段我們要選擇合適的數(shù)學(xué)模型來完成數(shù)據(jù)轉(zhuǎn)換。在進(jìn)行模型選擇之前我們可以先導(dǎo)入Scikit-learn工具包,它包含了豐富的回歸和聚類算法,包括我們進(jìn)行財務(wù)預(yù)測銷售收入最常用到的一元回歸或者多元回歸模型;經(jīng)常用于財務(wù)風(fēng)險預(yù)警的隨機(jī)森林模型等。在這個階段,我們可以通過選擇合適的模型公式或者自己構(gòu)建個性化的模型公式來實現(xiàn)對原始數(shù)據(jù)的轉(zhuǎn)換。
3.5?利用模型得出分析/預(yù)測值
在這一階段,我們通過合適的數(shù)學(xué)公式或者財務(wù)模型計算出最終的財務(wù)預(yù)測值。在這個階段,我們還需要根據(jù)市場的實際情況調(diào)整公式模型,以保證最后的結(jié)果盡可能準(zhǔn)確,對于企業(yè)運營管理和決策起到有效指導(dǎo)作用。
3.6?數(shù)據(jù)可視化
最后通過Python提供的Matplotlib工具包可以方便的創(chuàng)建可視化圖,常用的有折線圖、散點圖、直方圖和條形圖等。可視化視圖用于補充描述分析預(yù)測結(jié)果,可以直觀的將數(shù)據(jù)變化趨勢,不同組數(shù)據(jù)之間的關(guān)系表現(xiàn)出來,方便信息使用者讀取和利用。
4?結(jié)束語
隨著大數(shù)據(jù)時代的飛速發(fā)展,Python在企業(yè)財務(wù)數(shù)據(jù)分析中的作用不容忽視,特別是海量數(shù)據(jù)充斥的背景下,財務(wù)人員善用Python可以更深入挖掘有價值的數(shù)據(jù),并對其進(jìn)行深入分析,不僅提高工作效率,更重要的是可以分析出數(shù)據(jù)背后隱含的相關(guān)關(guān)系,為企業(yè)經(jīng)營決策提供有力支持。
參考文獻(xiàn)
[1]張文惠,張巖瑾.財務(wù)大數(shù)據(jù)基礎(chǔ)[M].立信會計出版社,2022年7月.
[2]李苗.Python在財務(wù)大數(shù)據(jù)中的應(yīng)用[J].今日財富(中國知識產(chǎn)權(quán)),2021,(11):115117.
[3]肖穎.Python在財務(wù)數(shù)據(jù)挖掘和分析中的應(yīng)用[J].今日財富,2021,(22):142144.
[4]黃文.數(shù)據(jù)在財務(wù)管理中的應(yīng)用研究:以Python技術(shù)為例[J].今日財富,2021,(14):117118.