田巧燕 王英萍 蒲玉潔



[摘 要]隨著數字經濟技術不斷發展,大數據時代已來,大數據對社會各行各業均產生深遠影響,大數據決策成為一種新的決策方式,結合實際數據獲取源、報表統計匯總要求日益復雜多樣化。本文主要以OFFICE 2019集成的Power Query、Power Pivot和透視表基本功能,利用M、DAX語言和度量值等程序,簡述人事數據完成數據清洗、建模,實現多源交叉異類異構報表數據自動化統計分析和交互式展示全過程。
[關鍵詞]大數據;數據分析;數據自動化
doi:10.3969/j.issn.1673-0194.2023.23.043
[中圖分類號]TP311 [文獻標識碼]A [文章編號]1673-0194(2023)23-0142-04
1? ? ?研究背景
如今,在大數據時代下,有效處理大量信息數據,對各領域而言都非常重要。通過深入調研分析,人事員工大部分時間用在處理復雜重復數據統計分析工作上,基層單位員工作中面臨大數據統計分析存在的問題:人事員隨時需對本單位員工收入情況進行多維度統計匯總及分析,該項工作重復操作工作量較大,跨表計算難度大、數據準確性低、生成報表占用資源偏大。如何解決此類問題?創新研發“人事數據自動化與交互式應用”,實現數據自動化及交互式展示效果。
1.1? ?研究目標
更新數據后,需【刷新】立即顯示為最新數據報表,分分鐘生成一份可視化圖表。釋放勞動強度,提高工作效率及數據準確率,為數據智能化、數據挖掘夯實基礎,為數字化轉型賦能。
1.2? ?研究內容
主要以免費OFFICE為載體,利用PQ、PP和透視表基本功能,利用Power Query 和 Power Pivot集成功能中M語言、DAX語言和度量值等程序,完成數據清洗、建模,實現多源交叉異類異構報表數據自動化統計分析和交互式展示全過程[1]。實現人事異構多源報表數據自動化統計匯總及動態交互展示,包括KPI、薪酬趨勢和員工交互式分析及10張多樣報表自動統計;分析維度:時間、員工、薪酬、用工形式、單位部門、職務級別等。
2? ? ?基本概念及需求
2.1? ?報表自動化
報表自動化是商業智能基礎,有以下應用價值:
(1)釋放勞動力:在數據如此龐雜的時代,任何一個企業都會有各種各樣的數據,但稍微復雜一些就會產生多類數據的融合或者是在時間線上的復雜分析,這時候就需要龐大的人力了,實現自動化可以直接地降低此部分的重復開發,注意是“重復”。
(2)降低錯誤率:自動化意味著通過編碼的手段持久化流程、邏輯,當我們調試正確一次后,那么我們就可以信任這個工具了,我相信在重復勞作場景下機器的穩定產出率要比人更加可靠[2-3]。
(3)時效性高:除了每個月的報表,我們還可以考慮實現在每一天統計當月的情況,實時地匯總每日信息以動態地調控月度計劃。
2.2? ?Power Query(數據編輯查詢)
在大數據時代,OFFICE推出了一個叫Power Query的插件,該工具彌補Excel的不足,處理數據的能力邊界大大提升。主要完成數據處理(數據獲取、清洗和豐富)環節;該工具主要應用M語言。
2.3? ?Power Pivot(超級透視)
在大數據時代,OFFICE推出了一個叫Power Pivot的插件,是OFFICE高級版本的靈魂,該功能要比數據透視表強大很多,又稱數據建模。數據建模為實現數據多維度分析建立數據表之間關系的過程,是數據自動化與交互式應用的基礎。
2.4? ?需求分析
(1)需求目標:如何實現人事數據自動化統計分析?
(2)存在問題:報表不停新增?數據量越來越大?人員信息調整?多維度交叉計算工作邏輯復雜多變?分析方向維度多樣?工資、獎金表和員工基本信息表結構不同?自動匯總表樣式維度不同?
(3)匯總表需求(工資和獎金表):按年月自動統計實發、應發工資、扣減情況、稅前工資、稅前獎金、四項補貼、個人所得稅等。
(4)分析需求:按方向及維度自動統計分析。詳見圖1、圖2。
(5)解決辦法:創新研發“人事數據自動化與交互式應用”。
3? ? ?應用研發實現過程
3.1? ?設計架構
人事數據自動化應用包括共5部分組成(參見圖3),按文件類型分類:
(1)文件夾類型名稱:
工資:存放工資EXCEL數據報表。
獎金:存放獎金EXCEL數據報表。
(2)EXCEL類型名稱:
員工基礎信息表:應用之前需要維護統計分析員工基礎信息。
數據自動化應用:實現數據自動化集成應用文件。
(3)PBIX類型名稱:
數據可視化應用:實現數據可視化應用文件。
3.2? ?數據結構
3.2.1? ?報表名稱結構
根據平臺設計要求工資和獎金報表名稱不能重復,報表名稱嚴格按照標準格式(日期-存放文件夾-****)命名,在自動化匯總報表中生成為【發放日期】、【工資分類】、【工資一級分類】字段。
3.2.2? ?報表數據結構
(1)工資表:存放于工資文件夾中,需從工資系統下載工資數據,維護到工資報表模板里,根據數據內容嚴格按照報表名稱要求修改表名稱,員工編號唯一,程序運行生產工資表匯總。
(2)獎金表:存放于獎金文件夾中,下載獎金表模板并維護數據,根據數據內容嚴格按照報表名稱要求修改表名稱,員工編號唯一,程序運行生成獎金表匯總。
(3)員工基礎信息表:該表直接存放于本應用文件夾中,該表名稱及樣式內容不允許修改,只允許按照表格內容如實完善員工信息,員工編號唯一,帶*字段為必填項。
3.3? ?功能研發實現
3.3.1? ?數據處理:自動生成6張查詢報表
Power Query—M語言:完成數據清理,自動生成報表,詳細操作步驟如下:
①報表數據源:EXCEL數據—獲取數據—【從文件夾】—選擇【報表匯總】文件夾路徑。②加載文件夾文件后,實現各類報表匯總和一維表生成,插入Excel.Workbook([content],true,true),通過高級編輯器編寫M語言程序;自動生成相關報表;(Table.Combine({表1,表2}))。
3.3.2? ?數據建模,生成星型關系模型
(1)Power Pivot:完成數據建模,生成星型關系模型(如下圖所示),明確報表之間關系,為員工人數、職務級別、用工形式和單位部門分析奠定基礎。
(2)模型關系說明。員工基本信息表[員工編號]與工資匯總一維表[員工編號]建立了一對多關系;便于從員工基本信息維度分析數據。
3.3.3? ?度量值創建
根據需求,利用度量值公式便于實現數據高效快捷自動計算,深入分析公式計算邏輯后,本次共創建26個度量值公式。
(1)核心度量值為[金額合計],計算工資匯總一維表所有金額合計。
金額合計=SUM('工資匯總一維表'[金額])
(2)個人所得稅交叉計算:通過一維表工資與獎金表個人所得稅字段名稱一致。
個人所得稅=CALCULATE([金額合計],'工資匯總一維表'[工資二級分類]="個人所得稅")
(3)保險合計=[基本養老保險合計]+[基本醫療保險合計]+[失業保險合計]+[企業年金合計]
(4)扣減情況合計=[保險合計]+[住房公積金合計]+[個人所得稅]
3.3.4? ?自動化交互式看板展示及匯總報表實現
使用OFFICE 透視表應用,由兩部分構成可視化看板和報表管理:
可視化看板:包括3類主題9項分析,報表鏈接及幫助說明。
報表管理:自動生成10項統計報表和4項基礎報表。
3.3.4.1? ?可視化看板主頁
該頁面包括3類主題9項分析,報表鏈接及幫助說明。從多維度實現動態趨勢分析。
維度分析:年月、工資、用工形式、單位部門、職務級別、員工姓名等維度。
3.3.4.2? ?報表管理
自動生成10項統計報表和4項基礎報表。
(1)自動生成統計報表:主要通過透視表功能實現多維度(時間、工資、員工、用工形式、職務級別等)數據匯總及分析鏈接應用。
(2)基礎報表自動匯總應用:主要通過工資表、獎金表和員工基礎信息表,生成4張數據自動匯總表,便于數據核對及校驗,是數據分析、透視表應用的核心基礎。
4? ? ?技術創新、應用效果及效益評價
4.1? ?技術創新
(1)數據自動化應用完全替代重復操作,大數據分析由重復低效向快捷高效方向轉變,達到一勞永逸效果,工作效率提升95%。
(2)數據交互式應用,輔助決策,數據價值達90%,為數字化轉型賦能。包括KPI、薪酬趨勢和員工交互式分析及10張多樣報表自動統計。
(3)電子報表自動化應用實現可移動性
使用電子報表公式參數,通過數據查詢編寫M語言,電子報表自動識別路徑,從而該應用可以隨時移動,應用程序不受位置限制,靈活性較強。
4.2? ?應用效果
(1)數據處理高效快捷,比傳統數據分析效率再提升20余倍。
實例對比:工資表13張、獎金表25張,員工人數10人。分析時間對比:從數據整理、統計匯總和問題差錯時長,三項總時長分別為2小時15分和25小時,自動化應用是手工效率20余倍。
(2)多源數據交叉計算高效快捷,報表樣式靈活多樣。
以人事數據為例,需要統計獎金合計,按照組成部分預發獎金、業績獎金和其他獎金統計,數據來源工資表與獎金表,數據多維統計分析高效快捷,根據個人需求調整透視表行、列、值及篩選項內容即可,自動生成靈活多樣報表。
(3)員工信息核對精準快。
員工報表中,實現按員工、用工形式、單位部門、職務級別分析。同時,根據員工人數分析,當前需要統計11人,表中顯示6人,精準快查到表中未統計到5人明細信息,輔助統計人員對報表數據進一步核對及原因分析,效率提升顯著。
4.3? ?效益評價
實現數據報表自動化分析及交互式展示,不僅解決了數據重復匯總統計工作量,降低勞動強度,提高工作效率及數據準確性,實現了數據共享及利用價值,同時在提升經濟效益方面也取得了較大成果。
(1)直接效益:將復雜報表實現自動化,降低勞動強度,報表自動化有效提高數據獲取及時性和準確性。
(2)間接效益:使用免費軟件,自主創新設計開發,零成本實現提質增效目標。
5? ? ?結束語
在大數據數字經濟時代,擁有處理大數據這個利器,用最少的時間來處理復雜繁瑣統計分析工作,進一步分析數據,發現數據背后的規律,實現數據價值及共享性,提高工作效率,降低勞動強度,為數字智能化分析、數據挖掘及AI報告實現夯實基礎,為油田建設高質量發展貢獻微薄之力,為數智化建設賦能。
主要參考文獻
[1]阿爾貝托·費拉里,馬爾·科魯索. PowerBI建模權威指南
[M].劉鈺,譯.北京:電子工業出版社,2021.
[2]金曉倩.面向大數據的網絡安全策略[J].智庫時代,2017
(13):168-169.
[3]凌宏偉.基于高校治理視域下的人事信息數據安全研究[J].中國新技術新產品,2020(21):130-133.