隨著數字化轉型,高校業財數據規模劇增、多源且異構,數據驅動決策,而地方高校財務人員信息素養參差不齊,非小數據分析技能多為短板,亟需快速提升。眾多數據分析工具中,編程軟件學習成本高易用性不足,專業BI軟件學習門檻略高,通用AI仍面臨安全和隱私問題,Excel傳統分析小數據功能面向非小規模和復雜類型數據時凸顯諸多無力,如重復勞動多,運行卡頓,函數公式有速度瓶頸且易錯易忘,簡單匯總數據粒度粗,不靈活、實現多維交互可視化動態分析和數據挖掘障礙多,分析效率低下,難滿足管理決策的數據需求。
Excel幾十年來不斷迭代升級,如從2016版起已將PowerBI的 PQ/ PowerQuery和PP/PowerPivot等組件整合其中,其部分功能在處理較大規模和復雜數據時十分強大,易學易用,卻未得到足夠重視。本文結合高校實務案例,圍繞綜合應用Excel的 PQ 、數據透視表(含基礎版PT和增強版PP)和超級表格之BI功能,對較大規模單源或多源業財數據實現多維交互細粒度可視化動態分析和輕量級數據挖掘以支持管理決策數據需求。此工具以鼠標操作為主,操作路徑不長,易學易用使用成本低,能顯著降低財務人員信息技能門檻,適合大多數地方高校業財數據特點,能克服傳統分析小數據功能的不足,大幅提升分析的速度、精度、深度和廣度,技術賦能業財深度融合,為科學管理提供數據支撐,助力學校高質量發展。
一、工具簡介
本數據分析工具為綜合應用Excel2016或更高版本的 PQ 、數據透視表和超級表格之BI功能,能適用較大規模單源和多源數據的分析,以鼠標操作為主,學習門檻較低。
1.PQPQ是專業的獲取和預處理數據工具。 PQ 獲取數據的路徑為【數據】、【獲取數據】和數據存儲路徑,其支持連接和查詢幾十種常用格式的數據源,規模可至2GB以內的CSV/文本文件,超過Excel百萬行數限制。對導入的不規范數據能輕松實現傳統Excel中很難完成的各種數據預處理,復雜情形下可用公式和代碼M語言,還能動態刷新實現自動化處理。當數據量更大時,或受內存制約,通過篩選、聚合減少數據量、使用數據庫文件或增量刷新等策略優化可予以適度應對。
2.數據透視表基礎版數據透視表/PT:點擊【插入】選項卡的【數據透視表】進人界面。它是Excel最強大的基礎功能,規范的數據源是其正確使用前提,主要有排序篩選、組合、分類匯總、多維度分析、交互分析、可視化和輕量級數據挖掘等數據分析功能,可手動或自動刷新。透視表操作簡單快捷,是突破函數公式速度瓶頸的重要手段。規范的數據源要求列字段名不重復且只能有一行、無空白數據行(列)、無合并單元格、無分類匯總行或總計行、數據格式規范統一,盡可能放置在同一工作表或簿中。下面任一類型都可以是數據源Excel數據列表清單、外部數據源如文本txt/csv或數據庫、多個獨立的Excel數據列表和其他透視表。

透視表可實現靈活精準的多維交互細粒度可視化動態分析和輕量級數據挖掘。將各字段(列名)選擇性拽入其四個區域(行、列、篩選、值)或進一步組合字段,得到多維分析報表。通過選擇維度和排序篩選切片器等實現交互分析。通過選擇細維度或雙擊合計數據可將分析穿透到最細粒度。一鍵刷新分析結果,結合運用超級表格可智能動態分析。數據透視表一一對應數據透視圖,以柱形條形餅狀環形等圖形可視化呈現,其圖形篩選工具切片器的報表連接功能能對同一數據源下多個透視表或圖實現聯動
控制,結合超級表格,可創建智能動態數據看板或可視化看板,分析更直觀靈活全面。借助這些功能可更全面深人認識大量業財數據后隱藏的信息,實現輕量級數據挖掘,為精細化科學管理提供數據支撐。當分析大數據集尤其是復雜計算和匯總時將大量消耗內存,或使運行緩慢甚至崩潰,需轉用PP等工具。
增強版數據透視表/PP:增強版可簡單理解為基礎版/PT的升級,用于增強Excel的數據分析功能,其核心功能是數據建模和數據分析,幾乎支持所有常用數據類型,支持多源數據,通過建模將多源數據建立起關系,在此基礎上實現類似PT的分析功能。點擊【PowerPivot】選項卡的【數據管理模型】進入PP界面,還可創建透視表時勾選【將此數據添加到模型】復選框進入,如非重復計數時。
PP支持較大規模數據的分析。PP能在Excel中建立快速強大的內存數據庫,存儲數千萬甚至億萬行數據,龐大的數據加載后能高效壓縮到只保留原來數據文件體積的 10% 左右,從而使運行幾十萬行數據時可能受制于硬件性能出現卡頓的問題迎刃而解,PP支持單表最多約20億行1.6萬列,支持Excel工作簿最大約2GB(32位)或4GB(64位),可用透視表和透視圖,還支持DAX編程語言完成更高級和復雜的計算與分析。通過減少不必要列、使用DAX語言優化計算、優化數據模型和使用增量刷新等策略,可支持更大規模的數據,若是大數據可先使用數據庫文件再用PP等工具
3.超級表格點擊【插入】選項卡的【表格】,表格數據轉化為超級表格。這是一種結構化數據工具,能夠將普通的數據區域轉換為具有增強功能的動態表格,能動態識別和擴展表格范圍(包括公式、格式等),使數據處理效率顯著提升,尤其適合需要持續更新的數據集。
三、業財數據分析基本流程
高校業財數據分析基本流程包括數據獲取、預處理、分析與挖掘及可視化。獲取原始數據才能有分析的原料。原始數據含臟數據,必須預處理(包括清洗和整理)作為可靠分析的前提,數據清洗包括檢查數據完備性,驗證和處理缺失值、異常值、錯誤值、重復值和格式標準化等數據質量問題,數據整理包括合并多源數據集、處理甬余、統一命名規范和聚合數據等。
通過統計和業務洞察等方法分析數據,從中提取有價值信息,以支持決策和優化流程,挖掘則是從海量數據中自動發現隱藏模式、關聯規則或預測趨勢,分析和挖掘相輔相成,前者側重解釋已知問題,后者側重探索未知規律。可視化是用圖形結構對分析挖掘結果進行直觀形象、生動有力的呈現,幫助使用者更清晰地獲取數據中隱含的信息,有靜態、動態圖表呈現或可視化看板綜合呈現。
高校業財原始數據主要分散在財務、收費、國資、人事和教務等信息系統中,多為結構化數據,交付格式為xlsx/csv/txt/pdf或數據庫,規模與師生數量及業務頻率強相關,地方高校師生數量多在0.5—3萬,業財數據規模般幾千到幾億行。可用前述組合工具完成數據分析全流程,用PQ獲取原始數據,授權后還可動態獲取,結合運用超級表格,用PQ動態預處理為規范的透視表數據源,再用數據透視表實現動態分析、可視化和輕量級數據挖掘,亦可對同數據源透視表打造智能數據看板或可視化看板。
四、A地方高校業財數據動態分析實踐
下面以A地方高校財務部門內部的多源收費業財數據為對象,運用前述工具動態分析,揭示大量數據隱含的信息,支撐相關管理科學決策。
1.情境簡介A校以適應數電票及財政票據電子化改革為契機引人某收費一體化智慧管理平臺,對收費業務模塊實行了初步數智化轉型。平臺按管理需求不同分設非稅收費和代收費等子平臺,收費業務原始數據可按xlsx或csv格式導出,自制匯總原始憑證作為核算依據。各學生收費數據分散在各子平臺,收費管理要求整合各子平臺數據,同時這些數據含臟數據,無論是財務核算還是業務管理都需預處理。
2.技術實現導出并管理原始數據:按照管理需求在各子平臺導出相關原始數據,如學生催費和收費風險預警管理,需導出非稅和代收費應收及欠費數據,然后管理這些數據以降低后續操作難度,如存儲在單一簿、表或文件夾內、統一工作表結構和命名等。
用PQ動態獲取原始數據:上述單源和多源數據,都可用 PQ 獲取。得到數據授權和管理授權后, PQ 可與各子平臺數據對接,從而動態獲取原始數據。
將數據源轉換為超級表格:PQ預處理中會自動將數據源轉換為超級表格,若直接用透視表,需在創建之前轉換,利用其自動識別表格范圍功能打造動態擴展的數據源
用PQ動態預處理數據:此步驟目標是創建規范且動態的透視表數據源,由于導出的為結構化數據,一般使用PQ基礎功能鼠標簡單拖拽即可完成,下面以某期間欠費數據為例:A.合并多源數據。用追加查詢合并
非稅和代收費數據,或者導出后就直接合并為單簿多表。B.直接選擇菜單功能處理重復值錯誤值異常值。C.補齊缺失值。先排序后向下填充可補齊【學生性質】和【學生類別】等字段的缺失值。D.拆分列。為更好的可視化效果,按分隔符拆分【院系】和【班級】等字段的代碼及名稱。E.格式轉換。將各字段數值轉換為標準的格式,如【代碼】【身份證】【學號】為文本格式、【日期】為日期格式、【金額】為貨幣格式。F.添加【年級】【收費大類】輔助字段并填充數據。各年級收費管理難度不同,對非稅和代收費需分類管理,故添加。重復【收費項目】列,將各收費項目替換為非稅和代收費,重復【班級代碼】列,提取前兩字符并添加后綴【級】,即可完成。
G.退出界面。若數據量超過工作表百萬行數上限,或超過幾十萬行可能受電腦性能影響而卡頓,須選擇【關閉并上載至】具體方式,因PQ是一種數據連接及查詢,若無需呈現在表格中,只占極少空間。H.動態預處理。點擊刷新, PQ 自動重復之前預處理步驟。
小規模數據用PT動態分析:一般幾十萬或百萬行以內小規模數據預處理為規范的透視表數據源后,除了要非重復計數(如人數統計),用PT即可實現動態分析、多維交互細粒度可視化分析及輕量級數據挖掘,操作如前所述,拖拽幾下就可完成,十分簡單快捷,且透視報表自動美化,常可直接讀取所需數據,
可直接讀出各個維度的各種顆粒度欠費數據,為精準催費管理提供數據支持。需說明的是,對于同源數據并非要做全所有透視報表或圖,滿足管理需要即可。
多源或較大規模數據用PP動態分析:多源數據或較大規模數據或非重復計數時,更適合用PP,先建模后分析,建模是將多源數據建立關系,以此整體作為數據源,再實現類似PT分析功能。
用透視圖可視化:透視圖與透視表一一對應,用透視圖可實現分析結果可視化。創建時,PT從【分析】選項卡【數據透視圖】進人,而PP從【主頁】選項卡【數據透視圖】進人,按提示創建并美化,將同源數據創建的多個透視圖用切片器聯動控制,就可制作出智能可視化看板,可實現圖形化交互多維動態分析和輕量級數據挖掘。
本文分享了綜合應用PQ、數據透視表和超級表格的BI功能對地方高校較大規模業財數據實行多維交互可視化動態分析和輕量級數據挖掘的技術方法。實踐表明,此方法易學易用使用成本低,能切實降低財務人員信息技能門檻,容易對接更專業的BI軟件,獲取分析結果方便,適合大多數地方高校業財數據特點,標準化的預處理及孤島數據的打破有效推動了數據治理,動態分析解決了人工重復勞動,極大提高了分析的速度和準確度,多維交互可視化分析及輕量級數據挖掘可精準穿透到業務問題的各種顆粒度數據,智能看板更是全面綜合交互、靈活精準直觀,顯著提升了分析的廣度和深度,能幫助管理者減少主觀臆斷,顯著提升決策的科學性,夯實了應用管理會計的數據基礎,賦能業財深度融合及管理效能,促進會計職能拓展及數字化轉型。未來隨著AI的發展,這些工具將與之融合,操作更簡單功能更強大,從而推動財務工作更高效、更智能、更前瞻。
(作者單位:湖南省湘潭市湘潭醫衛職業技術學院)