陳麗麗
(吉林建筑科技學院 發展規劃處,吉林 長春 130000)
當前信息技術快速發展,各行業對各項業務數據的抽取、統計等技術應用逐漸成熟,但在實際開展對數據的統計管理過程中,常常會因為各種原因無法實現對數據的準確分析。針對業務數據的統計和管理,主要涉及的數據類型包括設備數據、資產數據、客戶數據等[1]。若進行數據統計、管理時,沒有足夠的支撐條件,常會由于操作失誤,需要進行二次管理[2-3]。關聯規則是為查詢提供更可靠依據的規則,通過關聯規則給出的決策結果,能夠實現對用戶所需內容更精準的查詢。因此,結合關聯規則的應用特點,本文在關聯規則的基礎上,開展對數據統計管理系統的設計研究。
考慮到對數據統計管理需要,本文在對系統硬件結構進行設計時,按照圖1的設計思路實現對系統硬件結構基本組成的設計。

圖1 管理系統硬件結構
從圖1中可以看出,本文硬件部分主要涉及界面顯示、維護器以及管理器。為了解決以往數據統計管理系統在運行過程中存在的問題,本文在傳統管理系統硬件結構基礎上,重點針對上述3種硬件進行詳細的設計說明。
在本文系統的數據顯示界面,利用Tableau作為系統顯示載體,選用TBS2000B型號顯示器作為本文管理系統的界面顯示設備,以此實現對數據在后臺數據庫中處理具體情況的展示。TBS2000B型號顯示器顯示屏為9英寸,具備15個水平規格,可提供更長的每屏幕時間以及5 M記錄長度,通道數多達20條,其中4條為模擬通道,16條為數字通道。通過數字顯示器和125種觸發組合,能夠實現對數據的快速查詢,并通過Wave Inspector在顯示屏上實現各項指令動作。在TBS2000B型號顯示器中還引入了FilterVu ,可以有效降低數據在傳輸過程中周圍的噪聲,為后續管理提供精度需要[4]。
在系統運行過程中,一旦出現故障問題,應當在第一時間對其進行排查,并找出解決方案。針對系統運行過程中的維護設備主要包括數據維護和頁面維護兩種[5]。在系統運行中,將數據統計更新時間設置為一個月1次,在Excel當中實現對數據模板的更新,并對導入的數據進行相應的更新。為了確保上述運行需要,選用ELC-18-98640型號運行維護芯片。將該芯片應用到本文統計管理系統的服務器當中,利用該型號芯片的維護功能實現對系統的運行維護。為了確保系統運行穩定,在芯片當中引入了低壓差穩壓器,實現系統低噪聲、高波紋抑制比以及低電流消耗的運行效果。
在對管理器的選擇時,選用TUVA4958-49870型號管理器。該型號管理器包含了一個智能TUVA芯片,采用交互型的CANnet通信協議,波特率為1 200~38 400可調,接口為RS232串口,延時為通道1~500 s可調,可支持無線WiFi云智能網關網絡環境通信傳輸。TUVA4958-49870型號管理器,在研發階段引入了loT物聯網技術,適用于各項業務數據的管理系統,可充分滿足用戶對管理學通提出的各項應用需要。通過該型號管理器中具備的通道延時管理、模式管理以及定時管理等,實現對數據統計以及系統整體運行的自動化管理,解決以往由于人為操作失誤造成的損失[6]。
在對各類業務數據進行統計和管理時,可將數據大致劃分為已執行數據和未執行數據兩種,利用SQLPLUS工具軟件完成對數據的抽取,并生成相應的SQL語句,將其導入系統中的數據報表,并結合腳本實現對被抽取數據的性能分析。針對不同類型的數據,由系統將其調用到相應的應用程序中,并在各個應用程序內完成對數據的統計和管理。針對不同應用程序中的數據,為了確保后續數據統計和管理的便利,需要合并和清除定義問題步驟中的數據,通過對抽取數據的進一步整合提升數據的質量。
假設兩種強關聯規則分別為A和B,當A≥B時,則對應的項目集合存在A∪B的關系,并且在數據集合當中必定存在頻繁項目集,而頻繁項目集A∪B能夠進一步推導出關聯規則A≥B的置信度支持率。由于在海量數據中存在著多層結果,因此需要通過多層關聯實現對數據的統計。結合概念層次樹,在多個抽象空間中完成對多層抽象知識的描述,以此解決數據統計時由于多維數據空間中數據稀少而造成統計效率低的問題。結合上述關聯規則在從海量數據當中獲取到有效的數據后,對數據進行統計。在系統當利用Excel工具軟件進行數據處理,在管理過程中用戶可在對應的數據上貼上相應的屬性標簽,以此完成數據統計。
在挖掘過程中,針對數據和數據集的支持度和置信度進行計算,實現對數據的有效描述。其中,支持度的計算公式為:
φ=x/m
(1)
公式(1)中,φ表示為數據的支持度,即在某項業務中該數據出現的概率;x表示為存在多組該數據同時出現的次數;m表示為所有業務數據出現的次數。通過上述公式,得到數據的支持度后,利用該數據實現對管理過程中動態特性的描述。再針對數據的置信度進行計算,計算公式為:
(2)
公式(2)中,c(X->Y)表示為置信度;n′表示為某項業務數據在數據集合中出現的總次數。根據數據的置信度,實現對管理過程中數據安全性的評價。
為了實現對本文上述提出的統計管理系統的驗證,選擇將本文系統與傳統基于微服務架構的統計管理系統應用到相同的數據業務中,在相同運行環境中對比兩種系統的運行效果。對于兩種管理系統客戶端的選擇,均選用CPU P4 1.7 G128 MB內存、40 GB硬盤的服務器。為了實現對兩種系統統計效果的對比,選擇將統計結果可靠性作為評價指標,利用統計效率作為量化評價結果。為了實現對兩種系統管理效果的對比,選擇將管控時長作為量化評價指標。
綜合上述論述,為實現對實驗組和對照組兩種系統統計效果的驗證,記錄在系統運行不同時間條件下統計結果的效率,其計算公式為:
(3)
公式(3)中,β表示為系統統計效率;W表示為需要進行統計的業務數據總量;w表示為在規定時間中未正確完成統計的數據量;t表示為規定系統運行時間。根據上述計算公式(3)將實驗組和對照組管理系統的統計效率紀錄,如表1所示。

表1 實驗組與對照組統計效果對比
從表1可以看出,本文提出的基于關聯規則的統計管理系統具備更高的統計效率,統計結果可靠性更高。
在完成對兩種系統的統計效果對比后,在上述實驗準備基礎上,針對兩種系統的管理效果進行對比。兩種系統在上述相同的運行環境當中完成5次管理,分別對其達到預期管控效果時的管控時長進行記錄,如圖2所示。

圖2 實驗組與對照組系統管理效果對比
從圖2可以看出,實驗組和對照組在對相同業務數據進行統計管理時,其管控時長大致變化幅度相同,但明顯每次管理中實驗組的管控時長更短。證明本文提出的基于關聯規則的數據統計管理系統在實際應用中,確保統計結果可靠性更高的同時,縮短管控時長,提高管理效率。
為實現對各項業務數據的統計與管理,在傳統系統基礎上,總結其存在的問題,并通過引入關聯規則實現對其優化。在實際應用中,利用本文提出的管理系統除了能夠對日常業務數據進行統計和管理外,還能夠實現對數據的進一步分析和挖掘,提升數據的利用價值。但由于研究能力有限,在研究過程中并沒有考慮到關聯規則對數據挖掘時原始數據的廣泛性和豐富性,因此應用結果欠深入和全面。針對這一問題,在后續的研究中還將進行深入研究,從而實現對本文系統應用性能的進一步提升。