999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯分析FP-Tree算法的企業風險信息數據在線挖掘方法

2024-07-10 08:59:30龐泰翁巍孟燦趙蕾牛紅偉
無線互聯科技 2024年11期
關鍵詞:數據挖掘

龐泰 翁巍 孟燦 趙蕾 牛紅偉

摘要:現階段的數據挖掘方法缺少對數據關聯分析的過程,挖掘效果較差,故文章提出基于關聯分析頻繁模式樹(FrequentPattern Tree,FP-Tree)算法的企業風險信息數據在線挖掘方法。選取與企業風險相關的信息指標,收集有關數據并進行預處理操作后,設計一種考慮關聯分析的FP-Tree算法,生成FP-Tree節點的條件模式樹挖掘頻繁項集,計算滿足最小置信度的頻繁項集,實現企業風險信息數據在線挖掘。實驗結果表明,所用方法挖掘量和挖掘效率較高。

關鍵詞:關聯分析FP-Tree算法;企業風險信息數據;在線挖掘方法;數據挖掘

中圖分類號:TP391? 文獻標志碼:A

0 引言

小微企業在我國經濟中占據重要地位,近年來其抗風險能力有所下降,資金需求變得更為迫切,且融資成本容忍度更低。深入挖掘企業風險信息,可整合分析大量數據,揭示數據背后的規律。多位專家對此展開研究。

徐靜等[1]采用卡方自動交叉檢驗算法設計風險數據挖掘方法,基于現代風險導向審計理論,結合數據挖掘算法實現風險挖掘。此法雖可避免錯誤財報導致的決策失誤,但因指標范圍狹窄,關聯性低,挖掘風險數據量較少。劉柯倩[2]提出基于云計算的財務風險數據挖掘方法,降低了挖掘深度和量,但可能泄露用戶隱私。司橋林[3]則設計財務信息管理系統風險數據挖掘方法,結合技術實現風險信息挖掘,但結果存在偏差。

本文設計了關聯規則頻繁模式樹算法,利用此樹挖掘頻繁項集和生成關聯規則,實現數據挖掘。

1 企業風險信息數據在線挖掘方法設計

1.1 企業風險信息數據采集

在進行企業風險信息數據在線挖掘前,數據準備是關鍵。需根據企業運營情況,采集與風險信息相關的多項指標數據。這些風險數據涉及財務、市場、技術和運營等多個方面。財務風險關注盈利能力、償債能力和運營效率等,可通過財務報表和財務比率來評估;市場風險關注競爭地位、市場份額和客戶需求變化,需結合市場調研和消費者行為分析;技術風險涉及技術研發、創新速度和專利申請,與研發投入和技術人員相關;運營風險則關注生產流程、供應鏈和人力資源,需防范生產事故、供應鏈中斷和員工流失等風險。為應對這些挑戰,企業需建立風險管理體系,利用大數據和人工智能提高管理效率,確保穩健運營。本文選取盈利能力、償債能力、經營能力、發展能力、現金流、流動比率及非財務指標等作為關鍵風險信息指標[4]。

1.2 企業風險信息數據預處理

在企業風險管理中,數據清洗是核心環節。原始風險數據常含控制與冗余值,這些無助于風險分析,還可能干擾結果準確性。因此,清洗這些不必要數據至關重要,可凈化數據集[5]。同時,異常值亦需特別關注,可能源于錄入錯誤或系統故障,它們會扭曲數據分布。若未剔除,將導致分析失真,無法真實反映企業風險。故需專門檢測并剔除異常值。此外,數據轉換也必不可少,主要涉及正向化與標準化。正向化主要調整指標意義和處理負值,確保符合分析模型要求。某些風險指標可能低值表示低風險,高值表示高風險,但模型可能要求相反。因此,需進行調整,使指標與模型匹配。同時,負值處理也是關鍵,需通過平移、縮放等方法轉為正數,以滿足模型要求。標準化旨在消除量綱差異,使各指標在分析中地位平等。常用方法是基于均值和標準差進行標準化處理,將數據轉為均值為0、標準差為1的標準正態分布。這樣,數據點差異更多取決于相對位置而非絕對值,便于更精確比較和分析不同風險指標間的關系與影響力,為企業制定有效風險管理策略提供有力支持。

由于企業風險信息相關的指標數據大多為適度財務指標,具有一定特殊性,所以需要對其做正向化處理。假設第i個企業風險信息數據指標為xi,正向化計算如公式(1)所示。

x′i=11+|x0-xi|×φ(1)

式(1)中,x′i為正向化處理后的企業風險信息指標數據;x0為適度財務指標數據的最優值。同時,為消除指標量綱、數值大小等差異,本文采用下式對原始企業風險信息指標數據做標準化處理。

x″i=x′i-minx′imaxx′i-minx′i(2)

式(2)中,x″i為標準化處理后的企業風險信息指標數據;minx′i、maxx′i分別為標準化處理前的企業風險信息指標數據x′i的最小值和最大值。

1.3 基于關聯分析FP-Tree算法設計與應用

本文利用關聯分析FP-Tree算法進行且與風險信息數據在線挖掘時,主要分為2個環節:構建FP-Tree;利用FP-Tree挖掘數據對象關聯規則。構建FP-Tree是關聯分析過程中的核心環節,其目的在于建立一個能夠高效存儲和查詢頻繁項集的數據結構。為了實現這一目標,首先需要對收集到的企業風險信息相關指標數據進行預處理,包括數據清洗和轉換,以確保數據的質量和一致性。隨后,對預處理后的數據進行掃描,記錄每個數據項的支持度計數,即它們在數據集中出現的頻次,反映數據項的普遍性。基于這些支持度計數,按照降序依次插入數據項來構建FP-Tree,如式(3)所示。

m=σ(X)M(x″i)(3)

式(3)中,m為企業風險信息數據項X的支持度計數;σ(X)為數據項X出現的次數;M為記錄次數。利用上述構建的FP-Tree進行企業風險信息數據關聯規則的挖掘是一個系統性的過程。首先從最低支持度計數的數據項開始,遍歷整個企業風險信息數據的FP-Tree。在遍歷過程中,為每個FP-Tree節點生成條件模式樹。條件模式樹是基于當前節點的所有路徑集合構建的,它反映了該節點與其他節點之間的關聯關系。通過構建條件模式樹,能夠更深入地探索不同風險指標之間的潛在聯系。接下來,根據條件模式樹,對最低支持度計數節點進行剔除。這一步是為了確保挖掘出的關聯規則是基于足夠數量的數據支持,從而避免產生誤導性的結論。通過剔除不滿足最低支持度要求的節點,可以得到一個更加精煉和可靠的頻繁項集,然后對頻繁項集進行置信度計算。

δ=P(1-P)N(m)(4)

式(4)中,δ為頻繁項集的置信度;P為事件發生概率;N為頻繁項集的數據項容量。對企業風險信息數據進行FP-Tree關聯規則的挖掘后,通過公式(5)的挖掘計算,實現企業風險信息數據在線挖掘。計算公式如下。

θ=1N×∑niP(1-P)×δ(m)(5)

式(5)中,θ為挖掘得出的企業風險信息數據,即挖掘結果。

2 實驗分析

2.1 實驗設置

本次實驗采用了青海省小微企業信用融資服務中心平臺的企業風險數據集,選取了其中的5000個事務樣本。每個事務包含2~8個項,最長事務序列有17個不同項。

實驗對比了徐靜等[1]基于CHAID算法、司橋林[3]基于灰色模型和BP神經網絡的數據挖掘方法以及本文提出的基于關聯分析FP-Tree算法的企業風險信息數據在線挖掘方法。

為評估各方法的性能,實驗以企業風險信息挖掘量為主要指標,同時考慮挖掘時間和最低支持度作為實驗變量。通過統計不同變量下各方法挖掘的事務數量,對比了它們在企業風險信息數據挖掘方面的效率。

2.2 結果分析

2.2.1 不同挖掘時間下企業風險信息挖掘量

在上述實驗條件下,首先進行不同挖掘時間下企業風險信息挖掘量的對比,將數據最低支持度設置為20%,統計各方法實際挖掘的事務數量如圖1所示。

由圖1可知,挖掘時間在5000 ms時,不同數據挖掘方法展現出了不同的性能表現。具體而言,徐靜等[1]提出的基于CHAID算法的數據挖掘方法挖掘出的事務數量達到2625個,司橋林[3]提出的基于灰色模型和BP神經網絡的數據挖掘方法挖掘出的事務數量達到3749個,這2種方法在挖掘企業風險信息數據時,其事務數量均未能超過本文提出的設計方法。而采用本文設計方法挖掘企業風險信息數據時,挖掘出的事務數量達到了4138個,挖掘的事務數量均高于另2種方法,效率更高。

2.2.2 不同最低支持度下企業風險信息挖掘量

本文將最低支持度作為實驗變量,對比不同方法在最低支持度下企業風險信息挖掘量。將數據挖掘時間設置為5000 ms,統計各方法實際挖掘的事務數量如圖2所示。

由圖2可知,當數據挖掘時間等其他約束條件固定時,3種不同數據挖掘方法下的數據挖掘量均隨著最低支持度的增加而降低,但本文設計方法下挖掘出? 的事務個數一直大于對照組方法,當支持度增大到80%,本文設計方法實際挖掘出的事務數量仍有1624個;而徐靜等[1]方法挖掘出的事務數量僅為812個,司橋林[3]方法挖掘出的事務數量為1189個。由此可以說明,本文所提方法在支持度不斷增加的情況下,依舊能夠保持較高的挖掘量,挖掘能力較好。

3 結語

本文所提基于關聯分析FP-Tree算法的企業風險信息數據在線挖掘方法是一種有效且正確的數據挖掘方法,該方法可以從海量數據中提取出對企業運營風險有重要影響的信息,能對企業風險信息數據進行有效的挖掘; 不受時間與支持度的影響,能夠保持較好的挖掘能力,從而能夠更好地輔助企業進行風險識別。

參考文獻

[1]徐靜,李俊林.基于數據挖掘的重大錯報風險識別和評估研究[J].財經理論與實踐,2022(6):79-85.

[2]劉柯倩.基于云計算的企業財務數據挖掘方法[J].信息與電腦,2023(14):203-205.

[3]司橋林.基于數據挖掘的財務信息管理系統風險識別[J].微型電腦應用,2021(6):132-135.

[4]金恒,過文俊.基于數據挖掘的異常財務數據識別方法研究[J].電子設計工程,2021(21):43-46,52.

[5]侯旭華,蔣昕.互聯網保險公司審計風險及其防范方法[J].財務與會計,2021(17):52-55.

(編輯 沈 強)

Online mining method of enterprise risk information data based on association analysis FP-Tree algorithm

PANG? Tai, WENG? Wei, MENG? Can, ZHAO? Lei, NIU? Hongwei

(Qinghai Provincial Center For Public Credit Information, Xining 810001, China)

Abstract:? The current data mining methods lack the process of data association analysis, and the mining effect is poor, so the online mining method of enterprise risk information data based on the FrequentPattern Tree (FP-Tree) algorithm is proposed. After selecting information indicators related to enterprise risk, collecting relevant data and conducting pre-processing operations, an FP-Tree algorithm considering association analysis is designed to generate the conditional pattern tree of FP-Tree nodes to mine frequent item sets, calculate frequent item sets meeting the minimum confidence, and realize online mining of enterprise risk information data. The experimental results show that the method has higher excavation capacity and efficiency.

Key words: correlation analysis FP-Tree algorithm; enterprise risk information data; online mining method; data mining

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产无码网站在线观看| 国产精品任我爽爆在线播放6080| 国产9191精品免费观看| 亚洲高清在线天堂精品| 欧美无遮挡国产欧美另类| 久久这里只有精品免费| 一本大道AV人久久综合| 欧美丝袜高跟鞋一区二区| 亚洲国模精品一区| 99在线视频免费观看| 伊大人香蕉久久网欧美| 亚洲午夜18| 亚洲黄网在线| 免费高清自慰一区二区三区| 精品亚洲麻豆1区2区3区| 亚洲天堂777| 国产福利在线免费| 天堂在线www网亚洲| 一本久道久久综合多人| 日本精品视频一区二区| 亚洲无码视频一区二区三区 | 无码中文AⅤ在线观看| av色爱 天堂网| 成人国产精品网站在线看| 亚洲国产91人成在线| 福利在线不卡一区| 99re免费视频| 国内精品视频| www.日韩三级| 亚洲日韩精品综合在线一区二区| 国产精品视频第一专区| 在线观看免费黄色网址| 国产午夜在线观看视频| 欧美一级高清片久久99| 国产最爽的乱婬视频国语对白| 欧美第九页| 免费无遮挡AV| 午夜国产精品视频| 国内毛片视频| 免费又爽又刺激高潮网址 | 亚洲Va中文字幕久久一区| 中文字幕无线码一区| 亚洲国产日韩在线观看| 欧美A级V片在线观看| 国产女主播一区| 麻豆精选在线| 无码一区18禁| 国产黄色片在线看| 亚洲精品欧美重口| 尤物在线观看乱码| 四虎影视国产精品| 91区国产福利在线观看午夜| 久久久黄色片| 午夜视频在线观看免费网站| 成年网址网站在线观看| 一级成人欧美一区在线观看 | 亚洲天堂视频在线免费观看| 99热6这里只有精品| 国产原创第一页在线观看| 午夜性刺激在线观看免费| 亚洲婷婷丁香| 亚洲国产中文在线二区三区免| 亚洲成A人V欧美综合天堂| 国产又爽又黄无遮挡免费观看| www中文字幕在线观看| 91在线精品免费免费播放| 婷婷午夜天| 97亚洲色综久久精品| 九色在线视频导航91| 国产农村妇女精品一二区| 激情乱人伦| WWW丫丫国产成人精品| 国产免费自拍视频| 在线播放91| 免费jizz在线播放| 自慰高潮喷白浆在线观看| 亚洲精品在线影院| 欧美区一区| 亚洲一区二区在线无码| 国产91无毒不卡在线观看| 国产凹凸一区在线观看视频| 久久不卡精品|