999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在 財務舞弊識別問題中的可行性研究

2021-12-05 07:32:29郭月
大眾投資指南 2021年7期
關鍵詞:數據挖掘分類財務

郭月

(太原旅游職業學院,山西 太原 030032)

財務舞弊長期危害我國經濟社會的正常發展,如何識別財務舞弊一直是學術界和實務界的研究重點之一。財務舞弊的危害范圍極廣。站在投資者的角度,在確認投資之前,需要較為全面客觀的了解上市公司的財務狀況、經營成果等信息,而財務報告則是最直接、最有效的證明資料。但是,財務舞弊通過粉飾財務數據,掩蓋了上市公司所存在的問題,最終可能導致投資者的投資失敗。站在國家的角度,財務舞弊打破了資本市場的正常運行,降低了資本配置的效率,更有甚者會直接影響投資者對于我國資本市場的投資信心。

隨著財務舞弊現象的頻繁發生,如何及時識別并有效防止財務舞弊現象的發生成為政府和學術界的研究重點。早期的財務舞弊手段較為簡單,主要通過檢查財務報表相關項目之前的勾稽關系進行識別。但隨著財務舞弊手段的逐漸復雜,較為隱秘的財務舞弊問題已經無法通過簡單的財務數據關系進行識別,因此,有學者將統計學工具引入財務舞弊識別研究中,通過建立模型進行分析,大大提高了識別的準確性。然而傳統的識別模型仍然存在局限性,主要體現在:一是統計學模型大多建立在財務指標的基礎上,而對于非財務指標的舞弊問題則無法引入模型;二是依靠統計的預測性分析反映事物的共性規律,而部分特性問題則無法被識別;三是模型大多研究的是線性關系,而實務中的舞弊路徑更為復雜,因此會降低預測結果的準確度。

隨著現代信息技術的發展,數據挖掘獨有的特點被越來越多的引入到科學研究當中。數據挖掘的優勢在于,通過從數據池中篩選出的有效信息,并利用計算機高效的信息處理能力進行不同算法的學習,從而得到一個或多個數學模型,利用得到的模型進行分類和預測,克服了傳統統計學模型的單一線性要求,大幅度提高了識別的有效性。

神經網絡是最早運用到財務舞弊識別中的數據挖掘技術,與統計學模型不同的是,變量之間的線性關系并不是神經網絡技術的必要條件,因此,模型的適用范圍更廣,總體的預測正確率也較高。但是,由于神經網絡內部結構類似于“黑箱”,無法對連接權重進行明顯的解釋,因此不能確定結果的統計可信度。選擇其他數據挖掘技術并應用于財務舞弊識別問題成為未來研究的重點方向。

一、數據挖掘技術的基本思想

“大數據”已成為當今社會的“高頻詞”,在數據爆炸的時代,有效地對海量數據進行捕捉、存儲、管理和分析能夠推動整個社會的信息化發展。大數據之于政府,是提升效能的手段;大數據之于經濟,驅動增長的新動力;大數據之于人們,將改變傳統生活模式。正如愛德華·戴明所說:“任何人都必須用數據來說話?!币虼?,毫不夸張地說,大數據戰略將是爭奪全世界的下一個前沿。

托馬斯·H·達文波特曾說:“每一個組織都需要選定分析軟件,用它來挖掘數據的意義”。數據挖掘(DataMining,DM)的概念最早出現在1995年的美國計算機年會(ACM)上,其實質是利用計算機系統,對相關數據進行處理。整個過程設計多種學科,是一項綜合性的技術。數據挖掘的核心是利用計算機算法對已知有效的輸入數據和輸出數據進行訓練,并對訓練得出的模型進行反復驗證,使得模型能夠在一定程度上反映出輸入數據和輸出數據的關系。由于該模型經過了大量的練習和驗證,因此具有一定的科學依據。再利用得到的模型,對新的數據進行計算,從而得到新的預測結果,這就是數據挖掘的基本原理。

二、數據挖掘的主要內容

數據挖掘的主要內容可以概括為六個方面,即關聯、回歸、分類、聚類、預測和診斷。它們不僅在挖掘的目的和內容上不同,所使用的技術差別也很大,所以通常也將數據挖掘的技術按照這六個方面來分類。

關聯:數據關聯是旨在從大量的數據當中發現特征之間或者數據之間的相互依賴關系。關聯是指多個不同變量在取值范圍之間存在一定的規律性。對數據進行關聯分析主要是為了解決數據之間隱藏的相關關系。有時數據之間的關聯關系并非憑借經驗可以得出,因此關聯分析生成的規則具有一定的科學性和可信性。

回歸:回歸是確定兩種或兩種以上變數間相互定量關系的一種統計分析方法?;貧w是數據挖掘中最為基礎的方法,一般應用于量化型的問題。常見的回歸函數分為四類,根據因變量的個數不同分為一元回歸函數和多元回歸函數;根據函數類型分為線性回歸函數和非線性回歸函數。另外還有兩種特殊的回歸方式,一種是在回歸過程中可以調整變量數的回歸方法,成為逐步回歸。另一種是以指數結構函數作為回歸模型的回歸方法,成為Logistic回歸。

分類:在數據挖掘中分類是最為常見的問題,其典型的應用就是根據事物在數據層面表現的特征,對事物進行科學的分類。對于分類問題,人們已經研究并總結出了許多有效的分類方法,到目前為止,已經研究出的經典分類方法主要包括;決策樹、神經網絡、貝葉斯分類、K-近鄰算法、判別分析、支持向量機等分類方法?,F實生活中許多領域都需要對對象進行分類。例如,在銀行業務中,按照風險評價體系構建客戶信用分類模型,據此決定是否貸款;電子政務數據,客戶保持、工業生產領域等。挖掘財務舞弊的識別過程就是分類的過程,將影響財務舞弊行為的因素加入模型當中,通過各種分類算法生成最有效的模型,以區分是否發生財務舞弊。

聚類:聚類分析又稱群分析,是對大量樣品進行分類的一種多元統計分析方法。首先分析出各自的特性,在沒有任何規則可供參考的情況下,將數據分類到不同的類或者簇中,因此,相同的類或簇中所包含的樣本具有極大地相似性,不同的類或簇中包含的對象則存在極大地相異性。根據聚類原理,可將聚類算法分為以下幾種:劃分聚類、層次聚類、基于密度的聚類、基于網絡的聚類和基于模型的聚類。

預測:預測是預計未來事件的一門科學,它包含采集歷史數據并用某種數學模型來預測未來,它也可以憑借主觀思想對未來進行預期。預測的意義在于它能夠在根據客觀規律,借助大量的數據信息和不同情況,勾畫出事物未來的發展方向,人們在這種大致的輪廓中提出多種具有替代效果的方案,這樣就使人們具有了戰略眼光,并且這種戰略眼光并非臆想而出,而是具有一定的理論基礎。

診斷:在數據挖掘中,診斷的對象是離群點或稱為孤立點。離群點是不符合一般數據模型的點,它們與數據的其他部分不同或不一致。產生離群點的原因主要有兩點:一是由于度量或執行錯誤所導致的,二是固有數據可變性所造成的。大多數據挖掘算法都不同程度地減小離群點的影響,甚至排除它們。但是信息是否有噪聲往往是相對的,一個人的噪聲信息可能是另一個人的有效信號,一味地刪除離群點可能導致隱藏的重要信息丟失。這種離群點探測和分析簡稱為診斷。

近年來,有不少學者從關聯規則、模糊集和人工智能等其他方面出發提出了新的離群點診斷算法,比較典型的有基于關聯的方法、基于模糊集的方法、基于人工神經網絡的方法、基于遺傳算法或克隆選擇的方法等。

三、數據挖掘技術應用于財務舞弊識別問題中的主要優勢

在大量數據日新月異的年代,分析數據成為一種重要的需求,尋找從海量數據中分析得出有用信息的方法成為當下研究的重點和難點。數據挖掘技術作為統計學習的應用將會在今后的科學發展觀和技術應用中發揮越來越大的作用。使用數據挖掘技術,可以幫助人們發現數據之間隱藏的規律。數據挖掘應用于財務舞弊識別模型的主要優勢體現在以下幾個方面:

首先,數據挖掘是處理海量數據的有效方法。現實中的數據不但規模大,而且常常具有不確定性,數據挖掘技術往往是處理這類數據最強有力的工具。它在海量數據或者數據池中篩選出有用的信息,通過各種不同的計算方法學習到一個或者多個數學模型(計算機完成),再利用這個模型進行分類或者預測。我們知道,要識別財務舞弊需要通過大量的數據進行分析求證,充分考慮潛在的影響因素,而不是靠經驗去判斷。數據挖掘是在傳統統計分析方法基礎之上的升級,克服了多種假設條件,使得生成的模型更具有實踐性和可應用性。

其次,通過前文的理論分析可知,人們的心理、行為和環境等外部定性因素越來越成為研究財務舞弊問題的出發點,而這些定性因素很難用定量的指標精準描述出來,因此傳統統計分析手段顯得捉襟見肘。而數據挖掘則很好地彌補了這塊短板,通過海量數據的集成,尋找這些因素的共同特征,通過不斷地機器學習和試驗,可以近似定量地準確定描述出指標的特征,從而滿足研究的需要。由此可見,對財務舞弊這類無法定量描述的社會現象,完全可以借助數據庫和計算機進行深入研究。

最后,使用數據挖掘技術的數據庫模型則更側重于實驗的真實性。在傳統的統計模型之中,人們通過經驗分析做出假設,在假設的基礎上進行統計分析。此時,變量和模型已經確定,人們只是關注模型擬合的優劣及指標選取對趨勢的影響。但嚴格意義來說,確定的解釋變量往往不全面,在回歸分析時往往忽視了其他解釋變量對模型的影響,而數據挖掘可以很好地對此進行補充和完善。

單一使用傳統數據分析方式和數據大算法都無法達到高準確度的預測模型結果,需要將兩者有機結合,進一步對復雜數據進行規律研究,數據挖掘技術為構建財務舞弊模型奠定了先進的技術可行性。本文通過闡述數據挖掘技術的基本思路和主要內容,分析其在財務舞弊識別問題中的優勢及應用。通過將數據挖掘技術應用于財務舞弊識別問題中,可以對企業是否存在財務舞弊進行進一步的甄別,提高了報表信息使用者對財務舞弊的識別能力,有利于引導資本的合理配置,維護資本市場的健康發展。

猜你喜歡
數據挖掘分類財務
黨建與財務工作深融合雙提升的思考
現代企業(2021年2期)2021-07-20 07:57:18
分類算一算
探討人工智能與數據挖掘發展趨勢
論事業單位財務內部控制的實現
欲望不控制,財務不自由
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
水利財務
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
主站蜘蛛池模板: 国产欧美日韩一区二区视频在线| 国产一级二级在线观看| 国产女人在线视频| 97超级碰碰碰碰精品| 国产一级在线观看www色| 国产高清在线观看91精品| 永久免费av网站可以直接看的| 亚洲午夜福利在线| 18禁高潮出水呻吟娇喘蜜芽| 伊人久久婷婷五月综合97色| 尤物亚洲最大AV无码网站| 国产主播在线一区| 国产一级毛片网站| 国产成人免费观看在线视频| 国产jizz| 亚洲无码91视频| av在线5g无码天天| 粉嫩国产白浆在线观看| 国产麻豆福利av在线播放| 日韩视频免费| 欧美在线伊人| 青青久久91| 小说区 亚洲 自拍 另类| 国产制服丝袜无码视频| 国产97视频在线| 国产新AV天堂| 野花国产精品入口| 亚洲美女久久| 久久这里只有精品免费| 国内精品自在自线视频香蕉| 婷婷午夜天| 伊人天堂网| 2020最新国产精品视频| 亚洲无码在线午夜电影| 国产欧美日韩在线一区| 亚洲午夜福利精品无码| 国产毛片基地| 亚洲成人动漫在线| 九九热在线视频| 国产成人精品高清不卡在线| 日韩在线网址| 欧美yw精品日本国产精品| 69视频国产| 国产成人av大片在线播放| 久久免费看片| 精品日韩亚洲欧美高清a | 无码人中文字幕| 91精品视频在线播放| 黄色网页在线观看| 国产免费黄| 亚洲久悠悠色悠在线播放| 国产噜噜在线视频观看| 欧美色亚洲| 国产第一页亚洲| 日本午夜视频在线观看| 91亚洲免费| 亚洲中文字幕久久无码精品A| 精品伊人久久大香线蕉网站| 欧美日韩激情在线| 成年人视频一区二区| 亚洲欧美日韩精品专区| 无码福利日韩神码福利片| 亚洲无码精彩视频在线观看| 夜夜高潮夜夜爽国产伦精品| 日韩不卡高清视频| 日本免费高清一区| 欧美精品亚洲精品日韩专区va| 国产不卡一级毛片视频| 女人毛片a级大学毛片免费| 爱做久久久久久| 99久久国产综合精品2023| 欧美日韩第二页| 99re这里只有国产中文精品国产精品 | 国产AV无码专区亚洲精品网站| 国产免费羞羞视频| 日韩在线视频网站| 青青操国产视频| 亚洲美女一区| 久青草免费视频| 人人艹人人爽| 亚洲日韩精品无码专区97| 无码精油按摩潮喷在线播放 |