999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于社區發現和關聯規則分析的供應商圍串標審計方法探索

2020-09-27 23:04:42程向華李漢秋章崎峰尤震羅天
中國內部審計 2020年9期
關鍵詞:數據分析

程向華 李漢秋 章崎峰 尤震 羅天

[摘要]供應商間圍串標行為是困擾企業招標采購工作的難點問題之一,而找到供應商間的緊密關系,則是破解這一難題的關鍵所在。本文通過社區發現算法和關聯規則分析算法,對企業的招標采購數據進行分析,識別其團組社區并獲得內部關系結構,從中發現供應商間隱藏的關聯關系,為審計人員進行分析提供有效線索。

[關鍵詞]招投標審計 ? ?圍串標 ? ?數據分析

一、導言

自招標投標采購要求實施及推廣以來,供應商圍串標在企業采購招標過程中屢見不鮮。對企業采購來說,該行為可能對招標項目質量產生不利影響。對此,常見的內部審計策略是對每個項目進行檢查,判斷是否存在國家招標投標法實施條例中所列投標文件由同一單位編制、投標文件異常一致、投標保證金從相同賬戶轉出等串通投標情形,或者通過分析供應商之間是否存在股權相關投資、高管交叉任職等直接關系。但傳統方式核實工作量大、效率低,且難以發現供應商之間更為隱蔽的私下掛靠或協商組團投標行為。隨著電子招采平臺的普及與企業信息化程度的提高,更有效率的一種策略是根據供應商投標行為特征,在審計模型中對供應商緊密關系進行識別,找出疑似圍串標企業組,進一步分析相關投標項目。

現有關聯組團研究中,王俊芳、游松慶等采用頻繁集項等關聯算法對供應商投標數據進行分析,挖掘供應商之間的內部關系。但實際應用中,上述方法仍難以滿足圍串標行為識別分析的需要:一是簡單的關聯規則識別疑似圍串標團組精準度較低;二是未經分類的供應商投標數據在頻繁項集計算中會產生較多冗余數據。

本文整合社區發現和關聯規則分析算法進行數據挖掘應用,能夠有效識別供應團組社區并獲得其內部關系結構,對于在合同招投標審計過程中辨識圍串標行為具有顯著作用。

二、主要審計思路及相關算法

(一)審計思路

首先,利用社區發現算法對招采數據中涉及的供應商進行初步分組。其次,在供應商初步分組中逐個應用關聯規則分析尋找組內頻繁項集,即經常同時參與某些項目投標的供應商團組,在結果中設置提取規則,進一步提升社區名單的準確性與覆蓋面,并獲得團組內部的關系結構。最后,應用數據分析提取的供應商團組,反查相關合同標的,確認有關行為及事實。

(二)涉及算法介紹

1.Louvain社區發現算法。Louvain算法是一種基于模塊度的社區發現算法,通過模塊度來衡量一個社區的緊密程度。本例中,供應商視為節點,一起投標的同類供應商視為社區,供應商在尋源單中共同出現次數為權重,次數越多,邊權越大。模塊度定義函數Q如下:

其中,Aij代表節點i和節點j之間的邊權;ki和kj分別代表所有與節點i和節點j相連的邊的權重之和;m代表所有的邊權之和;ci和cj分別代表節點i和節點j所屬的社區;表示克羅內克函數。若一個供應商(節點)加入到某個社區(類別)中會使該社區的模塊度有最大程度的增加,則認為該節點屬于該社區;若未能使其模塊度增加,則該供應商留在原社區中,從而實現對供應商分類的目的。

2.Apriori關聯規則分析算法。Apriori算法是通過連接產生候選項及其支持度然后通過剪枝生成頻繁項集(疑似供應商團組),并分析頻繁項集產生強關聯規則。相關指標如下:

(1)支持度(support)。支持度代表供應商尋源單中當前供應商組合的頻繁程度,如果該組合的支持度大于預設的閾值,則認為該組合為疑似團組(頻繁項集)。Apriori算法采用反向減枝計算,即“若一個項目集是非頻繁項集,則它的所有超集也是非頻繁項集”,可以減少遍歷運算量。

(2)置信度(confidence)。置信度代表在供應商A投標的情況下,供應商C同時出現的概率。

(3)提升度(lift)。提升度用于衡量供應商A與C投標的相關性關系:當提升度大于3時,一般認為關聯規則有價值;若供應商A與C相互獨立,則提升度恰好為1;若提升度小于1,則表示供應商A與C互斥。但實際應用中,該指標易受零事務影響,零事務即與團組無關的供應商投標次數。如總投標次數1000次中,供應商A、C分別參與500次、600次,供應商A、C共同投標次數300次,則lift(A→C)為1;若總投標次數為10000次,則lift(A→C)變為10。

3.KULC度量與不平衡比(IR)。引入不受零事務和事務總數影響的KULC度量與不平衡比(IR),減小因置信度和支持度失效產生的影響。KULC度量值在0-1之間,值越大,供應商之間聯系越緊密。但當KULC度量值在0.5左右時,單從KULC度量無法判斷當前團組是否有價值。因此,引入不平衡IR比進行參考。當不平衡比接近0時,認為關聯關系是平衡的;不平衡比越大,則關聯關系越不平衡。若KULC度量值接近0.5并且不平衡比接近0,則認為該關聯關系是沒有價值的。

三、具體審計流程

根據上述Louvain與Apriori算法,內部審計需結合統計學相關知識并根據圍標具有尋源單中全部或大部分供應商同屬一個團體這一顯著特征,通過全局統計和分析各個尋源單內部的關系這兩個角度,評估各種團體的出現形式,篩選出可能性較大的目標組合,具體流程見圖1。

流程的關鍵步驟如下:一是獲取招采數據。從招采系統中獲取采購尋源單,主要包括采購單位、項目名稱、投標供應商名單、中標人名稱、中標金額等字段信息。二是數據清洗、轉換。根據實際需要,剔除無效數據,如同一尋源單中重復出現的供應商,并對源數據進行轉換,提取出關鍵數據。三是供應商初步分組。按照同類尋源單各供應商之間邊權增加1原則,對全局數據進行統計,遍歷全部尋源單條目,形成涵蓋全部供應商關系的網絡。然后,利用Louvain對樣本數據進行分類,將關系密切的供應商劃分到同一個社區,減少后續Apriori的運算時間,提升效率與準確度。四是形成高關聯度供應商團組。對分類之后的每一個初步分組,單獨運行Apriori算法,利用二分法尋找每個社群適用的最小支持度,獲得盡可能全面的頻繁項集結果,計算出對應的關聯關系、KULC度量和不平衡比,并篩選出有價值的頻繁項集。五是輔助審計。根據上述頻繁項集,反查相關合同標的,通過具體合同分析,排查有關圍串標行為。

四、方法運用示例

(一)社區發現結果

通過Louvain社區分類算法,將采購尋源單中560家供應商按互相之間同時出現的頻繁程度及業務范圍劃分為9個組別,如建筑建設、通信、工程設計、保險、電器設備等。從結果上看,劃分到同一個社區中的供應商業務方向大多一致,劃分結果較為精準,見圖2、圖3。此舉可以減少大量零事務,為后續使用Apriori時設置最小置信度提供便利。若不對采購尋源單數據進行預先劃分,在后續使用Apriori時,在設置最小置信度時會遇到困難。因為供應商種類繁雜,導致零事務數量巨大:若設置的最小置信度偏大,則會遺漏大量頻繁項集,導致輸出的結果覆蓋面大幅下降;若設置的最小置信度偏小,則會導致無法及時刪去非頻繁項集,失去Apriori算法的優勢,導致計算時間指數性增長。

(二)關聯規則分析結果

一部分提升度大于3的頻繁項集的KULC度量在0.5左右,不平衡比接近0。在對該部分結果進行排查之后發現,該部分結果雖然提升度大于3,但并非有價值的供應商團組,見圖4。由此可見,單獨考慮提升度情況下的結果輸出形式并不準確。

在引入KULC度量與不平衡比之后,篩選出的供應商團組占比從原來只考慮提升度情況下的73.5%下降到39.7%,大幅減少了輸出的數據量,提升了精準度,減少了后續審計疑點排查時間,見圖5。

以第2組社區團體中的供應商組合ABC進行說明。對于供應商A→BC,其對應的置信度為0.4,提升度為57.4,KULC度量值為0.7,不平衡比為0.6,見圖6。

該供應商團組提升度極高,KULC度量值偏高,不在紅色標注的0.4—0.6的范圍之內,并且不平衡比較大,遠超紅色標注的0.2的閾值。具備作為疑點的顯著特征,并且供應商A有可能是該團組的主導人。將該疑點事務提出,結合該組合中供應商A的中標率與全局情況下供應商A的中標率進行分析,發現該組合中供應商A的中標率明顯偏高。該組合極有可能是高度關聯團組,并且供應商A有可能是主導人。根據上述分析結果,審計人員進一步查找該團組相關合同,分析確認是否存在招標投標法實施條例所列述的串通投標情形。

從結果來看,該方法數據篩選精準度較高、覆蓋范圍較廣,極大地縮短了排查時間,輔助審計的作用較為明顯。面對大量的尋源單數據,通過采用Louvain分類結合Apriori挖掘的方式,能較好地克服尋源單數量龐大、種類繁多等難點;能對大量標的進行快速分類,較為精準地劃分項目類別。在對各個組別分別進行Apriori挖掘時,采用最小二分法快速尋找出適用于對應情況下的最小支持度,能免除對每一個組別設置特定最小支持度的流程,可使審計人員將精力主要集中在篩選出的疑似圍標團伙名單,擴大審計覆蓋面,提高圍標團伙發現率,降低審計風險。

需要指出的是,在最終結果篩選的過程中,如何設置置信度、提升度、KULC度量及不平衡比,以更為精準地篩選出有價值的疑點事務,仍需進一步與招標實際核實、分析。由于標的數量龐大,某些項目類型本身參與者不多,按照本算法,此類參與者可能會在結果中被誤認為是疑點團組輸出。如何在結果中進一步篩選出高精準度的疑點團組,仍需根據各企業招標實際,通過大量數據反復驗證調試各指標的參數。

(作者單位:浙江省能源集團有限公司,郵政編碼:310007,電子郵箱:513972995@qq.com)

主要參考文獻

遲殿委.淺析大數據關聯規則挖掘算法及應用[J].電子元器件與信息技術, 2019(4):4-7

杜潔,李芹,潘媛等.聚類分析在內部審計中的應用研究[J].中國管理信息化, 2019(1):4-6

王俊芳,王中龍,劉建,耿建,李艷,王蕾,秦賓.電力企業供應商疑似圍標串標行為分析[J].經營與管理, 2018(5):120-123

張志恒,成雪嬌.大數據環境下基于文本挖掘的審計數據分析框架[J].會計之友, 2017(16):117-120

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 91精品啪在线观看国产91九色| 国产欧美精品午夜在线播放| 亚洲AⅤ永久无码精品毛片| 伊人激情综合| 综合色在线| 午夜在线不卡| 国产又粗又猛又爽视频| 国产欧美亚洲精品第3页在线| 亚洲开心婷婷中文字幕| 美女免费黄网站| 国产麻豆福利av在线播放 | 国产乱人伦偷精品视频AAA| 精品精品国产高清A毛片| 一区二区三区在线不卡免费 | 黄色网站不卡无码| 欧日韩在线不卡视频| av天堂最新版在线| 国产精品第一区在线观看| 欧美亚洲第一页| 国产日韩欧美视频| 亚洲毛片在线看| 99精品视频在线观看免费播放 | 一区二区午夜| 亚洲综合第一页| 亚洲欧洲日韩久久狠狠爱| 色哟哟精品无码网站在线播放视频| 中文字幕伦视频| 国产手机在线小视频免费观看| 欧美精品亚洲二区| 一级全免费视频播放| 91精品日韩人妻无码久久| 色悠久久综合| 日韩色图区| 国产精品太粉嫩高中在线观看| 最新国产精品第1页| 91精品人妻一区二区| 人妻少妇久久久久久97人妻| 亚洲精品视频免费观看| 无码粉嫩虎白一线天在线观看| 91在线视频福利| 国产精品99r8在线观看| 制服丝袜一区| 国产精品无码翘臀在线看纯欲| 青青草国产一区二区三区| 免费无遮挡AV| 欧美精品黑人粗大| 毛片久久久| 久久男人资源站| 国产成人精品无码一区二 | 国产av无码日韩av无码网站| 华人在线亚洲欧美精品| 国产视频欧美| 欧美色视频网站| 在线观看精品自拍视频| 亚洲无码高清一区二区| 99在线观看视频免费| 国内精品伊人久久久久7777人| 久久五月天综合| 久久伊人久久亚洲综合| 国产精品久久久久久久久| 国产精品一区二区在线播放| 综合色在线| 国产美女精品人人做人人爽| 欧美一级黄片一区2区| 91久久夜色精品国产网站| 国产精品专区第1页| 久久天天躁狠狠躁夜夜2020一| 女人av社区男人的天堂| 国产精品护士| 天堂亚洲网| 无码啪啪精品天堂浪潮av| 欧美国产在线看| 视频二区亚洲精品| 91精品久久久久久无码人妻| 高清视频一区| 国产性精品| 91视频区| 91小视频在线观看免费版高清| 全午夜免费一级毛片| 久久这里只有精品免费| 熟妇人妻无乱码中文字幕真矢织江 | 乱码国产乱码精品精在线播放|