999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法的國家經濟數據分析

2020-02-27 02:02:10劉言哲柳炳祥
中國管理信息化 2020年4期
關鍵詞:關聯規則經濟

劉言哲,柳炳祥

(景德鎮陶瓷大學 信息工程學院,江西 景德鎮 333403)

0 引 言

有效的國家經濟數據分析,能夠為政府在宏觀調控以及政策制定上提供非常有價值的參考,可以大幅度提高政府決策的準確性及工作效率,促進經濟社會快速發展。同時,國家大數據分析也可以為企業的經營規劃、采購運輸和個人的工作規劃、學習方向等方面提供可靠的指導。但是由于國家數據涉及的領域非常廣,僅在國家數據網列出的第一大類指標就多達28項,導致以往數據分析往往比較片面,對于國家宏觀調控意義不大。本文選取了國民經濟、交通運輸等對經濟數據影響較大的6個方面21項指標,構建了基于Apriori關聯算法的數據分析模型,以探索在宏觀層面上國家各經濟數據之間的潛在聯系。

1 關聯規則與Apriori算法

關聯分析方法是用于挖掘大量數據中具有潛在聯系的一種數據挖掘研究方法,其挖掘結果可用頻繁集和關聯規則表示。關聯規則挖掘算法有搜索算法、寬度優先算法(分層算法)、深度優先算法、數據集劃分算法、抽樣算法、增量式更新算法和并行算法7大類。Apriori算法是寬度優先算法(分層算法)的典型代表,也是目前比較經典的挖掘頻繁集和產生關聯規則的挖掘算法。

1.1 關聯規則

若有I={i1,i2,…,im},則I是m個不同的項目的集合,每個I稱為一個項目,項目的集合I稱為項集,其元素個數稱為項集的長度,長度為k的項集稱為k-項集,k項集?I,若干個項目組成一個事務T,事務T?I,事務全體構成了事務數據庫D,|D|表示為事務數據庫D中事務的總個數。一個項集X的事務數在事務數據庫D中所占的比例稱為項集X的支持度。

最小支持度是設定的項集的最小支持閾值,記為SUPmin,支持度不小于SUPmin的項集被稱為頻繁項集,長度為k的頻繁項集被稱為k-頻繁集。

關聯規則是一個蘊含式:R:X?Y,其中X?I,Y?I,且X∩Y=?,關聯規則的強度可以用他的支持度和置信度度量。關聯規則的支持度是同時包含項集X和Y的事務在總事務中所占的比例,描述的是關聯規則的普遍性,表達式為:

關聯規則的置信度是同時包含項集X和Y的事務數與只包含X的事務數的比值,也是該關聯規則的支持度與項集X的支持度之比,表達式為:

最小置信度CONFmin是關聯規則必須滿足的最小置信度閾值,若關聯規則R的置信度和支持度都不小于最小置信度CONFmin和最低支持度SUPmin,則稱規則R為強關聯規則。

1.2 Apriori算法

關聯規則挖掘主要有兩個問題:頻繁集的產生和關聯規則的產生。針對以上兩個問題,Agrawal等人在1993年提出了Apriori算法,該算法采用自底向上的方法,從1-項頻繁集開始逐步找出高階頻繁集,Apriori算法的流程如圖1所示。

其中,連接步是為了產生頻繁k項集而通過JOIN運算得到候選頻繁k項集的集合Ck的步驟,Ck中包含了所有有可能成為頻繁k項集的項集;剪枝步是依據任何非頻繁(k-1)項集必定不是頻繁k項集的子集這一性質,從候選頻繁k項集中去除非頻繁的(k-1)子集,以減少Ck規模,大幅度減少計算量;剔除則是將Ck中不滿足最低支持度SUPmin的項集剔除,最終形成由頻繁k項集構成的集合Lk。

2 模型構建與數據分析

2.1 數據整理

本文數據源于國家統計局1999-2018年年度數據,選取的原始數據包括6個方面21項指標。因為近20年中國各方面均快速發展,因此各個指標都呈上升趨勢,僅僅依據單個指標的增減無法表示真實變化,因此需要對數據進行預處理,通過占比、增速、相關數據比例等表示某項數據的實際情況,最終經過數據整理提煉出住宅房均價/城鎮人均收入變化、國企經濟占比變化、財政收入增速變化等19項指標,并以0(或1)代表該數據較去年降低(或升高)作為算法的輸入數據,如表1所示。

2.2 結果與分析

圖1 Apriori算法流程

將模型的最低支持度設為0.5,最低可信度設為0.9,將2001-2017年共17年323項數據作為輸入值讀取到模型中,最終產生頻繁集3個(表2所示),強關聯規則10個,先按支持度排序,再按置信度排序(表3所示)。

針對挖掘到的規則可以得到以下結論。第一,旅游花費的相對上升和第三產業占比的上升保持同步,驗證了旅游業對于促進產業轉型尤其是對于第三產業的發展具有較大影響這一規律,同時也為推動第三產業發展情況提供了新思路,可以根據旅游業的發展情況預測第三產業整體的發展情況。第二,第三產業的發展與第二產業占比的下降保持同步,即工業比重下降而服務業比重上升,此時工業部門的產出增長速度要快于農業部門,但要慢于服務業部門,此現象也代表中國目前已經進入“后工業化”階段。第三,國企經濟占比下降對應旅游花費相對上升,適當降低國企經濟占比有助于激發多樣性競爭,而旅游業多元化發展與經濟發展呈正相關關系,經濟發展程度越高,對應旅游業多元化程度越高。綜合可知,國企經濟下降推動旅游業發展,本質上是國企經濟占比適當下降,促進了社會經濟發展,國企經濟占比下降的同時,旅游業繼續發展,也說明了國企經濟對旅游行業的貢獻不大。

表3 強關聯規則

3 結 語

將關聯規則Apriori算法應用在國家經濟數據中,可以分析出各經濟數據中具有強關聯的因素。該方法可以獲得“意外性知識”的發現,但是不同的數據處理方式得出的結論也不盡相同,需要有較合理的數據處理方法。此方法對研究國家經濟發展具有實際意義,對于驗證國家政策執行效果、政府的宏觀調控等具有一定的借鑒意義。

猜你喜歡
關聯規則經濟
“林下經濟”助農增收
今日農業(2022年14期)2022-09-15 01:44:56
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
增加就業, 這些“經濟”要關注
民生周刊(2020年13期)2020-07-04 02:49:22
民營經濟大有可為
華人時刊(2018年23期)2018-03-21 06:26:00
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 免费jjzz在在线播放国产| 欧美日韩国产系列在线观看| 亚洲色图在线观看| 日韩毛片免费观看| 人妻少妇久久久久久97人妻| 欧美日韩国产精品va| 亚洲av无码成人专区| 中文字幕亚洲电影| 欧美日韩资源| 免费毛片全部不收费的| 亚洲国产综合精品一区| 亚洲中文无码h在线观看| 亚洲欧美在线综合图区| 红杏AV在线无码| 欧美日韩北条麻妃一区二区| 免费又爽又刺激高潮网址| 国产在线拍偷自揄观看视频网站| av一区二区三区高清久久| 婷婷色中文| 久久久久中文字幕精品视频| 日本一区二区三区精品视频| 人妻出轨无码中文一区二区| 这里只有精品国产| 69av免费视频| 免费毛片视频| 狠狠做深爱婷婷久久一区| 亚洲日韩AV无码一区二区三区人| 一区二区理伦视频| 国产精品久久自在自线观看| 强乱中文字幕在线播放不卡| 免费精品一区二区h| 在线免费亚洲无码视频| 青草视频免费在线观看| 色婷婷啪啪| 色综合天天操| 国产欧美视频在线| 久久久久亚洲精品成人网| 欧美在线伊人| 国产成人福利在线视老湿机| 在线色国产| 日本成人一区| 亚洲娇小与黑人巨大交| 日本人妻丰满熟妇区| 色视频国产| 天天色综网| 国产精品伦视频观看免费| 凹凸国产熟女精品视频| 国产91精品久久| 99er精品视频| 国产美女主播一级成人毛片| 免费A级毛片无码免费视频| 美女扒开下面流白浆在线试听 | 全午夜免费一级毛片| 九九精品在线观看| 色窝窝免费一区二区三区| 91免费国产高清观看| 激情午夜婷婷| 9966国产精品视频| 国产色爱av资源综合区| 精品视频在线一区| 国产最新无码专区在线| 国产精品久久久精品三级| 亚洲国产欧美自拍| 国产啪在线91| 成人精品免费视频| 国产www网站| 国产理论最新国产精品视频| 四虎国产精品永久一区| 制服丝袜亚洲| 福利一区三区| 久久综合五月婷婷| 男人天堂亚洲天堂| 国产精品女同一区三区五区| 狠狠操夜夜爽| 在线观看无码a∨| 国产乱子伦视频三区| 97在线碰| 国产亚洲欧美日韩在线一区| 免费人欧美成又黄又爽的视频| 午夜毛片免费观看视频 | 日韩国产综合精选| 国国产a国产片免费麻豆|