999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘技術的個人信用的研究與分析

2016-02-02 13:07:10
山東工業技術 2016年22期
關鍵詞:數據挖掘關聯規則

董 婷

(榆林學院信息工程學院,陜西 榆林 719000)

基于數據挖掘技術的個人信用的研究與分析

董 婷

(榆林學院信息工程學院,陜西 榆林 719000)

本文使用國內頂尖的在線數據挖掘平臺(TipDM),找出對分類預測影響較大的屬性進行建模,分別通過基于k-means的聚類分析和Aporiori關聯規則分析等方法對樣本數據進行分析預測,找到了一條最后的規則。

數據挖掘;關聯規則;個人信用

0 引言

本文使用國內頂尖的在線數據挖掘平臺(TipDM),找出對分類預測影響較大的變量進行建模,分別通過k-means的聚類分析、Aporiori關聯規則分析等方法對樣本數據進行分析預測。

1 方法

1.1 K-means聚類算法

K-means聚類算法是把數據點到原模型的某種距離作為優化的目標函數,利用函數求極值的方法得到迭代運算的調整規則。K-means算法以歐式距離作為相似度測度,它是求對應某一初始聚類中心向量V最優分類,使得評價指標J最小[1]。算法采用誤差平方和準則函數作為聚類準則函數。

(1)K-means聚類算法的目標函數。對于給定的一個包含n個 S維數據點的數據集,以及要生成的數據子集的數目K,K-means聚類算法將數據對象組織為K個劃分。每個劃分代表一個類,每個類有一個類別中心。計算該類內各點到聚類中心的距離平方和,聚類目標是使各類總的距離平方和最小[2]。

(2)K-means算法的算法流程。K-means算法是一個反復迭代過程,目的是使聚類域中所有的樣品到聚類中心距離的平方和最小,算法流程如下:第一步:選定數據空間中K個對象作為初始聚類中心;第二步:根據歐氏距離最近原則分別將它們分配給與其最相似的聚類中心所代表的類;第三步:計算每個類別中所有對象的均值作為該類別的新聚類中心,計算所有樣本到其所在類,并判斷聚類中心和值是否發生改變,若不改變則結束,若改變則繼續循環操作,直到聚類中心和值不發生改變為止[3]。

1.2 關聯規則

兩個或兩個以上變量的取值之間存在某種規律性,就是關聯。數據關聯是數據庫中存在的一類重要的可被發現的知識。Apriori algorithm是關聯規則里一項基本算法。關聯規則的目的就是在一個數據集中找出項與項之間的關系,也被稱為購物藍分析。Apriori核心算法過程如下: 第一步:掃描數據庫計算出各個項集的支持度,得到頻繁項集的集合;第二步:做一個(k-2)JOIN運算得到 2個只有一個項不同的屬于的頻集;第三步:通過掃描數據庫,計算中各個項集的支持度,將中不滿足支持度的項集去掉[4]。

2 試驗數據

本文通過對300條樣本數據的年齡、姓名、地區、收入、是否結婚、是否有孩子、是否有汽車、是否有抵押等參數進行分析,通過關聯規則對樣本中的某些變量進行分析,找到了一條最優規則;通過聚類分析算法對樣本整體和某一變量進行聚類分析,分析出各簇中的樣本數與百分比。

3 試驗結果

3.1 利用K-means算法對樣本數據進行分析評估

k均值聚類迭代次數為3,集群內誤差平方和為775.1756576878267,用均值替代的全局缺省值,得到各簇分析統計結果如表1。

表1

3.2 利用Apriori關聯規則算法對樣本數據進行分析評估

樣本的最小支持度為0.1,置信度為0.9,產生的項集和其樣本數量如表2。

表2

Apriori關聯規則分析結果如下:

children=NO mortgage=NO pep=NO 49 ==> married=YES 48<conf:(0.98)> lift:(1.45) lev:(0.05) [15] conv:(8

4 試驗總結

現階段,信貸業務的發展迅速,針對企業的信用評級已逐步完善,然而,針對個人的信用評級卻相對欠缺。本次試驗是使用國內頂尖的數據挖掘平臺(tipdm)主要是針對個人信用評價的樣本數據的某些變量進行了k-means聚類分析和關聯規則分析,通過這次試驗我認為k-means聚類算法是一個NP難優化問題,無法獲得全局最優。

通過對樣本數據分析評估發現,在個人信用評級中信用最好的一條規則是沒有孩子、沒有抵押或負債,并且已經結婚。

[1]杜廣龍.面向多自由度機器人的非受限智能人機交互的研究[D].華南理工大學,2013.

[2]安璐.異構蜂窩網絡高能效節點部署研究[D].北京郵電大學,2015.

[3]任超.基于智能計算的預測模型研究及其在公共危機管理中的應用[D].蘭州大學,2013.

[4]陳雪萍.數據挖掘技術在高校教務管理中的應用研究[D].廣西師范大學,2014.

項目:2014榆林科技局項目(2014cxy-09-6)

10.16640/j.cnki.37-1222/t.2016.22.129

猜你喜歡
數據挖掘關聯規則
撐竿跳規則的制定
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
數獨的規則和演變
探討人工智能與數據挖掘發展趨勢
奇趣搭配
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
TPP反腐敗規則對我國的啟示
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 免费xxxxx在线观看网站| 精品国产Ⅴ无码大片在线观看81| 天天综合色天天综合网| 中国丰满人妻无码束缚啪啪| 热这里只有精品国产热门精品| 国产jizzjizz视频| 扒开粉嫩的小缝隙喷白浆视频| 亚洲天堂视频网站| 亚洲无线视频| 婷婷99视频精品全部在线观看 | 午夜福利无码一区二区| 成人国产免费| A级毛片高清免费视频就| 亚洲自拍另类| 99精品免费在线| 久久九九热视频| 国产幂在线无码精品| 国外欧美一区另类中文字幕| 色AV色 综合网站| 91精品视频播放| 91福利国产成人精品导航| 福利姬国产精品一区在线| 中日韩一区二区三区中文免费视频| 亚洲人成人伊人成综合网无码| 亚洲第一极品精品无码| 亚洲女同欧美在线| 亚洲—日韩aV在线| 直接黄91麻豆网站| 国产精鲁鲁网在线视频| 国产精品亚欧美一区二区| 亚洲精品国产精品乱码不卞| 欧洲熟妇精品视频| 国产一级做美女做受视频| 亚洲欧美综合在线观看| 国产一级做美女做受视频| 东京热一区二区三区无码视频| 欧美日韩第三页| 99热线精品大全在线观看| 一级毛片免费观看久| 国产福利不卡视频| 1769国产精品视频免费观看| 色135综合网| 超碰91免费人妻| 免费无码在线观看| 国产一区二区三区夜色| 成人va亚洲va欧美天堂| 国内丰满少妇猛烈精品播| 五月天婷婷网亚洲综合在线| 免费黄色国产视频| 亚洲国产成人综合精品2020| 高潮毛片免费观看| 日韩a在线观看免费观看| 激情综合五月网| 日韩成人在线网站| 欧美精品在线看| 18禁黄无遮挡网站| 中文字幕有乳无码| 欧美成人二区| 欧洲免费精品视频在线| 丝袜国产一区| 天天色综合4| 成人久久18免费网站| 亚洲欧美综合另类图片小说区| 中文字幕亚洲另类天堂| 久久精品91麻豆| 欧美色视频在线| 国产精品大尺度尺度视频| 亚洲一区二区约美女探花| 国产簧片免费在线播放| 久久综合国产乱子免费| 69国产精品视频免费| 色135综合网| 欧美成人aⅴ| 免费看美女自慰的网站| 亚洲开心婷婷中文字幕| 亚洲国产成人在线| 欧美97欧美综合色伦图| 欧美在线黄| 欧美亚洲网| 中文字幕日韩视频欧美一区| 国产性爱网站| 国产尤物视频在线|