999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘在高校資產管理中的應用

2011-01-01 00:00:00袁雋媛
中國管理信息化 2011年5期

[摘 要] 進行高校資產數據挖掘與分析研究,能更好地為高校管理、高校決策提供科學依據。本文分析了高校資產管理的現狀與特點,構建了高校資產數據倉庫雪花模型,挖掘出高校資產管理指標之間的關聯規則,并對該數據挖掘模型進行評價,在實際應用中取得了良好效果。

[關鍵詞] 高校資產;數據倉庫;數據挖掘;雪花模型;關聯規則

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 05 . 013

[中圖分類號]G475;TP311.131 [文獻標識碼]A [文章編號]1673 - 0194(2011)05- 0026- 03

1概述

高校資產信息管理系統中的數據客觀記錄了高校所有資產的歷史情況和現狀,同時也隱含著各種資產的特點,蘊藏著學校的發展規律和趨勢。然而現階段高校各部門一般采用不同的數據庫,數據整合困難,無法實現不同系統跨平臺信息的共享與交互,無法實現面向主題的數據分析,從而無法更多更好地利用數據資源。為了充分利用這些積累的記錄信息,從中發現有用的知識,獲得潛在的規律,為高校資產管理和決策提供科學參考,需要建立一個分析決策系統。而實現分析決策系統的主要技術就是數據倉庫和數據挖掘。

數據挖掘是指從大量數據中提取或發現知識[1]。數據挖掘通過一些模型和智能方法,從大量數據中提取、識別用戶真正感興趣的、新穎的、潛在有用的模式,提供給用戶作為決策的依據和參考。

數據倉庫與數據挖掘技術已被廣泛應用于商業領域,但用于高校資產管理領域的卻很少。本文通過構建高校資產數據倉庫模型,對資產管理指標的相關屬性進行分析,通過數據挖掘得出了資產管理指標之間存在的一些強關聯規則,各規則的信任度均達到70%以上。

2高校資產數據倉庫邏輯模型

數據倉庫多維數據集能對數據倉庫中的所有數據提供統一的和集成的視圖,可作為傳統報表、聯機分析處理和數據挖掘的基礎。數據倉庫的邏輯模型包括事實表和維度表,事實表描述挖掘主題包涵的多個角度,維度表則從不同角度描述挖掘主題的相關數據[2]。結合高校資產挖掘主題與資產信息數據的特點,高校資產數據倉庫的邏輯模型采用了雪花模型結構,如圖1所示。“資產數據事實表”與“部門表”、“資產編碼表”、“資產分級表”、“時間表”4個主維度表關聯,“部門表”、“資產編碼表”和“資產分級表”還分別有“上級部門表”、“資產類別表”和“資產指標表”3個二級維度表,其中“資產類別表”還有三級維度表“資產大類表”。建立這種多級維度表不但可以降低數據倉庫的數據冗余度,減少數據量,保證數據一致性,還有利于改變數據粒度,實現靈活粒度的數據挖掘。

數據挖掘如果建立在原始數據水平或較低的維層次上,則此時數據粒度小,挖掘速度慢,挖掘得到的規則繁雜,難以理解;如果數據從低維層次抽象到高維層次,對較高維層次數據進行挖掘,則此時數據粒度大,挖掘速度快,得到的規則泛化程度高,便于宏觀理解。因此通常在高維層次上進行挖掘,必要時再進行較低維層次上的挖掘[3]。

3數據屬性歸約及取值

3.1數據屬性歸約

高校的資產數據按教育部規定分為16類,對這些資產進行管理非常繁雜,根據實際我們選取以下4個管理指標以利于資產數據挖掘:

(1)資產購建價值,用A表示。它是購買或建造資產的原值。理論上同類資產價值高的要比價值低的使用壽命長。

(2)資產剩余使用年限率,用B表示。每種資產都有一定的使用年限,使用中每年提取折舊,當到達規定的使用年限后該資產一般只剩下很少的殘值,原則上也就報廢了。資產剩余使用年限率反映了資產的剩余使用年限,是資產管理的一個重要指標。

(3)資產每年使用率,用C表示。不同的資產每年的使用率各不相同,有的長年使用,如房屋和家具等;有的一年才使用幾次,如某些實驗儀器設備。同樣的資產使用次數多的肯定比使用次數少的容易壞。

(4)資產質量評估值,用D表示。每年由相關人員對每種資產進行一次評估,評估該資產當時的性能和好壞程度。

3.2 資產管理指標數據的取值

對資產管理的4個指標值采用統一的分級,分為“一級”、“二級”、“三級”、“四級”、“五級”5個等級,分別用1、2、3、4、5表示,對指標數據的取值采取分類轉換。

(1)同一類資產的購建價值會因品牌種類、購建時間、市場行情等因素的影響而不同,一線品牌中的高檔資產購建價值肯定高,定為一級;一線品牌中的中檔資產或二線品牌中的高檔資產定為二級;二線品牌中的中檔資產或非品牌中的高檔資產定為三級;非品牌中的中檔資產定為四級;淘汰產品、試用品或非正規單位生產的產品定為五級。

(2)會計上對資產的使用年限沒有明確規定,資產折舊的年限通常是分大類按稅務規定進行計算的:一般房屋為20年;生產設備為10年;工具、家具為5年;電子設備為3年;低值易耗品為1年。這個規定與實際使用年限相比是偏低的,因此將規定使用年限近似平均分成5個區間,其中第五區間包括規定使用年限到期后仍在使用的那段時間。每個區間數按年取整,如不為整則在購建初的第一區間多分配一點時間。資產剩余使用年限率=(稅務規定使用年限-已使用年限)/稅務規定使用年限。將數值型數據離散化后分區計算資產剩余使用年限率,結果各類資產剩余使用年限率基本近似,各區間取值(1,0.8],(0.8,0.6],(0.6,0.4],(0.4,0.2],(0.2,0],依次定為一級、二級、三級、四級、五級,如房屋從新建起使用(0,4]年為一級,(4,8] 年為二級,(8,12] 年為三級,(12,16] 年為四級,>16 年為五級。

(3)資產每年使用率由使用資產的負責人在每年年中依據使用記錄對每種資產作出評價,平均分成五級,使用最少的為一級,它的使用壽命相應就長;使用最多的為五級,它的使用壽命相應就短。

(4)對資產質量進行評估的相關人員在每年年中時對每種資產的性能和好壞進行一次評估,評估的結果值也分成五級,最好的為一級,最差的為五級,五級意味著不能再使用。

根據以上分析,高校的每種資產可以描述如下:(資產編號,購建價值,剩余使用年限率,每年使用率,資產評估值)。例如:(415012,A1,B3,C1,D2)表示資產號為415012的資產,其購建價值一級, 剩余使用年限率三級,每年使用率一級,質量評估值二級。

實例:2008年某學院的實驗室正在使用的計算機有126臺,當年各項管理指標分級情況和計算機數量之間的關系如表1所示。

4數據挖掘

本文對高校資產進行關聯規則挖掘,頻繁數據項集的生成采用Apriori算法。

4.1 Apriori算法及其特點

關聯規則挖掘是數據挖掘的一個主要研究方向,目的是發現海量數據中數據項集之間存在的潛在關系規則。先識別出頻繁出現的屬性值集,也稱頻繁項集,然后再利用這些頻繁項集創建描述關聯規則[4]。關聯規則中有支持度和信任度兩個重要的度量,為滿足一定的要求,用戶需要指定規則必須滿足最小支持度(minsupport)和最小信任度(minconfidence)兩個門限[5]。關聯規則的挖掘分為兩個步驟:①發現頻繁項目集: 找出所有大于或等于用戶指定最小支持度的最大頻繁項目集,又稱強項集;②生成關聯規則: 根據用戶指定的最小信任度利用頻繁項目集生成關聯規則,該規則是滿足最小支持度和最小信任度的強關聯規則。

Apriori算法是關聯規則中最典型的算法,它通過對事務數據清單D的多趟掃描來發現所有的頻繁項目集(強項集)L:

L1 = {large 1-itemsets}; //頻繁1項目集

for(k=2;Lk-1≠Φ;k++)

{Ck=apriori-gen(Lk-1,minsupport); // Ck是頻繁k項目候選集

for all transactions t∈D

{ Ct=subset(Ck,t); // Ct是從候選集Ck中提取的包含在事務t中的候選集元素

for all candidates C∈Ct

C.count++ ;

Lk={ C∈Ck | C.count≥minsupport};

L= UkLk; //求所有頻繁項目集Lk 的和

Apriori算法中調用了函數apriori-gen(Lk-1,minsupport),是為了通過頻繁(k-1)項目集產生頻繁k項目候選集,即利用第(k-1)趟掃描得到強項集集合Lk-1 的候選集Ck。該函數先進行拼接,再剪枝。在拼接生成候選數據項集時,一個項集必須是頻繁數據項集且它的所有子集也都是頻繁數據項集,因此要刪除所有含有非頻繁項目子集的候選元素。如果k項集 C∈Ck 的某(k-1)子集不是(k-1)強項集,則將C從候選集Ck 中刪除。

Arpiori算法中如果生成的候選項集太多,則多次掃描會使效率急劇下降,同時過多的候選項集還可能生成大量的規則,影響它的應用。本系統中采用數據屬性歸約,大大減少了生成的候選項集,能快速發現關聯規則,提高使用效率。

4.2 采用Apriori 算法實現關聯規則挖掘

本系統對建立的某高校資產數據倉庫多維數據集進行數據挖掘,先對原始數據進行整理和特征化變換,設定資產管理指標中的資產質量評估值為規則目標。

采用Apriori 算法生成頻繁數據項集。設定最小支持度為3%,最小信任度為70%,先構造1個屬性的候選集C1,計算C1 的支持度,去掉C1 中支持度小于3%的屬性,得到頻繁項目集L1。再根據L1 及2個屬性的組合,構造候選集C2,計算C2 的支持度,去掉C2 中支持度小于3%的二維屬性,得到頻繁項目集L2。依次類推重復上述過程,直到所有屬性組合完畢,形成頻繁項集L={ L1,L2,…}。

再研究資產數據間的關聯性,挖掘滿足最小信任度的規則。若X,Y為項目集,且X∩Y= ?準,蘊涵式X?圯Y稱為數量關聯規則,X和Y分別稱為X?圯Y的前提和結論。項目集(X∪Y)的支持度稱為關聯規則X?圯Y的支持度,記作support(X?圯Y),即support(X?圯Y)=support(X∪Y)。數值關聯規則X?圯Y的信任度記作confidence(X?圯Y):confidence(X?圯Y)= support(X∪Y)/support(X)×100%。給定用戶的最小支持度minsupport和最小信任度minconfidence,如果 support(X?圯Y)≥minsupport,同時confidence(X?圯Y)≥minconfidence,則稱數量關聯規則X?圯Y為強規則,即根據用戶指定的最小信任度而生成的關聯規則是滿足最小支持度和最小信任度的強關聯規則。表2是系統數據挖掘的強關聯規則,它反映了資產購建價值、資產剩余使用年限率和資產每年使用率這3個指標與資產質量評估值之間的關聯性。購建價值高,又在購建初期且很少使用的資產其性能變化不大,它的資產質量評估值肯定很高。數據挖掘時如降低最小支持度,會增加系統生成的頻繁項目集數,這樣挖掘出的規則會太多,因而會降低了規則的普遍性和代表性。

5結束語

本文利用數據挖掘技術對高校資產作了深層次研究,通過采用Apriori 算法生成頻繁數據項集,進而挖掘出高校資產管理指標之間的關聯規則,各規則的信任度均達到70%以上,對關聯規則進行分析得出的結論和決策建議在實際應用中取得了良好效果。

主要參考文獻

[1][加]Jiawei Han,Micheline Kamber.數據挖掘——概念與技術[M].影印版.北京:高等教育出版社,2001.

[2]袁雋媛.試論數據倉庫在高校網絡教育管理中的應用[J].發明與創新,2007(5):36-37.

[3]安利平,張松,仝凌云.基于決策樹的OLAM及其應用研究 [J].計算機工程與設計,2008,29(15).

[4]陳安,陳寧,周龍驤.數據挖掘技術及應用 [M].北京:科學出版社,2006.

[5]李新良,陳湘.數據挖掘中關聯規則算法的研究 [J].計算機工程與科學,2007,29(12).

主站蜘蛛池模板: 综1合AV在线播放| www.精品国产| 免费黄色国产视频| 国产免费福利网站| 亚洲区一区| 国产SUV精品一区二区| 日韩精品毛片| 三上悠亚一区二区| 丰满人妻久久中文字幕| 亚洲AV无码不卡无码 | 小13箩利洗澡无码视频免费网站| 国产探花在线视频| 丁香六月综合网| AV老司机AV天堂| 免费国产黄线在线观看| 欧洲熟妇精品视频| 国产无码制服丝袜| 国产高清免费午夜在线视频| 亚洲码一区二区三区| 国产区免费精品视频| 亚洲精品爱草草视频在线| 亚洲三级视频在线观看| a级毛片免费播放| 91久久夜色精品国产网站| 欧美国产在线看| 99视频在线免费观看| 欧美成人午夜视频免看| 精品無碼一區在線觀看 | 久久久久久久久久国产精品| 色婷婷色丁香| www.99精品视频在线播放| 国产一区二区三区在线精品专区| 亚洲三级色| 国产无码在线调教| 真人高潮娇喘嗯啊在线观看 | 国产系列在线| 国产精品免费电影| 久久久久夜色精品波多野结衣| 一本无码在线观看| 色欲不卡无码一区二区| 伊人成色综合网| 亚洲无码在线午夜电影| 六月婷婷激情综合| 天天综合网站| 国产精品对白刺激| 国产亚洲成AⅤ人片在线观看| 久久精品人人做人人爽97| 日本国产在线| 福利在线一区| 麻豆精品国产自产在线| 国产福利一区二区在线观看| 欧美午夜视频| 国产91无码福利在线| 精品国产成人a在线观看| 毛片大全免费观看| 国产丝袜91| 欧美日韩国产成人高清视频| 女人18毛片水真多国产| 毛片一级在线| 色偷偷一区二区三区| 日韩一二三区视频精品| 日韩午夜福利在线观看| AV无码一区二区三区四区| 亚洲男人在线天堂| 国产成人成人一区二区| 婷婷六月激情综合一区| 国产一区二区三区免费观看| 欧美在线黄| 大乳丰满人妻中文字幕日本| 亚洲av无码专区久久蜜芽| 亚洲人成网站色7799在线播放| 亚洲精品国产自在现线最新| 国产精品xxx| 亚洲成a人在线观看| 国产精品无码久久久久AV| 免费无码AV片在线观看国产| 久热re国产手机在线观看| 亚洲 成人国产| 成人福利在线观看| 国产午夜精品一区二区三| 中文无码伦av中文字幕| 久久人搡人人玩人妻精品|