999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術分析及其在高等學校教務管理中的應用

2008-12-31 00:00:00
經濟師 2008年7期

摘要:“信息孤島”和“數據爆炸但信息貧乏”的事實已經開始影響人類的進步和發展,難道沒有什么辦法讓我們從幾乎爆炸的數據中找到我們需要的信息嗎?神奇的“啤酒搭著尿布賣”的事件就提醒我們要對數據進行挖掘。文章通過對數據倉庫、數據挖掘技術和決策支持系統的研究,提出了基于數據挖掘的高等學校教務管理決策支持系統。該系統能為高等學校教務管理提供科學的依據并指導其發展方向。關鍵詞:數據挖掘決策支持系統數據倉庫決策樹

中圖分類號:G640 文獻標識碼:A

文章編號:1004-4914(2008)07-103-02

隨著我國高等教育事業的迅速發展,高等學校的辦學規模在不斷地擴大,招生人數也在突飛猛進,教務管理的人員技術和質量卻仍然沒有很大的改善。同時,教務管理人員的事務相對以前有增無減,加上教育方式更加靈活多樣等,這樣高等學校教務管理的問題越顯突出,學生人數的急劇增加、教學資源日趨緊張、教務管理手段落后的現象在全國隨處可見,很多高等學校在教務管理方面不斷地嘗試改革,給高等學校的教務管理既帶來了前所未有的發展的同時也帶來了新挑戰。根據經濟原則,高等學校如何以最小的代價獲得最好的管理效果成為了新的研究課題。

高等學校要從管理的最高角度出發,總體把握目前的、將來的、宏觀的形勢,解決目前存在的問題,預見潛在的問題,優化資源配置,提高管理效率。在信息時代的今天,構建一個有效的高等學校教務管理決策支持系統(Decision Supporting System,簡稱DSS)的重要意思就不言而喻了。一個良好的系統除了能支持日常簡單的查詢、統計、協調學校各項工作順利開展外。還應該為高等學校決策提供有關教育形勢的變化、發展趨勢以及通過高科技手段來對歷史數據進行挖掘,提取出隱含在數據背后的人的行為,預見未知的、潛在的、深層次的、有價值的趨勢,為學校的教務管理和教育決策提供有利的信息。

建立DSS時。一般都要用到數據庫DB(Database)技術,但這種傳統的DB技術目前不能很好地進行數據的合成、分類等,其它更高的要求就更顯得困難了。同時,為進行高效的數據分析,信息就必須與決策密切相關的主題組織起來,這時傳統的DB就顯得力不能及了。在專家學者的研究下,數據倉庫技術的出現給這類決策支持系統帶來新的希望,這種技術把人們需要的信息從原始的數據中挖掘出來,把零散的、分散的、難以訪問的原始數據進行數據轉化為集中統一、隨時可訪問的信息,同時對數據進行清洗,即數據倉庫對信息實現合理、全面而高效的管理。因此,數據倉庫和它的相關技術并應用于高等學校教務管理決策支持系統中是舉足輕重的。

本文提出的解決方案是基于數據倉庫(Data Warehouse,簡稱DW)技術、采取數據挖掘(Data Mining,簡稱DM)手段的高等學校教務管理決策支持系統。在其中,DW用來存儲和組織基礎數據,而DM用來對DW中的基礎數據進行一系列挖掘后,提取出具有價值的知識信息,驗證和預測高等學校的管理對象、資源、目標,輔助學校決策,使得高等學校在前進的過程中隨時把握自己的發展方向。

一、數據倉庫和數據挖掘技術分析

(一)數據倉庫技術分析

1 數據倉庫的概念。數據倉庫(DW)作為一切決策支持系統的基礎,同時也是高等學校教務管理決策支持系統的基礎,然而對于它的定義不同的專家學者有不同的定義。最典型的就是數據倉庫之父W.H.Immon將其定義為:“數據倉庫是支持管理決策過程的、面向主題的、集成的、隨時間變化的、持久的數據集合。”

我們把數據倉庫中存貯的數據分為四級:遠期基本數據、近期基本數據、輕度綜合數據和高度綜合數據。還有一部分重要的關于數據的數據,我們稱之為元數據。數據倉庫中用來與終端用戶的多維模型與前端工具間建立映射的元數據,稱為決策支持系統的元數據。

數據倉庫系統必須具備建立、管理和使用等功能。W.H.Immon認為,數據倉庫系統可以分為三個組成部分:(1)數據源:提供源數據;(2)后端加工處理:包括來自數據源數據的接受、析取、匯總、變換、打包和儲存等;(3)前端服務:面向用戶的數據需求,完成數據提取和計算分析等功能。

2 開發數據倉庫的流程。開發數據倉庫的流程包括以下幾步:(1)建立開發數據倉庫工程的目標及制定工程計劃;(2)建立技術環境,選擇實現數據倉庫的軟硬件資源;(3)根據決策需求確定主題,進行數據建模,選擇數據源,對數據倉庫的數據進行邏輯結構設計;(4)設計數據倉庫中的數據庫,基于用戶的需求,著重于某個主題,開發數據倉庫中數據的物理存儲結構,即設計多維數據結構的事實表和維表;(5)數據轉換程序實現從源系統中抽取數據、清理數據、一致性格式化數據、裝載數據等過程的設計和編碼;(6)定義元數據,即表示定義數據的意義及系統各組成部件之間的關系。元數據包括關鍵字、屬性、數據描述、物理數據結構、源數據結構、映射及轉換規則、綜合算法、代碼、缺省值、安全要求、變化及數據時限等;(7)開發用戶決策的數據分析工具,建立結構化的決策支持查詢,實現和使用數據倉庫的數據分析工具,包括優化查詢工具、統計分析工具、客戶機/gR務器工具、聯機分析處理工具及數據開采工具等,通過分析工具實現決策支持需求;(8)管理數據倉庫環境,包括質量檢測、管理決策支持工具及應用程序。并定期進行數據更新,使數據倉庫正常運行。

3 高等學校教務管理數據倉庫建立。我們知道,DW不光是各種數據的簡單堆積或者相加,而且還要從大量的事務型數據庫中抽取數據,并將其清理、轉化為新的存儲格式,即為決策目標把數據聚合成一種特殊的格式。隨著此過程的進行和完善,這種支持決策的、特殊的數據存儲即被稱為DW。對高等學校教務管理來說,DSS建立數據倉庫的數據可能來自如人事處、學生處、教務處、財務處、設備處、后勤管理等職能部門和二級學院、系,還有學生等,所有這些數據從結構上看,是相對獨立的,是不利于高等學校教務管理決策者進行全面分析和做決策的。根據高等學校教務管理的DSS需求,就要求數據倉庫從較高層次上把分散的、難以訪問的數據從不同信息系統中分離出來,經過抽取、清洗、凈化、轉換、遷移為統一、隨時可用的信息,通過深層次加工把信息轉換成大小不一、各式各樣的數據集市(DataMart)以滿足各個職能管理部門和院系做專題分析和輔助領導層決策,輔助學生做出自己的學業規劃和職業規劃。系統必須定期自動完成分散數據源的采集、入庫和刷新工作,充分預測今后的擴展性與外部數據的接口??傊珼W把高等學校教務管理分散的、難以訪問的日常營運數據轉化為集中統一、隨時可用的信息。一般來說,完整的DW具備建立、管理和使用全部成分。由此也可知,建立數據倉庫是一個長期復雜的過程,也是工作的重點。

數據倉庫主要應用于對事物的總體分析,從全局把握信息。它的真正價值在于幫助決策者制定出能夠改進過程的決策,而不僅光停留在工作流程的自動化方面。憑借良好的數據倉庫,高等學校教學管理領導層決策時就可以從歷史數據出發,有事實作為依據,而不再是只依賴直覺。

(二)數據挖掘技術分析

1 高等學校教務管理需要數據挖掘。根據目前高等學校教務管理系統的特點,首先需要在不同的層次上將不同信息系統中的數據綜合、清洗、歸類、統一,并進行分析利用的抽象,即建立數據倉庫,在數據倉庫的基礎上進行聯機分析處理和數據挖掘,為科學管理決策提供依據支持。

數據挖掘(DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,抽取隱含在其中的、人們事先不知道、但又是潛在有用的信息和知識的過程。從更廣義角度來講,DM就是在一些事實或觀察數據的集合中尋求模式的決策支持過程。因此,它除了處理傳統數據庫中的數值型的結構化數據外,還可以對文本、圖形、圖像、web信息資源等半結構、非結構數據進行挖掘。

DM就是在一些事實或觀察數據的集合中尋找模式的決策支持過程,DM的對象不僅是數據庫,也可以是文件系統、數據集合或DW?;贒W的DM技術,其任務是發現DW中尚未被發現的知識,預見的、潛在的具有價值信息。決策者明確的信息,直接用查詢等其它工具直接獲取,那些隱藏在大量數據中的關系、趨勢等信息就需要DM技術。DM技術可從DW中智能挖掘出大量真正有價值的信息和知識,根據高等學校的發展歷程,對未來趨勢做出科學的定量分析和預測。高等學校教務管理決策者提供更科學的決策基礎,從而有效地提高管理質量,有針對性地加強教學管理。

2 數據挖掘的任務。DM的首要任務是發現知識,具體包括:廣義型的知識,反映同類事務共性的知識;特征型知識,反映事物各方面特征的知識:差異性知識,反映不同事物之間屬性差別的知識;關聯型知識,反映事物之間依賴或關聯的知識;預測性知識,根據歷史和當前的數據推測未來的數據;偏離型知識,揭示事物偏離常規現象等。

3 數據挖掘的流程。DM就是利用數據挖掘技術,從基礎的數據庫、數據倉庫及其其它信息庫的大量數據中挖掘有價值的知識的過程。其主要分為四個步驟:(1)業務對象:首先應熟悉應用領域的數據、背景知識,清晰地定義出業務問題,明確所要完成的數據挖掘的任務,完成數據定義工作。(2)數據準備:包括數據抽取和預處理工作。對數據質量進行分析,完成消除數據噪聲,清除不一致數據,進行多個數據庫的集成、組合工作。然后從數據庫中選擇挖掘的對象,將數據轉換成數據挖掘系統要求的統一格式。(3)數據挖掘:是知識發現的核心步驟。包括選擇合適的算法和技術、執行挖掘算法、搜尋提取數據模式等。(4)結果分析:依據要解決的問題,對挖掘的模式進行確認、翻譯和解釋,將發現的知識以最簡單、最易理解的方式提供給用戶。

4 數據挖掘的方法。DM的結果體現在知識,而知識的發現是一個復雜的過程。面對高等學校教務管理的數據挖掘這個領域,怎么樣從眾多的挖掘技術中挑選出有效的技術、方法和工具,是研究和開發高等學校教務管理數據挖掘系統的首要問題。常用的數據挖掘方法有:(1)遺傳算法:主要用于分類和關聯規則的挖掘。遺傳算法是基于達爾文進化論中基因重組、突變、自然選擇和適者生存等概念,試圖通過組合或“繁殖”現存的最好的解法來產生更好的解法。(2)決策樹方法:主要用于數據分類。它利用信息論中的信息增益尋找數據庫中具有最大信息量的字段,建立決策樹的一個節點,再根據字段的不同取值建立樹的分支;在每個分支子集中重復建立樹的下層節點和分支的過程,即可建立決策樹。接著進行剪枝處理,然后把決策樹轉化為規則。利用這些規則對新事物進行分析。(3)粗糙集理論:用于數據簡化、數據意義評估、對象相似性或差異性分析、因果關系及泛化式挖掘等。主要思想是:把對象的屬性分為條件屬性和決策屬性,按各屬性值相同分等價類。條件屬性上的等價類E與決策屬性上的等價類Y分三種情況,分別為:下近似,Y包含E;上近似,Y和E交集非空;無關,Y和E的交集為空。對下近似建立確定性規則,對上近似建立不確定性關系,對無關情況則不存在規則。(4)人工神經網絡:用于分類、聚類、特征挖掘、預測和模式識別。人工神經網絡從結構上模仿生物神經網絡,通過簡化、歸納、提煉總結出來的一類并行處理網絡。以模擬和學習規則為基礎,建立三類多種神經網絡模型:前饋式網絡、反饋式網絡、自組織網絡。(5)關聯規則方法:用于對大型關系數據庫發現有價值的關聯模式。也可對半結構化數據(如文檔數據)進行關聯規則挖掘。它通過統計方法對數據中的if--then規則進行尋找、歸納和提取。

高等學校的教務管理信息系統大都具有分類特性,因此,高等學校教務管理DSS的數據挖掘方法主要采用能實現分類模式分析的方法,以分類模式分析為主線,關聯模式分析為輔線結合其他分析方法進行。

二、決策支持系統技術分析

1 基本概念。決策是管理的核心。高等教育的發展,高等學校面臨著空前未有的復雜生存環境,更難以形成自己的優勢,并且維持好自己的競爭優勢,競爭的壓力對高等學校制定教務管理決策的質量、速度、效率都提出了更高的要求。

決策支持系統(DeCls]onSuppoaingSystem,簡稱DSS)是一種針對半結構化的決策問題,支持決策活動的具有智能作用的人機系統。這種系統能夠為決策者提供決策所需的有效數據、信息和背景材料,幫助明確決策目標和進行問題識別,建立或修改決策模型,提供各種備選方案,并且對各種方案進行評價和優選,通過人機交互功能進行分析、比較和判斷,為正確決策提供必要的支持。決策支持系統作為一種新型的信息技術,能夠為高等學校教務管理提供各種決策信息以及許多問題的解決方案,減輕了教務管理者從事低層次信息處理和分析的負擔,使得他們專注于最需要決策智慧和經驗的工作,提高了管理的質量和效率。一般地,我們認為是決策支持系統由數據庫系統、模型庫系統、知識庫系統及人機會話系統等部分組成的。

2 DSS的分析方法。DSS以滿足決策支持系統的要求和達到DSS的性能指標為主要的性能指標,由于DSS的特殊性,對DSS的系統分析通常采用一種稱之為ROMC的方法。所謂的ROMC就是一種基于決策過程基本活動的方法,是決策者進行表達(R)、操作(O)、存儲輔助(M)和控制(c)的方法,其基本思路是建立起DSS的要求與性能之間的關系,并盡量減少它們之間的差異。

三、基于數據挖掘的決策支持系統的建立

從以上的內容,我們可以建立一種基于數據挖掘的決策支持系統基本結構框架。它由數據庫、數據倉庫、數據倉庫管理模塊、數據挖掘工具、知識庫、知識發現模塊、人機交互模塊組成。系統的數據主要來源于其他的信息系統,我們需要輸入是源于數據庫的數據以及存儲在知識庫中的知識和經驗;人機交互模塊通過自然語言處理和語義查詢在用戶和系統之間提供相互聯系的集成界面;數據倉庫管理模塊完成數據倉庫的創建以及數據倉庫中數據的清洗、綜合、提取、統一等各種操作,負責管理整個系統的運轉;數據挖掘工具用于完成實際決策問題所需的各種查詢檢索工具、多維數據的OLAP分析工具和數據開采DM工具等,以實現決策支持系統的各種要求;知識發現模塊控制并管理知識發現過程,它將數據的輸人和知識庫中的信息用于驅動數據選擇過程、知識發現引擎過程和發現的評價過程。

決策支持同數據庫管理是密切相關的,當有命令從用戶發出后,數據挖掘工具就自動觸發數據倉庫管理模塊,從數據倉庫中獲取出相關的數據。

該決策支持系統的建立過程可大致描述如下:(1)對需求進行分析也稱系統分析,描述和表示問題;(2)確定數據來源,建立數據倉庫;(3)對要發現的任務進行分類別,如歸類、回歸分析、聚類、發現關聯規則等,設計或選擇有效的數據挖掘算法并加以實現;(4)數據挖掘,逐層綜合。調用數據挖掘功能,從平凡的歷史數據中提出綜合數據,并且獨立存儲為庫文件,作為更高一層數據挖掘對象;(5)測試發現的知識,對知識進行一致性、效用性、適應性進行處理;(6)應用開發,根據高等學校教務管理發展的要求,建立適用于決策支持的數據倉庫的集成界面和應用程序,使教務管理者能在決策支持中運用所發現的知識。

以上過程不是簡單的線性流程,而是一個綜合的學習、發現和修改過程,步驟之間包含了循環和反復,這樣可以對發現的知識不斷求精、深化,并使其易于理解、使用。

四、結束語

數據挖掘一門是方興未艾的前沿科學,數據挖掘技術為決策支持系統地研制與開發提供了一種有效、可行的體系化解決方案。決策支持系統應集成數據倉庫、數據挖掘技術。隨著數據倉庫和數據挖掘技術在各個領域的廣泛采用,決策支持系統的研究與開發工作將被推向一個更高的層次。

教務管理的領域,隨著高等學校教務管理信息系統的數據信息的不斷增長,把DM技術應用該系統中,以建立高等學校教務管理決策支持系統,必將為高等學校教務管理提供切實可行的提高教學質量、優化教學資源、規范教學管理的依據,為高等學校在激烈的競爭中掌握主動,在未來的發展中提供更廣闊的空間,發揮重要的作用,為高等學校的跨越式發展起到一個科學導向作用。

(責編:若 佳)

主站蜘蛛池模板: 国产主播福利在线观看| 免费中文字幕在在线不卡| 亚欧美国产综合| 91九色国产在线| 无码视频国产精品一区二区| 一级福利视频| 亚洲第一区在线| 色婷婷在线影院| 亚洲精品无码人妻无码| 美女视频黄又黄又免费高清| 亚洲天堂视频在线观看免费| 国产亚洲精品无码专| 男女性午夜福利网站| 国产免费观看av大片的网站| 国内丰满少妇猛烈精品播| 久久影院一区二区h| 国产系列在线| 欧美一级高清免费a| 亚洲精品自拍区在线观看| 2021国产v亚洲v天堂无码| 亚洲成人精品| 久久精品女人天堂aaa| 国产 日韩 欧美 第二页| 日韩在线视频网| m男亚洲一区中文字幕| 国产91无毒不卡在线观看| 亚洲欧洲美色一区二区三区| 在线亚洲精品福利网址导航| 日本国产精品一区久久久| 久青草免费在线视频| 亚洲aⅴ天堂| 白丝美女办公室高潮喷水视频| 91精品aⅴ无码中文字字幕蜜桃| av无码一区二区三区在线| 91精品福利自产拍在线观看| 五月婷婷丁香综合| 久久久久久久久18禁秘| 2020久久国产综合精品swag| 亚洲第一综合天堂另类专| 97视频精品全国在线观看| 免费看av在线网站网址| 91视频免费观看网站| 中文字幕一区二区人妻电影| 国产欧美中文字幕| 香蕉eeww99国产在线观看| 中文字幕av一区二区三区欲色| 真实国产精品vr专区| 国产又爽又黄无遮挡免费观看| 国产精品免费电影| 无遮挡国产高潮视频免费观看| 国产亚洲精品资源在线26u| 国产人碰人摸人爱免费视频| 最新日本中文字幕| 国产aaaaa一级毛片| 国产免费福利网站| 久久精品娱乐亚洲领先| 国产91精品调教在线播放| www.91在线播放| 日本精品一在线观看视频| 国产网站一区二区三区| 无码AV高清毛片中国一级毛片| 热思思久久免费视频| 高清国产在线| 色综合日本| 一边摸一边做爽的视频17国产 | a亚洲视频| 日韩大乳视频中文字幕| 中文字幕无线码一区| 国产又大又粗又猛又爽的视频| 亚洲侵犯无码网址在线观看| 色亚洲成人| 999在线免费视频| av在线5g无码天天| 亚洲日韩国产精品综合在线观看 | 日韩精品视频久久| 久久精品视频亚洲| 国产精品无码一区二区桃花视频| 久久国产拍爱| 亚欧成人无码AV在线播放| av在线手机播放| 国产v精品成人免费视频71pao| 国产欧美综合在线观看第七页|