文/昆明醫(yī)科大學(xué) 吳娜 王媛(通訊作者)
高校管理是對學(xué)校教育、教學(xué)、科研、后勤和師生員工等各項工作進行計劃、組織、協(xié)調(diào)和控制的活動。通過管理,把各項工作及其組成要素結(jié)合起來,發(fā)揮整體功能,以實現(xiàn)其對學(xué)生的培養(yǎng)目標(biāo)和各項工作目標(biāo)。高校管理決策是高校管理的基礎(chǔ)和行為指南,決策的合理性、科學(xué)性對高校管理工作是至關(guān)重要的。
高校管理決策支持的宗旨是輔助高校管理者作出合理、科學(xué)的決策,而非代替管理者作決策。高校管理科學(xué)化就是高校管理層在制定決策和執(zhí)行決策的過程中,運用科學(xué)的管理理論和大量的基礎(chǔ)數(shù)據(jù),做出可行的、合理的決策。
高校管理決策支持是輔助決策者通過數(shù)據(jù)、模型和知識,以人機交互方式進行半結(jié)構(gòu)化或非結(jié)構(gòu)化決策的應(yīng)用。它為決策者提供分析問題、建立模型、模擬決策過程和方案的環(huán)境,調(diào)用各種信息資源和分析工具,輔助解決各類決策問題,幫助決策者提高決策水平和質(zhì)量。
隨著數(shù)據(jù)倉庫(Data Warehouse,DW)、聯(lián)機分析處理(On-Line Analysis Processing,OLAP)和數(shù)據(jù)挖掘(Data Mining,DM)新技術(shù)的出現(xiàn),DW+OLAP+DM逐漸形成決策支持的新概念,其特點是從數(shù)據(jù)中獲取輔助決策信息和知識,實現(xiàn)更有效的輔助決策。
信息性是檔案本質(zhì)屬性中一項重要屬性,檔案具有“信息價值”。數(shù)據(jù)是信息世界的基礎(chǔ)性資源,從數(shù)據(jù)層面來挖掘檔案的價值,我們會發(fā)現(xiàn)檔案的“數(shù)據(jù)價值”。檔案的“數(shù)據(jù)價值”為檔案工作創(chuàng)新實踐提供了指引,檔案信息化的最終目的是挖掘檔案的數(shù)據(jù)價值。
高校檔案記載著豐富的教學(xué)、科研和管理信息,是高校歷史真實、全面的反映,是規(guī)范管理的基礎(chǔ),是積累和傳播知識、經(jīng)驗等的重要載體,是文化建設(shè)的重要素材,是寶貴的歷史記憶。從時效性來看,檔案數(shù)據(jù)都屬于靜態(tài)數(shù)據(jù),有定性和定量兩個特點。定性數(shù)據(jù)表示數(shù)據(jù)對象的抽象特征,如取得圓滿成功、得到了進一步發(fā)展等。定量數(shù)據(jù)反映數(shù)據(jù)對象的具體數(shù)量特征,如在校生數(shù)、招生數(shù)、職工數(shù)、發(fā)文數(shù)等。通過高校檔案數(shù)據(jù)挖掘,可以為高校決策提供科學(xué)的依據(jù),加強高校管理決策的合理性和科學(xué)性。
提高決策的科學(xué)化、民主化水平,是實踐科學(xué)發(fā)展觀的先決條件。國家檔案局多次提出要加強檔案信息資源體系建設(shè),將“檔案庫”變成“思想庫”,努力成為服務(wù)領(lǐng)導(dǎo)決策的重要參謀和助手。高等學(xué)校肩負(fù)著人才培養(yǎng)、科學(xué)研究、社會服務(wù)、文化傳承創(chuàng)新、國際交流合作的重要使命。要讓高校檔案成為高校管理的思想庫和資源庫,更好地實現(xiàn)高校管理決策支持。
如何將“檔案庫”變成“思想庫”,筆者認(rèn)為可以通過檔案數(shù)據(jù)挖掘來實現(xiàn)。檔案數(shù)據(jù)挖掘是從大量的、模糊的、隨機的檔案數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,可通過以下流程來實現(xiàn)。
(一)業(yè)務(wù)理解。本階段的主要任務(wù)是把高校管理的目標(biāo)需求轉(zhuǎn)化為檔案數(shù)據(jù)問題的定義和實現(xiàn)這些目標(biāo)的初步計劃,并確定對檔案數(shù)據(jù)挖掘結(jié)果進行評價的標(biāo)準(zhǔn)。1.確定目標(biāo)。數(shù)據(jù)挖掘分析人員從高校管理決策支持角度全面理解用戶的問題,發(fā)現(xiàn)其真實需求,清晰明確地定義用戶的目標(biāo)和成功的標(biāo)準(zhǔn)。2.形勢評估。詳細(xì)了解用戶所具有的檔案資源、需求、假定和限制等因素,為下一步確定數(shù)據(jù)挖掘目標(biāo)和制定項目實施計劃做準(zhǔn)備。3.確定數(shù)據(jù)挖掘目標(biāo)并制定數(shù)據(jù)挖掘成功標(biāo)準(zhǔn)。例如,一個業(yè)務(wù)目標(biāo)是“合理設(shè)置各專業(yè)招生人數(shù)”,其相應(yīng)的數(shù)據(jù)挖掘目標(biāo)是“對過去五年的各專業(yè)招生人數(shù)和就業(yè)率進行分析,預(yù)測招生人數(shù)”。4.制定實施計劃。制定完成數(shù)據(jù)挖掘任務(wù)的項目計劃,包括項目執(zhí)行的階段,每階段時間,所需的資源、工具等。
(二)數(shù)據(jù)理解。本階段的主要任務(wù)是完成對檔案數(shù)據(jù)資源的認(rèn)識和清理,是數(shù)據(jù)處理的核心。主要包括下面幾個方面。1.數(shù)據(jù)的初步收集。數(shù)據(jù)初步收集的內(nèi)容包括數(shù)據(jù)源、存儲方式、表數(shù)、記錄數(shù)、字段數(shù)、使用限制等多方面。2.數(shù)據(jù)描述。從總體上描述所獲得數(shù)據(jù)的屬性,包括數(shù)據(jù)格式、數(shù)據(jù)質(zhì)量、數(shù)據(jù)出處、收集時間頻度等多方面,并檢查數(shù)據(jù)是否能夠滿足相關(guān)要求。3.數(shù)據(jù)的探索性分析。包括關(guān)鍵屬性分布、屬性之間的關(guān)系、數(shù)據(jù)簡單的統(tǒng)計結(jié)果、重要子集的屬性和簡單的統(tǒng)計分析等,這些分析可能直接達(dá)到了某些數(shù)據(jù)挖掘目標(biāo),也可能豐富或細(xì)化數(shù)據(jù)描述和質(zhì)量報告,或者為將來的數(shù)據(jù)轉(zhuǎn)換和其他數(shù)據(jù)處理工作做準(zhǔn)備。4.數(shù)據(jù)質(zhì)量檢驗。檢驗數(shù)據(jù)是否滿足數(shù)據(jù)挖掘的要求,如數(shù)據(jù)是否完整;是否具有缺失性和缺失屬性。
(三)數(shù)據(jù)準(zhǔn)備。此步驟同樣是數(shù)據(jù)處理的核心,是建立模型之前的最后一步,其任務(wù)是將原始檔案數(shù)據(jù)轉(zhuǎn)化為適合數(shù)據(jù)挖掘工具處理的目標(biāo)數(shù)據(jù),主要包括下列步驟:1.選擇數(shù)據(jù)。制定數(shù)據(jù)進入、剔除的標(biāo)準(zhǔn),決定分析所要用到的數(shù)據(jù)。2.數(shù)據(jù)清洗。保證數(shù)據(jù)值的準(zhǔn)確性和一致性,解決數(shù)據(jù)缺失問題,將數(shù)據(jù)質(zhì)量提高到能滿足分析精度的要求。3.數(shù)據(jù)構(gòu)建。通過一個或幾個已有屬性構(gòu)建新的屬性數(shù)據(jù)。4.數(shù)據(jù)整合。將來自不同表或記錄的數(shù)據(jù)合并起來以產(chǎn)生新的紀(jì)錄或?qū)傩灾担婕皩_突和不一致的數(shù)據(jù)進行一致化。5.數(shù)據(jù)格式化。對數(shù)據(jù)進行語法上的修改,以滿足建模的需求。
(四)建立模型。選擇和應(yīng)用多種不同的數(shù)據(jù)挖掘技術(shù),調(diào)整它們的參數(shù)使其達(dá)到最優(yōu)值。同一個問題,會有很多種可以使用的數(shù)據(jù)挖掘技術(shù),但每一種挖掘技術(shù)對數(shù)據(jù)有不同的限制及要求,就需要回到數(shù)據(jù)準(zhǔn)備階段重新進行數(shù)據(jù)的選擇、清洗、轉(zhuǎn)換等活動。該階段主要包括下列步驟:1.選擇建模技術(shù)。了解相應(yīng)的建模技術(shù)的特點及該技術(shù)對數(shù)據(jù)的假定要求。2.生成檢驗設(shè)計。分析如何對模型的效果進行檢驗。3.建立模型。設(shè)定模型參數(shù),在備好的數(shù)據(jù)集上建立模型,記錄和描述構(gòu)建的模型。4.評估模型。包括根據(jù)數(shù)據(jù)挖掘的成功標(biāo)準(zhǔn)評價模型的使用和模型參數(shù)的調(diào)整。
(五)模型評估。由業(yè)務(wù)人員和領(lǐng)域?qū)<覐臉I(yè)務(wù)角度全面評價所得到的模型,確定模型是否達(dá)到業(yè)務(wù)目標(biāo),最終作出是否應(yīng)用數(shù)據(jù)挖掘結(jié)果的決策,主要包括下列步驟:1.評估結(jié)果。評估產(chǎn)生的數(shù)據(jù)挖掘模型滿足業(yè)務(wù)目標(biāo)的程度,篩選出被認(rèn)可的數(shù)據(jù)挖掘模型。2.數(shù)據(jù)挖掘過程回顧。查找數(shù)據(jù)挖掘過程中是否存在疏忽和遺漏之處。3.確定下一步。列出所有可能的行動方案,根據(jù)評估結(jié)果和數(shù)據(jù)挖掘過程回顧,確定項目下一步如何進行。
(六)發(fā)布。發(fā)布是運用數(shù)據(jù)挖掘結(jié)果解決現(xiàn)實業(yè)務(wù)問題,實現(xiàn)數(shù)據(jù)挖掘的價值。主要包括計劃實施、計劃監(jiān)測和維護、生成最終報告、項目回顧。
高校檔案記載著豐富的教學(xué)、科研和管理信息,本文從高校檔案的“數(shù)據(jù)價值”出發(fā),探討如何把數(shù)據(jù)挖掘技術(shù)應(yīng)用于檔案數(shù)據(jù)價值發(fā)現(xiàn),最終為高校管理提供決策支持。