薛泉祥


[摘 要]信息管理與信息系統專業是信息時代的產物,迄今經歷了技術型、工程型和復合型三種類型人才培養的發展之路,其專業設置也發生了一系列變化。本文結合社會發展形勢提出了當下信息管理與信息系統專業人才的知識結構,并以某所高校信管專業學生成績數據為基礎,通過數據挖掘尋找關聯規則,為進一步做好信管專業課程設置提供決策支持。
[關鍵詞]數據挖掘;信息管理與信息系統;課程設置;決策支持
[中圖分類號]G643 [文獻標識碼] A [文章編號] 1009 — 2234(2015)12 — 0153 — 03
信息管理與信息管理專業是信息時代的產物。它培養具備扎實的現代管理學基礎知識、計算機科學技術知識、動手能力強、適應面寬的信息管理人才。信息管理與信息系統學科是由管理學基礎理論與計算機科學技術相結合的交叉學科,具有基礎科學與應用科學的雙重屬性,由于數學定量方法和信息技術的融合,它又體現了應用學科的某些特征〔1〕。學科特征的復雜性決定了該學科課程設置的復雜性。本研究根據某高校信息管理與信息系統專業學生的成績數據通過數據挖掘的方法,從中尋找規律,為高校更為合理地設置信管專業的課程提供決策依據。
一.信息管理與信息系統專業的人才培養定位及課程設置變化
信息管理與信息系統專業人才的培養經歷了技術型、工程型和復合型三種類型人才培養的發展之路〔2〕。不同類型人才的培養過程需要相應的課程設置,“技術型”人才的培養主要源于計算機應用等專業,課程主要以計算機應用類課程為主,重點強調程序設計的能力。此類畢業生在工作中往往表現出較強的程序設計能力。
工程型人才培養課程主要以經濟管理、工程數學、計算機、系統工程四類課程為核心,以計算機能力培養為重點。與前兩類人才相比,復合型人才更具有競爭力,因為他們具有信息分析能力與企業管理創新的知識,是具有駕馭信息資源知識與能力的新型管理人才。這類復合型人才的核心競爭力主要分為兩類:信息系統開發的能力和信息分析的能力。
二.數據挖掘及數據挖掘工具簡介
數據挖掘(Data Mining)簡稱DM,又稱為數據庫中知識發現,它是一個從大量數據中抽取挖掘出未知的、有價值的模式或規律等知識的復雜過程〔3〕。具體的數據挖掘方法有關聯分析、聚類分析、分類和預測等。本文選取了Clementine12.0對數據進行挖掘建模分析。
三.利用Clementine軟件進行數據挖掘
1.數據收集
本文選舉一所以工科為主、經管文理農等學科為輔的教學型大學通過學校的教務部門的學生成績系統,我們可完整獲取該高校2004級信息管理與信息系統專業學生的成績信息。
2.數據預處理
數據挖掘過程中數據預處理包括三個步驟:數據集成、數據清理、數據轉換〔4〕。在本研究的數據預處理階段,我們主要通過對學生的成績數據庫進行信息抽取、轉換和加載,形成適合于本課題研究需要的學生成績分析基本數據庫;按照Clementine軟件對數據的要求,數據源中的連續值屬性如考試成績需進行離散化處理。在數據源中,我們令成績在90分以上的為“A”,令成績在80-89之間的為“B”,在70-79之間的為“C”,60-69之間的為“D”,小于60的為“E”。對于“優”“良”“中”等非分數成績也按照同樣的方法進行離散化,形成目標數據表。
為便于開展研究和分析,我們信管專業人才知識結構將目標成績數據分成:公共基礎知識、經濟類知識、管理決策類知識、信息技術類知識、信息系統開發類知識、建模知識六大類。并運用Clementine建模,進行數據挖掘,尋找各類六類課程之間的關聯關系。
3.數據挖掘的主要步驟及結果分析
(1)用Clementine的K-means模型對數據表S中各類課程成績數據進行聚類分析處理。
K-means節點提供了一種聚類分析方法,與Clementine中的其他學習方法不同,K-means模型不使用目標字段。K-means不是去預測某一結果,而是從輸入字段中發現特征,記錄被分成群組,同一群組中的記錄彼此相似,而不同群組的記錄大不相同,對于大型數據集,K-means模型通常是最快的分群方法〔5〕。運用Clementine的K-means聚類建模節點構建數據流,設置聚類結果為3簇,導入數據執行數據流,形成聚類結果。以管理類課程為例,形成的聚類結果如表1:
通過表1所示結果的分析,我們可以較為直觀的看出:第二簇的17個記錄中,成績普遍偏低,大多在C與D之間徘徊。而第一簇的45個記錄中結果明顯好于Cluster2大部分在B;第三簇共有6個記錄,6個記錄中除會計信息系統分析與設計為B,其余均為A。據此我們可以令第三簇為A,即第三簇的6名學生的管理類課程的整體學習水平為優秀。以此類推,第一簇的45名學生管理類課程的整體學習水平中等,我們令其為B,第三簇的17名學生管理類可課程的整體學習狀況較差,我們用C表示。
利用輸出節點輸出聚類結果,放入數據表S備用。按照同樣的方法,我們分別對其余五類課程成績進行了聚類。
(2)用Clementine平臺的Apriori規則挖掘模型分別對數據表S中的各類別的數據進行數據挖掘,尋找關聯規則。
利用數據挖掘平臺Clementine,構建數據挖掘流程,針對數據表S的具體挖掘過程以及挖掘出的關聯規則如下:
1)對六類課程組進行關聯規則挖掘,將六個字段全部設為既是條件屬性又是決策屬性,設置最小規則支持度為6%,最小置信度為80%。執行數據流得出關聯規則,形成關聯規則,其中較為具有意義的規則如表2:
②構建數據挖掘數據流,把公共基礎類課程作為條件屬性,其他課程聚類及畢業設計成績決策屬性進行挖掘,設置最小規則支持度為5%,最小置信度為40%,執行數據庫流得出關聯規則,形成關聯規則,其中有意義的如表3:
3)以其他各課程聚類字段為條件屬性,畢業設計成績字段作為被決策屬性,設置最小規則支持度為10%,最小置信度為80%,執行數據流,得出關聯規則,其中有意義的規則如表4:
4)以各課程字段作為條件屬性,以畢業設計成績為決策屬性,設置最小規則支持度為5%,最小置信度為50%,執行數據流,得出關聯規則,其中有意義的共有10條。
(3)學生成績挖掘結果分析
1)信息管理與信息系統專業各類課程之間存在一定的依存關系,尤其體現在信息技術類課程與管理決策類課程之間。規則:公共基礎知識聚類=A?信息技術類聚類=A關聯規則(置信度82.5%,支持度85.824%)表明:信息技術類課程學習狀況良好的學生,管理決策類知識的學習狀況學習良好。這充分體現了學校信息管理與信息系統專業對學生的培養注重工程應用背景,側重于工程應用型專門人才的培養定位。
2)規則:公共基礎知識聚類=A?信息技術類聚類=A(置信度66.667%,支持度30.882%)、公共基礎知識聚類=A?信息技術類聚類=A(置信度61.905%,支持度30.882%)、公共基礎知識聚類=C?畢業設計=C(置信度43.75%,支持度23.529%)、公共基礎知識聚類=A?信息開發類聚類=A(置信度,42.857%,支持度30.882%),分別表明公共基礎類知識對于數學建模類、基礎信息技術類、畢業設計、信息系統開發類課程學習的重要作用。
3)表4所示規則重點反映了信息技術類、管理決策類等六類課程對于學生畢業設計的影響。表明,信息技術知識類、管理決策類和信息開發類課程對于信息管理與信息系統專業的學生的更好地從事實踐性開發工作作用明顯。其中信息技術類知識的影響尤為明顯。
4)表5所示規則反映了信息管理與信息系統所開設的各門課程對于畢業設計的關系,即該專業的所有課程,哪些對于學生較好地掌握信息管理與信息系統專業的知識,并進行綜合運用是有重要關聯意義的。通過這一關聯規則的挖掘,我們可以找到該專業學習過程中的關鍵學科,可以指導學生的學習,也可以為學校教學過程,優化課程設置提供參考。該專業的關鍵課程為:《企業資源計劃》、《運籌學》、《會計系統分析與設計課程設計》、《管理信息系統課程設計》等10門課程。其中公共基礎類1門,經濟類1門,數學建模類1門,管理決策類2門,基礎信息技術類4門,信息系統開發類1門,實踐性環節課程2門。
四.基于上面的論述,結合本文的研究,我們認為信息管理和信息系統專業的課程設置應注意四個方面的問題:
(1)把握好與計算機科學與應用學科的關系
信息管理與信息系統專業課程設置中,信息技術類課程比重較大,且該類課程的學習對于管理決策類課程的決定作用較為明顯。計算機應用是信息管理與信息系統的基本載體,信息技術是它的重要內容,軟件工程確為信息系統中項目開發的指導思想,但信息管理與信息系統專業更強調信息的組織與管理。在該專業的課程設置中,有關現代信息技術的課程應當占有相當大的比重,但是其重點在于“用”技術,而不是研究這些技術的本身,因此在重點和內容的取舍上有著明顯的區別。應該強調的是,該專業畢業的學生應能承擔各級各類信息管理工作,從事各種類型的信息系統建設和管理工作,其工作重點不是編程。因而在培養學生時,不宜過分強調編程能力,而應加強信息組織、信息管理、系統分析、系統設計的訓練。
(2)把握好與管理學科的關系
該專業也不同于管理科學,它與其他管理學科的區別在于:重點是信息管理,并且大量使用信息技術。在信息社會,信息已成為企業的生命線,信息資源是企業的重要財富,信息管理不容忽視。基于本研究,我們認為,在課程設置中,應適當加重信息系統開發類知識的比重。
(3)加強公共基礎類課程教學內容改革
表5所示關聯規則充分說明了公共基礎知識的基礎性地位。此次實證分析中,公共基礎類課程主要是數學類基礎課程。數學是基礎,不僅是信息處理的工具,也是提高思維能力的重要訓練手段。現代信息處理技術越來越多地應用到諸多數學方法。依據本文的研究結果,我們認為應該提高本專業的數學要求;同時,現代數學軟件的使用已經變得越來越重要,可考慮在數學課程中增加相應數學軟件的使用內容。此外,應用數學解決信息處理問題的第一步是建立相應問題的數學模型,不僅應在數學模型課程中向學生傳授數學建模方法,更應該在所有數學課程中融入數學建模思想。
(4)加大實踐環節的比重
在本文的研究對象中僅有兩門實踐類課程:《會計信息系統分析與設計課程設計》、《管理信息系統課程設計》。關聯規則:管理信息系統課程設計B?畢業設計B(置信度66.667%,支持度13.235%)和會計信息系統課程設計=A?畢業設計=B(置信度60%,支持度14.706%),充分說明了實踐性環節對于學生綜合運用專業知識解決實際問題的重要作用。
〔參 考 文 獻〕
〔1〕齊二石.中國管理科學與工程類專業教育教學改革與發展戰略研究〔R〕.高等教育出版社,2002.
〔2〕蔡淑琴,張自剛,張金隆.信息管理與信息系統專業人才培養的研究〔J〕.高等工程教育研究.2001(4):26
〔3〕劉同明等.數據挖掘技術及其應用〔M〕.北京:國防工業出版社.2001:15-27
〔4〕謝邦昌.數據挖掘Clementine應用實務〔M〕.機械工業出版社,2008:14-28
〔5〕武森,程鍇,陳鳳潔.聚類分析在電信客戶細分中的應用〔J〕.技術經濟與管理研究.2008,(1):10
〔責任編輯:侯慶海〕