魏 慶
(河南財經政法大學 計算機與信息工程學院,鄭州 450002)
國外,盡管E-learning概念的提出已有十年,但真正“紅火”起來只是近五年的事。據IDC統計,自1998年以來,美國E-learning市場的年增長率是83%。是什么促使E-learning市場在短短幾年內有了如此之快的增長?其實,這是來自時代的壓力。知識經濟時代,恰恰是知識和技能極度短缺的時代,因為它們的半衰期越來越短。員工50%的知識和技能會在3到5年內過期,在IT領域這個半衰期更短。時代的特征決定了人們必須改變觀念,“終生學習”不再是口號。我們的上一輩,也就是我們的父母,他們在中學或大學所學到的技能足以使他們在一生的工作中如魚得水。而現在的一代則沒有這樣的幸運。知識經濟時代的每一個人除了通過不斷學習以獲得新的技能,力求跟上變化,其他別無選擇。
有人將E-learning界定為用因特網技術來實施一系列的學習解決方案,用以傳播知識、提高效率。按照美國培訓和發展協會(ASTD)的定義,E-learning是指由網絡電子技術支撐或主導實施的教學內容或學習體驗,E-learning必須具備以下特征:
1)基于Internet/Intranet,這是E-learning最主要的特征,正是有這樣的技術背景,才極大方便了資料的即時更新、數據的分發和共享、學員之間的即時交流。
2)運用標準的網絡技術,通過計算機把知識傳輸給最終用戶。這里的關鍵在于運用標準的網絡技術,如TCP/IP協議,網頁瀏覽技術等組成的平臺。
3)不局限于信息和技能的傳授,其學習方式、內容及結果早已超越了傳統學習或培訓所涵蓋的外延,E-learning是學習理念的革命。
這里要特別說明的是,E-learning與利用光盤的學習方式不同。用光盤進行單機學習不乏優點,如豐富的視頻效果和動畫,不受傳輸帶寬的影響,但它缺乏網絡特性,無法做到即時更新和共享學習,因此,它不是真正意義上的E-learning。
現在已有的E-learning服務大致可以分為四種:在線公告、在線培訓、在線知識分享和在線指導。在線公告即在第一時間內通過網絡發布重要信息;在線培訓是通過網絡向員工傳播技能的一種有效方式,培訓師可籍此了解培訓效果;在線知識分享和在線指導是培訓雙方在網上開展交流、互動。
相比簡單的費用節省之外還有其他一些好處,這就是E-learning所具有的靈活、快速、便捷的特點,而且特別易于管理。
E-learning可以提供同步或不同步的培訓模式。不同步的溝通技術包括討論、e-mail和共享數據庫等。這些技術能讓身處不同地區,甚至是世界各地的學員們分享豐富的學習資源,以及在課程和作業上進行合作,而無須考慮時間、地點的局限,因而我們經常稱E-learning為“隨時、隨地的學習”。不同步的溝通亦為教員提供了方便。教員不一定要立刻提供幫助,而是可以離線進行。課程的評估、布置作業、安排測驗亦可以如此。
若采用同步的、實時的模式,公司的所有員工可以在規定的時候同時進行交流,卻無需離開辦公室或家。同步的合作是由教員作為主導者,學員們在虛擬的環境中與教員交流,及互相討論。教員通過交互式的在線學習及時、有針對性地指導學員。E-learning軟件可以不斷更新,使企業有持續不斷的最新鮮的培訓內容,給學員及時的資訊。軟件包可以進行調整以適應不同的用戶。因此,用戶可以為自己定制所需的學習素材,掌控完整的學習過程,以達到最好的學習效果。一旦需要更新,立刻所有人都可以得到最新的培訓。
研究表明E-learning可以使人們學習效率提高25%-40%,正是從“要我學”到“我要學”的轉變激發了人們的學習興趣,從而提升了效率。
數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘相近的同義詞有數據融合、數據分析和決策支持等。這個定義包括好幾層含義:數據源必須是真實的、大量的、含噪聲的;發現的是用戶感興趣的知識;發現的知識要可接受、可理解、可運用;并不要求發現放之四海皆準的知識,僅支持特定的發現問題。
何為知識?從廣義上理解,數據、信息也是知識的表現形式,但是人們更把概念、規則、模式、規律和約束等看作知識。人們把數據看作是形成知識的源泉,好像從礦石中采礦或淘金一樣。原始數據可以是結構化的,如關系數據庫中的數據;也可以是半結構化的,如文本、圖形和圖像數據;甚至是分布在網絡上的異構型數據。發現知識的方法可以是數學的,也可以是非數學的;可以是演繹的,也可以是歸納的。發現的知識可以被用于信息管理,查詢優化,決策支持和過程控制等,還可以用于數據自身的維護。因此,數據挖掘是一門交叉學科,它把人們對數據的應用從低層次的簡單查詢,提升到從數據中挖掘知識,提供決策支持。在這種需求牽引下,匯聚了不同領域的研究者,尤其是數據庫技術、人工智能技術、數理統計、可視化技術、并行計算等方面的學者和工程技術人員,投身到數據挖掘這一新興的研究領域,形成新的技術熱點。
數據挖掘在E-learning中的具體應用體現在以下三個方面: E-learning特征的數據挖掘和E-learning教學設計的數據挖掘,E-learning在線分析處理的數據挖掘。
1)E-learning特征的數據挖掘
將數字化內容與學科課程相整合,是達到E-learning目標的具體途徑。E-learning數字化特征使信息的存儲、加工、重放、復制過程變得簡單可靠,標準易于統一,這使數據挖掘用于E-learning成為可能。E-learning多媒化特征是以計算機多媒體技術為依托,使信息媒體設備一體化,信息表征多元化,真實現象慮擬化,建立結構化、動態化、形象化的E-learning教學內容。這此是數據挖掘應用于E-learning的前提。E-learning網絡化特征突破時空限制、實現資源共享、多向互動和多邊合作。
2)E-learning教學模式的數據挖掘
E-learning的教學模式主要是研究型學習模式、案例研習模式、發現式學習模式、資源型學習模式、協作型學習模式和虛擬教學模式。E-learning的資源學習系統要求能夠提供資源答理下具,為教師組織、編輯、管理資源提供幫助,為學生利用資源進行學習提供方便,允許教師根據教學的需要,隨時增減資源,根據不同的教學內容和學習者特征進行教學設計。基于數據挖掘的e-Learning資源型學習系統由教師或學習者擔任目標樣本,并進行系統設置,提取目標的特征信息,根據目標特征自動在網絡上搜集資料。
3)數據挖掘和E-learning在線分析處理
一個經常問的問題是,數據挖掘和E-learning在線分析處理到底有何不同。下面將會解釋,他們是完全不同的工具,基于的技術也大相徑庭。E-learning在線分析處理是決策支持領域的一部分。傳統的查詢和報表工具是告訴你數據庫中都有什么(what happened),E-learning在線分析處理則更進一步告訴你下一步會怎么樣(What next)、和如果我采取這樣的措施又會怎么樣(What if)。用戶首先建立一個假設,然后用E-learning在線分析處理檢索數據庫來驗證這個假設是否正確。
數據挖掘通過預測未來趨勢及行為,做出前攝的、基于知識的決策。數據挖掘的目標是從數據庫中發現隱含的、有意義的知識,主要有以下五類功能。
1)自動預測趨勢和行為
數據挖掘自動在大型數據庫中尋找預測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數據本身得出結論。一個典型的例子是市場預測問題,數據挖掘使用過去有關促銷的數據來尋找未來投資中回報最大的用戶,其它可預測的問題包括預報破產以及認定對指定事件最可能作出反應的群體。
2)關聯分析
數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之間存在某種規律性,就稱為關聯。關聯可分為簡單關聯、時序關聯、因果關聯。關聯分析的目的是找出數據庫中隱藏的關聯網。有時并不知道數據庫中數據的關聯函數,即使知道也是不確定的,因此關聯分析生成的規則帶有可信度。
3)聚類
數據庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強了人們對客觀現實的認識,是概念描述和偏差分析的先決條件。聚類技術主要包括傳統的模式識別方法和數學分類學。80年代初,Mchalski提出了概念聚類技術牞其要點是,在劃分對象時不僅考慮對象之間的距離,還要求劃分出的類具有某種內涵描述,從而避免了傳統技術的某些片面性。
4)概念描述
概念描述就是對某類對象的內涵進行描述,并概括這類對象的有關特征。概念描述分為特征性描述和區別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區別。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區別性描述的方法很多,如決策樹方法、遺傳算法等。
5)偏差檢測
數據庫中的數據常有一些異常記錄,從數據庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規則的特例、觀測結果與模型預測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是,尋找觀測結果與參照值之間有意義的差別。
E-learning帶來信息量的急劇增長,對信息提取提出更高要求,很難再依照傳統方法在海量數據中尋找教育決策的依據。因此有必要借助數據挖掘對E-learning的應用進行挖掘,發現其中隱藏的規律,為信息技術與課程整合提供依據。
[1] 王銳,馬德濤,陳晨. 數據挖掘技術及其應用現狀探析[J].電腦應用技術, 2007,(02):147-149.
[2] 李丹丹. 數據挖掘技術及其發展趨勢[J]. 電腦應用技術,2007,(02):177-179.
[3] 武森,俞曉莉,倪宇,王瑞峰.數據挖掘中的聚類技術在學生成績分析中的應用[J].中國管理信息化,2009,(15):104-108.
[4] 黃科軍,王靜萍. 淺談數據挖掘在電子商務中的應用[J].益陽職業技術學院學報, 2007,(02):163-165.