任鎖平
(陜西職業技術學院 教務處,陜西 西安710100)
WEB挖掘在課程開發與教學資源管理平臺中的應用研究
任鎖平
(陜西職業技術學院 教務處,陜西 西安710100)
隨著計算機網絡技術的不斷發展和進步,數據挖掘在各行業得到了大力的應用。基于課程開發與教學資源管理平臺在后期的數據處理方面存在的不足,將WEB挖掘技術應用于課程開發與教學資源管理平臺,提出了系統設計的需求及WEB使用挖掘在平臺中的應用,通過案例分析,提高了平臺的使用效率。
WEB挖掘;課程開發與教學資源管理平臺;設計;WEB使用挖掘
隨著互聯網信息技術迅猛發展,網絡已經深入到我們的學習生活中,并產生了深刻影響。據中國互聯網絡信息中心發布的第35次《中國互聯網絡發展統計報告(2015年1月)》顯示截至 2014年 12月,中國網民規模達6.49億,互聯網普及率為 47.9﹪[1]。由此可見互聯網的發展規模之大。而作為高等職業院校,課程開發與教學資源管理平臺的建設成為互聯網快速發展時代學校資源共享與交流的知識共享系統,不僅僅是資源的共享,同時也是網絡時代生成性知識產生的重要平臺,有利于改變傳統的教學方式,提高教育教學質量。
1.1 WEB挖掘概述
Web挖掘是在數據挖掘的概念上產生的,是數據挖掘技術在Web上的應用,利用數據挖掘技術從與WWW相關的資源和行為中抽取感興趣的、有用的模式和隱含的、有潛在應用價值的信息,涉及Web技術、數據挖掘、計算機語言學、人工智能、統計學、信息學等多個領域,是一項綜合技術[2]。WEB挖掘技術通常可以劃分為建立在統計模型基礎上,主要包括有決策樹、分類、聚類、關聯規則等;另外一種則是人工智能模型,主要包括神經網絡、自然法則計算方法等。
1.2 WEB挖掘的分類
一般情況下,WEB挖掘技術可分為3類,即WEB內容挖掘、WEB結構挖掘、WEB使用挖掘3類[3]。其中內容挖掘又可分為文本和多媒體挖掘兩類,前者可以對文檔的內容、關聯性、趨勢進行挖掘分析,后者是指對圖形圖像音視頻等文件進行挖掘提取;結構包括有網站目錄結構、超鏈接等結構類型,可以使用HITS算法、PageRank算法進行WEB結構挖掘;使用挖掘主要是通過WEB日志記錄進行數據挖掘分析,主要挖掘瀏覽者在訪問站點的過程或行為中所產生的數據。具體如圖1所示。

圖1 WEB挖掘的分類Fig.1 The classification of WEB mining
2.1 總體設計
在教育信息化發展的引領下,計算機網絡資源已經成為教育教學過程中必不可少的學習資源,整合優質的學習資源顯得尤為重要。該平臺能夠滿足教師教學需求,為高職教育提供優質教學資源與服務,集資源設計、建設、開發、共享等功能為一體的,能夠為教師提供各種教學資源來促進教學手段和方法的改革,提升教學質量;為學習者提供豐富的學習資源,提高學習效率。
該平臺功能設計由3部分構成,分別為精品課程模塊、網絡課程模塊、資源平臺模塊等,每一部分均有自己獨立的功能,同時三部分之間也相互聯系,網絡課程和精品課程中的資源均可以共享在資源平臺中。平臺有門戶頁面、教師登錄頁面、管理員頁面,每個頁面之間相互獨立,所有的課程及資源均可在門戶頁面登錄學習和使用。教師登錄頁面具備了整個平臺的功能操作,可進行課程和資源的更新制作,進行課程和資源的設計與維護。管理員通過管理頁面可以對系統進行整體的維護和設置。
2.2 平臺開發模式
平臺采用分布式架構設計,采用B/S(瀏覽器/服務器模式)架構,基于Web技術開發,管理員和用戶不必另外安裝客戶端軟件,僅使用瀏覽器就可以進行使用和管理平臺相關操作。平臺可分布式部署:將服務器進行分離部署,將Web Server和Database Server分布部署;同時平臺可根據用戶量的增大而擴充服務器數量,具有出色的系統穩定性的可擴展性,支持服務器集群。
平臺采用Windows Server2008系統,Sql Server 2008 R2數據庫,使用Java進行開發。基于安全策略的用戶組和權限管理確保了平臺與服務器的安全,采用模塊化設計,并采用基于Load_balance的Web計算。
2.3 數據庫設計
課程開發與教學資源管理平臺設計中,系統的主要對象是教師、學生、課程和資源等。分別對應著不同的屬性,例如教師的屬性包括有姓名、性別、職稱、所屬院系等。學生的屬性包括有姓名、學號、年級、班級、專業等。課程的屬性包括課程編號、所屬專業、授課教師等,在設計中應根據具體的對應關系確定合理的數據庫表,應將所有的屬性設計在數據庫表中。下面以教師表和課程表的設計來描述數據庫的具體實現。

表1 教師表Tab.1 Teacher table
2.4 數據倉庫設計
采用SQL Server2008建立數據倉庫,根據決策分析的需求與預測目標,探尋資源和課程實際需求,為學習者提供更多的感興趣的學習資源和課程,為教育管理者和決策者提供決策依據。根據平臺使用情況整理數據信息,經過數據清洗和整理后,本次數據倉庫設計主要是分析統計數據倉庫,建立以資源、課程和學習者等3個主題。其中資源主題主要描述資源的類型、大小、學科類型等信息,課程主題主要描述課程類型、課程所屬學科、課程點擊量等信息,學習者主題主要描述不同學習者的基本信息、學習時長、學習時段、使用資源類型等基本信息。3個主題含有共同的字段作為主碼的一部分,方便將各個主題之間進行聯系。隨著信息量的逐步增多,相應主題下的表及其關聯性也不斷擴充,數據倉庫中信息也隨之越來越豐富,最終涉及整個平臺[4]。

表2 課程表Tab.2 The curriculum
3.1 課程與資源開發
本系統實現了教師一站式開發和發布課程開發模式,教師只需通過登錄后臺,即可建立精品課程或網絡課程,同時上傳學習資源。教師根據各個專業或各個課程分類的不同特點,選擇具有特定屬性的課程模板,也可自定義課程模板中的屬性實現制作定制的課程;同時實現課程和資源標簽屬性設置,便于平臺內部進行搜索和歸類。課程生成符合SCORM標準,同時支持將課程導出。資源提供多種格式進行上傳,學習者進行資源下載同時也可進行資源評價,為其他學習者提供參考。課程開發與教學資源管理平臺中課程與資源發布界面如圖2所示。
3.2 WEB使用記錄挖掘
WEB挖掘一般而言需要對數據源的規范和要求進行一定的預處理,達到能夠挖掘分析的目的,高質量的數據預處理保證了數據挖掘的效果[5]。 WEB日志是客戶端使用瀏覽器訪問服務器時留下來的記錄信息和痕跡,它提供了WEB挖掘的重要數據源,日志挖掘的主要數據對象就是WEB日志數據記錄。
學習者或教師登陸平臺進行訪問時,平臺自動記錄了訪問者的點擊行為,并按每日記錄保存在WEB日志文件中,由于該平臺采用Windows Server服務器,因此其使用IIS進行網絡環境搭建, 其日志保存目錄為﹪SystemDrive﹪inetpublogsLogFiles,可自由設置,通過IIS進行網站日志文件保存選項進行保存目錄及保存時將和方式等進行設置,該平臺采用按日記錄,方便后期進行WEB挖掘分析。

圖2 課程與資源發布界面Fig.2 The curriculum and resources released interface
3.2.1 課程開發與教學資源管理平臺日志文件挖掘
WEB日志是以txt格式保存的,WEB挖掘的方法有很多,主要使用挖掘工具進行挖掘分析,常用的工具主要有AWStats、Webalizer、Analog、web log explorer、web log expert等。
文章使用Web Log Explorer進行分析,Web Log Explorer具有的功能[6]包括有:1)能夠統計從FTP下載到本地的日志文件,支持多種格式;2)文件類型組別的統計及分類;3)允許用戶自定義分類,如:CSS、JS、images、pages、downloads等;4)常規的日志屬性統計;5)能夠統計路徑分類,文件夾分類,所有文件類型,所有錯誤響應碼;6)訪問者報告:能夠統計出主機分類、訪問分類和國家分類等;7)引用報告:能夠統計出來路分類、關鍵詞分類、搜索引擎分類等;8)用戶代理報告:能統計所有類型,包括蜘蛛分類,瀏覽器分類,操作系統分類等,并且有很多查看方式,如日期,頁面等;9)日期屬性:適合查看網站總體的一個情況,也可以按年、月、日、星期、小時查看。
3.2.2 結果分析
文章采用Web Log Explorer分析了平臺WEB日志中的2015年2月22日——2015年2月28日期間的日志記錄進行了簡單分析。主要分析了網頁的點擊量,結果如圖3所示。

圖3 平臺點擊量分析Fig.3 Platform for traffic analysis
通過上圖可以看出在2015年2月22日——2015年2月28日期間平臺的點擊量差異比較大,每種顏色代表一天,從左至右代表22日—28日,其中27日點擊量約為920次,為此時段內最多點擊量,23日、24日、25日點擊量較低。
隨著互聯網技術的迅猛發展,結合WEB挖掘對課程開發與教學資源管理平臺進行數據挖掘分析,不僅可以幫助教師對課程和資源的使用情況掌握和了解,同時也有利于在后期對資源進行更新和設計時作出更加符合學習者要求的資源和課程設計,促進學習效果的提升,提升教育教學質量。
[1]中國互聯網絡信息中心.中國互聯網絡發展統計報告[EB/OL].[2015-02-23]http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/201502/P020150203551802054676.pdf.
[2]WEB挖掘.百度百科[EB/OL].[2015-02-26]http://baike.baidu.com/view/1133748.htm.
[3]胡秀.基于WEB的數據挖掘技術研究[J].軟件導刊,2015(1): 149-150.HU Xiu.data mining techniques based on WEB[J].Software Guide,2015(1):149-150.
[4]張青.教學管理數據倉庫的設計與應用[J].數字技術與應用,2012(1):111-112.ZHANG Qing.Design and Application of Teaching Management Data Warehouse[J].Digital Technology and Application,2012(1):111-112.
[5]盧明泰.WEB挖掘及其在社交網絡中的應用研究[D].西安:電子科技大學,2012.
[6]EL-數字化教育.Web Log Explorer3.85.056中文版[EB/OL].[2015-02-29]http://blog.sina.com.cn/s/blog_706ef0120102vpwd.html.
Research-based teaching resources in a shared platform WEB mining
REN Suo-ping
(Office of Academic Affairs,Shaanxi Vocational and Technical College,Xi’an 710100,China)
With the continuous development of computer network technology and progress,data mining has been greatly used in various fields.Based on the curriculum development and teaching resource management platform in the aspect of data processing in the late of WEB mining technology was applied to curriculum development and teaching resources management platform,puts forward the demand of the system design and WEB usage mining on the platform,the application of through case analysis,improve the efficiency of the use of the platform.
WEB mining;Curriculum development and teaching resource management platform;design;WEB use mining
TN99
:A
:1674-6236(2015)18-0056-03
2014-02-18稿件編號:201402080
任鎖平(1986—),男,陜西商洛人,碩士,助教。研究方向:教育信息技術、教育信息化。