999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

海量網絡教育資源挖掘研究與實現

2019-11-30 12:05:31鄭志勇
科技資訊 2019年26期
關鍵詞:數據挖掘

鄭志勇

摘? 要:隨著網絡教育信息資源的信息容量急劇增加,簡單依靠商業化搜索引擎已不能滿足個性化教與學的需求,通過使用解析工具Jsoup抓取教育資源網站和搜索引擎的搜索結果保存進Derby數據庫,再利用數據挖掘技術對可用資源的進行頁面價值評價和格式化存儲,必將有效提高網絡教育資源的使用水平。大部分學生觸網,都是進入微博、玩網絡游戲、聊天,網絡在學生群體中的使用更多的只是娛樂工具。

關鍵詞:數據挖掘? Jsoup? 網絡教育資源? 抓取策略

中圖分類號:TP311 ? ?文獻標識碼:A 文章編號:1672-3791(2019)09(b)-0004-02

1? 網絡教育資源建設的現狀和利用分析

隨著中國互聯網網絡結構持續優化,網絡性能顯著提升,網絡基礎設施建設規模不斷擴大,網民低齡化趨勢明顯。但有研究顯示,盡管在校學生上網人數相當多,利用網絡作為學習工具的人數比例還是很少,能很好地使用網絡資源,尤其是豐富的學科資源輔助學習的學生人數更少。在校學生無法利用網絡教育資源的主要原因有下面幾個方面:(1)是因為網上學習資源太雜,難以選擇;(2)是網絡學習資源呈現方式五花八門,有的是主次部分,充斥大量垃圾廣告,更有甚者還有包含暴力、不健康的文字和圖片,引誘學生點擊。(3)是網絡上的材料太難影響興趣;(4)是老師缺乏指引。隨著海量的網絡教育資源建設和快速上升的帶寬、接入終端普及率與極低的在校學生使用網絡教育資源的利用率形成了巨大的反差。通過數據挖掘技術抓取教育資源網站和搜索引擎的搜索結果,再利用數據挖掘技術對可用資源的進行有效分析與格式化,將大大提高在校學生網絡教育資源的利用率。

2? 網絡教育資源挖掘系統的工作原理和主要策略

2.1 網絡教育資源挖掘系統的基本架構

網絡教育資源挖掘系統的基本架構如圖1,主要由包含數據存儲部分、頁面分析部分和終端輸出3個部分。其中數據存儲部分有URL資源庫、本地資源庫、格式庫;頁面分析部分有頁面價值計算系統和頁面結構分析系統;終端輸出部分主要包括終端展示(含手機APP、微網站、微信應用)及學習反饋兩個部分。

2.2 網絡教育資源挖掘系統的數據流程

網絡教育資源挖掘系統的工作機制為教師或家長在明確學習目標的基礎上,使用HTML解析工具Jsoup抓取教育資源網站和搜索引擎的搜索結果,對結果URL進行頁面價值計算,將計算結果滿足條件的URL記錄到URL目標資源庫中。執行頁面內容抓取分析,進行頁面結構化分析,去除無效的頁面(如腳本、鏈超接、商業廣告、導航),將分析結果保存到本地資源庫中。最后,教師或家長可自行設計輸出格式,學生可在手機APP、微網站、微信應用上進行學習。

2.3 網絡教育資源挖掘系統的資源抓取策略

如表1所示。

2.4 網絡教育資源挖掘系統的數據挖掘策略

網絡教育資源挖掘系統頁面價值評價系統,采用百分制計算,頁面分為三等,分別為不合格,合格和優秀;其中0~50分為不合格,50~80為合格,80~100分為優秀。

網絡教育資源挖掘系統頁面價值分數計算公式:

F=A*(W*C/B+(P+M)(2-C)/B)

A:代表網站權重,其中專業教育資源類網站權重為1.2,搜索引擎結果權重為1;

B:代表網站權重最大值,這里是1.2;

C:代表文字部分權重,可根據教學目標調整;

W:代表文字內容,滿分50分(見表2)。

P:代表圖片資源,滿分20分(見表3)。

M:代表多媒體視頻率資源,滿分30分(見表4)。

2.5 網絡教育資源挖掘系統的格式輸出策略

網絡教育資源挖掘系統的格式輸出采用內容管理系統CMS技術,網頁抓取功能將符合條件的頁面內容,過濾后格式化到本地資源庫中,通過事先設計網站、手機APP、手機微站、微信應用等模版,教育內容可直接的發布在手機APP、微網站、微信應用上。

頁面內容過濾策略為:過濾所有腳本、所有外鏈、所有樣式、導航欄,只保留范圍標簽內的內容。

3? 網絡教育資源挖掘系統的實現

3.1 基礎準備

開發平臺操作系統為Windows;開發語言采用Java;數據庫采用JAVA自帶Derby數據庫。

3.2 URL目標資源庫設計

URL目標資源庫用于存儲有價值的教育資源網站頁面URL地址和搜索引擎的搜索結果中有價值的頁面URL。核心字段有:來源類型,分搜索引擎和教育資源兩類,保存頁面的地址,抓取時間,文字數,圖片數,資源URL抓取核心代碼,采用Jsoup的Document類來完成。

3.3 本地資源庫設計

本地資源庫設計與普通的內容管理系統類似,核心是頁面內容表。核心字段主要有教學任務,文章類型文章內容等。

4? 應用案例

本課題研究應用于素質拓展課程古詩詞教學,網絡上有關古詩的網站,百度找到相關結果約86,100,000,面對如此海量的、質量參此不齊的信息資源,僅依托搜索結果是很難達到教學目標的,如要求教師自己建設一個相關教學網站,需要教師有一定的信息技術能力和教學資源的儲備,影響教師使用信息化教學的積極性。通過網絡資源挖掘系統挖掘古詩的原文、譯文、古詩的寫作環境、古詩的內涵、古詩朗讀、古詩視頻等資源存儲到本地資源庫用于教學,能大大提高學生對古詩的感悟能力和古詩鑒賞能力。

5? 結語

網絡教育資源挖掘系統通過對現有海量網絡教育資源挖掘和格式化,一方面簡化或避免了教師重復建設教育資源;另一方面也降低了學生查找和使用網絡教育資源的難度,避免了學生被網絡不良資源的侵害,對實際有效利用海量網絡教育資源是可行的。

參考文獻

[1] 盛雪豐.Android開發一大神器——Jsoup[J].電腦知識與技術,2015,11(8):63-65.

[2] 馮思度,楊健葉,韓煦.基于醫療信息的網絡爬蟲系統的研究與設計[J].現代信息科技,2019(10):23-25.

[3] 胡文瑜,孫志揮,吳英杰.數據挖掘取樣方法研究[J].計算機研究與發展,2011,48(1):45-54.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 国产91久久久久久| 91黄色在线观看| 精品国产aⅴ一区二区三区| 伊人色综合久久天天| 亚洲一区国色天香| 国产激情无码一区二区三区免费| 亚洲欧洲日韩久久狠狠爱 | 国产无码性爱一区二区三区| 天天摸夜夜操| 无码aaa视频| 亚洲天堂首页| 国产精品hd在线播放| 狠狠色综合网| 日韩无码真实干出血视频| 久久人人爽人人爽人人片aV东京热| 国产成人精品男人的天堂下载| 香蕉eeww99国产精选播放| 欧美另类一区| 免费观看无遮挡www的小视频| 91色在线观看| 麻豆精品久久久久久久99蜜桃| 亚洲视频无码| 国产99免费视频| 国产资源免费观看| 国产高清自拍视频| 亚洲第一国产综合| 蜜臀AV在线播放| 天天躁日日躁狠狠躁中文字幕| 国产在线一区视频| 天天色综合4| 国产精品内射视频| 亚洲免费成人网| 色哟哟国产精品| 日本精品视频一区二区 | 成人夜夜嗨| 国产a在视频线精品视频下载| 97se亚洲综合不卡| 精品無碼一區在線觀看 | 亚洲欧美激情小说另类| 成人韩免费网站| 少妇被粗大的猛烈进出免费视频| 久久国产精品波多野结衣| 亚洲美女久久| 成人亚洲天堂| 尤物国产在线| 99国产精品国产| 亚洲天堂免费| 国产美女91视频| 成人日韩精品| 亚洲欧洲日韩国产综合在线二区| 国产又粗又爽视频| 国产精品久久久免费视频| 美女无遮挡免费网站| 成人在线观看一区| 国内精品久久久久鸭| 久久综合一个色综合网| 国产JIZzJIzz视频全部免费| 999福利激情视频| 在线欧美一区| 精品国产成人国产在线| 国内精品久久人妻无码大片高| 91免费在线看| 亚洲一级毛片| 成人福利在线看| 激情综合激情| 人人91人人澡人人妻人人爽| 日韩国产综合精选| 亚洲第一成年网| 亚洲中文精品人人永久免费| 欧美中文字幕一区| 国产成人亚洲欧美激情| 午夜福利无码一区二区| 黄色网址免费在线| 国产视频一区二区在线观看| 亚洲欧美日韩另类在线一| 四虎精品黑人视频| 欧美日本在线观看| 亚洲第一区在线| 国产毛片不卡| av一区二区人妻无码| 欧美成人一级| 亚洲成人动漫在线|