999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

海量網絡教育資源挖掘研究與實現

2019-11-30 12:05:31鄭志勇
科技資訊 2019年26期
關鍵詞:數據挖掘

鄭志勇

摘? 要:隨著網絡教育信息資源的信息容量急劇增加,簡單依靠商業化搜索引擎已不能滿足個性化教與學的需求,通過使用解析工具Jsoup抓取教育資源網站和搜索引擎的搜索結果保存進Derby數據庫,再利用數據挖掘技術對可用資源的進行頁面價值評價和格式化存儲,必將有效提高網絡教育資源的使用水平。大部分學生觸網,都是進入微博、玩網絡游戲、聊天,網絡在學生群體中的使用更多的只是娛樂工具。

關鍵詞:數據挖掘? Jsoup? 網絡教育資源? 抓取策略

中圖分類號:TP311 ? ?文獻標識碼:A 文章編號:1672-3791(2019)09(b)-0004-02

1? 網絡教育資源建設的現狀和利用分析

隨著中國互聯網網絡結構持續優化,網絡性能顯著提升,網絡基礎設施建設規模不斷擴大,網民低齡化趨勢明顯。但有研究顯示,盡管在校學生上網人數相當多,利用網絡作為學習工具的人數比例還是很少,能很好地使用網絡資源,尤其是豐富的學科資源輔助學習的學生人數更少。在校學生無法利用網絡教育資源的主要原因有下面幾個方面:(1)是因為網上學習資源太雜,難以選擇;(2)是網絡學習資源呈現方式五花八門,有的是主次部分,充斥大量垃圾廣告,更有甚者還有包含暴力、不健康的文字和圖片,引誘學生點擊。(3)是網絡上的材料太難影響興趣;(4)是老師缺乏指引。隨著海量的網絡教育資源建設和快速上升的帶寬、接入終端普及率與極低的在校學生使用網絡教育資源的利用率形成了巨大的反差。通過數據挖掘技術抓取教育資源網站和搜索引擎的搜索結果,再利用數據挖掘技術對可用資源的進行有效分析與格式化,將大大提高在校學生網絡教育資源的利用率。

2? 網絡教育資源挖掘系統的工作原理和主要策略

2.1 網絡教育資源挖掘系統的基本架構

網絡教育資源挖掘系統的基本架構如圖1,主要由包含數據存儲部分、頁面分析部分和終端輸出3個部分。其中數據存儲部分有URL資源庫、本地資源庫、格式庫;頁面分析部分有頁面價值計算系統和頁面結構分析系統;終端輸出部分主要包括終端展示(含手機APP、微網站、微信應用)及學習反饋兩個部分。

2.2 網絡教育資源挖掘系統的數據流程

網絡教育資源挖掘系統的工作機制為教師或家長在明確學習目標的基礎上,使用HTML解析工具Jsoup抓取教育資源網站和搜索引擎的搜索結果,對結果URL進行頁面價值計算,將計算結果滿足條件的URL記錄到URL目標資源庫中。執行頁面內容抓取分析,進行頁面結構化分析,去除無效的頁面(如腳本、鏈超接、商業廣告、導航),將分析結果保存到本地資源庫中。最后,教師或家長可自行設計輸出格式,學生可在手機APP、微網站、微信應用上進行學習。

2.3 網絡教育資源挖掘系統的資源抓取策略

如表1所示。

2.4 網絡教育資源挖掘系統的數據挖掘策略

網絡教育資源挖掘系統頁面價值評價系統,采用百分制計算,頁面分為三等,分別為不合格,合格和優秀;其中0~50分為不合格,50~80為合格,80~100分為優秀。

網絡教育資源挖掘系統頁面價值分數計算公式:

F=A*(W*C/B+(P+M)(2-C)/B)

A:代表網站權重,其中專業教育資源類網站權重為1.2,搜索引擎結果權重為1;

B:代表網站權重最大值,這里是1.2;

C:代表文字部分權重,可根據教學目標調整;

W:代表文字內容,滿分50分(見表2)。

P:代表圖片資源,滿分20分(見表3)。

M:代表多媒體視頻率資源,滿分30分(見表4)。

2.5 網絡教育資源挖掘系統的格式輸出策略

網絡教育資源挖掘系統的格式輸出采用內容管理系統CMS技術,網頁抓取功能將符合條件的頁面內容,過濾后格式化到本地資源庫中,通過事先設計網站、手機APP、手機微站、微信應用等模版,教育內容可直接的發布在手機APP、微網站、微信應用上。

頁面內容過濾策略為:過濾所有腳本、所有外鏈、所有樣式、導航欄,只保留范圍標簽內的內容。

3? 網絡教育資源挖掘系統的實現

3.1 基礎準備

開發平臺操作系統為Windows;開發語言采用Java;數據庫采用JAVA自帶Derby數據庫。

3.2 URL目標資源庫設計

URL目標資源庫用于存儲有價值的教育資源網站頁面URL地址和搜索引擎的搜索結果中有價值的頁面URL。核心字段有:來源類型,分搜索引擎和教育資源兩類,保存頁面的地址,抓取時間,文字數,圖片數,資源URL抓取核心代碼,采用Jsoup的Document類來完成。

3.3 本地資源庫設計

本地資源庫設計與普通的內容管理系統類似,核心是頁面內容表。核心字段主要有教學任務,文章類型文章內容等。

4? 應用案例

本課題研究應用于素質拓展課程古詩詞教學,網絡上有關古詩的網站,百度找到相關結果約86,100,000,面對如此海量的、質量參此不齊的信息資源,僅依托搜索結果是很難達到教學目標的,如要求教師自己建設一個相關教學網站,需要教師有一定的信息技術能力和教學資源的儲備,影響教師使用信息化教學的積極性。通過網絡資源挖掘系統挖掘古詩的原文、譯文、古詩的寫作環境、古詩的內涵、古詩朗讀、古詩視頻等資源存儲到本地資源庫用于教學,能大大提高學生對古詩的感悟能力和古詩鑒賞能力。

5? 結語

網絡教育資源挖掘系統通過對現有海量網絡教育資源挖掘和格式化,一方面簡化或避免了教師重復建設教育資源;另一方面也降低了學生查找和使用網絡教育資源的難度,避免了學生被網絡不良資源的侵害,對實際有效利用海量網絡教育資源是可行的。

參考文獻

[1] 盛雪豐.Android開發一大神器——Jsoup[J].電腦知識與技術,2015,11(8):63-65.

[2] 馮思度,楊健葉,韓煦.基于醫療信息的網絡爬蟲系統的研究與設計[J].現代信息科技,2019(10):23-25.

[3] 胡文瑜,孫志揮,吳英杰.數據挖掘取樣方法研究[J].計算機研究與發展,2011,48(1):45-54.

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 成人另类稀缺在线观看| 高清国产va日韩亚洲免费午夜电影| 91啦中文字幕| 日本精品影院| 国产成人午夜福利免费无码r| 午夜毛片免费观看视频 | 日韩精品毛片人妻AV不卡| 精品伊人久久久大香线蕉欧美| 久久毛片网| 大陆国产精品视频| 久久无码高潮喷水| 日本黄色不卡视频| 男女男免费视频网站国产| 国产欧美日韩综合在线第一| 国产小视频免费| 免费国产不卡午夜福在线观看| 色综合激情网| 小说区 亚洲 自拍 另类| 视频在线观看一区二区| 欧美成人影院亚洲综合图| 婷婷开心中文字幕| 久久频这里精品99香蕉久网址| 四虎永久免费地址| 亚洲AV成人一区国产精品| 日韩欧美中文在线| 国产精鲁鲁网在线视频| 蜜臀AV在线播放| 国产性生交xxxxx免费| 不卡无码h在线观看| 欧美激情视频在线观看一区| 亚洲日韩日本中文在线| 成·人免费午夜无码视频在线观看| 一本大道无码日韩精品影视| 青青青伊人色综合久久| 成人夜夜嗨| www亚洲天堂| 成人午夜在线播放| 伊人激情综合网| 91无码人妻精品一区| 国产精彩视频在线观看| 欧美人人干| 岛国精品一区免费视频在线观看| 成年人福利视频| 91麻豆国产精品91久久久| 中文字幕在线欧美| 亚洲精品无码专区在线观看| 九九这里只有精品视频| 欧美国产菊爆免费观看| 国产成人1024精品下载| 伊人天堂网| 99re热精品视频国产免费| 一本综合久久| 亚洲人成人伊人成综合网无码| 国产不卡在线看| 91原创视频在线| 任我操在线视频| 极品私人尤物在线精品首页 | 国产亚洲视频免费播放| 亚洲精品天堂在线观看| 亚洲中文字幕手机在线第一页| 亚洲全网成人资源在线观看| 热久久综合这里只有精品电影| 亚洲欧美一区在线| 亚洲欧美日韩中文字幕在线| a级毛片视频免费观看| 午夜精品区| 国产综合精品一区二区| 亚欧乱色视频网站大全| 成人韩免费网站| 人妻中文久热无码丝袜| 亚洲另类国产欧美一区二区| 91久久夜色精品国产网站| 狠狠色综合网| 精品国产一区二区三区在线观看| 精品超清无码视频在线观看| 99re热精品视频国产免费| av一区二区三区高清久久| 亚洲动漫h| 亚洲爱婷婷色69堂| 亚洲 成人国产| 国产第一页屁屁影院| 久久久波多野结衣av一区二区|