999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據的網絡公開課標簽庫建設

2016-04-12 00:00:00許金玲孟慶福劉婧
現代電子技術 2016年3期

摘 要: 大數據時代的到來,使得應用教學資源提升教學效果成為必然,而網絡公開課標簽化又是提升網絡教學資源使用效果的前提。在分析了三種主要的網絡公開課信息數據獲取途徑的基礎上,對其分別采用定期抽取、矩陣打分和智能聚類分類模型算法進行分析和提取,搭建了具有分層分級管理思想的網絡公開課標簽體系架構,形成了綜合性和獨特性兼備的課程標簽庫。通過對公開課標簽庫的研究,提升網絡公開課資源的覆蓋率和準確性,對提升教學效果有重要意義。

關鍵詞: 大數據; 網絡公開課; 標簽; 模型

中圖分類號: TN711?34 文獻標識碼: A 文章編號: 1004?373X(2016)03?0101?03

Construction of network public class label database based on big data

XU Jinling, MENG Qingfu, LIU Jing

(Beijing Institute of Technology, Zhuhai 519080, China)

Abstract: Coming of big data era makes the application of teaching resources and promotion of teaching effect become the necessity, and the labeling network public class is the premise of promoting the using effect of the network teaching resource. The main three approaches to acquire the information data of network public class are analyzed. Based on this, the data is analyzed and extracted by means of regular extraction, matrix grading, intelligent clustering and classification model algorithm respectively. The network public class label architecture with the thought of hierarchical and layered administration was established to form the class label database with both integrity and peculiarity. The studying of the public class label database can promote the coverage rate and accuracy of the network public class resources, and has certain contribution to promote the teaching result.

Keywords: big data; network public class; label; model

0 引 言

在信息與網絡技術迅速發展的推動下,大數據時代[1]已經來臨。以數據為基礎的科學研究,為人類的生活創造了前所未有的可量化的維度。科技文獻、科學數據、科技報告、科技成果等信息的開放與共享日益成為“數據驅動科研”方式的重要內容和手段。高校教學資源在大數據時代也日趨豐富、完善[2?3],主要體現在互聯網上國內外名校日益增多的公開課資源。使用網絡教學資源提升教學效果成為必然趨勢[4?5]。

由于網絡教學平臺的普遍使用[6?8],公開課資源幾乎覆蓋了經濟與管理學科基礎教學內容,成為相對最為完善的網上公開課程群。這些資源服務于不同的教學大綱和專業要求,適應不同學習水平和特點的學生,直接將其用于教學存在嚴重的適應性問題[9],因而國內高校普遍把這些資源用于課外輔導和參考資料,鮮有直接用于課堂教學的案例。因此,提高公開資源在不同教學要求上的適應性,能夠準確甄別所需資源并應用于課堂教學成為提升教學效果的必要手段。與此同時,大數據環境下的網上公開課程標簽不僅能提升教師和學生搜索視頻資料的精準度,而且能提升資料搜索的快捷性,為提高網絡公開課資源的利用提供便利條件。

在電信業、金融業等信息化產業標簽體系[10]迅速發展的條件下,數據標簽化已成為提升數據運用效果的首要前提。因此,為提升網絡資源使用效果,網絡公開課走向標簽化是必然的趨勢。

1 網絡公開課標簽庫框架

網絡公開課標簽體系架構如圖1所示,它包含網絡公開課數據源獲取、標簽維度分析、標簽適配和形成標簽庫4個層次。首先通過網站收集、學校調研等多種方式獲取所需要的網絡公開課,針對課程屬性、面向群體等特征進行分析形成多維標簽,對這些分散的多維標簽進行梳理和匯總形成具有網絡公開課特色的標簽庫。目前形成網絡公開課標簽的維度包括:課程名稱、課程分類、作者分類、適用人群分類、訪問頻次、用戶評價分類,從而使教師或瀏覽人員能夠快速找到所需要的公開課,形成精確適配的網絡公開課標簽庫。

2 搭建網絡公開課標簽庫

2.1 獲取標簽數據源

網絡公開課標簽化就是對教學資源進行科學分析,按資源特點、面向對象、案例解決問題類別等不同維度進行分類,在建立公開課資源多媒體信息庫的基礎上,對信息庫中每項資源建立標簽,形成網絡公開課程標簽庫,以便于教師在精細資源模塊基礎上根據不同教學需求進行模塊重組,提高這些資源用于課堂教學的適應性。網絡公開課標簽之所以不能采用現在通用的社會化標簽,是因為教學對象、教學目標、關注點等因素都可能影響網絡公開課標簽的構建。

結合網絡公開課的具體特征,標簽庫建設采用“客觀標簽+主觀標簽”的思路進行搭建,維度主要覆蓋以下幾個方面:

(1) 基本信息。課程的基本信息,歸屬于客觀化標簽。該信息可來源于教務系統的信息錄入,如所屬學科、授課人、授課時長、使用教材,該信息可幫助確立課程的基本標簽,是擴展標簽分析與提供服務的基礎,是一切標簽確立的根本化平臺。

(2) 適用對象。該標簽庫介于主觀與客觀信息、原始與分析信息之間的一種課程特有的用戶信息,視頻課程平臺的瀏覽信息、觀看信息甚至觀看的時長和頻次等都可以作為分析與標注網絡公開課標簽的來源。對所獲取到的數據分析得越透徹,越能更準確地識別公開課適用人群的適配特征。

(3) 網絡提取。課程的網絡提取信息,歸屬于客觀化標簽。該部分信息來源的分析與提取難度較大,需要對重點視頻課程網站進行分析,深入研究各網站的網頁腳本規律,采用網絡爬蟲技術對指定網站的瀏覽信息進行追蹤,并通過多次的分析、提取,最終概括出準確的公開課標簽信息以及適用對象,這是挖掘課程與用戶需求對應關系的重要途徑。

(4) 其他。根據增加的標簽維度進行擴展的子庫,主要根據標簽庫使用情況進行調整和完善。

前三類數據源的獲取,既借鑒了現有標簽理論的成果,又充分考慮到網絡公開課的特性,分析和建立了與之適配的個性化標簽維度。這三個部分的有機融合構成了基于大數據的網絡公開課標簽庫搭建的基礎。

2.2 標簽維度分析算法

2.2.1 基本信息標簽的分析與提取

網絡公開課基本信息中可提取出許多鮮明、確切的標簽,如課程名稱、授課人員、所屬學科等信息,因此該部分標簽的算法可由高校根據具體信息內容與特點進行抽取,既可從存儲數據庫中定時提取,也可根據制定的提取頻率從頁面進行采集。但不論哪種方式,在標簽制定時必須將課程基本信息維度的重要程度進行選取與排序,鑒于授課人員、授課時長、所屬學科哲學因素對公開課選取的影響度較高,因此必須將其設置成優先考慮的因素。

2.2.2 適用對象標簽的分析算法

該算法的主導思想是根據用戶對公開課的評價和公開課中包含的標簽,建立用戶和標簽的關系,這就需要在公開課系統中增加公開課資源評價這一模塊,具備用戶打分、用戶信息記錄的功能,具體的分析算法可采用矩陣方法進行。

可把用戶、公開課、標簽定義為3 個相互關聯的數據集合,分別為用戶集[U=U1,U2,…,Un,]公開課集[C=C1,C2,…,Cn,]標簽集[T=T1,T2,…,Tn。]由于用戶與標簽的對應關系是根據公開課與標簽的對應關系推算獲得,因此將這3 個集合可設置成兩個對應矩陣:

[F:]用戶與公開課的對應關系;

[F:]公開課與標簽的對應關系。

如果用戶[Ui]瀏覽了公開課[Cj,]并且評分為[Q,]那么[Fij=Q,]否則[Fij=0;]如果公開課[Cj]被標注成了標簽[Tk,]那么[F′ij=1,]否則[F′ij=0。]

由于用戶對課程的打分可以理解成用戶對標簽的打分,因此用戶對不同課程中對于出現的同一個標簽的打分綜合就可以理解成該標簽對用戶的重要性,據此,將其定義成標簽的重要性;但由于有些標簽是主觀判斷的結果,其準確性有待提升,因此在判斷標簽重要性的同時還要考慮用標簽的穩定性來補充和完善。綜合標簽和對標簽打分的穩定性來判斷標簽對用戶的重要程度,設定公式如下:

式中:Sum表示用戶對某一標簽的打分;[fVt(i)]是用戶[U]對包含標簽[t]的課程打分為[i]的比例;[n]為[fVt(i)]可能出現不同值的個數。根據以上理論,[EVt]越大,那么對標簽打分的穩定性越低;[EVt]越小對標簽打分的穩定性越高。結合兩個公式便可準確判斷標簽對用戶的重要程度,從而準確確定公開課面向對象的標簽,即確定用戶與標簽的對應關系。

2.2.3 網絡提取庫標簽的分析算法

針對梳理出的重點公開課資源網站,如中國大學視頻公開課、中國公開課、網易公開課、新浪公開課等網站,采用爬蟲技術[11]對其瀏覽信息進行有針對性的重點抓取、分析,以便識別公開課與適用人群的潛在關系。因此,該部分的標簽準確性集中在數據抓取和分析的準確性上。為了提升抓取內容翻譯的準確率和覆蓋率,采用智能聚類分類模型[12],借鑒該模型理念對公開課分析采用一級、二級分類方式:一級分類是基于訪問公開課的分類屬性庫建立的;而二級分類是對一級分類的細分,每個一級分類下延伸出多個二級分類,所有網頁先采用地址方式匹配分類。如無法匹配,則通過網頁內容分詞技術、網絡標簽及關鍵字定位,根據用戶訪問網頁確定網頁屬于哪個二級分類。

2.3 標簽適配與形成

網絡公開課標簽的形成會依據來源系統的科學性進行合理分配,三大類來源標簽從不同維度揭示了公開課的特性,形成了獨立而又統一的標簽體系,如圖2所示。

為了便于對課程標簽的查詢與維護,標簽體系實現分級管理機制完成標簽適配流程,即以客觀標簽和主觀標簽為一級分類,下設二級下屬分類,即一級分類/二級分類/三級分類/客戶標簽的標簽維度體系。另外,由于大數據可實現網絡數據提取,更加豐富了主觀化標簽的獲取途徑和范圍,因此,本標簽庫一方面實現了課程客觀化的標簽維度,另一方面更偏重于課程主觀化維度的標簽梳理,以提升課程適應度。

考慮到實際的應用情況,對公開課的分類只細化到三級,分類示例見表1。

3 結 語

網絡教學資源也是一種社會資源,需要針對特定群體進行資源整合,在高校教學使用這些資源的過程中,既要強調重視學科經典基礎內容,也要做到因人施教,與時俱進,將公開課標簽化就是對教學資源的一種整合,并必將為社會的良性運行和協調發展帶來影響。

本文在分析了三種主要的網絡公開課信息數據獲取途徑的基礎上,對其分別采用定期抽取、矩陣打分和智能聚類分類模型算法進行分析和提取,搭建了具有分級管理思想的網絡公開課標簽體系架構,形成了綜合性和獨特性兼備的課程標簽庫。希望通過對公開課標簽庫的研究,能提升網絡公開課資源的覆蓋率和準確性,對提升教學效果有所貢獻。

參考文獻

[1] 王元卓,靳小龍,程學旗.網絡大數據:現狀與展望[J].計算機學報,2013(6):3?16.

[2] 金陵.大數據與信息化教學變革[J].中國電化教育,2013(10):13?18.

[3] 朱建平,李秋雅.大數據對大學教學的影響[J].中國大學教學,2014(9):44?47.

[4] 國務院研究室課題組.粵港澳更緊密合作一體化發展的空間布局和政策選擇:建立粵港澳更緊密合作框架研究報告之三[J].中共珠海市委黨校珠海市行政學院學報,2011(1):47?51.

[5] 國務院研究室課題組.推進粵港澳共同建設具有國際競爭力的創新型區域:建立粵港澳更緊密合作框架研究報告之四[J].中共珠海市委黨校珠海市行政學院學報,2011(2):34?36.

[6] CHABRA T, FIGUEIREDO J. How to design and deploy handheld learning [EB/OL]. [2007?03?13]. http://www.empowering technologies.net/eLearning/eLearning_expov5_files/frame.html.

[7] GEORGIEVA E S, SMRIKAROV A S, GEORGIEV T S. Evaluation of mobile learning system [J]. Procedia Computer Science, 2011, 3(1): 632?637.

[8] LUO P P, YANG S B. Development and evaluation of mobile learning system for collaborative learning [C]// Proceedings of 2010 International Conference on Development and Evaluation of Mobile Learning System for Collaborative Learning. [S.l.]: UbiLearn, 2010: 179?183.

[9] 王軍強.課程的標簽化分析[J].教育評論,2014(7):36?38.

[10] 許金玲,陳旭翔,趙少娟,等.基于信令分析的客戶網絡標簽體系搭建[J].電信快報,2012(5):28?31.

[11] 李勇,韓亮.主題搜索引擎中網絡爬蟲的搜索策略研究[J].計算機工程與科學,2008(3):3?4.

[12] 王實,高文.數據挖掘中的聚類方法[J].計算機科學,2007,27(4):42?45.

主站蜘蛛池模板: 亚洲女同欧美在线| 全免费a级毛片免费看不卡| 色播五月婷婷| 在线亚洲精品福利网址导航| 亚洲天堂成人| 欧美www在线观看| 在线观看亚洲成人| 日韩无码视频网站| 小说 亚洲 无码 精品| 超级碰免费视频91| 国产精品成人啪精品视频| 亚洲VA中文字幕| 亚洲浓毛av| 免费毛片全部不收费的| 久久黄色影院| 欧美午夜在线观看| 中文字幕一区二区人妻电影| 视频二区亚洲精品| 国产成人久视频免费| 国产精品自拍露脸视频| 国产欧美另类| 欧美一区二区啪啪| 夜精品a一区二区三区| 亚洲黄色片免费看| 国产18在线播放| 天天色综合4| 久久国产成人精品国产成人亚洲 | 538精品在线观看| 亚洲系列无码专区偷窥无码| 欧洲成人在线观看| 最新精品国偷自产在线| 亚洲无限乱码| 欧美有码在线| 国产成人91精品免费网址在线| 亚洲午夜片| 中国一级特黄视频| 亚洲日韩AV无码精品| 干中文字幕| 国产福利一区在线| 国产一二三区视频| 亚洲日本韩在线观看| 国产精品视频观看裸模| 久久这里只精品热免费99| 欧美日韩第三页| 亚洲人成影视在线观看| 欧美精品v欧洲精品| 国产精品专区第一页在线观看| 国产精品手机在线播放| 欧美va亚洲va香蕉在线| 999精品在线视频| 欧美色视频日本| 精品久久综合1区2区3区激情| 激情影院内射美女| 国产欧美日韩专区发布| 福利国产在线| 啦啦啦网站在线观看a毛片| 欧美日韩成人| 国产精品视频导航| 免费99精品国产自在现线| 人妻丝袜无码视频| 日本三级黄在线观看| 亚洲成a∧人片在线观看无码| 激情爆乳一区二区| 欧美一级片在线| 一级片免费网站| 性网站在线观看| 色偷偷一区二区三区| 国产亚洲一区二区三区在线| 老司国产精品视频91| 日韩毛片免费视频| 91视频青青草| 色婷婷视频在线| 内射人妻无套中出无码| 亚洲,国产,日韩,综合一区| 国产成人综合在线观看| 国产综合欧美| 亚洲国产成人久久精品软件| 亚洲黄色成人| 亚洲精品制服丝袜二区| 日韩性网站| 亚洲一区免费看| 狠狠v日韩v欧美v|