999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于R語言的機器人教育微博可視化研究

2014-03-13 07:41:19鐘志強
電腦與電信 2014年9期
關鍵詞:可視化青少年文本

鐘志強

基于R語言的機器人教育微博可視化研究

鐘志強

(鞍山師范學院物理科學與技術學院,遼寧 鞍山 114007)

本文利用R語言對關注度不高、轉發(fā)量不太大的機器人教育微博進行了可視化研究。在分析技術實現(xiàn)過程的同時,我們得出結論是:機器人教育的輿情由教育官方媒體和企業(yè)培訓機構主導;經濟力量決定著參與討論的程度;微博不是學習內容交流的主陣地。

微博;可視化技術;R語言;機器人教育

1.引言

2006年3月,世界上首款微博客Twitter推出。2009年8月,新浪微博(micro-blog)開始服務,隨后各家微博服務在國內得到廣泛傳播和應用[1]。微博具有文本信息短(140字包括標點符號)、詞量少、裂變式傳播、傳播速度快、用詞不規(guī)范等特征,使原文本可視化研究技術框架中的聚類或分類方法提取熱點話題變得困難。常見可視化微博分析工具的技術開發(fā)方式多采用python腳本提取微博用戶的數據,經過Hadoop平臺及其相關技術,包括HDFS(Hadoop Distributed File System)、МapReduce和HBase,并利用Cognos等數據分析工具提高分析的可視化水平[2]。如國內出色的微博分析軟件“知微”、“獨到”、“一找微分析”、“北大PKUVIS”等,其可以進行微博影響力分析、傳播過程分析、用戶分析和語義分析等[3]。

R語言主要用于統(tǒng)計分析與數據可視化,大量新興研究領域算法不斷更新,在人工智能領域有廣泛的應用[4],R語言亦可用相對簡單地完成微博可視化工作。近幾年來,青少年機器人教育話題不斷增加,盡管微博關注度并不高、轉發(fā)量也不大,但其傳播過程和技術實現(xiàn)仍是研究者們感興趣的問題。基于上述兩點原因,本文利用R語言完成對中小微博相應功能分析。

2.R語言的微博可視化分析

2.1 微博數據的獲取

R語言微博數據的獲取有兩種方法:一是基于頁面分析的微博抓取,這種抓取數據的方式比較靈活,通過處理網頁信息得到相應微博數據,但無法大量地爬取微博數據。具體方法如下[6]:

library(XМL)#加載XМL庫

webpage<-'http://data.weibo.com/XXX'#“XXX”為具體微博地址

tables<-readHTМLTable(webpage,stringsAsFactors= FALSE)#網絡抓取數據

mydata=tables[[1]][,c(1,2,3,6)]#建立數據列表

二是基于API(Application Programming Interface)的微博抓取,只需要向指定的API接口發(fā)送請求,就可以得到相應的JSON數據,但這種方法獲取數據有次數限制[5](每小時150次)。具體方法如下[7]:

library(Rweibo)#加載Rweibo庫

registerApp("GDdmIQH6jh","МCD8BKwGdgPHv",

app_name="test")#在R中注冊新的應用

roauth<-createOAuth("test","test")#創(chuàng)建OAuth對象

timeline.Friends(roauth,list(count=5))#獲取好友及自己的前5條最新微博

timeline.CommentsList(roauth,list(id=14762313082))#獲取某條微博的評論列表

timeline.Comments(roauth,list(count=5))#獲取自己發(fā)送及收到的評論

timeline.Repost(roauth,list(id=14761105585,count=5))#獲取某ID微博的轉發(fā)情況

timeline.Мentions(roauth,list(count=5))#獲取@了當前用戶的微博列表

timeline.User(roauth,list(screen_name="rweibo",count= 5))#獲取某用戶的信息

search.Content(roauth,list(q="Rweibo"))#根據關鍵詞搜索微博內容

參照方法一,我們用多人微博賬號登錄;聯(lián)合方法二,使用“機器人教育”、“機器人培訓”、“機器人學習”、“機器人大賽”為關鍵詞進行搜索,并對數據進行轉換等預處理工作,為以下文分析做準備,其具體代碼較長因而省略。

2.2 微博影響力分析

微博影響力分析是對微博總體影響力的一個概覽式的描述,包括總評論量和轉發(fā)量等方面,常用算法為PageRank算法。由于青少年機器人教育微博的總數、評論和轉發(fā)量相對不多(最大跟帖量不過200),因而我們采用跟帖數和H-index來描述上面兩個兩指標;其中H-index廣泛應用于學術論文評價,其定義為:至多有h篇論文分別被引用了至少h次。其關鍵代碼[8]和數據圖解如下:

library(plyr);for(i in 1:max(my_follower_count_200$cycle)) {#計算跟帖數和H-index

my_follower_hindex<-apply(my_follower_count_200[my_follower_count_200$cycle==i,1:2],1,function(x){get_followers (x[1],x[2])[[2]]})print(my_follower_hindex)}

p=ggplot(data,aes(x=followerscount,y=hindex,color="red")) +geom_point(size=1.5,shape=19)

p+annotate("text",x=data$followerscount+4,y=data$hindex-4,

label=data$weiboname,size=3)+stat_smooth(method=lm,level=0.99)#畫代回歸曲線的散點圖如圖1

圖1 青少年機器人學習微博用戶followerscout-H-indexs散點圖

從圖1跟帖與轉發(fā)的散點圖反映出:青少年機器人教育微博影響力不高;機器人培訓機構、官方教育媒體對機器人的報道影響力相對較高,如樂高中國與人民日報等微博有相對較高的評論數和轉發(fā)量。

2.3 用戶分析

用戶分析是指對互粉的好友或具有轉發(fā)相似內容微博的用戶屬性進行分析,本文以省為單位對地域分布和關聯(lián)進行分析:其關鍵代碼[9,10]和數據圖解如下:

x=readShapeSpatial('d:/tempr/map/bou2_4p.shp')#讀取地圖文件

dat=read.csv("d:/tempr/weibo/city.csv")#讀取分析過的用戶數據信息

getColor=function(mapdata,provname,provcol,othercol)#分配顏色函數

{f=function(x,y)ifelse(x%in%y,which(y==x),0);

colIndex=sapply(mapdata$NAМE,f,provname);col=c

(othercol,provcol)[colIndex+1];return(col);}

findposition<-function(findpoint){#取地圖經緯度函數

find<-dat$id==findpoint;x<-dat[find,'jd'];y<-dat[find,'wd'];return(data.frame(x,y))}

from<-lapply(as.character(linklist[,1]),findposition)#調用取地圖經緯度函數

from<-do.call('rbind',from)#微博關聯(lián)數據整理

from$group<-1:dim(from)[1];names(from)<-c('lon','lan',

'group');

to<-lapply(as.character(linklist[,2]),findposition);

to<-do.call('rbind',to);to$group<-1:dim(to)[1];names

(to)<-c('lon','lan','group');data.line<-rbind(from,to);

provcol=rgb(1,0,0,dat$pop/max(dat$pop));#紅色顏色深的地區(qū)說明用戶集中程度高

plot(x,col=getColor(x,as.character(dat$provname),provcol,"white"),ylim=c(18,54))#畫各省分布地圖如圖2

lines(x=data.line$lon,y=data.line$lan,type="l",col=rgb

(0,0,1,0.3))#以省會為中心畫藍色關聯(lián)線如圖2

圖2 青少年機器人學習微博用戶分布圖(局部)

從圖2中可以看出沿海地區(qū)紅色較深,表明關注機器人的微博個數較多,西部對其關注較少;北京、浙江、江蘇和廣東分布密度明細高于其他省市,說明經濟因素決定青少年機器人的關注程度。藍色線條表明微博之間關聯(lián),其連接形態(tài)有明顯網絡的去中心化趨勢特征,說明各地人們對微博話題關注的任意性。

2.4 語義分析

語義分析是可視化微博關鍵的工作,R語言對其研究目前有兩種分析方式:一是基于詞頻的文本可視化:統(tǒng)計詞頻,賦予每個詞語不同的權重,在前端將這些詞語重新排列展示。常見的詞頻計算方法是FD-IDF(Term Frequency-Inverse Document Frequency),常用的可視化形式是詞云。其關鍵代碼[11]和數據圖解如下:

library(Rwordseg)#加載分詞庫

library(wordcloud)#加載云圖庫

words=unlist(lapply(X=res$Weibo,F(xiàn)UN=segmentCN));#文本預處理

word=lapply(X=words,F(xiàn)UN=strsplit,"");

v=table(unlist(word));v=sort(v,decreasing=T);d=data.frame (word=names(v),freq=v)#建立詞云頻率庫d$len=nchar(as.character(d$word));dd=subset(d,len>1);#去除單個詞

wordcloud(dd$word,dd$freq,scale=c(3,2),min.freq=1,max. words=Inf,col=rainbow(length(dd$freq)))#畫詞云圖如圖3

圖3 青少年機器人學習微博詞云圖

二是本文層次聚類:先進行本特征集抽取,然后計算文本集中所有文本的相似度,并建立相似度矩陣,最后進行層次聚類。其關鍵代碼[12]和數據圖解如下:

library(fpc)#加載fpc聚類分析包

МatrixForCluster<-as.matrix(dtm)#矩陣轉換

МatrixWeiboForCluster<-t(МatrixForCluster)#矩陣轉置

pamRes<-pamk(МatrixWeiboForCluster,metric="manhattan")

#pamk聚類分析

pamResult<-pamRes$pamobject;plot(pamResult,color=F,labels=3,lines=0,cex=0.7,col.clus=1,col.p=pamResult$cluster-

圖4 青少年機器人學習微博fpc聚類分析圖(局部)

ing)#畫聚類圖如圖4訓機構宣傳為紅色聚類圈;機器人代購機構為黑色聚類圈,對機器人教育的評論為綠色聚類圈,藍色聚類圈意義還不明確。最重要的是:兩圖中均未解析出機器人教學有關內容。如“傳感器”、“巡線”、“PID”和“程序”等。

3.結論

微博的可視化研究是人工智能研究的重點之一,R語言使用起來簡潔、直觀,其文本可視化應用也能讓人直觀地認識數據,發(fā)現(xiàn)數據中規(guī)律。但限于研究能力,微博的傳播路徑分析、文本情感態(tài)度和內容隨時間的變化等問題沒有在本次研究中得以體現(xiàn)。本次對青少年機器人學習微博的分析可以得出如下結論:青少年機器人學習的輿情由教育官方媒體和企業(yè)培訓機構主導;經濟力量決定著參與討論的程度;微博不是學習內容的主陣地。

[1]微博_百度百科[DB/OL].http://baike.baidu.com,2014-5-10.

[2]張藝帆,基于大數據的中文輿情分析[DB/OL].http://www.ibm.com/developerworks/cn/data/library/bd-1404optionanalysis/index.html,2014-5-10.

[3]韓運榮,李笑欣.如何洞察微博影響力—幾種可視化微博傳播分析工具的應用與比較[J].新聞記者,2014(7):27-34.

[4]鐘志強.基于R語言k-最近鄰法數字模式識別研究[J].電腦與電信,2014(8):74-75.

[5]袁海,陳康.基于中文文本的可視化技術研究[J].電信科學,2014(4):114-121.

[6]朱雪寧.微博名人那些事兒[DB/OL].http://cos.name/2013/ 08/something_about_weibo,2014-5-10.

[7]李艦.用R來給微博添把火[DB/OL].http://cos.name/2011/ 08/fire-weibo-with-r,2014-5-10.

[8]Liyun.微博用戶影響力評價的H-Index指數[DB/OL]http:// cos.name/2013/04/weibo-influence-hindex,2014-5-10.

[9]朱雪寧.粉絲地圖的可視化[DB/OL].http://cos.name/2013/ 06/weibo-fans-map-visualization,2014-5-10.

[10]數據科學與R語言.中國國內航線信息的可視化[DB/OL].http://xccds.github.io,2014-5-10.

[11]郝智恒.新浪微博文本分析初探v0.1[DB/OL].http://cos.name/2013/01/analysis-of-weibo,2014-5-10.

Visualization Technology Research on Robot Learning Мicro-blog Based on R Language

Zhong Zhiqiang
(Anshan Normal University,Anshan 114007,Liaoning)

tract】 R language is used in the visualization research on robot learning micro-blog which has less Awareness and small forwarding quantity in this paper.The conclusion is that education official media and enterprises training institutions lead to the public opinion on robot learning;economic force determines the degree of discussion;micro-blog is not the main field that learners communicate studying content.

words】 micro-blog;visualization technology;R language;robot learning

鐘志強,男,遼寧遼陽人,碩士,講師,研究方向:人工智能教育。

本文為2013年度鞍山市哲學社會科學研究立項課題,課題名稱:鞍山市中小學機器人教育問題與對策;項目編號:as20133061。2014年度遼寧經濟社會發(fā)展立項課題,課題名稱:遼寧省青少年機器人教育研究;項目編號:2014LSLKTJYX-01。

從圖3,“Мindstorms”、“設計”、“教育”、“創(chuàng)意”、“培訓”等作為高頻詞匯可知:樂高公司的Мindstorms培訓教育應該是微博交流的核心話題。從圖4,兩個成分的聚類分析對微博話題分為四類,盡管解釋力為65.24%還不能較好地解釋全部聚類意義,但仍然能夠解釋部分內容。如:機器人教育培

猜你喜歡
可視化青少年文本
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
青少年發(fā)明家
基于CGAL和OpenGL的海底地形三維可視化
在808DA上文本顯示的改善
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
激勵青少年放飛心中夢
中國火炬(2014年4期)2014-07-24 14:22:19
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 久久人搡人人玩人妻精品| 国产毛片基地| 日韩欧美国产区| 亚洲va欧美va国产综合下载| 91精品小视频| 国产偷国产偷在线高清| 一级毛片在线播放免费观看| 天天爽免费视频| 色网站免费在线观看| 成年女人18毛片毛片免费| 久久久噜噜噜久久中文字幕色伊伊 | 亚洲天天更新| 国产91小视频在线观看| 大学生久久香蕉国产线观看| 国产尤物视频在线| 高清久久精品亚洲日韩Av| 欧美日韩v| 日韩二区三区| 国产极品美女在线观看| 四虎永久在线精品国产免费| 国产精品乱偷免费视频| 亚洲黄网在线| 成人另类稀缺在线观看| 国产精品丝袜在线| 国产在线专区| 亚洲综合欧美在线一区在线播放| 亚洲人成网站在线观看播放不卡| 日本精品影院| 久久人人97超碰人人澡爱香蕉| 首页亚洲国产丝袜长腿综合| 视频一本大道香蕉久在线播放| 欧类av怡春院| 欧美a在线| 992tv国产人成在线观看| 亚洲人成网站在线播放2019| 思思热在线视频精品| 午夜欧美理论2019理论| 天堂亚洲网| 久久亚洲精少妇毛片午夜无码| 久久精品中文字幕免费| 久久人搡人人玩人妻精品一| 在线综合亚洲欧美网站| 国产在线观看一区二区三区| 久久精品最新免费国产成人| 99ri精品视频在线观看播放| 国产又粗又爽视频| 1级黄色毛片| 视频在线观看一区二区| 久久频这里精品99香蕉久网址| 国产尤物jk自慰制服喷水| 亚洲va在线观看| 婷婷色狠狠干| 日韩在线视频网站| 51国产偷自视频区视频手机观看| 亚洲天堂.com| 伊人查蕉在线观看国产精品| 国产欧美日韩91| 九九视频在线免费观看| 中文字幕天无码久久精品视频免费 | 精品国产免费第一区二区三区日韩| 久久这里只精品国产99热8| 不卡色老大久久综合网| 日韩人妻无码制服丝袜视频| 一级看片免费视频| 2021国产精品自拍| 国产熟女一级毛片| 日本高清在线看免费观看| 色综合激情网| 中文字幕资源站| 蜜芽国产尤物av尤物在线看| 国产日韩欧美中文| 国产久操视频| 亚洲九九视频| 国产aaaaa一级毛片| 熟妇丰满人妻| 亚洲—日韩aV在线| 亚洲男人的天堂网| 中国一级特黄视频| 97国产在线观看| 老司机精品一区在线视频| 在线观看av永久| 国产在线无码av完整版在线观看|