鐘志強(qiáng)
(鞍山師范學(xué)院物理科學(xué)與技術(shù)學(xué)院,遼寧 鞍山 114007)
影響青少年機(jī)器人學(xué)習(xí)效果客觀因素的關(guān)聯(lián)分析*
——以遼寧省沈陽(yáng)、大連、鞍山三市青少年機(jī)器人學(xué)員為例
鐘志強(qiáng)
(鞍山師范學(xué)院物理科學(xué)與技術(shù)學(xué)院,遼寧 鞍山 114007)
文章依據(jù)數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析方法,使用R語(yǔ)言對(duì)影響青少年機(jī)器人學(xué)習(xí)效果的客觀因素進(jìn)行了分析。分析結(jié)果表明:在是否獲得獎(jiǎng)項(xiàng)作為學(xué)習(xí)效果劃分標(biāo)準(zhǔn)下,機(jī)器人學(xué)習(xí)時(shí)間是檢驗(yàn)其學(xué)習(xí)成果的關(guān)鍵規(guī)則。
機(jī)器人學(xué)習(xí);關(guān)聯(lián)分析;學(xué)習(xí)客觀因素
2003年教育部頒布的高中技術(shù)課程標(biāo)準(zhǔn)中,把“人工智能初步”和“簡(jiǎn)易機(jī)器人制作”設(shè)為技術(shù)領(lǐng)域的選修模塊,意味著我國(guó)的人工智能和機(jī)器人教育在大眾化、普及化層面上進(jìn)入了一個(gè)新階段。[1]國(guó)內(nèi)教育專(zhuān)家和學(xué)者們都認(rèn)識(shí)到:以機(jī)器人技術(shù)為代表的人工智能技術(shù)是信息技術(shù)發(fā)展的一次重大飛躍,信息技術(shù)教育未來(lái)發(fā)展的趨勢(shì)必然是向智能機(jī)器人教育轉(zhuǎn)移。人工智能機(jī)器人教學(xué)集中承載著中小學(xué)信息技術(shù)教育的諸多核心價(jià)值,是全面培養(yǎng)學(xué)生信息素質(zhì)、提高其創(chuàng)新精神和綜合實(shí)踐能力的良好載體。[2]
截至2013年,青少年機(jī)器人教育仍以校外培訓(xùn)班和校內(nèi)課后班為主,機(jī)器人教育還沒(méi)有真正走進(jìn)課堂。但據(jù)不完全統(tǒng)計(jì),十年中遼寧省沈陽(yáng)、大連、鞍山等市中小學(xué)校學(xué)生參加學(xué)習(xí)人數(shù)累計(jì)4萬(wàn)余人,在國(guó)際、國(guó)內(nèi)(省級(jí)以上)比賽中相繼獲得不菲成績(jī)(累計(jì)1000以上獎(jiǎng)項(xiàng))。在熱情高漲的青少年機(jī)器人教育背后,不乏企業(yè)和培訓(xùn)機(jī)構(gòu)的逐利動(dòng)機(jī),也不乏家長(zhǎng)在子女教育問(wèn)題上對(duì)輿論導(dǎo)向的盲從心理。如何分析機(jī)器人對(duì)青少年身心成長(zhǎng)的影響是該領(lǐng)域必需正視的問(wèn)題。由于信息素質(zhì)、創(chuàng)新精神和綜合實(shí)踐能力衡量困難,機(jī)器人的比賽和獲獎(jiǎng)尤其是國(guó)際獎(jiǎng)項(xiàng)就成為當(dāng)前最好衡量標(biāo)準(zhǔn)。為驗(yàn)證影響機(jī)器人學(xué)習(xí)效果的因素,我們將影響學(xué)習(xí)效果因素按主客觀劃分,將主觀因素分為學(xué)習(xí)的興趣與知識(shí)水平(認(rèn)知結(jié)構(gòu)),學(xué)習(xí)過(guò)程中解決問(wèn)題的學(xué)習(xí)能力或克服困難的堅(jiān)韌力。其中青少年學(xué)習(xí)興趣廣泛,而知識(shí)水平,學(xué)習(xí)能力和堅(jiān)韌性是相對(duì)有限的。因而客觀因素的分析就顯得更加重要。影響學(xué)習(xí)的客觀因素種類(lèi)較多,對(duì)學(xué)習(xí)過(guò)程也有重要影響。本文利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析方法對(duì)影響青少年機(jī)器人學(xué)習(xí)成果的客觀因素進(jìn)行分析。
關(guān)聯(lián)分析(association analysis)是數(shù)據(jù)挖掘中一個(gè)重要的課題,被廣泛研究。關(guān)聯(lián)分析是在大量數(shù)據(jù)集中的發(fā)現(xiàn)關(guān)聯(lián)性或相關(guān)性,描述事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式。[3]關(guān)聯(lián)分析與統(tǒng)計(jì)學(xué)中的相關(guān)分析均討論事物間的相互關(guān)聯(lián)。相關(guān)分析主要刻畫(huà)兩類(lèi)平行關(guān)系變量間相關(guān)程度,是揭示不確定性的隨機(jī)現(xiàn)象之統(tǒng)計(jì)規(guī)律的學(xué)科,因此對(duì)于因素間具有不確定性的系統(tǒng),既可應(yīng)用相關(guān)分析,也可應(yīng)用關(guān)聯(lián)分析。還有關(guān)聯(lián)分析主要處理二分變量,并對(duì)其出現(xiàn)的頻率進(jìn)行分析,這一點(diǎn)區(qū)別于數(shù)據(jù)挖掘中的決策樹(shù)分析。當(dāng)然關(guān)聯(lián)分析也可以對(duì)連續(xù)的變量進(jìn)行離散化后分析。[4]在關(guān)聯(lián)分析中每一個(gè)觀測(cè)稱(chēng)為事務(wù)或交易 (transaction),數(shù)據(jù)集合稱(chēng)為項(xiàng)集(item),一個(gè)集包含k個(gè)項(xiàng),則稱(chēng)為k項(xiàng)集。[5]用X表示一個(gè)項(xiàng)目 (前項(xiàng)或左項(xiàng)),Y表示與X沒(méi)有交集的另一個(gè)項(xiàng)目(后項(xiàng)或右項(xiàng)),蘊(yùn)涵式X≥Y表示X,Y同時(shí)出現(xiàn)的規(guī)則(rule)。X≥Y的支持度(support):表示前項(xiàng)和后項(xiàng)在整個(gè)數(shù)據(jù)集中同時(shí)出現(xiàn)的頻率,σ(Z)表示事務(wù)集Z的頻數(shù),TX,TY分別表示含有X和Y的事務(wù)集。supp(X≥Y);置信度(confidence):支持度與前項(xiàng)頻率之比;提升(lift):置信度與后項(xiàng)頻率之比。關(guān)聯(lián)分析代表性算法有:先驗(yàn)(Apriori)算法,頻繁模式樹(shù)(frequent pattern-growth,F(xiàn)P-growth)算法(R語(yǔ)言目前不支持)及頻繁項(xiàng)集(Eclat)算法。[6]
影響青少年機(jī)器學(xué)習(xí)效果客觀因素分析數(shù)據(jù)來(lái)源于整理后的近五年里遼寧省內(nèi)沈陽(yáng)、大連、鞍山三城市352名機(jī)器人學(xué)員1100筆記錄 (含個(gè)人幾年內(nèi)連續(xù)記錄),如表1。變量包括:學(xué)員性別(gender:female,male);機(jī)器人學(xué)習(xí)時(shí)間(time:1-6年);機(jī)器人學(xué)習(xí)課堂融合程度(Integration:高h(yuǎn)igh,中mid,低low);父母的教育程度(研究生 postgraduate、大學(xué)college(本科、大專(zhuān))、其他other,二人中取高學(xué)歷);學(xué)校學(xué)習(xí)成績(jī)(academic performance,AP:優(yōu) best、良 good、一般 ok);獲獎(jiǎng)(reward: yes,no各種企業(yè)和政府組織省級(jí)以上比賽)。此外,還有一些觀測(cè)變量統(tǒng)計(jì)困難。如家庭收入,家庭對(duì)孩子的教育方式,家庭和諧程度,上一代對(duì)家庭的照顧方式與程度,父母職業(yè)(由于同一職業(yè)內(nèi)部差異較大不具有統(tǒng)計(jì)學(xué)上可辨別性,雙親不同職業(yè)對(duì)子女影響也無(wú)法考量),機(jī)器課堂學(xué)習(xí)成績(jī)(不同的學(xué)習(xí)班有不同的教學(xué)內(nèi)容和考核標(biāo)準(zhǔn))。其它等未列入數(shù)據(jù)分析中。

表1 機(jī)器人學(xué)員部分客觀因素表局部
R是GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件,主要用于統(tǒng)計(jì)分析與數(shù)據(jù)可視化。[7]其使用簡(jiǎn)潔、靈活而且新興研究領(lǐng)域算法不斷更新,在數(shù)據(jù)挖掘(或機(jī)器學(xué)習(xí))領(lǐng)域有廣泛的應(yīng)用。現(xiàn)利用R語(yǔ)言對(duì)青少年機(jī)器學(xué)習(xí)效果客觀因素與是否獲獎(jiǎng)進(jìn)行關(guān)聯(lián)分析。
1.數(shù)據(jù)整理[8]
mydata=read.table("clipboard",header=T)#加載數(shù)據(jù)mydata$time=factor((as.numeric(mydata$time)>3)+1,levels= 1:2,labels=c("short","long"))#關(guān)聯(lián)規(guī)則處理的是二分變量,需將學(xué)習(xí)時(shí)間time轉(zhuǎn)成”long,short”兩個(gè)水平myrobot=as(mydata,"transactions")#arules包要求的數(shù)據(jù)形式為(transactions)itemFrequencyPlot(myrobot,support=0.05)#顯示頻率在5%以上的項(xiàng)如圖1。

圖1 各客觀因素頻率在5%以上的直方圖
2.apriori算法求解關(guān)聯(lián)規(guī)則[9]
library(arules);mynewrules=apriori(myrobot,parameter=list(minlen=2,supp=0.05,conf=0.05),appearance=list (rhs=c("reward=yes"),default="lhs"),control=list(verbose= F))#第一個(gè)規(guī)則的lhs是個(gè)空集,可以使用minlen=2排除lhs空集;verbose=F設(shè)置算法處理的過(guò)程簡(jiǎn)化;以lift提升度排序myrulessorted=sort(mynewrules,by="lift")#關(guān)聯(lián)規(guī)則按“l(fā)ift”排序

表2 各客觀因素關(guān)聯(lián)規(guī)則表
#以下去除冗余關(guān)聯(lián)規(guī)則
m y s u b s e t = i s . s u b s e t ( m y r u l e s s o r t e d , m y r u l e s s o r t e d) ;m y s u b s e t [ l o w e r . t r i ( m y s u b s e t , d i a g = T )] <-N A ;r e d u n d a n t <-c o l S u m s ( m y s u b s e t , n a . r m = T) >= 1 ;r u l e s p r u n e d <-m y r u l e s s o r t e d [ ! r e d u n d a n t] ;i n s p e c t ( r u l e s p r u n e d )#顯示關(guān)聯(lián)規(guī)則,見(jiàn)表2 。
library(arulesViz);plot(mynewrules,method="graph", control=list(type="items"))#關(guān)聯(lián)分析的圖形表示如圖2。

圖2 各客觀因素對(duì)學(xué)習(xí)獲獎(jiǎng)關(guān)聯(lián)規(guī)則圖
3.關(guān)聯(lián)分析結(jié)果解釋
從表2,無(wú)論是支持度、信任度還是提升,與后項(xiàng)獲獎(jiǎng)關(guān)聯(lián)最大的前項(xiàng)是學(xué)習(xí)時(shí)間 (長(zhǎng))。信任度較大關(guān)聯(lián)(0.335,0.325)的前項(xiàng)是機(jī)器人學(xué)習(xí)課堂融合程度(中)、學(xué)校成績(jī)(優(yōu)秀)、父母教育程度(大學(xué))。支持度較大關(guān)聯(lián)(0.188)的前項(xiàng)是性別(男)。人們假想的父母學(xué)歷較高、機(jī)器人學(xué)習(xí)課堂融合程度高卻不是機(jī)器人獲獎(jiǎng)的關(guān)聯(lián)項(xiàng)。從圖2,將獲獎(jiǎng)置于中心,離中心較近的項(xiàng)是學(xué)習(xí)時(shí)間(長(zhǎng)),機(jī)器人學(xué)習(xí)課堂融合程度(中),性別(男);提升(顏色較深)和支持度(面積較大)的項(xiàng)目是性別(女)、學(xué)校成績(jī)(一般),其方向離心說(shuō)明這是負(fù)關(guān)聯(lián),即學(xué)校學(xué)習(xí)平常的小姑娘不能實(shí)現(xiàn)機(jī)器人比賽獲獎(jiǎng)的目標(biāo)。
盡管作用于學(xué)習(xí)的客觀因素不能直接的參與學(xué)習(xí)的知識(shí)建構(gòu),但在學(xué)習(xí)之初,特別是青少年階段,客觀的輔助作用是不可或缺的,學(xué)習(xí)時(shí)間是檢驗(yàn)其學(xué)習(xí)成果的關(guān)鍵規(guī)則。青少年的機(jī)器人學(xué)習(xí)組織以社會(huì)辦學(xué)為主,學(xué)習(xí)時(shí)間意味著家長(zhǎng)的投入和企業(yè)利潤(rùn)的最大化。但我們不是金錢(qián)決定論的完全支持者,因?yàn)楸荣惈@獎(jiǎng)不是機(jī)器人學(xué)習(xí)的真正目標(biāo),而且較長(zhǎng)時(shí)間的學(xué)習(xí)投入對(duì)促進(jìn)學(xué)生綜合發(fā)展的利弊還需進(jìn)一步討論。此外,機(jī)器人學(xué)習(xí)中的主觀因素在學(xué)習(xí)過(guò)程中如何表現(xiàn)?原有的學(xué)習(xí)成績(jī)對(duì)機(jī)器人學(xué)習(xí)效果沒(méi)有預(yù)期遷移效果,而反之是否有影響?這些仍是我們需要進(jìn)一步討論的問(wèn)題。
[1]鐘志強(qiáng),張毅寧,李國(guó)軍.高中機(jī)器人教育課程讀解[J].鞍山師范學(xué)院學(xué)報(bào),2014,(2):43-46.
[2]鐘志強(qiáng),張毅寧.中小學(xué)機(jī)器人教育課程讀解[J].中小學(xué)電教,2012,(11):15-18.
[3]維基百科——關(guān)聯(lián)式規(guī)則[DB/OL].http://zh.w ikipedia. org/w iki/關(guān)聯(lián)式規(guī)則,2014-5-10.
[4]韓家煒.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2012.
[5][8]吳喜之.復(fù)雜數(shù)據(jù)統(tǒng)計(jì)方法:基于R的應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2013.
[6]Pang-N ing Tan.數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社,2011.
[7]R語(yǔ)言——百度百科 [DB/OL].http://baike.baidu. com,2014-5-10.
[9]R and Data M ining:Examples and Case Studies [DB/OL]http://www.RDataM ining.com,2014,5.
(編輯:郭桂真)
G40-057
A
1673-8454(2015)02-0086-03
本文為2013年度鞍山市哲學(xué)社會(huì)科學(xué)研究立項(xiàng)課題《鞍山市中小學(xué)機(jī)器人教育問(wèn)題與對(duì)策》(項(xiàng)目編號(hào):as20133061);2014年度遼寧經(jīng)濟(jì)社會(huì)發(fā)展立項(xiàng)課題《遼寧省青少年機(jī)器人教育研究》(項(xiàng)目編號(hào):2014LSLKTJYX-01)。