999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文本挖掘技術(shù)的教育類文獻主題識別方法研究

2022-10-31 09:43:48苗馮博王甜甜董哲原辛瑞昊
吉林化工學院學報 2022年7期
關(guān)鍵詞:人工智能研究教育

馮 欣,苗馮博**,王甜甜**,董哲原**,叢 萍***,辛瑞昊

(1.吉林化工學院 信息與控制工程學院,吉林 吉林 132022;2.吉林化工學院 理學院,吉林 吉林 132022)

隨著信息化時代的發(fā)展,人工智能、大數(shù)據(jù)等新興技術(shù)引起了全球經(jīng)濟結(jié)構(gòu)、社會生活和工作方式的深刻變革.教育作為傳承文明、創(chuàng)新知識的主要領(lǐng)域,應該主動迎接新一輪科技革命和產(chǎn)業(yè)革命的浪潮,通過信息化與教育的深度融合,構(gòu)建智能化教育體系.近日,國家主席習近平在國際人工智能與教育大會致賀信中強調(diào),要高度重視人工智能在教育領(lǐng)域的應用,積極推動人工智能和教育深度融合,促進教育變革創(chuàng)新,加快發(fā)展伴隨每個人一生的教育、平等面向每個人的教育、更加開放靈活的教育.推動人工智能與教育領(lǐng)域深度融合發(fā)展,可以加快我國教育向數(shù)字化、信息化和智能化轉(zhuǎn)變[1-2].

基于知識圖譜的文本挖掘技術(shù)是人工智能在教育領(lǐng)域的成功應用之一[3].相較于傳統(tǒng)文獻研究法或問卷調(diào)查法分析,知識圖譜分析優(yōu)勢在于將信息學、圖形學、計量學結(jié)合形成交叉科學研究問題,通過大數(shù)據(jù)分析和可視化技術(shù)[4]探尋科學前沿領(lǐng)域的海量文獻數(shù)據(jù)信息之間的關(guān)聯(lián),展示學科前沿領(lǐng)域的進展和趨勢.本文對中國知網(wǎng)(CNKI)數(shù)據(jù)庫收錄的教育領(lǐng)域高質(zhì)量學術(shù)期刊進行知識圖譜分析,采用文本挖掘技術(shù)對文獻的關(guān)鍵詞和摘要進行主題詞抽取與擴充,利用K-means聚類等方法搭建、擴充、分類文獻知識模型,從高頻關(guān)鍵詞、文獻主題和熱點詞聚類的統(tǒng)計結(jié)果來探討當前教育領(lǐng)域的研究熱點和發(fā)展趨勢.

1 基于自然語言處理的文獻分析方法

1.1 基于Jieba分詞的人工智能教育主題詞擴充

為實現(xiàn)教育文獻的精準分析,提升統(tǒng)計結(jié)果的可信度[5],通過TF-IDF算法[6]結(jié)合Jieba分詞技術(shù)進一步擴充文獻主題詞.本文采用TF-IDF的權(quán)值計算公式為:

w=f1*f2=m/M*log[D/(DW+1)],

(1)

其中:w表示指定詞的權(quán)值;f1表示該詞在所在文本中出現(xiàn)的頻率(TF);f2為該詞的逆文本頻率(IDF);m表示該詞在指定文檔中出現(xiàn)的次數(shù);M表示指定文檔的總詞數(shù);D表示文檔庫中的總文檔數(shù);DW是出現(xiàn)該詞的文檔數(shù),并且在分母處加1防止分母為零的情況出現(xiàn).

具體步驟,見圖1,首先,通過語料庫中的詞、詞頻、詞性等屬性構(gòu)建前綴詞典;其次,根據(jù)前綴詞典對文本進行圖文掃描并切分;因為對于每個字都有多種切分方法,所以對于切分后的每個字,構(gòu)建一個以字的位置為key,以劃分的末尾位置所構(gòu)成的列表為value的映射;之后,根據(jù)切分結(jié)果的映射,得到每個字所有可能生成詞的有向無環(huán)圖;然后,利用基于詞典的逆向最大匹配法原理,采用從后往前的方式,從待分詞句子的句尾向句首進行計算;最后,根據(jù)動態(tài)規(guī)劃計算最大概率路徑,從而得到最大概率的切分組合[7-8].

1.2 基于K-means算法的研究內(nèi)容聚類

為了更深層次剖析人工智能教育文獻研究內(nèi)容中的主要研究方向,本文通過運用K-means算法[9]結(jié)合余弦距離函數(shù)對研究內(nèi)容主題詞進行聚類[10].算法具體步驟如下:

1.給定數(shù)據(jù)集X,樣本x∈X,從X中隨機選取K個樣本作為初始聚類中心記為c1,c2,…,ck;

2.根據(jù)余弦相似性度量函數(shù)計算所有樣本與初始聚類中心的相似度,根據(jù)相似度將所有的樣本劃分為K個簇X1,X2,…,XK,然后,計算每個簇內(nèi)的平均值,作為新的聚類中心;

3.計算聚類準則函數(shù)為:

(2)

其中cj為簇Xj的聚類中心,d(x,cj)為余弦相似性度量函數(shù);

4.重復步驟2和步驟3直到f值最小,則終止算法.

2 文獻主題知識圖譜分析

2.1 數(shù)據(jù)來源和數(shù)據(jù)預處理

采用文本挖掘和數(shù)據(jù)分析等方法,研究人工智能背景下教育領(lǐng)域的熱點信息和發(fā)展趨勢.選取中國知網(wǎng)(CNKI)數(shù)據(jù)庫作為數(shù)據(jù)源,檢索主題包含“人工智能”和“教育”的文獻,檢索時間跨度為2010年至2020年,去除非學術(shù)文獻后,為保證統(tǒng)計結(jié)果的可信度及預測模型的精準度,需要選取具有代表性和高質(zhì)量特點的文獻數(shù)據(jù),因此保留SCI、EI、北大核心、CSSCI等高質(zhì)量學術(shù)期刊,最終共檢索到1 651篇文獻作為研究樣本.

通過網(wǎng)絡爬蟲技術(shù)[11]獲取的文獻數(shù)據(jù)包括10類:文獻篇名、第一作者、來源期刊、第一作者所在單位、發(fā)表時間、引用次數(shù)、下載次數(shù)、關(guān)鍵詞、摘要和文獻頁數(shù).采用Python開源框架獲取和處理檢索到的研究樣本.將獲取到的文獻信息整理并存儲到Excel文件中,剔除2篇沒有頁碼信息的文獻,共獲得文獻數(shù)據(jù)1 649條.除了關(guān)鍵詞外,文獻的摘要也蘊含研究的主題信息,為了更全面地分析文獻主題,從文獻摘要中運用自然語言處理進行主題詞抽取,用于擴充文獻的主題詞[12].擴充后共得到關(guān)鍵詞5 331個,其中頻數(shù)大于1的關(guān)鍵詞共有1 567個.為了進一步細化分析,將關(guān)鍵詞分為研究對象、研究內(nèi)容和研究方法[13].本文通過引用文獻、規(guī)則判斷和專家審核將主題詞分為三類,分別為研究對象(O)、研究內(nèi)容(T)和研究方法(M).具體研究過程,見圖2.

2.2 基于網(wǎng)絡拓撲的主題詞頻度分析

為發(fā)現(xiàn)高頻主題詞和關(guān)注度較高的主題詞,在對文獻主題詞進行了選取和預處理基礎(chǔ)上,進行了詞頻統(tǒng)計和TF-IDF平均值計算.根據(jù)詞頻統(tǒng)計排名,剔除無法明確定義類型的主題詞以后,篩選頻數(shù)前45名的主題詞,得到人工智能教育研究高頻主題詞,并列舉出前20的高頻主題詞,見表1.從提取的主題詞可以發(fā)現(xiàn),人工智能、教育、學習、教師、機器人等是高頻關(guān)鍵詞,說明將這些研究方面作為主題進行研究的學者較多,代表著研究領(lǐng)域的核心和熱點研究方向.依據(jù)高頻主題詞在文獻中的關(guān)系,由此構(gòu)建了高頻主題詞網(wǎng)絡拓撲結(jié)構(gòu),見圖3.

表1 人工智能教育研究高頻主題詞

2.3 基于聚類算法的主題詞分析

研究對象作為研究領(lǐng)域的研究客體,從高頻主題詞統(tǒng)計表中可以看出,教育和教師是最為常見的研究客體.研究對象根據(jù)屬性不同也可以分為不同的類別.對于不同的研究群體,熱點研究對象分別是教師(142)、學生(78)、高校(73)等.

研究內(nèi)容反映了研究領(lǐng)域中重點關(guān)注的問題和現(xiàn)象.本文對研究主題詞進行余弦相似性分析和k-means聚類,將主題詞分為3類并得到以研究內(nèi)容為聚類中心的3個簇,聚類中心分別為信息化、人才培養(yǎng)、智能.根據(jù)主題詞判斷文獻所屬類別,將所有文獻分為3個類別.各類研究主題的年度分布,見圖4.

從聚類中心可以看出在人工智能教育研究中,人才培養(yǎng)[14]和智能化正在逐漸成為研究的核心和熱點.通過信息化促進培養(yǎng),已經(jīng)成為一種必然趨勢.

研究中所采用的理論或模型稱為研究方法,由于研究方法類的主題詞數(shù)量少、頻數(shù)低,所以在主題詞分析中往往被忽略,本文則將研究方法單獨列為一項主題進行分析,從而更好地了解領(lǐng)域內(nèi)學者們使用的研究方法.從高頻主題詞統(tǒng)計表中可以看出,除了學習(476)和研究(89)這兩個通用的方法外,融合(74)為人工智能教育的主要研究方法.人工智能與教育的融合是一次教育的革命,打破了傳統(tǒng)學校和教室的界限,倡導以學習者為中心的教育理念,促使個性化學習或定制學習成為現(xiàn)實.

2.4 基于詞頻共現(xiàn)的研究熱點分析

在一段時間內(nèi)相似主題文獻共同探討的話題稱為研究熱點.傳統(tǒng)的知識圖譜分析,使用關(guān)鍵詞進行聚類分析,專家再根據(jù)分類結(jié)果分析得出熱點研究領(lǐng)域,這樣得到的結(jié)果是以標簽為代表的聚類端點,缺少研究對象和研究內(nèi)容的相關(guān)性探討.為進一步對熱點領(lǐng)域進行分析,本文利用研究對象(O)和研究內(nèi)容(T)的熱力圖進行熱點展示,見圖5.從圖中可以看出,教師對應的熱門主題詞是智能、人工智能、教學、技術(shù)、實踐等,可見教師主要致力于探索人工智能下課程教學變革;線上線下結(jié)合的混合教學模式,成為當前高校教育關(guān)注的熱點,學生應用人工智能學習平臺可以給教育提供更多知識資源;教育智能化要求校園向環(huán)境智能化發(fā)展,高校也在逐步推行創(chuàng)新創(chuàng)業(yè)人才培養(yǎng)機制,探尋智能助力下高校現(xiàn)代化的可能路徑.

在構(gòu)建主題詞庫后,通過網(wǎng)絡拓撲圖展現(xiàn)出教學、智能、實踐、技術(shù)和人才培養(yǎng)等研究內(nèi)容都是圍繞教育、學生、教師和高校等研究對象展開的;經(jīng)過聚類分析得到,在教育領(lǐng)域,人才培養(yǎng)成為近些年來最受關(guān)注的方向;結(jié)合熱力圖對研究熱點領(lǐng)域的展示可以看出人工智能與教育之間的關(guān)系愈加緊密.

新時代對人工智能的運用,需要人工智能類專業(yè)人才來實現(xiàn),人才短缺成為當前科技發(fā)展的瓶頸之一.面對這一突出問題,高校應調(diào)整教育教學思維模式,建設多學科、復合型知識框架體系,培養(yǎng)學生的創(chuàng)新能力與實踐能力,引入前沿科技思想,開展交叉學科交流,拓展前沿領(lǐng)域的視野和眼界.人工智能是能夠引領(lǐng)教育發(fā)展方向的重要技術(shù),在人工智能時代背景下開展相關(guān)專業(yè)的人才培養(yǎng),高校要注重提升學生的學科視野,拓寬學科思維,豐富解決問題的方法,拓展解決問題的能力,夯實專業(yè)知識的認知及應用能力,為國家人工智能的發(fā)展奠定人才基礎(chǔ).

3 結(jié) 論

運用文本挖掘和統(tǒng)計學的方法結(jié)合自然語言處理技術(shù)對文獻進行信息抽取構(gòu)建主題詞庫,采用網(wǎng)絡爬蟲技術(shù)構(gòu)建樣本集,通過文本聚類和數(shù)據(jù)可視化展示文獻的研究熱點和發(fā)展趨勢.以教育論文為例,構(gòu)建后的主題詞庫,得到詞頻數(shù)最高的5個主題詞分別為人工智能(1157)、教育(674)、學習(476)、技術(shù)(186)和教學(173),其對應的平均TF-IDF分別為0.58、0.4、0.48、0.3和0.43,可以看出學習和教學對于教育的重要性,在人工智能發(fā)展中專業(yè)技術(shù)人才的培養(yǎng)至關(guān)重要.通過網(wǎng)絡拓撲圖展示出研究對象、研究內(nèi)容和研究方法之間的關(guān)系,研究內(nèi)容是圍繞著研究對象展開的.通過聚類及數(shù)據(jù)可視化展示出:信息化、人才培養(yǎng)和智能正在逐漸成為研究的核心和熱點;人工智能與教師、學生和高校結(jié)合得越來越緊密,教育事業(yè)在人才培養(yǎng)、科技創(chuàng)新等方面為人工智能的發(fā)展奠定了良好的基礎(chǔ).

猜你喜歡
人工智能研究教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
FMS與YBT相關(guān)性的實證研究
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
教育有道——關(guān)于閩派教育的一點思考
EMA伺服控制系統(tǒng)研究
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
辦好人民滿意的首都教育
主站蜘蛛池模板: 广东一级毛片| 国产成+人+综合+亚洲欧美| 免费一级毛片完整版在线看| 精品久久高清| 日韩欧美高清视频| 四虎永久在线精品国产免费| 青草视频久久| 999国内精品久久免费视频| 亚洲黄色网站视频| 亚洲最猛黑人xxxx黑人猛交| 九色国产在线| 99在线免费播放| 亚洲综合片| 91精品在线视频观看| jizz在线免费播放| 欧美午夜视频| 亚洲精品国产精品乱码不卞 | 久久综合激情网| 日韩专区第一页| 久久这里只精品热免费99| 国产在线观看第二页| 天天躁夜夜躁狠狠躁图片| 中文字幕第4页| 五月天福利视频| 2021国产乱人伦在线播放| 无码啪啪精品天堂浪潮av| 国产小视频免费| 91精品久久久无码中文字幕vr| 久久久精品国产亚洲AV日韩| 中文字幕va| 午夜免费小视频| 国产9191精品免费观看| 精品国产免费观看| 久久超级碰| 日本免费福利视频| 国产精品片在线观看手机版| 亚洲 日韩 激情 无码 中出| 亚洲成综合人影院在院播放| 老色鬼久久亚洲AV综合| 国产精品视频导航| 无码精品国产dvd在线观看9久| 欧美日韩综合网| 午夜精品久久久久久久无码软件| 久久综合亚洲鲁鲁九月天| 国产三级毛片| 亚洲福利片无码最新在线播放| 国产99在线观看| 午夜欧美在线| 亚洲视频四区| 国产精品香蕉| 久久夜色精品| 精品国产免费观看一区| 国产一区免费在线观看| 欧美视频在线不卡| 亚洲成人一区在线| 国内精自视频品线一二区| 精品国产香蕉伊思人在线| 欧美日韩中文国产va另类| 国产成人乱无码视频| 亚洲日本一本dvd高清| 在线一级毛片| 久久精品aⅴ无码中文字幕| 四虎影视永久在线精品| 国产美女91视频| 日本久久久久久免费网络| 99re热精品视频国产免费| 亚洲爱婷婷色69堂| 国产成人精品2021欧美日韩 | 午夜国产精品视频| 精品夜恋影院亚洲欧洲| 青草娱乐极品免费视频| 色香蕉影院| 久久国产精品影院| 亚洲中文制服丝袜欧美精品| 福利视频一区| 色综合天天视频在线观看| 热九九精品| 狠狠久久综合伊人不卡| 高潮爽到爆的喷水女主播视频| 熟妇无码人妻| 国产精品冒白浆免费视频| 欧美日韩综合网|