








摘要:當(dāng)前,以ChatGPT為代表的人工智能生成內(nèi)容(Artificial Intelligence Generated Content,AIGC)在教育領(lǐng)域引起的變革受到各類專家學(xué)者的廣泛關(guān)注,然而較少有研究從網(wǎng)絡(luò)問答社區(qū)層面探討公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知。為此,文章通過隱含狄利克雷函分布(Latent Dirichlet Allocation,LDA)主題建模與時間序列分析,對2022年12月6日~2024年4月9日知乎平臺中與AIGC、教育等主題相關(guān)的問答與文章進行了探究。LDA主題建模結(jié)果顯示,公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知主要集中在教師教學(xué)與學(xué)生課堂學(xué)習(xí)面臨的挑戰(zhàn)、AIGC對學(xué)術(shù)倫理帶來的挑戰(zhàn)、AIGC對學(xué)生批判性思維和跨學(xué)科學(xué)習(xí)能力的影響,以及中外大學(xué)生使用AIGC完成論文作業(yè)情況的對比等方面。時間序列分析結(jié)果顯示,公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知在2023年2月~3月達到高峰,且主要關(guān)注點在AIGC對學(xué)生學(xué)習(xí)的影響方面。文章通過研究,旨在為教育領(lǐng)域更好地適應(yīng)并應(yīng)對AIGC帶來的變革與挑戰(zhàn)提供參考。
關(guān)鍵詞:AIGC;ChatGPT;教育;網(wǎng)絡(luò)問答社區(qū);關(guān)注與認知
【中圖分類號】G40-057 【文獻標(biāo)識碼】A 【論文編號】1009—8097(2024)10—0042—11 【DOI】10.3969/j.issn.1009-8097.2024.10.005
一 提出問題
隨著科學(xué)技術(shù)的不斷發(fā)展,以ChatGPT為代表的AIGC正在深刻改變著教育領(lǐng)域。其通過大規(guī)模語言模型模擬人類語言,實現(xiàn)自然交互,為個性化教學(xué)提供了新的技術(shù)支撐,如果使用得當(dāng),將是一種變革性教育工具,會使教育發(fā)生巨大的變化[1][2][3]。因此,自ChatGPT發(fā)布以來,越來越多的專家學(xué)者開始關(guān)注AIGC對教育領(lǐng)域的影響和潛在應(yīng)用,而隨著ChatGPT 4.0的發(fā)布,社會對AIGC在教育中影響及應(yīng)用的關(guān)注與認知展現(xiàn)出新的變化和趨勢,教師、學(xué)生、專家以及廣泛的社會公眾對此表達了各自的看法和認識。國外研究發(fā)現(xiàn),教師對ChatGPT的接受度較低,主要擔(dān)心其在學(xué)生學(xué)習(xí)過程中存在的負面影響,學(xué)生認為ChatGPT雖然能夠給出結(jié)構(gòu)良好的回答,但質(zhì)疑其準確性,公眾對ChatGPT在教育中的應(yīng)用則表現(xiàn)出多元化的態(tài)度[4][5][6]。而國內(nèi)更多關(guān)注專家層面的看法,聚焦于ChatGPT教育應(yīng)用對教育的可能影響及應(yīng)對策略、ChatGPT在教育領(lǐng)域的應(yīng)用及其挑戰(zhàn)、AIGC時代拔尖創(chuàng)新人才培養(yǎng)的重要性和面臨的挑戰(zhàn)、ChatGPT應(yīng)用于高等教育德育領(lǐng)域的可能性和局限性,以及ChatGPT對教師專業(yè)發(fā)展的影響[7][8][9][10][11]。通過對知網(wǎng)相關(guān)文章的檢索、梳理與分析得到的“ChatGPT+教育”相關(guān)論文發(fā)表趨勢(如圖1所示),可以看出,自2023年1月以來,該主題的學(xué)術(shù)論文顯著增加,直到2024年7月才呈現(xiàn)出顯著下降的趨勢,這表明在AIGC發(fā)展期間學(xué)術(shù)界對該主題一直保持著高度的關(guān)注。在眾多的研究中,雖然有學(xué)者已經(jīng)探討了社會公眾對“ChatGPT+教育”的看法與態(tài)度,但僅限于2022年底至2023年初[12]。考慮到公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知是逐步發(fā)展的,同時網(wǎng)絡(luò)問答社區(qū)的問答機制能引導(dǎo)深入討論,提供比一般社交媒體更具價值的觀點。因此,本研究嘗試利用Python爬取網(wǎng)絡(luò)問答社區(qū)中與“AIGC+教育”相關(guān)的問題、回答與文章,通過LDA主題建模和時間序列分析探討網(wǎng)絡(luò)問答社區(qū)公眾(下文簡稱“公眾”)對AIGC在教育中影響及應(yīng)用的關(guān)注與認知,以期為教育領(lǐng)域更好地適應(yīng)和應(yīng)對AIGC帶來的變革與挑戰(zhàn)提供參考。基于此,本研究提出以下問題:①公眾對AIGC在教育中影響及應(yīng)用的主要關(guān)注點有哪些?他們對其潛在影響有哪些擔(dān)憂?②公眾對AIGC在教育中影響及應(yīng)用的認知是什么?有什么特點?③隨著時間的變化,公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知有哪些變化趨勢?
圖1 "“ChatGPT+教育”相關(guān)論文的發(fā)表趨勢
二 研究設(shè)計
1 數(shù)據(jù)來源
知乎作為中國領(lǐng)先的網(wǎng)絡(luò)問答社區(qū),憑借高質(zhì)量的數(shù)據(jù)和廣泛的公眾參與度,匯集了來自各行各業(yè)的知識分享者,其中30歲以下的年輕人作為主體用戶,提供了大量深入多元的內(nèi)容。知乎與其他互聯(lián)網(wǎng)平臺不同,其內(nèi)容主要在問答場景中產(chǎn)生和流通,通過獨特的問答討論機制,引導(dǎo)用戶深入探討特定議題,在用戶群體和討論深度上具有一定代表性[13][14]。因此,本研究收集了2022年12月6日~2024年4月9日期間(研究期間的平臺問答起止時間)知乎這一網(wǎng)絡(luò)問答社區(qū)中關(guān)于AIGC對教育影響及應(yīng)用的問答和文章進行研究并展開討論。
2 數(shù)據(jù)收集
本研究以“生成式人工智能”“AIGC”和“ChatGPT”為主題關(guān)鍵詞,結(jié)合“教育”“教學(xué)”“教師”“學(xué)生”“學(xué)校”“課堂”“科研”和“學(xué)術(shù)”等詞匯,使用集搜客(GooSeeker)工具在知乎平臺采集了所有相關(guān)問答和文章的鏈接。GooSeeker是一個用戶友好的網(wǎng)絡(luò)爬蟲,允許非編程用戶抓取網(wǎng)頁信息,同時遵守網(wǎng)站規(guī)則和法律,保證數(shù)據(jù)采集的合法性。《數(shù)據(jù)安全管理辦法(征求意見稿)》第十六條規(guī)定,網(wǎng)絡(luò)運營者在不干擾網(wǎng)站正常運行的前提下,可以自動化訪問收集網(wǎng)站數(shù)據(jù),但不能超過網(wǎng)站日均流量的三分之一[15]。考慮到知乎沒有開放API,本研究使用Python針對問題、回答、問答發(fā)布時間、文章標(biāo)題、內(nèi)容、發(fā)布時間等進行爬取,最終收集的數(shù)據(jù)量為4449條,遠低于知乎日均流量的三分之一。同時,本研究遵循目標(biāo)網(wǎng)站的robots.txt文件規(guī)定,避免訪問敏感路徑(如/login、/logout等),確保數(shù)據(jù)獲取的合規(guī)性;爬蟲程序設(shè)計遵循網(wǎng)站允許的參數(shù)和訪問方式,設(shè)置合適的請求間隔以減輕服務(wù)器負載,未突破任何技術(shù)性訪問控制措施。
3 數(shù)據(jù)處理
本研究將獲取的數(shù)據(jù)劃分為“問題與文章標(biāo)題”(QT)和“回答與文章內(nèi)容”(AC)兩類。關(guān)注是指公眾對某一議題或事件所表現(xiàn)出的興趣和重視程度,反映了人們認為什么是重要的,什么是值得討論和思考的,因此QT揭示了公眾關(guān)注的興趣和熱點[16]。認知是指個體對AIGC在教育領(lǐng)域應(yīng)用的心理表征和信息處理過程,反映了個體對AIGC技術(shù)的深入理解,因此AC揭示了公眾的認知水平和理解深度[17]。在最終獲取的數(shù)據(jù)中,QT類別包含792條記錄,共計21463字符;AC類別包含3657條記錄,共計5669443字符。為保證分析的準確性和有效性,本研究對收集的數(shù)據(jù)進行了預(yù)處理和清洗[18]:首先,利用Python的Pandas庫對收集的數(shù)據(jù)進行去重處理,以免由于數(shù)據(jù)重復(fù)導(dǎo)致主題建模結(jié)果不準確;接著,刪除與“AIGC”“ChatGPT”“教育”等關(guān)鍵詞不相關(guān)的數(shù)據(jù),并使用Jieba庫對數(shù)據(jù)進行分詞,將長文本劃分為短詞匯。同時,移除表情符號、網(wǎng)址鏈接、標(biāo)點符號和特殊字符,并采用哈爾濱工業(yè)大學(xué)的中文停用詞表去除常見但冗長的詞匯。最終,獲得507條QT數(shù)據(jù)和1466條AC數(shù)據(jù),分別包含2701和99249個詞語。此外,本研究還為每條數(shù)據(jù)添加了時間戳,并統(tǒng)計了QT和AC文本中每月出現(xiàn)頻率較高的三個詞匯及其頻數(shù)。
4 研究方法
為分析公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知,本研究采用LDA主題建模和時間序列分析來探究AIGC在教育領(lǐng)域內(nèi)的影響及其在公眾話語中的演變。LDA主題建模是一種基于概率模型的文本分析技術(shù),能夠從大量文本數(shù)據(jù)中識別出隱含主題,揭示公眾討論的潛在話題模式,對于理解難以直接觀察到的話題結(jié)構(gòu)至關(guān)重要[19]。時間序列分析是一種統(tǒng)計方法,用于分析和解釋隨時間變化的數(shù)據(jù)序列,能夠揭示數(shù)據(jù)隨時間變化的趨勢和模式,幫助識別和預(yù)測討論的時間動態(tài)[20]。結(jié)合上述方法,可以分析與AIGC相關(guān)的教育討論主題及其隨時間的發(fā)展,從而深入了解公眾討論的趨勢和周期性模式,全面捕捉AIGC在教育領(lǐng)域應(yīng)用的公眾關(guān)注和話語演變。
5 數(shù)據(jù)分析
本研究采用變分貝葉斯推斷的LDA算法進行主題建模,該算法是gensim庫中LdaModel的默認方法,適用于大規(guī)模文本數(shù)據(jù),能有效避免過擬合。在模型訓(xùn)練前,本研究使用Deveaud等[21]提出的基于詞分布自動估計潛在概念數(shù)量的方法,計算最佳主題數(shù)量:首先通過Bootstrap抽樣創(chuàng)建多個子數(shù)據(jù)集,并在Gensim庫中訓(xùn)練多個LDA模型,主題數(shù)從5~50不等;然后,利用Scikit-learn庫計算模型間的Jaccard相似度(J=1.0),確定最佳主題數(shù)量為5。得到最佳主題數(shù)后,就可以針對QT和AC分別訓(xùn)練深度LDA模型,并使用pyLDAvis庫將結(jié)果可視化。需要注意的是,LDA主題建模雖能有效揭示文本集合中的潛在主題,但由于忽略了詞序和上下文,有時主題含義不夠明確,因此需通過主題解釋和驗證方法來進一步分析其輸出[22][23]。這種方法將算法的客觀性與研究者的深度理解相結(jié)合,需要通過多名研究者的獨立審閱和討論,確保主題解釋的準確性和語義連貫性[24]。因此,研究團隊對相關(guān)數(shù)據(jù)進行了瀏覽和深入討論,具體步驟如下:三名研究者獨立審閱用于進行LDA主題建模的相關(guān)文本樣本;根據(jù)主題建模得出每個主題的核心內(nèi)容和可能的解釋并進行討論;通過多輪討論,對主題的命名和解釋達成一致意見。
此外,本研究基于每條數(shù)據(jù)的時間戳,利用Python的Pandas和Matplotlib庫對數(shù)據(jù)進行了時間序列分析:首先,按照日期對數(shù)據(jù)進行重采樣,統(tǒng)計每日的QT和AC數(shù)量,生成時間序列圖,并在圖中標(biāo)注與AIGC技術(shù)發(fā)展相關(guān)的重要日期(如GPT-4的發(fā)布時間、國內(nèi)主要AIGC產(chǎn)品的發(fā)布時間等)。然后,將時間戳按照季度進行劃分,結(jié)合詞頻統(tǒng)計,利用Python繪制詞頻熱力圖,從而直觀展示公眾關(guān)注與認知的時間變化。
三 結(jié)果與討論
1 LDA主題建模結(jié)果
通過LDA主題建模,本研究得到了QT和AC的網(wǎng)絡(luò)交互圖,如圖2、圖3所示,其中主題間距離的氣泡大小代表主題的相關(guān)程度,氣泡間的距離反映主題相似性,氣泡中的數(shù)字則代表主題序號。在圖2(a)中,1表示LDA主題建模網(wǎng)絡(luò)交互圖中所選的主題,其相關(guān)的前30個關(guān)鍵詞如圖2(b)所示,可以看出:主題1的關(guān)注點集中于ChatGPT對傳統(tǒng)教育的挑戰(zhàn),關(guān)鍵詞包括“ChatGPT”“教育”“學(xué)習(xí)”“教師”。而在圖3中,主題1的關(guān)注點則集中在ChatGPT對教育變革的影響,關(guān)鍵詞包括“ChatGPT”“學(xué)習(xí)”“論文”“文章”。
通過主題解釋和研究者的驗證,最終得到如表1、表2所示的主題分類,隨后計算主題連貫度(Topic Coherence,TC)為0.86。TC值可以衡量主題中高頻詞之間的語義相關(guān)性,反映了主題的連貫性和可解釋性[25]。表1、表2分別展示了QT和AC數(shù)據(jù)集的主題、主題標(biāo)簽、10個高頻率特征詞以及相應(yīng)的文本示例。為了確保主題的準確性和實際相關(guān)性,本研究基于10個高頻率特征詞閱讀了原始上下文的文本數(shù)據(jù),為每個主題指定一個切合其內(nèi)容的主題標(biāo)簽,最終總結(jié)出每個主題的含義并進行舉例。
(a)主題間距離 (b)主題1相關(guān)的前30個關(guān)鍵詞
圖2 "QT的LDA主題建模網(wǎng)絡(luò)交互圖
(a)主題間距離 (b)主題1相關(guān)的前30個關(guān)鍵詞
圖3 "AC的LDA主題建模網(wǎng)絡(luò)交互圖
2 公眾對AIGC在教育中影響及應(yīng)用的關(guān)注分析
如表1所示,QT數(shù)據(jù)集主要有5個主題:①AIGC(如ChatGPT)對教師教學(xué)帶來什么挑戰(zhàn),AIGC如何變革課堂學(xué)習(xí);②AIGC(如ChatGPT)對中美大學(xué)生的論文作業(yè)產(chǎn)生什么影響;③ChatGPT如何幫助學(xué)生高效學(xué)習(xí)英語和編程;④AIGC(如ChatGPT)給高等教育的學(xué)術(shù)倫理帶來哪些挑戰(zhàn);⑤AIGC(如ChatGPT)如何輔助中小學(xué)教師進行課程設(shè)計。從這些主題可以看出,公眾更加關(guān)注ChatGPT對教師職業(yè)和課堂學(xué)習(xí)的影響及應(yīng)用。其中,留學(xué)生關(guān)注其在中美論文寫作中的應(yīng)用差異;教師群體關(guān)注其教學(xué)輔助作用,尤其是在英語和編程學(xué)習(xí)中的應(yīng)用以及對個性化教學(xué)的支持。此外,還有部分公眾對AIGC可能帶來的負面影響表示擔(dān)憂,特別是學(xué)術(shù)倫理方面的問題。不少人質(zhì)疑,隨著ChatGPT這類AIGC工具的普及,學(xué)生可能會利用其完成論文和作業(yè),導(dǎo)致學(xué)術(shù)不端行為的增加。例如,有人提出:“國內(nèi)高校已有學(xué)生用ChatGPT寫論文,‘杰作’快趕上老師的水平,高校要如何防止‘AI作弊’?”,這種擔(dān)憂源于AIGC強大的生成能力,使學(xué)生可以輕易獲得高質(zhì)量的文本,傳統(tǒng)的抄襲檢測工具難以識別AI生成的內(nèi)容[26]。因此,這不僅加深了教育領(lǐng)域在學(xué)術(shù)誠信方面面臨的挑戰(zhàn),還限制了學(xué)生批判性思維的發(fā)展。這些挑戰(zhàn)在Iqbal等[27]的研究中也有所體現(xiàn),該研究分析了教師對ChatGPT在學(xué)生學(xué)習(xí)過程中可能產(chǎn)生負面影響的擔(dān)憂,如對自主學(xué)習(xí)能力的侵蝕、學(xué)術(shù)不端行為的增加等。此外,Extance[28]在Nature發(fā)表的文章中也探討了將大型語言模型(如ChatGPT)應(yīng)用于教育領(lǐng)域的挑戰(zhàn),表達了對AI作弊、過分依賴AI快速回答以及AI提供信息的準確性不足等擔(dān)憂。
綜合來看,公眾對AIGC在教育中的影響及應(yīng)用的關(guān)注點主要包括兩個方面:一方面,公眾關(guān)注AIGC技術(shù)對教師職業(yè)發(fā)展和課堂教學(xué)的輔助作用,以及在英語和編程學(xué)習(xí)、個性化教學(xué)中的應(yīng)用。同時,AIGC能夠提升教學(xué)效率、豐富教學(xué)資源,并且有助于滿足不同學(xué)生的學(xué)習(xí)需求,從而促進教育質(zhì)量的提高。另一方面,公眾也關(guān)注AIGC可能引發(fā)的學(xué)術(shù)倫理問題和對學(xué)生發(fā)展的負面影響,以及AIGC技術(shù)在教育應(yīng)用中的信息準確性和可靠性問題。由于AIGC可能生成不準確或者帶有偏見的信息,學(xué)生在未經(jīng)核實的情況下使用這些內(nèi)容,可能會被誤導(dǎo)和引發(fā)知識偏差,這也對教師的指導(dǎo)和監(jiān)督能力提出了更高的要求。
表1 "QT主題分類表
3 公眾對AIGC在教育中影響及應(yīng)用的認知分析
如表2所示,AC數(shù)據(jù)集主要有5個主題:①ChatGPT幫助搜索文獻資料,助力學(xué)術(shù)論文寫作;②ChatGPT對大學(xué)生批判性思維的影響;③AIGC時代,要培養(yǎng)學(xué)生的跨學(xué)科學(xué)習(xí)能力和創(chuàng)造性思維;④AIGC帶來的學(xué)術(shù)倫理與風(fēng)險挑戰(zhàn);⑤ChatGPT在科研領(lǐng)域中的應(yīng)用。可以看出,公眾對AIGC在教育中的影響及應(yīng)用有較為深刻的理解。公眾普遍認可ChatGPT這類AIGC工具在學(xué)術(shù)論文寫作和研究中的輔助作用,這反映了AIGC在提高學(xué)習(xí)效率和資源獲取方面的巨大潛力。同時,公眾也認識到在AIGC時代培養(yǎng)學(xué)生跨學(xué)科學(xué)習(xí)能力和創(chuàng)造性思維的重要性,這反映了公眾期待更加開放和靈活的學(xué)習(xí)環(huán)境。此外,公眾還認為,ChatGPT在科研中的應(yīng)用能夠促進科技創(chuàng)新,這反映了公眾對AIGC在教育中應(yīng)用的積極認知。但是,公眾同樣認識到AIGC對學(xué)生批判性思維的影響及其給學(xué)術(shù)誠信和倫理帶來的挑戰(zhàn),這一認知與公眾的關(guān)注點一致,公眾不僅關(guān)注AIGC給學(xué)術(shù)誠信帶來的挑戰(zhàn),同樣也認識到這一挑戰(zhàn)可能會對學(xué)生的批判性思維產(chǎn)生影響。
綜合來看,公眾不僅認識到了AIGC給教育帶來的機遇,也認識到了其帶來的挑戰(zhàn),這一全面的認知表明,在AIGC時代,教育界在充分利用新技術(shù)優(yōu)勢的同時,也要積極應(yīng)對可能出現(xiàn)的問題。
表2 "AC主題分類表
4 公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知的變化趨勢
為探究公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知的變化趨勢,本研究通過時間序列分析方法,對2022年12月~2024年4月期間公眾在知乎中針對相關(guān)主題的提問和搜索行為進行了逐月的分析,結(jié)果如圖4、圖5所示。
由圖4可知,在2022年12月期間,公眾的日均提問與搜索頻率約為0.31次,表明此時公眾對AIGC在教育中影響及應(yīng)用的關(guān)注度較低。可能是因為處于初期階段,AIGC尚缺乏廣泛的輿論討論和案例分享,公眾對新技術(shù)的心理預(yù)期較低。然而在2023年1月和2月,隨著ChatGPT 4.0、文心一言、智譜清言和GPT-4Turbo等新語言模型的發(fā)布,日均提問與搜索頻率顯著提升,尤其在2月下旬達到峰值,這凸顯了公眾對AIGC在教育領(lǐng)域影響及應(yīng)用的高度關(guān)注,揭示了公眾持續(xù)增長的興趣,顯示出公眾對AIGC技術(shù)在教育中應(yīng)用潛力的逐步認可。由圖5可知,2022年12月~2023年2月上旬,公眾針對“AIGC在教育中影響及應(yīng)用”相關(guān)問題的回答或文章的發(fā)布頻率較低,這可能是因為在技術(shù)發(fā)展的初期階段,公眾往往對新技術(shù)的實際價值和應(yīng)用場景缺乏直觀的理解與體驗,導(dǎo)致認知和討論熱度不高。而在2023年2月中下旬,知乎平臺中的相關(guān)討論達到高峰,主要原因是ChatGPT最初于2022年11月發(fā)布,還需要一定的時間才能夠被我國的公眾廣泛了解和關(guān)注,這種延遲可能受信息傳播、語言障礙、使用限制等因素的影響[29]。而在此之后,相關(guān)討論有波動但整體呈下降趨勢,原因可能是公眾逐漸適應(yīng)了AIGC帶來的沖擊,不再局限于網(wǎng)絡(luò)問答社區(qū),而是在更為廣泛的社交媒體中進行討論。
圖4 "QT時間序列分析 圖5 "AC時間序列分析
結(jié)合時間序列分析可以發(fā)現(xiàn),在以ChatGPT為代表的AIGC發(fā)布初期,公眾對其在教育領(lǐng)域的影響及應(yīng)用的關(guān)注相對較低,但這不意味著公眾對此沒有關(guān)注。有研究探討了公眾在國內(nèi)主要在線社區(qū)中對“ChatGPT+教育”的關(guān)注點、理解和態(tài)度,發(fā)現(xiàn)公眾對其關(guān)注是多元化的,主要包括ChatGPT作為教學(xué)助手角色的可能性、在教育應(yīng)用中存在的倫理風(fēng)險、對學(xué)生的學(xué)習(xí)管理與評估,以及對教育發(fā)展和決策的影響等問題[30]。然而,隨著ChatGPT 4.0和國內(nèi)眾多主流AIGC的發(fā)布,公眾對AIGC在教育中的影響及應(yīng)用的關(guān)注程度達到了高峰,其關(guān)注點與討論焦點變得更加多樣化,這一趨勢反映了公眾從對AIGC潛在教育應(yīng)用的初步了解已經(jīng)演變到對其深層次影響的積極探討。
圖6 "QT季度高頻詞匯熱力圖 圖7 "AC季度高頻詞匯熱力圖
為探究公眾在不同時間段關(guān)于AIGC對教育的影響及應(yīng)用的具體關(guān)注與認知情況,本研究根據(jù)QT與AC每個季度出現(xiàn)頻率前三的詞匯,結(jié)合AIGC、ChatGPT關(guān)鍵詞繪制了季度高頻詞匯熱力圖,如圖6、圖7所示。由圖6可知,公眾主要關(guān)注ChatGPT對教育的影響及其在學(xué)習(xí)中的應(yīng)用。特別是在2022年12月和2023年8月期間,公眾的關(guān)注度達到了高峰;而從2023年11月起,公眾關(guān)于ChatGPT對學(xué)習(xí)過程影響的關(guān)注度有所下降,說明隨著對AIGC工具的長期關(guān)注和使用,公眾逐漸掌握了AIGC的使用方法與技巧,從而降低了對ChatGPT這類AIGC工具的關(guān)注。這一趨勢揭示了在教育領(lǐng)域公眾對AIGC從初期的廣泛關(guān)注到逐步整合到日常教學(xué)實踐的過程,也反映了技術(shù)應(yīng)用從引發(fā)興趣到融入常規(guī)使用的自然演變。
由圖7可知,公眾對以ChatGPT為主的AIGC的認知貫穿于整個時間線,而關(guān)于AIGC對教育影響的認知集中在2023年3月~2023年5月,原因可能是ChatGPT 4.0版本的發(fā)布帶來了顯著的技術(shù)改進和新功能,進而吸引了公眾的廣泛關(guān)注。另外,公眾對AIGC在學(xué)生學(xué)習(xí)中的影響也進行了深入的討論,特別是在2023年2月,這一討論達到了一個顯著的峰值。盡管關(guān)于AIGC對學(xué)生學(xué)習(xí)影響的討論相對集中,但公眾對于AIGC可能對教師角色和教學(xué)方法帶來的變化關(guān)注相對較少。這表明公眾更多地關(guān)注AIGC技術(shù)對學(xué)生的影響,而對于教育者變革和調(diào)整的討論還有待進一步加深與擴展。
四 結(jié)語
本研究通過LDA主題建模和時間序列分析揭示了公眾對AIGC在教育中影響及應(yīng)用的關(guān)注和認知情況。研究發(fā)現(xiàn),公眾主要關(guān)注AIGC給教師教學(xué)、學(xué)生課堂學(xué)習(xí)方式帶來的挑戰(zhàn),對學(xué)術(shù)科研領(lǐng)域可能引發(fā)的作弊和學(xué)術(shù)不端行為,以及對中外大學(xué)生課程論文寫作的影響。公眾對AIGC在教育領(lǐng)域應(yīng)用的認知集中在對學(xué)生論文寫作輔助、跨學(xué)科學(xué)習(xí)能力、創(chuàng)造性思維和批判性思維的培養(yǎng)、對學(xué)術(shù)倫理的影響等方面。隨著時間的推進,特別是ChatGPT 4.0及中外各AIGC發(fā)布后,公眾對AIGC在教育中影響及應(yīng)用的關(guān)注與認知逐漸深化,并聚焦于對學(xué)習(xí)的影響。本研究從公眾角度解釋了AIGC對教育質(zhì)量、教學(xué)方法、學(xué)術(shù)誠信等方面可能帶來的長遠影響,為教育領(lǐng)域更好地適應(yīng)和應(yīng)對AIGC帶來的變革與挑戰(zhàn)提供了參考,但本研究也存在一定的局限性,如數(shù)據(jù)來源于單一的網(wǎng)絡(luò)問答社區(qū),這可能影響了結(jié)果的普遍性;將數(shù)據(jù)集劃分為問題與標(biāo)題、回答與文章可能存在信息片面和認知深度不足等問題。后續(xù)研究可擴展至多個網(wǎng)絡(luò)問答社區(qū)或跨文化環(huán)境,采用定性的方法深入探討個體的詳細觀點,同時重點關(guān)注其對教育公平和學(xué)術(shù)誠信的影響。
參考文獻
[1]Euchner J. Generative AI[J]. Research-Technology Management, 2023,(3):71-74.
[2]Rudolph J, Tan S, Tan S. ChatGPT: Bullshit spewer or the end of traditional assessments in higher education?[J]. Journal of Applied Learning and Teaching, 2023,(1):342-363.
[3]盧宇,余京蕾,陳鵬鶴,等.生成式人工智能的教育應(yīng)用與展望——以ChatGPT系統(tǒng)為例[J].中國遠程教育,2023,(4):24-31、51.
[4][27]Iqbal N, Ahmed H, Azhar K A. Exploring teachers’ attitudes towards using ChatGPT[J]. Global Journal for Management and Administrative Sciences, 2022,(4):97-111.
[5]Shoufan A. Exploring students’ perceptions of ChatGPT: Thematic analysis and follow-up survey[J]. IEEE Access, 2023,11:38805-38818.
[6]Li L, Ma Z, Fan L, et al. ChatGPT in education: A discourse analysis of worries and concerns on social media[J]. Education and Information Technologies, 2024,(29):10729-10762.
[7]焦建利,陳麗,吳偉偉.由ChatGPT引發(fā)的教育之問:可能影響與應(yīng)對之策[J].中國教育信息化,2023,(3):19-32.
[8]馮建軍.我們?nèi)绾慰创鼵hatGPT對教育的挑戰(zhàn)[J].中國電化教育,2023,(7):1-6、13.
[9]王景,李延平.ChatGPT浪潮下拔尖創(chuàng)新人才的培養(yǎng):價值意蘊、現(xiàn)實隱憂與生態(tài)重塑[J].中國電化教育,2023,(11):62-71.
[10]閆利利,侯虹印.ChatGPT道德感與高教德育的技術(shù)限度問題[J].中國電化教育,2023,(11):72-82.
[11]吳軍其,吳飛燕,文思嬌,等.ChatGPT賦能教師專業(yè)發(fā)展:機遇、挑戰(zhàn)和路徑[J].中國電化教育,2023,(5):15-23、33.
[12][30]劉天麗,楊現(xiàn)民,李康康,等.社會公眾如何看待“ChatGPT+教育”?——基于國內(nèi)主流開放社區(qū)的文本分析[J].現(xiàn)代教育技術(shù),2023,(10):14-23.
[13]秦亞,王達.知乎:讓青年找到向上的答案[J].中國記者,2022,(6):30-33.
[14]呂洋,朱紫怡,郭星硯,等.在線問答平臺中基于回答質(zhì)量的用戶排序模型——以“知乎”為例[J].數(shù)理統(tǒng)計與管理,2023,(5):761-774.
[15]國家互聯(lián)網(wǎng)信息辦公室.國家互聯(lián)網(wǎng)信息辦公室關(guān)于《網(wǎng)絡(luò)數(shù)據(jù)安全管理條例(征求意見稿)》公開征求意見的通知[OL]. lt;https://www.cac.gov.cn/2021-11/14/c_1638501991577898.htmgt;
[16]McCombs M E, Shaw D L. The agenda-setting function of mass media[J]. Public Opinion Quarterly, 1972,(2):176-187.
[17]Neisser U. Cognitive psychology: Classic edition[M]. East Norwalk, CT, US: Appleton-Century-Crofts, 2014:23-24.
[18]Sievert C, Shirley K. LDAvis: A method for visualizing and interpreting topics[A]. Proceedings of the Workshop on Interactive Language Learning[C]. Baltimore, Maryland, USA: Association for Computational Linguistics, 2014:63-70.
[19]Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003,(1):993-1022.
[20]Yule G U. On a method of investigating periodicities in disturbed series, with special reference to wolfer’s sunspot numbers[J]. Philosophical Transactions of the Royal Society of London. Series A, Containing Papers of a Mathematical or Physical Character, 1927,226:267-298.
[21]Deveaud R, SanJuan E, Bellot P. Accurate and effective latent concept modeling for ad hoc information retrieval[J]. Document Numérique, 2014,(1):61-84.
[22]Chang J, Gerrish S, Wang C, et al. Reading tea leaves: How humans interpret topic models[J]. Advances in Neural Information Processing Systems, 2009,32:288-296.
[23]Maier D, Waldherr A, Miltner P, et al. Applying LDA topic modeling in communication research: Toward a valid and reliable methodology[J]. Communication Methods And Measures, 2018,(10):93-118.
[24][25]Mimno D, Wallach H, Talley E, et al. Optimizing semantic coherence in topic models[A]. Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing[C]. Edinburgh, Scotland, UK.: Association for Computational Linguistics, 2011:262-272.
[26]Khalil M, Er E. Will ChatGPT get you caught? Rethinking of plagiarism detection[A]. International Conference on Human-Computer Interaction[C]. Cham: Springer Nature Switzerland, 2023:475-487.
[28]Extance A. ChatGPT has entered the classroom: How LLMs could transform education[J]. Nature, 2023,(7987):474-477.
[29]Zhang X, Li D, Jiang Z, et al. From ChatGPT to China’ sci-tech: Implications for Chinese higher education[J]. Beijing International Review of Education, 2023,(3):296-314.
Research on the Concerns and Cognition of the Public in Online Qamp;A
Communities Regarding the Impact and Application of AIGC on Education
——LDA Topic Modeling and Time Series Analysis
CHAI Shao-Ming1 " "HE Zhen-Hai2[Corresponding Author] " "LI Zuo-Kun3
(1. Aberdeen Institute of Data Science and Artificial Intelligence, South China Normal University, Foshan, Guangdong, China 528225; 2. School of Information Technology in Education, South China Normal University, Guangzhou, Guangdong, China 510631; 3. Faculty of Education, University of Macau, Macao, China 999078)
Abstract: Currently, the transformations in the field of education brought about by artificial intelligence generated content (AIGC) represented by ChatGPT have attracted widespread attention from various experts and scholars. However, few studies have explored the public’s concern and cognition on the impact and application of AIGC in education from the perspective of online question-and-answer communities. Therefore, through LDA topic modeling and time series analysis, this paper investigated questions and articles related to AIGC and education on Zhihu platform from December 6, 2022, to April 9, 2024. The results of the LDA topic modeling indicated that the public’s attention and perception were mainly concentrated on challenges faced by teachers’ teaching and students’ classroom learning, the challenges to academic ethics posed by AIGC, the impacts of AIGC on students’ critical thinking and interdisciplinary learning abilities, and comparisons between domestic and foreign university students in using AIGC to complete essays and assignments. The time series analysis revealed that public’s attention and perception on the impact and application of AIGC in education peaked from February to March 2023, with the main focus on the impact of AIGC on students’ learning. Through this research, the paper was expected to provide reference for the educational field to better adapt to and address the transformations and challenges brought about by AIGC.
Keywords: AIGC; ChatGPT; education; online Qamp;A communities; concern and cognition
*基金項目:本文為廣東省教育科學(xué)規(guī)劃課題(高等教育專項)“教育數(shù)字化轉(zhuǎn)型背景下生成式人工智能賦能高校教學(xué)改革與創(chuàng)新的路徑”(項目編號:2023GXJK266)、廣東省哲學(xué)社會科學(xué)規(guī)劃2024年度一般項目“數(shù)字化轉(zhuǎn)型背景下生成式人工智能高等教育應(yīng)用的倫理風(fēng)險與治理路徑研究”(項目編號:GD24CJY33)的階段性研究成果。
作者簡介:柴少明,副院長,教授,博士,研究方向為人工智能教育應(yīng)用、計算機支持的協(xié)作學(xué)習(xí)(CSCL)、學(xué)習(xí)科學(xué)與技術(shù)和知識建構(gòu)等,郵箱為charmingchai@m.scnu.edu.cn。
收稿日期:2024年4月27日