



DOI:10.3969/j.issn.1673-8454.2023.12.004
作者簡介:賈積有,北京大學教育學院教授、博士生導師,博士(北京 100871);王光迪,北京第二外國語學院漢語學院碩士研究生(北京 100024)
基金項目:全國教育科學規劃2022年國家一般項目“基于大數據挖掘的學生智能評測和輔導研究”(編號:BCA220208)
摘" "要:教育科學研究中經常采用訪談調查法,通過對訪談文本進行內容分析以滿足研究的需要,傳統的訪談文本分析依賴人工逐一編碼和標注,費時費力。而大語言模型因其強大的自然語言處理能力,為自動化處理教育訪談文本提供一種新的可能?;谝阅硠摽徒逃椖繛橹黝}的學生訪談文本內容,利用大語言模型對初始訪談文本進行預處理、提煉摘要式總結,歸納出一套針對教育訪談文本處理的提示詞框架。研究結果表明,應用大語言模型自動化處理教育訪談文本不僅可行,而且快速有效;提出的提示詞框架可以生成一份基于初始訪談文本,簡明扼要、主題清晰、信息要素齊全的高質量摘要式總結。
關鍵詞:大語言模型;提示工程;生成式人工智能;訪談法;教育技術
中圖分類號:G434" " " " "文獻標志碼:A" " " " "文章編號:1673-8454(2023)12-0034-08
一、引言
訪談法是教育研究中常見的重要手段。在教育研究中,通過訪談法收集到的資料被研究者整理成訪談文本并進行文本挖掘,得到的信息經處理后能成為后續教育評估和教育決策的參考依據。因此,合理科學地使用訪談法,高效精準地處理訪談文本也是教育研究者必備的專業素養之一。
然而,在實際運用訪談法進行科研的過程中,教育研究者會發現訪談法具有一定局限性。除了訪談者和訪談內容本身的主觀性、不全面性等專業領域的針對性問題,由于訪談內容的靈活性和訪談環境的不確定性,初始訪談文本往往呈現重點內容和非重點內容混雜的狀態,需要人工耗費大量的時間和精力進行編碼標注、厘清訪談線索、總結訪談焦點,因此,對訪談文本的后續處理是所有采用訪談法的科研人員都要面臨的普遍性問題。
同時,人工智能等新技術蓬勃發展,正在催生新型教育形態?!吧墒饺斯ぶ悄堋痹诿绹叩冉逃畔⒒瘏f會(EDUCAUSE)于2023年5月8日發布的《2023地平線報告(教與學版)》(2023 EDUCAUSE Horizon Report: Teaching and Learning Edition)中被列為影響未來高等教育領域的關鍵技術與實踐。[1]而大語言模型(Large Language Model,LLM)是生成式人工智能的代表。在教育場景中,大語言模型為教育研究人員高效處理并分析大規模的教育數據和文本資料提供一種新的可能,相較于人工處理訪談文本,它展現出更大的優勢,包括自動化處理效率高、耗時短,以及在結合提示工程(prompt engineering)的基礎上個性化處理訪談文本,進一步提高訪談文本的分析質量。
基于此,本文將介紹在教育場景下應用大語言模型對訪談文本進行文本預處理和總結分析的方法,歸納展示一套針對教育訪談文本處理的提示詞框架,以期為探究應用大語言模型自動化處理大規模教育訪談文本的路徑提供參考。
二、訪談文本的相關研究
在教育領域,訪談文本具有重要的研究價值。首先,分析訪談文本可以深入了解學生和教師的觀點和反饋,從而更好地揭示學生和教師在教育過程中面臨的需求和問題,發現教育體系的薄弱環節、學生的學習障礙、教師的需求等,為改進教育政策和實踐提供指導。其次,訪談文本能夠反映教育實踐的有效性,通過訪談參與者的回答和觀點,教育研究者可以了解教育項目,以及課程或政策對學生學習成果、興趣和參與度的影響,有助于提高評估教育實踐的質量,為改進和優化教育提供依據。最后,訪談文本還可以為教育改革和創新提供理論和實踐的支持,為促進教育研究和理論構建提供豐富的實證材料。因此,對訪談文本進行高質量的科學分析至關重要。
(一)訪談文本的構成特點
本研究分析的訪談文本來自對8所小學參加創客教育學生的訪談錄音,訪談采取半結構化方式,以集體訪談的形式進行。文中涉及的訪談文本具有以下特點:
第一,訪談文本重點和非重點內容混雜。半結構化方式指的是訪談者根據具體情況隨時調整訪談方案,在把握訪談大綱的基礎上鼓勵受訪者積極自由表達,以獲取更豐富的材料。集體訪談指的是一個訪談者面對多個訪談對象進行訪談。這種訪談形式具有較高的開放性和自由度,允許訪談者在核心問題基礎上進一步探索和追問,受訪者也相應提供更深層次的觀點經驗、更細致的思考過程和動機背景。訪談者提問具有較大的靈活性,同時每個受訪者的生活經驗不同,對同一事物所觀察到的細節和所感受的體驗不同,基于他們個性化的認知特點,在面對相似的訪談問題時發揮程度也各有不同,所以,訪談文本篇幅往往字數不一,且獲取的反饋信息的質量水平和思維深度參差不齊。
第二,原始文本信息要素模糊。訪談過程中可以對訪談對象進行觀察,包括訪談對象在表述觀點或陳述事實時的言辭、語氣、神態、動作等,利于判斷訪談對象的說法可信度、全面性等,而在后期對訪談內容進行文本轉錄時會損失一部分可能透露重要信息的表情、語氣、動作等非文字性元素,增加訪談雙方的口頭禪、重復表達、環境噪音等冗余信息。同時,語音識別準確率的技術缺陷也會導致訪談文本中出現錯別字、術語誤用、標點符號缺失、信息缺失等問題。
(二)訪談文本的處理方法
質性研究中經常采用扎根理論,即研究者以實際觀察入手,從系統收集到的原始資料中歸納出經驗概括,尋找反映社會現象的核心概念,然后上升到建構出概念之間關聯的理論。對資料進行逐級編碼是扎根理論操作程序中最重要的一環,對訪談文本的處理遵循“開放式登錄—關聯式登錄—核心式登錄”的編碼典范,即研究者根據訪談大綱回收資料后將問題錄入記錄表,并逐步歸納主題、進行編碼,直到明確邏輯關系、提煉出核心理論?,F有很多可視化工具或軟件能夠幫助研究者進行文本資料的質性分析和量化分析,如MAXQDA 2018、NVIVO、ATLAS.ti等。
三、大語言模型相關研究
(一)大語言模型及提示工程
大語言模型是指對文本語料庫進行自監督學習的基于Transformer架構的深度神經網絡模型,它可以自動提取語言特征,并生成符合語言習慣的新文本。[2]它作為由人工智能技術驅動的信息獲取新工具,功能遠遠超過以往的任何檢索搜索工具。[3]
對于部署成本頗高的大語言模型,人們不追求以修正模型參數的方式滿足任務需求,而是采取提示詞(prompt)模式。提示工程(prompt engineering)是一種通過提供初始文本提示詞或問題來引導模型生成所需的響應或輸出的技術。這種方法允許用戶以自然語言的形式與模型進行對話或交互,并通過提供適當的提示詞來引導模型生成期望的回復。提示工程的發展使大語言模型的輸出更加可控和可預測,能提高人機交互的效率和準確性。在提示工程領域,已有提示類型包括任務性提示、示例性提示、限定性提示、個性化提示等不同的方式。其中任務性提示和示例性提示是提示工程中最常見的兩種方式,是非常適合作為訪談文本處理的提示方式。任務性提示為指導大語言模型提供特定的任務輸出,如在分析訪談文本過程中提出提示任務“請為以下訪談文本生成一個總結”。示例性提示指在提示中提供特定的示例,控制大語言模型的文本生成,如在進行訪談文本預處理時,給出規范的優化文本作為參考,以人工修改后的文本為標準進行提問,從而提高回答質量。
(二)應用大語言模型處理教育訪談文本可行性分析
用戶可以通過自然語言指令直接與大語言模型進行交互,簡化任務的執行過程,降低人們利用人工智能技術處理任務需求的門檻。在教育研究和評估領域,通過構建優質的提示工程,大語言模型可以發揮以下作用:
1.文本糾錯和文本處理
大語言模型通過學習大量的文本數據,可以自動識別和糾正文本中的錯別字、常見的口頭禪、冗余的語氣詞和重復的表達,并根據上下文和語言規則推斷出更合適的表達方式,使文本更加清晰和精練。使用特定的提示詞對訪談文本進行預處理時,大語言模型能夠通過對訪談文本進行分析和比對,根據上下文和語法規則推斷初始訪談文本中存在的錯別字、生造術語、無意義的口語化表達等文字問題,去除冗余信息,保留有效信息,提高后續處理的準確性。
2.數據分析和文本挖掘
大語言模型能夠從大量的訪談文本中發現、提取,以及理解有價值的知識、模式和關聯信息,快速提取大規模訪談文本中的重點內容,把握受訪者情感態度,并結構化組織文本中的關鍵信息,呈現必要的細節。在教育訪談文本分析過程中應用大語言模型構建知識庫并提取出關鍵信息,為研究人員快速了解受訪者的觀點、綜合各研究結果進行進一步的分析總結提供知識支持。同時,大語言模型還能根據文本的上下文和語義信息,識別出訪談文本中的主題和話題并進行分類,有助于研究人員了解訪談的覆蓋范圍和焦點問題,明確訪談線索。另外,通過對訪談長文本進行情感分析,大語言模型可以識別出文本中的情感傾向,如正面、負面或中性情感,有助于研究人員了解受訪者在訪談中表達的情感態度傾向,為全面分析受訪者的觀點和意見提供數據支持。
3.成為更好的編碼輔助工具
在對訪談文本進行編碼時,除了分析文本本身內容之外,提取訪談主題的意義和價值時,需要還原訪談小場景和社會大背景,復雜的現實因素應納入主題歸納考慮之中。大語言模型具備世界知識能力,包括事實性知識(factual knowledge) 和常識(commonsense)。[4]而傳統的編碼輔助軟件并不具備這樣的能力,可能存在細節信息提取失真的問題。同時,大語言模型處理訪談文本還展現出相較于人工的突出優勢。一是自動化處理效率高。大語言模型是自動化的文本分析工具,不需要像人工一樣逐一閱讀和分析每個文本樣本,通過調用應用程序接口(Application Programming Interface,API)的手段,可以在較短時間內完成大量的分析任務。二是低技術門檻的交互方式。通過利用簡單直觀的自然語言指令,不具備專業技術背景或深入的領域知識的教育研究新手也可以利用大語言模型來分析教育訪談文本,隨時調試需求和控制模型輸出。
四、應用大語言模型處理訪談文本
(一)研究內容
本研究分析的訪談文本整理自對8所山西省和陜西省的小學生的訪談錄音。訪談主題為學生參加學校里創客教育項目的感想體會,訪談采取半結構化方式,以集體訪談的形式進行,錄音轉錄后得到總數為37,440字的8份初始訪談文本。訪談文本處理工具為ChatGPT3.5 turbo大語言模型,ChatGPT的全稱是聊天生成預訓練轉換器(Chat Generative Pre-trained Transformer),是美國人工智能實驗室OpenAI公司開發的人工智能聊天機器人程序。[5]
(二)研究方法
使用大語言模型處理訪談文本主要包含三個步驟:一是預處理文本,二是總結訪談文本內容,三是生成摘要式綜合總結,流程如圖1所示。其中,基于上文提到的提示類型,本文對不同提示做研究和調整,構建三個提示工程的提示類型如表1所示。
1.初始訪談文本預處理
預處理階段采用提示工程一。提示工程一包括兩組提示詞。第一組提示由一個任務性提示和一個單一樣本學習(one-shot learning)示例性提示組成。單一樣本學習可以讓大語言模型明確訪談文本優化的標準,如標注句末標點、整合同一說話人的訪談內容、去除重復表達等,是在文本預處理階段使用效果最好的提示方式。
(1)任務性提示
請按照以下要求對訪談文本進行優化:
①去除文中重復詞語和句子。
②去除漢語常見口頭禪,如“這/那個”“呃”“就是”“然后”等。
③改正錯別字和相關術語。
④加上合適的漢語標點符號,保持原來的分行。
(2)單一樣本學習示例性提示
例如:
訪談文本:
都學習過了
那
還有那個涂染
涂染 濕度的什么
火焰
火焰
那是溫度的那種傳感器
溫度也試過
溫度是試過的
那這種嘗試就是在老師的這個指導之下
然后做一個項目的過程中去使用到的是嗎
那就是有沒有比如說自己有一些想法的過程之中
會想著比如說我們在課下或者是完成老師任務之后
去做一個什么樣的東西
優化后文本:
都學習過了。
還有那個涂染、濕度的什么?
火焰。
那是溫度的那種傳感器。
溫度也試過。
溫度是試過的。
那這種嘗試在老師的這個指導之下,做一個項目的過程中去使用到的,是嗎?
那有沒有比如說自己有一些想法的過程之中會想著我們在課下或者是完成老師任務之后去做一個什么樣的東西?
訪談文本:
第二組提示由一組重復的任務性提示組成。ChatGPT3.5 turbo大語言模型單次處理文本限制為1,500到2,000個漢字,需要對各個訪談文本進行切分,該組提示重復到對單個訪談文本處理完結束。
(1)任務性提示
請按照以上要求優化以下訪談文本:
(2)任務性提示
請按照以上要求優化以下訪談文本:
……
預處理階段結束之后將得到8份優化后的訪談文本。為測試大語言模型的預處理質量,本研究對比對同一訪談文本進行人工預處理和大語言模型預處理兩種方式的文本相似度,如表2所示。由于人工預處理根據訪談錄音補充了訪談文本細節,而大語言模型是基于原本轉錄文字材料進行刪減,所以預處理后字數出現一增一減的情況。但是高達77.02%的文本相似度說明,提示工程一操作大語言模型執行文本預處理任務的結果具有較高可信度。
2.分總結
分總結階段使用提示工程二。提示工程二由一組重復的任務性提示組成,同樣囿于大語言模型單次處理字數限制,需要對每個優化后的訪談文本進行切分,該組提示重復到對單個訪談文本處理結束。該階段處理完畢之后將得到8份針對各個優化后訪談文本的分總結。
(1)任務性提示
請對以下訪談文本進行總結:
(2)任務性提示
請對以下訪談文本進行總結:
……
3.綜合總結
提示工程三是對所有分總結進行摘要式綜合總結。由于大語言模型的交互形式為單輪對話,而任務需求是對超出單次處理字數限制的多個文本進行一次性總結,所以提示工程三由一組形成多輪對話的閉合式任務性提示組成。提示工程三的任務性提示一中,對話次數根據處理訪談文本個數進行修改,該提示重復次數和處理訪談文本個數相等。
(1)任務性提示一
接下來的8次對話中,我每次發給你一個總結,請在每次收到后回復“好的”。
①分總結一
②分總結二
……
(2)任務性提示二
請綜合以上8個總結進行綜合總結。
(三)研究結果
根據每一步研究需求,最終設計出一套針對教育訪談文本處理的提示工程框架,如表3所示。
根據該提示工程框架提煉出一份簡明扼要、主題清晰、信息齊全的摘要式總結。以下內容為應用大語言模型采用上文流程對8個訪談文本的摘要式綜合總結生成的結果:
學生積極參與創客活動,并通過創客課程和比賽展示自己的學習成果。他們對創客活動持有積極態度,認為它有趣且簡單,能夠培養他們的動手能力和創造力。學生喜歡教師的指導和任務安排,并計劃參加比賽展示自己的作品。他們通過學習編程和手工技能不斷提高自己,并希望在未來的課程中挑戰和超越其他案例。
學生在創客課程中使用機房電腦進行編程,并完成多個項目。他們喜歡使用模塊拼裝的方式學習編程,并通過觀看視頻教程、向教師或同學請教來學習。小組合作是他們喜歡的學習方式,通過討論和合作來完成任務。在創客課程中,學生的思維能力、問題解決能力和創新思維得到提升。他們希望未來的課程能包括更多有趣的內容,如游戲編程,并提出一些自己想要制作的項目。學生的家人對他們參與創客活動持支持態度,并認為這是一種新穎的學習方式。
綜合來看,學生通過積極參與創客活動,在實踐項目、小組合作和教師指導下,能提高編程技能和創新能力。他們對未來的課程和項目有積極的期望,并得到家人的支持和認可。這些訪談能使我們深入了解學生在創客課程中的經驗獲得和未來的發展方向。
這段摘要式綜合總結表達清晰,內容簡潔明了,沒有冗余的詞語和句子,以客觀的角度描述學生在創客活動中的積極參與和成果展示,突出他們對創客活動的態度和認可。文中基本以事實為基礎,提到學生使用機房電腦進行編程、喜歡小組合作、通過討論和合作來提高思維能力、問題解決能力等細節。說明大語言模型對訪談文本的重點內容的抓取、受訪者情感態度的把握、關鍵信息的組織方面表現較好。
五、總結與展望
研究表明,針對教育領域常見的訪談文本處理問題,使用大語言模型作為文本分析工具具有一定的現實價值。總體而言,應用大語言模型對教育訪談文本進行分析具有以下特點。
第一,耗時短且效果佳。大語言模型具備強大的自然語言處理能力,可以高效地分析大規模的教育訪談文本。相比使用傳統的編碼輔助軟件結合人工的內容分析方法,使用大語言模型能節省大量的時間和人力成本,并且能夠提供高質量的分析結果,顯然具有很大優勢。
第二,交互簡單易上手,提示工程具有普遍性。通用型大語言模型可以應用于各個領域的文本分析,包括教育領域的訪談文本,它的推廣也意味著可以廣泛應用于不同的教育研究和實踐場景。同時,自然語言指令的交互方式使分析過程更加直觀和對用戶友好,每一個人都可以借鑒這套提示工程框架指導大語言模型個性化地執行私人文本分析任務。
需要注意的是,盡管大語言模型具備極大的潛力和應用價值,但它目前仍然存在一些教育應用和倫理問題。包括且不限于:①真實性難以保證,存在算法隱藏、文化偏見現象。[6]雖然大語言模型相較于傳統編碼軟件已經具備更加完善的世界知識,但仍需使用者明確文本分析的目的要求、仔細甄別分析結果中是否存在虛假內容。②傾向于生成模棱兩可的回應。大語言模型作為一個大規模的語言模型,只能在數據的基礎上對人類的語言行為進行模仿,內容隨機、不透明、不可控。[7]
有學者認為,如果人工智能將導致人類的終結,那么在教育中使用人工智能可能會加快人類終結的到來。因此,對人工智能在教育中的應用應當慎之又慎。[8]也有學者認為,我們應該保持開放,擁抱技術變革,不故步自封,不過早下結論。[9]作為教育研究者,應該具備足夠的人工智能素養,擁有以開發、實施,以及使用人工智能技術為核心的知識、技能和價值觀,[10]在應用大語言模型提升研究效率的同時應遵守社會倫理道德規范。
參考文獻:
[1]EDUCAUSE. 2023 EDUCAUSE horizon report: teaching and learning edition[EB/OL]. (2023-05-08)[2023-10-18]. https://library.educause.edu/resources/2023/5/2023-educause-horizon-report-teaching-and-learning-edition.
[2]克勞斯·邁因策爾,賈積有,張譽月.ChatGPT和人工智能:從基本原理到教育應用[J].北京大學教育評論,2023,21(1):35-48,188.
[3]李志民.ChatGPT本質分析及其對教育的影響[J].中國教育信息化,2023,29(3):12-18.
[4]朱光輝,王喜文.ChatGPT的運行模式、關鍵技術及未來圖景[J].新疆師范大學學報(哲學社會科學版),2023,44(4):113-122.
[5]KEVIN ROOSE. The brilliance and weirdness of ChatGPT[N]. The New York Times, 2022-12-05.
[6]楊海燕,李濤.ChatGPT教學應用:場景、局限與突破策略[J].中國教育信息化,2023,29(6):26-34.
[7]賈積有,張譽月.人工智能與教育:機遇、挑戰與對策[J].北京大學教育評論,2023,21(1):49-61,188-189.
[8]譚偉,張曼茵,陳良.人工智能應用于教育的風險及其應對[J].中國教育信息化,2023,29(7):22-29.
[9]焦建利,陳麗,吳偉偉.由ChatGPT引發的教育之問:可能影響與應對之策[J].中國教育信息化,2023,29(3):19-32.
[10]韋恩·霍姆斯,孫夢,袁莉.人工智能與教育:本質探析和未來挑戰[J].中國教育信息化,2023,29(2):16-26.
Analyzing Educational Interview Texts Using Large Language Model
Jiyou JIA1, Guangdi WANG2
(1.School of Education, Peking University, Beijing 100871;
2.Chinese Language Institute, Beijing International Studies University, Beijing 100024)
Abstract: The method of Interview survey is often employed in educational scientific research, and content analysis of interview texts is carried out to meet research needs. Traditional interview text analysis relies on manual coding and annotation, which is time-consuming and laborious. Large language model has strong natural language processing ability, which guarantees a possibility for automatic processing of educational interview text. Taking the semi-structured interview texts collected from eight primary schools in a maker education project as an example, this study uses a large language model to preprocess the initial interview texts, extract summary, and conclude a set of prompt word framework for text processing of educational interviews. The results show that it is feasible to apply the large language model to the automatic processing of educational interview texts, and the effective construction of prompt word frame can generate a concise, clear and comprehensive high-quality summary based on the initial interview text.
Keywords: Large language model; Prompt engineering; Generative artificial intelligence; Interview methods; Educational technology
編輯:王天鵬" "校對:王曉明