本刊特邀記者 劉 凱 王 韶 隆 舟 屈 靜
記者:格雷澤教授,您好。很高興您能接受我們的學術專訪。您在教育技術學領域,尤其在智能導學系統(ITS)研究領域,可謂名聞遐邇。今天訪談的主題主要圍繞三方面展開:一是基于個人視角概述您的研究工作;二是請您回應幾個熱點問題,因為您的經驗和見解也許能對中國同仁有幫助和啟發;三是請您簡評自己的學術生涯。
格雷澤教授:在全球范圍內,學校都在應對數字技術進課堂的挑戰,但教師通常沒有作好準備,這個挑戰異常嚴峻。雖然好于傳統教學的解決方案不少,但只要教師沒有理解、接受或使用,那么一切都將枉然。所以,教師培訓是重中之重。此外,情緒管理、小組探究或互動指導等有益于教學的非技術方法也很多,但教師仍缺乏足夠的訓練。教師很少接受如何引導和利用學生情緒或協作解決問題的培訓。他們不了解信息技術不足為奇,但我們面對的挑戰是巨大的。
中國也許可以解決這些問題,通過師資培訓或職業發展靈活、有針對性地提升教師能力。但是,美國的發展步子非常緩慢,原因可能是:一,教師工資普遍偏低,教育職業缺乏吸引力。相對而言,中國教師的平均收入更可觀;二,很多教師雖然接受過培訓,但培訓內容未涉及信息技術。為了學習新知或提升新技能,他們需要通過進修不斷充電;三,學生是社交媒體、電視、電影院、計算機和數字游戲的“原住民”,師生代際差異也是難點之一。
再談談情緒,這是極為重要的問題。人非草木孰能無情,但直到最近十年,人們才真正了解如何應對學習者情緒。過去,教師沒有受過指導如何處理自己的情緒,也沒有正確地關注情緒。他們了解氣憤、欺凌以及興奮和煩惱,但不明白困惑、挫敗和無聊。比如,我和同事悉尼(Sydney)及德梅羅(Demerol)對比研究學習者主觀情緒感受與教師和專家觀測之間的差異,經常發現一個問題:詢問學生感受時,他們會說“我覺得很無聊”,但教師卻認為學生此時正積極參與。實際上,半數情況下,學習者感到無聊時,教師都以為他們正在積極思考。其原因部分在于,人們不會將無聊寫在臉上。我們發現,無聊、集中思想或不無聊也不集中思想時,人們的表情沒有顯著差別。所以,教師觀察學生的面部表情,并不總能起作用。困惑具有顯著表情標記——好似一頭霧水。事實上,困惑和驚奇情緒一看便知,但挫敗感不易察覺。由于教師沒有受過如何閱讀情緒的訓練,他們通常只能覺察生氣、憤怒和悲傷等生存性情緒,卻不知如何辨識與學習密切相關的情緒。
而且,教師不僅閱讀情緒有困難,回應情緒也存在不足。事實上,我曾在這個問題上申請過專利。以困惑為例,我們都希望學生能夠自主思考,也希望學生感到困惑,因為困惑能促進深度思考,但教師的想法是“既然他們感到困惑,我最好把問題變得簡單一點,或者直接公布答案吧”。教師希望擺脫困惑局面,但這絕非處理困惑情緒的最佳方法,反倒應希望學生盤桓在一種理想的困惑中。不過,應對持續的困惑并不容易。如果學生正在汲取知識,我們希望他們保持困惑,因為他們可能由此作出有益的推理及解決問題的嘗試。當他們攻克難題,會非常欣喜。如果能力不足,就可能放棄。盡管我們對此已有所知,但世界上幾乎沒有教師受過相應的培訓,索性可以編制電腦程序完成這項任務,或通過AutoTutor系統訓練人類教師。
記者:AutoTutor系統能幫助教師開展教學?
格雷澤教授:是的。我們可以通過數字技術訓練教師。例如,系統展示不同情緒的學生,然后讓教師預測相應情緒,以此練習情緒識別。同樣,數字技術也可以訓練教師回應情緒。運用數字技術助力職業發展是個全新的領域,盡管它還處于起步階段,但很有發展潛力。
在團隊中,個人提議不會總被他人采納,所以困惑和失望情緒很常見。這也是小組學習常有負面效果的原因。例如,皮埃爾·迪倫巴克(Pierre Dillenburg)曾記錄團隊情緒變化軌跡。在團隊成立初期,成員間交流常帶來積極影響,大家因此相互了解,一切都很和諧。然而,當團隊目標確定后,成員間可能對同一問題提出不同的解決方案,而方案的復雜性和視角的多樣性往往很難用某種簡單的辦法解決。當觀點沖突嚴重時,團隊就會放棄嘗試甚至解散。不過,如果成員間最終達成共識,此時又會帶來積極影響。
因此,情緒和團隊活動非常重要。我們應該如何制定社交互動的規范和策略?比如,團隊活動中,我們不直接舍棄個人提議,而是吸收其中的恰當內容,這樣建議者就會覺得自己作了貢獻。試想,如果某人分享一個為之驕傲的好主意,那么在得到反饋“這主意真是太糟糕了!我們才不會這么做”與“我喜歡你提議中的第三步,應該把它考慮進去”之間,當事人的感受會有天壤之別。即使該倡議不是最終方案,只要可能是其中的一部分,上述規范和策略就能促進團隊協作。該領域前景廣闊,畢竟全世界都想知道如何才能實現有效的團隊合作,但相關研究少得可憐。常見的例子是,團隊的兩個成員意見產生分歧時,應該如何應對和處理?遺憾的是,人們沒有受過指導該如何解決協作問題,世界上也沒有專門教授協作的課程。事實上,學校應當提供相關培訓,方法之一便是運用虛擬會話代理,將受訓者編入虛擬小組中,嘗試解決爭端。我們可以預設多種角色,制造多種沖突,觀察受訓者如何處理,還可以設置旁觀者。而這些都能通過虛擬代理加以引導和訓練,教師和學生均可使用。這一方向仍是有待探索的處女地。
記者:這需要使用對話分析,您曾提出一對一虛擬對話教學五步驟,在多人情況下是否也有章可循?
格雷澤教授:是的,可以用虛擬代理訓練學生或教師如何使用語言開展小組互動。我總結了不同情境的八條產生式規則,這里列舉幾項。假設團隊中有個學生不愛說話,缺乏行動的勇氣或主動性,我們就可在團隊中增設一位虛擬導師。
其中的規則之一是,如果某人不說話,導師會主動問他“你怎么看?”“你的任務完成了嗎?”或“你還有任務沒完成嗎?”,目的是將其置于任務焦點下。而對那些滔滔不絕的學生,導師可以說“你說得對。不過,我很好奇其他人怎么看?”,從而擴散會話,了解其他成員的想法。假如大家沒有專心解決問題,只是在閑聊,這時可以讓虛擬代理說“好的,現在請大家回到手頭的工作上來”。今天,借助人工智能技術,我們能實時監測某人的發言是否與主題相關。如果持續閑聊,虛擬導師會打斷并指出“我不知道這與主題有什么關系”。另一個問題是,一旦有人說臟話或者言辭過激,即發言不當或不專業,系統會提醒“請別說這種話,我們還有正事要做呢”。
當小組成員的意見發生分歧時,解決辦法之一是找到分歧的共同點。假設在某方面兩人都同意,但其他方面有異議,那么接下來需要明晰的是,贊同與不贊同的內容。其實,只要組員共同厘清這些異同,他們自然而然會形成某種共識。其中有多種對話技巧,都是人工智能和自然語言理解可利用的。我們可以使用虛擬代理靈活驅動,經濟又高效。
記者:也就是說,虛擬代理能促進人們之間更好地溝通交流。那么,相對于一對一輔導,團隊導學系統是否有所不同?
格雷澤教授:是的,這是個很好的問題,因為兩者側重點不同。我的博士生曾作過研究,對比傳統課堂、一對一輔導和小組互動中學生提問的數量。結果發現,小組提問數量最多,超過一對一輔導,遠多于課堂——因為課堂幾乎為零。頗具諷刺的是,它發生在美國。美國統計數據發現,學生在課堂中每小時提問數量平均僅0.11個!換言之,每名學生大概九到十小時才會問一個問題。然而,小組互動中每小時卻高達20個。所以,主動性或提問可以當作衡量標準開展研究。這位博士后來做博士后,目前就職于ACT①,年薪15萬美元。很顯然,知識就是金錢,前提是能夠找到并真正解決問題。
記者:對研究新手而言,這既受啟發又相當勵志。那么,以AutoTutor為例,在一對一輔導中,智能導學系統在教學中只需建立暢通的教學對話即可,但在團隊教學中,是不是系統本身也需要參與其中,有角色參與并起到協調作用?
格雷澤教授:對,這就是為什么把它叫做Tutor而不是Mentor或Monitor的原因。在理想狀態下,虛擬導師的風格應該不同:有的是微觀管理者,催促人們做事;有的負責觀察學生、觀察互動,在互動沒有進展時發言推進討論。假設某個小組正在協作解決問題或設計某種產品,但突然因某種原因停滯不前了,這時虛擬導師會出面提供信息,幫助小組攻克難關。有人認為這種導師比微觀管理者更好,因為學生會得到激勵并保持主動。布倫特·摩根(Brent Morgan)等人的文章②,討論了不同導師的策略,可供參考。
關于團隊教學,我想強調一個重要問題,那就是,現在的問題比過去復雜,需要更深層的理解和學習,一人往往獨木難支。因此,采用團隊協作促進學習者的深層學習仍是所有人的共同愿景。這有三種實現方式:
一、在個體層面上,通過一對一輔導改善學生的心智模式。這可借助AutoTutor或其他智能導學系統完成。
二、在團隊層面上,通過協作解決問題或制作物品。比如,極具挑戰的“創客運動”,無人能獨自完成,甚至連答案都無從知曉。這通常應由不同技能的人組成團隊共同探討,也只有在團隊中才能獲得深入的解決方案。
三、選擇“真正的問題”。所謂“真正的問題”是指能激發人們內在動力開展研究和解決的問題。舉例說,假設某學校幫派和暴力問題嚴重,不論作為整體還是其中的小團體,學生都會主動尋求辦法避免陷入幫派糾紛,這就是個“真正的問題”。于是,學生對某件事越有動力,會鉆研得越深,越可能探查到更深層的知識。有趣的是,今天的美國人正奮力研究如何擺脫特朗普(Trump),且已經學習到很多關于政府的知識。
記者:這真是個值得深入探索的領域。在智能導學系統中團隊往往以小組出現,那么小組輔導的理論挑戰是什么?
格雷澤教授:一是小組如何運作,二是如何提升小組協作質量。我是協作問題解決能力評價專家團主席。我與他人合作撰寫了涵蓋各種團隊理論的論文,作為2015年國際學生評價項目(PISA)的成果。就目前來說,理論還在發展完善中,不過首要問題是如何在協作問題解決上訓練學生。
帕特里克·格里芬(Patrick Griffin)是澳大利亞研究者,2007—2015年間,他的研究團隊嘗試訓練學生的協作技能,但由于缺乏經費未能繼續。幸運的是,他出版了這方面的著作。
還有斯蒂芬·菲奧里(Stephen Fiore),我們合作在《Nature》子刊發表了討論訓練團隊協作解決問題的論文③。文章討論的是,有時分組解決問題反而不會得到反饋。比如,學生分組完成項目時,教師拍拍頭表揚一句“不錯”,但這不是詳細的反饋,因為教師不清楚該如何推進合作。
鑒于反饋的重要性,許多人將目光投向智能導學系統,希望它能教導如何成為優秀的合作者。事實上,美國海軍已經嘗試設計了此類智能導學系統基本框架,形成了通用智能導學框架(Generalized Intelligent Framework for Tutoring,簡稱GIFT)開源項目④。關于協作解決問題的基本理論,你們可以參考那篇論文。它囊括了大部分相關文獻。但是,對于如何訓練協作解決問題的研究仍很少。而這正是我想要做的,我想研究人們還沒有研究過的東西,因為那里會有更多的發現。
記者:您已經為智能導學系統研究作出了卓越貢獻。我們想知道,當您從學校畢業時,為何選擇從事教育技術研究?怎么萌發創建AutoTutor系統的?
格雷澤教授:非常好的問題。其實,一切都源于興趣。在整個職業生涯中,我一直對交流和對話感興趣。我發現在輔導過程中,師生的知識結構之間實際上鴻溝很大。我十分好奇人們是如何解決這個問題的,事實上人們對此知之甚少。因此,我的研究領域之一便是指向(direction giving)。比方說,大家都有過向陌生人問路的經歷,路人盡管十分友善并詳細地告知答案,但你仍可能在一大堆熱情回復中迷茫不已。很顯然,這樣的交流并不順暢。有時他們還會追問“你明白了嗎?”,而你鼓起勇氣回答“是的,非常感謝”,然后目送他走遠后趕忙找下個人打聽。這是現實生活中存在巨大溝通鴻溝的典型案例。教學是另一個案例。也有人研究醫生與病人之間的互動。病人去看醫生時,醫生總是使用成串晦澀難懂的專業術語,讓病人不知所云。
于是,我特別想探索這一過程,了解人際鴻溝前人們是如何溝通的。所以,我對輔導過程特別感興趣,分析了許多眾所周知的教學過程、面部表情和動作等。然后,我發現教師們所做的也沒什么特別之處,加之我是學習認知科學出身,有計算機科學背景,所以我打賭計算機也能做到。
實際上,我讀大學時是神奇的六十年代,反叛精神特別強,我們抗議越戰,我當時還留了長發,是個嬉皮士。我主修過八個專業,但沒有全部獲得學位。一開始我學習數學和計算機科學,但這與社會學相關不大。我便去學哲學,又學經濟學,接著又學英語、人類學和語言學。經過廣泛涉獵后,最后我進入心理學。因此,我主修心理學,但輔修數學、計算機科學、哲學和語言學等。后來這些正是認知科學的基礎,也是認知科學的主要研究領域。回過頭看,只要跟著這些問題走,最終都會殊途同歸。
有了這些基礎后,再加上我喜歡創造,所以每次分析各類行為時,我總會思考這些人的行為能否通過計算機實現,并對此充滿信心。恰好在這一時期,出現了語義分析技術,并引發了計算語言學的變革。早期分析人類教師時,胡祥恩⑤教授曾跟我一起工作,我們合作論文之一就叫量化會話心理學⑥。我們提交了申請書,這成為后續研究的起點。就這樣,我進入教育領域,開啟了研究生涯。
虛擬代理出現很早,第一個代理名叫“巴迪(Baldi)”。那時,各種想法不斷涌現,我開始對創造新東西感興趣,但創造需要淵博的知識。比如,汽車半路拋錨,得去哪兒修呢?是去汽車制造廠,還是汽車經銷商?有些人能滔滔不絕地講個不停“這車五秒內能達到45公里時速”,這只是對汽車進行測量,并沒有制造和維修能力。重點是,現在的心理學家對各種事物開展實驗——通常也只是測量而非構建事物。比起測量者,創造者對事物的內部機制理解更深。
記者:AutoTutor已形成了家族,您設計AutoTutor的愿景是什么?
格雷澤教授:在美國,非常多的成年人閱讀水平低到無法找到合適的工作,所以我想讓有需要的人能免費使用。我們跟“專業讀寫”(Pro-literacy)機構合作,花了很長時間建立訓練理解能力的導學系統,其中包含35個小課程模塊,每個時長約半小時,目的是幫助閱讀障礙的成年人。這是其中的愿景之一,若能幫助成千上萬人更好地閱讀,我將十分欣慰。
還是用數據說話。在美國大學生中,閱讀能力未達到八年級的占38%,數學能力嚴重不足的占40%,形勢相當嚴峻——他們就這樣進入大學,學不好便面臨退學。實際上,我們可以對理解和閱讀水平低的大學生進行實驗,無須費力招募校外被試。如果將范圍拓寬,有這類問題的成年人有多少?答案是五千萬。那么其中又有多少人去讀寫中心求助呢?答案是3%。也就是說,五千萬美國人中僅一百五十萬人試圖尋求幫助,更多人甚至不知道這個機構。因此,我希望AutoTutor能夠讓更多人受益,這就是我的初衷。
記者:與人類教師相比,他們喜歡用這種方式提高自己的能力嗎?
格雷澤教授:是的,大多數人喜歡使用AutoTutor。首先,人們在它面前不會感到尷尬,可以輕松地展示和審視自己的不足;其次,系統備有教師和學生兩種代理角色,有時我們會安置學生代理與真人比賽環節,但設定人不會輸給機器。有趣的是,如果人的表現不好,學生代理會被“降級”到低一級學段。這類系統能夠幫助學生培養自信等品質,這是我正在做的事。
我還想創建另一個系統,希望和優秀游戲團隊合作,開發一組對情緒高度敏感的代理系統。之所以選擇游戲方向,是因為思考常會受挫,人們生性不喜歡多思考。但是,虛擬代理和比賽或許能把任務變成娛樂而引人入勝。人們花時間努力通關,甚至有時會感到沮喪,直到成功完成任務。我希望用虛擬代理達到這種效果,也想和公司合作開發出色的學習游戲,但這樣的公司不好找。我們曾嘗試與培生教育集團(Pearson Education Group)合作,開發一款寄予厚望的商業游戲。該游戲面向高中生和大學生,用于訓練批判性思維,講述火星人降臨地球,以擴散偽科學的伎倆妄圖侵占地球。學習者需要努力成為聯邦科學局的探員,找到并將火星人緝捕。但他們只有掌握科學方法,才能在宣傳材料中鑒別出偽科學。然而,五年前培生教育集團遭遇經濟問題,只得中途放棄所有高端科技項目。
記者:真是太可惜了,這屬于“黑天鵝”因素,完全不可控制。不過,游戲中有很多可控因素,最可能影響學習效果的因素是哪些呢?
格雷澤教授:成功的游戲的確有利于生成淺層知識,但不適用于深層知識學習。人們很難直接在游戲中深度探究。據我所知,所有成功的商業游戲,都無法提供深層知識,主要原因是思維上的阻隔和非連續性。
不過,如果能嘗試找到正確的游戲設計方法,或許可以克服。比如,有些人——盡管只是少數——喜歡有深度的、嚴肅的游戲,他們甚至可能花上幾十個小時沉浸于此。如果能讓更多的人參與其中,那么人們便可能進入并享受深度學習、系統性思維和因果推斷的樂趣,之后還會對淺層內容感到無聊。截至目前,我只見過游戲偶然或短暫地達到深層學習的效果。至于其中的要素,可參考我、胡祥恩和鮑勃(Robert A. Sottilare)合作撰寫的論文⑦。在游戲環境下,使用通用智能導學框架和深度學習的可能性,奧秘在于反饋和選擇。
再聊一個哥特式的想法。假定任務為引導孩子進入深度學習,可他們大多很頑皮并愛搞破壞。所以,如果游戲主題是“如何炸毀一幢建筑”,他們一定會長時間非常用心地研究這個問題。又比如,“如何給一個村莊下毒,在指定時間內使死亡率最高?”,有些人還喜歡玩欺騙和密謀類的游戲。既然男孩和女孩都會經歷這個階段,為何不借機使之與深度學習相關聯?
還有個值得思考的問題:為什么在游戲中人們對積極的事情沒那么感興趣呢?為什么孩子們的學習會偏好哥特式元素?這種現象在心智中如何發展起來的?我敢打賭中國也會有這種情況,肯定有孩子一拿到玩具就想拆解,即使拆開后無法裝回原樣。請注意,他們正自發努力弄清事情背后的運作方式,這就是深層知識的萌芽!但有多少家長和教師不是在斥責聲中扼殺了孩子們這種深度思考和大膽探索之途呢?
為推翻敘利亞巴沙爾政權,美國除了動用阿盟政治力量、反對派武裝之外,還暗中助長“伊斯蘭國”壯大。“伊斯蘭國”發動圣戰,并在較短時期迅速占領敘利亞、伊拉克的一些重要城市和地區,以及包括中國石油企業在內的國際公司在敘利亞運營的油氣田。“伊斯蘭國”推行原教旨主義,采取極端統治手段,對世界和西方的威脅越來越大。美國不得不與國際力量聯合開展清剿,并在軍事上基本終結了存在三年多的極端組織“伊斯蘭國”。
記者:不止孩子,成年人仍有這種沖動。感謝您的啟發,這是個非常深刻的問題。您如何看待深層知識和深度學習之間的關系?
格雷澤教授:深層知識不僅需要系統性思考,還需要因果互動。通常,某個事物被視為包含眾多要素的整體系統,那么附帶效應和意外事件會使實際方案變復雜。
例如,人行橫道剛被使用時,事故率陡增三倍。原因在于,行人認為自己被允許過馬路,可司機不十分清楚這一點,不少司機直接忽視人行橫道而引發交通事故,這屬于意料外的后果。直至十年后情況才發生逆轉,人行橫道切實降低了事故頻率。這需要以“有多少司機會注意人行橫道?”“有多少行人會十分小心?”等反思思維去思考。當習慣于系統性思考后,就會意識到一個簡單的解決辦法很可能存在紕漏,因為背后的整體機制不簡單。
現實問題根本不像建立數學模型求得最優解一樣容易,折中權衡極具挑戰。比如,美國新奧爾良市曾多次遭遇颶風襲擊,城市受損嚴重。起初,人們計劃建造超大堤壩擋住洪水,事實證明此事絕非那么簡單,因為只要水位漫過堤壩,就是一場滅頂之災。如果換種思考方式,種植一些植物群落,隨機排列在海岸線上而非把墻建得越來越高,就能使阻擋洪水的屏障功用發揮到最大化,這才是真正穩妥的解決方案。同理,在政治領域中,特朗普想建造“美式長城”,結果這個愚蠢提議讓更多的人越過了邊境。
記者:因此在您看來,為了提升學生深度學習的能力,對話是必需的?
格雷澤教授:對,很有必要。我贊同喬治·米勒(George Miller)的觀點,這位神人不僅對認知心理學、心理語言學和認知神經科學的建立貢獻巨大,還將喬姆斯基(Chomsky)的生成語法理論引入心理學,甚至參與了WordNet項目,不過最知名的一定是神奇數字“7±2”。他認為語言是最不模糊的交流方式,人們通常從語言中獲取的信息和判斷比其他交流形式都高級。很多人說有研究表明人們的主要交流方式是面部表情和肢體語言,這太偏激了,這些結論通常來自實驗室中簡單互動的圖片或視頻,因此生態效度很低。假如你想向我傳達復雜信息,比如你打算明年春夏之交的某個時間來孟菲斯拜訪我,如何用肢體語言表達呢?同樣,若想解釋事物的問題出在哪里,不用言語表達,溝通將變得非常困難。
回到 “指路”的例子。如果向別人問路,98%的人會用手指著目標方向,甚至自己都沒有意識到就指了,此時范圍已明顯縮小。反之,如果他們只用語言回答“向南或向東南方向走”,就不易理解。這時,手勢往往能迅速傳達準確信息。因此,手勢和面部表情有時比語言交流效果好。
然而,現實生活中人們需要整合很多信息,特別是在假設的情況下,必須使用語言。動物不討論假設世界,有人也許會說它們也有這種跡象,其實沒有,只有人類才會討論假設的世界。與他人交流時,提及的多為別的時間和地點,針對此時此地的信息不多。我敢說你們的談話內容有很大部分不是關于假設的就是關于其他時間和地點的。在談論假設事件時,離開語言通常很難做到。因此,我堅信理解深層知識通常需要涉及清晰的辨別和解釋,這也正是語言的看家本領。不然,用非言語的方式交流深層知識,那就太痛苦,會不得不中斷的。
記者:為了更好地學習深層知識,學生需要更多的深度解釋,創設對話環境是一種理想方式。不過,對話與學生的認知緊密聯系。對嚴肅游戲的研究,有認知和情緒兩種視角。近年來,為何越來越多的研究者開始對情緒感興趣?
格雷澤教授:實際上,概念學習是認知的,但情緒更能激發人們的動機和注意力,二者都為學習所必需。進一步來說,使人保持學習的動力是什么呢?就是情緒。我剛完成一篇論文⑧,對“情緒在學習環境中扮演的角色”進行梳理,指出情緒對學習而言好似黏合體驗的膠水。在日常生活中,情緒同樣非常重要。假如早上一起床心情就不好,這會影響我們大半天或一整天。多年來,情緒在心理學研究中一直居次席,現在轉向情緒研究正是為了掌控動機——讓學生保持動力來源、獲得足夠關注和毅力堅持學習。如果動機缺乏,成功便遙不可及。
記者:我們非常希望深入了解和使用AutoTutor,也很好奇它有什么缺點?
格雷澤教授:正所謂“甘瓜苦蒂,物無全美”。對這個問題的詳細闡述,可參考2016年的文章⑨。此外,一篇剛發表的論文⑩,也指出了其中的不足。我把AutoTutor的缺點大致歸納如下:
第一個實際上是人類自身的弱點,與AutoTutor無關。比如,當學生回答問題時,他只需說出一兩個關鍵詞就能獲得人類教師的認可。但AutoTutor卻期望學生說出詳細的信息,這會讓學生抵觸。很自然,學生在自動化輔導環境下也會有這種期望,于是AutoTutor可能會惹到他們。這是非常現實的矛盾,但并非不能解決。
第二個缺點是AutoTutor無法妥善處理學生的問題,畢竟設計者不可能考慮到所有潛在問題,考慮到的問題也不可能提供所有答案。因此,無法直接回答學生的提問時,AutoTutor會使用語言技巧來回避。比如,它會說“哦,這是個好問題,請稍后再問我”或者“這是個好問題,你怎么看?”
第三個缺點是AutoTutor不會復述。復述是很重要的教學技巧,即教師根據學生發言重新組織語言加以表述。假如你說“哦,AutoTutor,有問題”。如果我需要重述你的話,我會說“你是想知道AutoTutor應用是否存在問題嗎?”雖然這只是重復,卻是用更完善的語言加以組織和表達。優秀教師在課堂上也許會這么做,尤其在不明確學生的表述時,可以說“喬治正在思考語言和交流之間的關系,你們對此有什么看法?”這種做法一箭雙雕——既能帶動學生,又能串聯起其他同學的問題。我們希望AutoTutor也能做到,但目前還達不到。事實上,很多人類教師也不擅長復述,需要接受培訓。匹茲堡大學專門開設會話課程,指導教師如何在課堂上與學生更好地交談,復述便是其中的常見方法。
此外,還有個問題,AutoTutor情緒反饋系統目前仍不理想,不過我們正在改善。例如,假設學生回答非常精彩,我們希望系統能夠給出與之對應的情緒反饋——用熱切而非平時那種平淡的語氣稱贊學生。人們一直希望設計出情緒反饋得當的虛擬導師,用細致的情感、熱情的或者懷疑的語氣進行反饋。很多人類教師可以做到,但AutoTutor還做不到。
記者:由于AutoTutor已被整合到GIFT中,請簡單介紹一下兩者之間的關系。
格雷澤教授:GIFT既是理論框架,也是工程框架,有一套開源的軟件系統,任何人都可以借助GIFT免費快速搭建導學系統。現在,世界上活躍的智能導學系統有數十個。比如,MathTutor是個輔導數學的智能導學系統,美國軍方也有用于訓練射擊術的智能導學系統。GIFT對所有這些智能導學系統進行詮釋,AutoTutor只是其中涉及自然語言交互的一例。
記者:AutoTutor基于對話思想而設計,GIFT和AutoTutor之間是否存在架構沖突呢?
格雷澤教授:不,沒有實質性的沖突。AutoTutor和史蒂夫·里特(Steve Ritter)的Cognitive Tutors for Mathematics,后者面向數學,前者面向自然語言。但當學生陷入僵局時,系統都會給出提示。假如學生仍不明白,才會告知答案。此外,其他導學系統通常也遵從“線索-提示-結論”循環,不會直接被訓練成“填鴨機”。這是GIFT基本原則決定的——不只是講課或直接給出答案,而是提出問題并給出提示,鼓勵學生主動解決問題。
記者:MOOC在中國非常受歡迎,您如何看待MOOC和AutoTutor之間的關系,二者能否融合?
格雷澤教授:今天,“融合”指的是不同技術的協同工作。八年前,我們討論過MOOC與AutoTutor的結合,曾設計了基于MOOC的AutoTutor模型。其實,我們既然有MOOC,又有會話代理,沒理由不能融合。當時本想深入探究,卻因忙于其他事務而擱淺,但我仍覺得二者融合十分必要。
在MOOC模式下,要么觀看視頻,要么閱讀文本或完成練習,學生不知道自己是否真正理解。因為人的閱讀理解能力并不完美,學生對材料的實際理解程度和自認為理解程度之間的相關性僅0.27。這其實是缺乏反饋所致。這看似復雜,其實很簡單,不需要懂得很多技術知識就能做到。比如,學生正在學習MOOC視頻課程,中途暫停并彈出對話框“如果按1-5評分,請您就本材料的理解程度打分”。學生給出評分,系統繼續提問“現在,請你概括觀看的內容并輸入”。不少學生開始都自認為理解到位,卻往往在概括環節啞口無言。這是個非常簡單的操作,只需暫停并概括總結即可,其間僅需采集概括的內容,甚至無須給出任何反饋。這種方法有兩方面優勢:一,可以提高內在認知標準和理解標準,學生將意識到“我可能沒有完全理解學習材料,因為我什么也說不出來”;二,助力學生深入內化信息。最終,理解和概括能力都將獲得提升。
記者:AutoTutor有良好的過程控制,其效果可以細化至個體,但MOOC不同。
格雷澤教授:是的,就AutoTutor控制MOOC教學進度而言,技術上沒有任何問題。Moodle就是理想的平臺,胡祥恩教授已經將很多課程以Moodle的方式進行部署,創作插件提供多種控制方式,可對視頻或多頁材料的目標位置設置斷點,實現學生評分及收集總結等操作,全程無需編程、易掌握。其實,MOOC本身也有聊天互動的功能,但使用者寥寥無幾。人們可以開發一個插件運行虛擬代理,讓它站出來說“等一會,你理解了嗎?你學習得怎么樣?能替我總結一下剛剛學習的內容嗎?”使之更富社交性。還可設置積分,讓你認為另一個學生正與你一起學習,如果你能提供幫助,就可以加分。
記者:請暢想一下,如果您有足夠的財富,您會選擇哪種人工智能技術開發更好的AutoTutor呢?
格雷澤教授:首先跳入腦海的念頭是,一定要做與眾不同的事。以物聯網為例,世界上有各式各樣的設備,人們并不熟悉它們的功能,也不知道該如何使用。現在,也請你們暢想一下,假如設備能夠像AutoTutor一樣與人類互動,可以向使用者介紹自己該有多好。在你拿到一個新設備卻窘于不知如何使用時,它便開口道“嗨,你想了解我嗎?”,而不是像現在,你拿著一個不會說話的新輪胎,心中痛苦地嘀咕著“我該怎么辦?”然而,未來的孩子們或許會驚訝道“我的自行車竟然是個啞巴!”
記者:太酷了,也許下一個谷歌和臉書就在這里。謝謝您,最后還有三個小問題,請您用一句話回答。第一個小問題是,在整個職業生涯中,您最高興的事情是什么?
格雷澤教授:最開心的時刻是被授予Harold W. McGraw學習科學獎,這要感謝胡祥恩教授的幫助。
記者:第二個小問題,在所有成就中,什么是最成功的?
格雷澤教授:最成功的事情就是我和同事一起合作創建了AutoTutor。
記者:最后一個小問題,您最遺憾的事情是什么?
格雷澤教授:最大的遺憾是沒有足夠的能力將AutoTutor造福于千千萬萬的人。
所以,我們現在需要與企業合作。其實,到了我這個年齡,并不在乎能否借AutoTutor致富,只關心它能否被大眾使用。擔心侵犯知識產權在我這兒是多余的。我真心希望我的知識產權被大家“侵犯”,也誠摯歡迎大家前來“侵犯”!
[注釋]
① ACT是一家提供美國大學入學考試(American College Test,簡稱ACT)服務的非營利性教育培訓公司。
② D’Mello S., Jackson T., Craig S., et al.(2008). AutoTutor detects and responds to learners affective and cognitive states[C]//Workshop on emotional and cognitive issues at the international conference on intelligent tutoring systems: 306-308.
③ Fiore, S. M., Arthur, G., & Samuel, G.(2018). Collaborative problem-solving education for the twenty-first-century workforce[J]. Nature Human Behaviour,2(6):367-369.
④ https://gifttutoring.org.
⑤ 胡祥恩教授是美國孟菲斯大學心理學系、電子計算機工程系、計算機科學系教授,智能系統研究院高級研究員,華中師范大學心理學院院長、中國青少年網絡心理與行為教育部重點實驗室高級研究員,主要研究領域包括數學心理學、實驗設計與統計、心理學、人工智能和智能導學系統。
⑥ Graesser, A. C., Swamer, S. S., & Hu, X.(1997). Quantitative discourse psychology[J]. Discourse Processes,23(3):229-263.
⑦ Graesser, A. C., Hu, X., Nye, B. D., & Sottilare, R. A.(2016). Intelligent tutoring systems, serious games, and the Generalized Intelligent Framework for Tutoring (GIFT)[M]. Using Games and Simulations for Teaching and Assessment. Routledge: 82-104.
⑧ Graesser, A. C.(2019). Emotions are the experiential glue of learning environments in the 21st century[J]. Learning and Instruction, 2019:https://doi.org/10.1016/j.learninstruc.05.009.
⑨ Graesser, A. C.(2016). Conversations with AutoTutor help students learn[J]. International Journal of Artificial Intelligence in Education,26(1):124-132.
⑩ Dowell, N. M. M., Nixon, T. M., & Graesser, A. C.(2019). Group communication analysis:A computational linguistics approach for detecting sociocognitive roles in multiparty interactions[J]. Behavior research methods,51(3):1007-1041.