(重慶第一中學 重慶 401329)
為了解學生和教師對評教的真實看法,我們對某高校48名教師以及50名學生開展了匿名問卷調查,針對教師和學生設置了兩套不同的調查,每套問卷包含10道題。綜合調查問卷反饋的結果,我們發現有65%的教師不清楚目前評分結果的計算方法,有71%的教師遇到過非常不合理的評分結果。但是大多數教師和學生認為,相比分數評價,文本評價是相對客觀和更有價值的反饋。
通過對現有的學生評分數據進行分析,我們發現分數評價主要有三種不足。一是有的學生傾向于打高分,有的學生則要求嚴苛,偏向于給低分,這兩類學生給的分數不存在可比性。二是大多數學生給所有的教師都打相同的分數,從而影響了教師評分的可區分度。三是部分學生對教師有嚴重的偏見。例如,他們可能給某個教師打非常低的分數,掩蓋了大多數其他學生的評分。
由此可見,利用分數評價去評估教師的課程教學水平有失公允。相對來看,文字評價比分數評價更客觀一些。因為學生愿意花時間撰寫文字,說明這是他們確實希望反饋給教務處這些信息。但是直接利用文字評價也存在兩個問題:
如果教師僅僅閱讀文字評價,他可能對學生評語中一些偏激的語句比較排斥,從而不能有效地接受學生的反饋。另外,教師只能看到學生對自己的評價,他可能不清楚自己在學校的相對情況。最后,也是最重要的,呈現給教師的只是一些零散的評語,這不利于教師有體系地、全面地了解自己的教學情況。
學校將教學考核評價結果作為教師職稱(職務)評定、績效分配、評優評先及繼續培養的重要依據。教務處作為學校的審核部門,需要了解每一個教師的教學情況。然而,如果教務工作人員要逐一查看這些意見,則需要耗費大量的人力物力。因此,迫切需要采用自動化的文本分析技術幫助教務工作人員更好地評價教師。
為了解決以上兩個問題,我們提出了一種基于文本分析技術的教師畫像技術,可以根據學生撰寫的教師評語自動生成多維度的教師畫像。
本文使用的數據是某大學部分學院6個學期中學生對教師的評價文本。共獲取評價文本9萬余條記錄,涉及教師近1000名。
數據集包括學期、課程號、教師號、班號、學號和評語,其含義如下:
學期:課程所在的學期名稱,如2018-2019第一學期
課程號:課程編號,如080125
教師號:教師編號,如013485
班號:教學班編號,如001
學號:學生編號,如20160378
評語:學生對教師的評價文本,如“張老師備課認真,只是語速過快”。由于許多學生沒有對教師進行評分,評語可能為空。
本文提出的教師多維度畫像方法以原始的評價文本作為輸入,以教師畫像作為輸出。該方法包括五步驟,即預處理、重點詞提取、方面詞分類、意見詞量化和生成畫像(參見圖1)。下面對這些步驟進行詳細說明。

圖1:教師畫像生成過程
(1)預處理:包括數據清洗、分詞、詞性標注、依存句法分析等過程。例如使用 Jieba文本處理庫進行中文分詞和詞性標注;并利用Stanford Parser提供的處理包對文本進行依存句法分析。這些過程使用相應的工具即可完成,下面我們主要描述第一個過程,即數據清洗。
通過觀察原始數據,發現文本數據存在很大的缺失。實際上,含有文本評論的記錄約占全體記錄的30%。此外還包括一些無效的評語,例如“無”,“沒”等字樣的評論。另一種情況是長難句。對于中文長難句,目前并沒有一個準確的定義,但是可以基于英語長難句的定義:有過多、過長修飾成分或者含有從句則為長難句。對長難句的處理一直是中文文本處理中的難題,而本文的研究重點是從句子中準確的提取方面詞語與方面情感詞組合。長難句句子結構復雜,依存句法分析結果也存在一定的誤差。在生成教師畫像的過程中會有很多不利因素,所以沒有對長難句進行操作。
基于以上原因,我們在數據清洗時刪除了沒有文本評價的記錄、無效評語以及長難句。
(2)重點詞提取。重點詞包括方面詞和意見詞兩類。方面詞是代表教師某個方面的詞,通常是名詞;意見詞是對某個方面進行評價的詞,通常是形容詞。方面詞和意見詞是成對出現的。例如,在“張老師備課認真,只是語速過快”中,“備課”“語速”是方面詞,“認真”“過快”是意見詞。并構成了(備課,認真)和(語速,過快)兩個詞對。
提取過程中,首先構建一個基本的方面詞庫和意見詞庫。根據詞庫提取出基本的方面詞和意見詞。然后通過語法分析將(方面詞,意見詞)補充完整,并將新的方面詞和意見詞添加到詞庫中。以上過程反復進行,直到不能發現新的方面詞和意見詞為止。
(3)方面詞分類。使用手工方式將全部方面詞劃分到六大類,包括教學內容、教學方法、課程管理、課程考核、教學態度和學習收獲。
(4)意見詞量化。將意見詞轉換成一個得分。如果該意見詞是正面的,轉換成1,如果是負面的,轉換成-1。例如“認真”轉換成1,“過快”轉換成-1。
(5)畫像生成。將同一大類方面詞對應的全體意見詞得分進行求和。例如如果一個教師獲得20個正面的意見詞和5個負面的意見詞,則求和的結果為15分。最后將求和結果映射為一個0到1之間的小數。由此得到該教師六個方面的評分,并轉換成可視化的圖形形態。
通過以上方法,我們為近900名教師生成了六個方面的評分。為了顯示實驗結果,我們以選取的某個教師為例,顯示其評分(參見表1)和畫像(參見圖2)。

表1:某教師六個方面的得分

圖2:教師畫像示例
本文提出了一種基于文本分析技術的教師畫像方法。通過預處理、重點詞提取、方面詞分類和意見詞量化等過程,最終實現了對教師的多維度的畫像。本文提出的方法可以幫助教務工作人員快速掌握教師的情況,幫助教師改進教學方法,提高教學質量。