羅強 馮杰



摘? ?要:在教育大數據時代,數據可視化作為教育數據呈現的重要手段,能清晰直觀地呈現教育規律和結論。蘇州市教育質量監測中心積極探索并應用數據可視化技術,開發了圖表集成系統、報告生成系統、大數據展示系統等一系列智能系統,實現對多維數據的呈現、動態追蹤、橫向比較、問題預警等功能,并通過在蘇州市教育質量監測工作中的實踐應用,發現教育教學過程中存在的問題,為改進教育教學以及教育部門決策提供依據。最后,提出未來可進一步優化和完善的三個方面:優化大數據展示平臺,滿足用戶使用需求;封裝圖表生成代碼,降低用戶使用門檻;設計Web動態圖表,增加圖表間的交互功能。
關鍵詞:數據可視化;ECharts技術;智能系統;可視化圖表
中圖分類號:G434? ? ? ? ?文獻標志碼:A? ? ? ? ?文章編號:1673-8454(2022)08-0102-08
一、實踐背景
隨著信息技術在教育領域的不斷應用,人類生產和獲取教育數據的能力增長迅猛,各類教育數據的獲取已經變得越來越方便快捷。如何在海量的教育大數據中找到有用的信息、如何根據這些數據來發現問題、得出有價值的規律和結論?如何通過數據可視化幫助數據受眾更好地理解數據的內涵,服務于學校教育質量提升以及教育行政決策?這些都是數據時代迫切需要解決的問題。
對于數據可視化(Data Visualization),目前業界對它的定義基本一致,是指利用計算機圖形學和圖像處理技術,通過一定的方式和方法,將抽象的數據轉換成圖形或圖像在屏幕上顯示出來,并進行交互處理的理論、方法和技術。[1-3]
對數據進行可視化處理,需要經過獲取、分析、過濾、挖掘、表述、修飾、交互等流程,同時兼顧美學呈現形式與功能的需要,體現直觀化、關聯化、藝術化和交互性的特征。[4]數據可視化能將抽象的數據通過適合的圖表表達得更加清晰直觀,還可以在圖表中突出需要關注的數據,能夠更快、更精準地抓住數據的重點。
此外,數據面向的受眾大都不具備專業的數據知識,可視化的形式有助于降低其讀懂數據的門檻。中國人民大學彭蘭教授認為,在這個數據爆炸的時代,需要的是對數據更明晰的呈現、更準確的分析和更深層的解讀。其認為,信息圖表在此背景下開始扮演越來越重要的角色。[5]而信息圖表的生成要借助計算機技術,目前在各領域應用比較廣泛的是基于ECharts[2]、HTML5[6]、Python[7][8]等來實現數據可視化。
在質量監測領域,運用可視化技術來呈現數據的實踐一直在進行。國家義務教育質量監測基于個性化數據,挖掘開發了大規模數據分析模型與方法,對真實數據與分析結果進行及時有效的呈現,采用多維動態、交互并結合地理空間信息的三維結構可視化技術,直觀地反映我國教育質量與教育公平現狀。[9]
蘇州市教育質量監測中心為了更好地呈現數據,積極探索并應用數據可視化技術,基于ECharts(一款基于JavaScript的數據可視化圖表庫)對教育數據進行可視化,并通過智能技術平臺,實現對多維數據的呈現、動態追蹤、橫向比較、問題預警等功能,通過對蘇州市教育質量的全面診斷,發現教育教學過程中存在的問題,為蘇州市及各區域、各學校改進教育教學方式和教育決策提供依據。
二、區域學業質量監測的運行流程
蘇州市教育質量監測中心(以下簡稱“監測中心”)是在國家深入推進教育管辦評分離,構建督政、督學、評估監測三位一體教育督導體系,促進教育治理體系和治理能力現代化的大背景下,于2014年9月正式掛牌成立的江蘇省首個獨立建制的地市級教育質量監測中心,主要負責組織實施全市各級各類教育質量監測工作,指導各市、區及基層學校開展教育質量監測工作,構建基于大數據的蘇州市教育質量評估監測體系。
2015年9月,監測中心啟動義務教育學業質量監測,之后持續開展了面向全市初中學生的連續追蹤監測。截至2021年,參測學生已超過160萬人次。針對蘇州市各縣市區以及各初中學校,累計發放10000余份監測結果報告,包括主報告、學科數據報告、學生相關因素報告和教師相關因素報告。從2018年起,監測中心為全市所有小學提供《監測結果追蹤反饋報告》;從2020年起,為集團化辦學的學校提供集團化報告。
蘇州市義務教育學業質量監測嚴格按照標準化流程和相關規范要求進行,前后歷時11個月,歷經監測實施方案擬定、監測指標研制、監測工具研發、多輪預試與修訂、監測數據分析、監測報告撰寫等過程,重點環節包括工具研發、組織實施、數據采集、數據分析、數據呈現、結果運用六個環節,構成了蘇州市義務教育學業質量監測的運行閉環。
三、區域學業質量監測的結果呈現
經過數據清理、工具質量分析、數據計算等模塊的數據分析加工后,監測中心通過報告生成系統和大數據展示系統,進行監測報告批量生成和圖表封裝,支撐監測數據的可視化和快速呈現。
(一)監測報告生成系統批量生成各類監測報告
在監測報告生成的前端,監測中心開發了圖表集成系統,輔助監測報告撰寫時對各類數據圖表進行審校,確保數據和圖表的準確性。數據分析加工后的所有圖表都會存在圖表集成系統中,只要用檢索的方式就能查到相對應的數據。當報告審校人在審校某個學校數據時,如果需要與區域或者蘇州市的數據進行對比,或者與去年的數據進行對比,只需要利用圖表集成系統調取相關數據圖表進行對比,就能發現數據是否正確。此外,圖表集成系統還支持在線撰寫功能,可以輔助各區域、集團綜合分析報告的在線撰寫。
在對數據和圖表審校完之后,依托監測報告生成系統,批量生成初中、小學兩個學段,市、區、校三級的主報告、學科數據報告、相關因素報告、集團化報告等各類監測報告。
主報告的閱讀對象為區域領導、分管校長和年級組長,主要呈現區域、學校層面的基本信息、基本情況;學科數據報告的閱讀對象為區教研員、教研組長、備課組長,主要分學科呈現學科發展狀況;相關因素報告的閱讀對象為分管校長、學生處和年級部領導,主要呈現學生和教師的相關因素發展狀況;集團化報告的閱讀對象是集團化辦學學校的總校長、分管校長和年級組長,主要呈現本集團的基本信息和基本情況。2021年,監測中心共完成報告模板41份,通過報告生成系統批量生成兩個學段、三個層級、七種類型的基礎數據報告,共計3647份。
(二)大數據展示系統提供線上監測大數據展示
該系統呈現的內容包括反映蘇州市、區域和學校層面參測基本信息的導航地圖,以及學業水平、學業增值、學生相關因素(含閾值預警)、教師相關因素四個維度,從中精選與學業生態密切相關的24個關鍵指標,構成以學生學業發展為核心的、具有“結構意義”的教育生態健康圖譜,并以指數化的方式呈現數據,為區域和學校的教育生態提供多維度、立體化、多層次的數字畫像。
如圖1所示,蘇州市義務教育學業質量監測大數據展示平臺分為對象切換、導航地圖、學業水平、學業增值、閾值預警、學生相關因素、教師相關因素和健康圖譜八個版塊,具體如下:
“對象切換”主要作用是切換學段、年份和年級的數據顯示;“導航地圖”的主要作用為支持切換蘇州市、區域和學校三個層面的數據顯示;“學業水平”主要呈現蘇州市、各區域和各學校的語文、數學、英語、科學學科的百分等級,且支持2018年到2020年各科百分等級的追蹤呈現;“學業增值”主要呈現各區域和各學校的語文、數學、英語、科學學科的各年百分等級的增值數據;“閾值預警”主要呈現教育部五項管理中涉及的近視率、睡眠時間和作業時間,將蘇州市、各區域和各學校的數據與標準進行比較,以此來實現預警功能;“學生相關因素”和“教師相關因素”呈現了主要的八個指標,且支持2018年到2020年各維度得分的追蹤呈現,指標的選取突出典型性、多維性、發展性和動態性,以此來評價學生和教師的生態健康狀況;“健康圖譜”部分呈現了本年度各區域和各學校的初一、初二、初三年級學生的學業水平、學業增值、學生相關因素和教師相關因素的等級狀況,并用不同顏色以及顏色的深淺來分級顯示,能夠對蘇州市、區域、學校各年的教育生態進行比較全面的數據化描述。
該平臺對區域和學校的教育生態健康進行了縱向全過程、橫向全要素的一體化呈現,可以精準描繪高質重負、低質輕負、高質低壓、低質高壓等不同類型學校的特征畫像,實現監測大數據的多維、動態和結構化展示,實現對區域和學校教育生態的“健康體檢”和“數字診斷”。
四、區域學業質量監測的數據可視化探索
蘇州監測數據量大,涉及各種數據類型,數據意義、關系復雜程度高,且報告類型豐富多樣。為了讓區域和學校在閱讀報告時能夠快捷準確地理解和使用數據,降低獲取關鍵數據和信息的專業要求,監測中心開展了監測數據可視化的研究探索與創新實踐。特別是在監測報告撰寫的過程中,監測中心運用一系列監測數據可視化策略,研制各種直觀易懂的可視化圖表,為監測數據結果的反饋與應用提供便捷高效的支撐。
(一)通過圖表合一的方式精準刻畫學業發展狀況
監測中心的監測報告在提供基礎數據表的同時,大量采用圓點圖、柱形圖、折線圖等可視化圖表來刻畫區域或學校各項數據在連續幾年間的發展情況,直觀地展示不同維度的增值,并用圖表合一的方式幫助教師加深對抽象數據的理解。
監測中心在等值計算的基礎上,用百分等級來描述學生各科的學業表現。百分等級是測量學中應用最廣的表示測試分數的方法之一。一個測試分數的百分等級是指在常模樣本中低于這個分數的人數的百分比。因此,百分等級85表示在常模樣本中有85%的人比這個分數要低。換句話說,百分等級指的是個體在常模群體中所處的位置,百分等級越低,個體所處的位置越低。
如圖2所示,監測中心用百分等級圓點圖表示某區域某年級各校學生的各科百分等級。橫坐標代表學科,縱坐標代表各科的百分等級。橫向選擇同一種顏色的圓點位置高低,可以比較該區域同一所學校學生在各學科上的表現情況,如果某學校某學科的圓點位置相對較高,即表明百分等級相對較大,說明該校學生在該學科上表現相對較好;縱向選擇同一學科上不同顏色的圓點,可以比較該區域各學校在學科學業水平上的高低情況。
(二)運用不同的顏色和數據等級構建教育生態健康圖譜
顏色是一種信息表現方式,在圖表中恰當地使用顏色有助于吸引用戶的關注,并表達對數據的價值判斷。監測中心將蘇州市教育生態健康指標體系中的24個關鍵指標全部進行指數化加工,首先將全市所有學校各維度得分作為總體,分別由低到高劃分成9個水平,來描述各個學校在各維度上的指數得分。9個水平占比分別為4%、7%、12%、17%、20%、17%、12%、7%、4%。9個水平分別著色,用1—9來進行表示,1代表深紅、9代表深綠。紅色越深表明區域/學校在某指標上表現越弱,綠色越深表明區域/學校在某指標上表現越好,如圖3所示。
這種將指數的可視化表達,可以刻畫區域和學校學業生態的典型特征,呈現區域和學校學業生態結構的均衡與共生情況,幫助區域和學校找準自己的位置,了解自身學業生態的發展態勢。如圖4所示,某區域初中三個年級的教育生態健康圖譜中,不同的顏色和指數對該區域的各個維度給出了直觀的預警或肯定(呈現了各維度的水平及對應的顏色),方便管理人員在與基準數據的比較中研讀數據、發現差異、診斷問題和自主改進。
(三)參照標尺和常模直觀呈現多維過程數據的意義
監測中心通過學校各學科學業水平百分等級的橫向對比,以及各學校同學科的縱向對比,明確本校各學科的優勢與不足。此外,為了讓各校更清楚自己在蘇州市或本區域內的相對水平,通過提供蘇州市的常模,呈現出本校在蘇州市或本區域內的相對位置。
如圖5所示,用百分等級標尺圖反映某區域某年級各校學生的各科百分等級,圖中不同顏色的圖形代表不同學科的百分等級,右側圖中的豎線代表蘇州市的平均百分等級50。與百分等級圓點圖不同的是,該圖不但可以清晰地表達某校各科學業水平與蘇州市平均水平的大小,還能呈現該校各科學業水平發展的均衡情況。
相關因素各維度得分經過標準化處理后轉換成T分數,使得各維度在同一量綱上,實現維度間可比。如圖6所示,報告中我們通過自己命名的“地形圖”展示了某區域2018級學生相關因素三級維度三年的得分情況。其中,5分代表的直線表示蘇州市平均得分,淡色區域最左邊的點代表的是所有區域的最低值,淡色區域最右邊的點代表的是所有區域的最高值。一方面,通過給全市最低值和最高值分別上色,使對比更加鮮明,可以清晰地看出本區域的某個相關因素維度在蘇州市中的相對位置;另一方面,通過對同一維度的三年追蹤,呈現該區域在該維度上三年的發展情況。
數據受眾通過“地形圖”可以清晰地看出,本區域在相關因素三級維度上與蘇州市均值的差異情況,且通過T分數呈現能夠看出相對差異的大小。在此基礎上,監測中心通過自己命名的“地鐵圖”來直觀呈現每個區域相關因素各二級維度在蘇州市所有區域內的排序情況,圓圈中的數字即表示各二級維度得分在各區域得分中由高到低進行的排序,能夠讓區域管理人員清晰直觀地看到本區域在蘇州市中的排序情況,如圖7所示。
(四)提供完整的數據標準幫助閱讀者理解數據含義
除了對各類數據進行可視化呈現之外,監測中心還對不同維度的數據,按照一定的規則劃定理解數據意義的標準,數據受眾可以依據數據標準理解本區域、本校相關數據的意義。
如表1所示,其首先呈現了某區域各校各學科百分等級的增值情況,然后把所有學校增值按照數據大小,分別由低到高劃分成7個水平,占比分別為5%、10%、10%、50%、10%、10%、5%,并用不同顏色表示,進而進行分級預警。紅色越深表明在所有學校中的排名越靠后,綠色越深表明在所有學校中的排名越靠前。在表格最下方的注釋中,對不同顏色在總體中所處的位置分別給出了占比的數據標準。數據受眾可通過數據的大小和顏色快速理解該數據在蘇州市總體數據中所處的位置。
(五)構建更加精細的結構性數據描繪學業水平
除了用百分等級來整體描述各區域和學校的學業水平外,監測中心還采用四水平分布圖和箱型圖來刻畫學生學業水平的分布情況和離散情況。
如表2所示,將蘇州市學生學科成績由高到低,按照0~25%、25%~50%、50%~75%、75%~100%,分成Ⅳ、Ⅲ、Ⅱ、Ⅰ四個水平,將各水平人數占比用長方形長度來表示,并從右至左依次排列,人數占比累計百分比為100%。通過表2,學校可以直觀地看到本校各學科、各水平的學生在蘇州市的分布情況,以及年度間的變化情況,一定程度上能夠了解本校學業水平質量的變化主要是由哪個水平的人數變化引起的。
如圖8所示,箱型圖最左邊的豎線為5%分位點,表示群體內有95%的學生高于此線所對應的分值;中間長方形左邊的豎線為25%分位點,表示群體內有75%的學生高于此線所對應的分值;中間長方形中間的豎線為該校的均值;中間長方形右邊的豎線為75%分位點,表示群體內有25%的學生高于此線所對應的分值;箱型圖最右邊的豎線為95%分位點,表示群體內有5%的學生高于此線所對應的分值。
通過整個箱形圖的長短,能夠反映出該校去除兩端后的90%學生的成績分布情況,通過中間箱體的長短,能夠反映出該校中間50%學生的成績分布情況,以此來體現出學生在某門學科上的離散情況。此外,用不同圖案和顏色表示不同的年級,通過縱向比較,可以看出學生某門學科三年內的離散變化情況。
五、總結和展望
在大數據時代,獲取數據、分析數據和呈現數據是開展數據研究的三個重要的環節,而數據可視化是呈現數據的主要方式之一。監測中心在數據可視化上進行了諸多探索,開發了監測報告生成系統(包括圖表集成系統)和監測大數據展示系統,又基于ECahrts開發了各類圖表,這些圖表不同于Office、WPS等辦公軟件生成的柱狀圖、折線圖等,形式多樣、清晰直觀,包含了更多的數據信息。此外,在圖表中用不同顏色區分年級、學校、學科,以及對部分數據進行預警,基本實現了報告使用者對監測數據可視化的需求。
對多維監測數據動態追蹤、橫向比較的可視化表達,可以提升監測數據的問題診斷和預警等功能,讓區域和學校能夠更加直觀地了解自己的教育生態,精準診斷問題所在,開展針對性的靶向改進和自我完善。數據可視化作為一種需要不斷探索創新的新技術,未來在以下方面還可以進一步優化和完善:
(一)優化大數據展示平臺,滿足用戶使用需求
目前的監測大數據展示系統1.0,可通過界面按鈕切換年份、年級、區域和學科,以此呈現不同層級的數據,但僅限于數據的可視化呈現,用戶無法對呈現的圖表數據進行進一步操作,比如對圖表進行縮放、個別數據的選擇、突出顯示等。
此外,各個層面、各個模塊圖表之間的交互路徑不夠明確,用戶的學習成本相對較高。有時用戶進入該系統之后不知道要點哪里來獲取自己需要的數據,也不知道自己能獲取到什么數據。因此,在后續的研發過程中,可優化各模塊之間的交互路徑,增加圖表的過濾、縮放、突出顯示等交互功能,嘗試構建關鍵指標下鉆模式、詳情說明模式、多圖表構成模式等交互模式,更加貼合用戶的使用習慣,滿足用戶的使用需求。
(二)封裝圖表生成代碼,降低用戶使用門檻
通過ECharts技術來實現數據可視化有兩個明顯的優勢,即數據圖表代碼開源,且數據圖表類型豐富。但如果要對圖表樣式和數據進行重新編輯和修改,則對用戶要求較高,不像常用的辦公軟件,只要有數據就能插入對應的圖表,沒有計算機編程基礎的用戶無法對這些基于ECharts生成的圖表進行個性化修改。因此,為降低這些圖表使用的門檻,有必要對各種類型的圖表進行模塊化封裝,把各種屬性、各種參數都封裝成按鈕或者文本框的形式,并制定相應的操作手冊,用戶經過簡單的、非專業的培訓后,能夠實現對圖表個性化修改的需求,降低圖表編輯、修改的門檻。
(三)設計Web動態圖表,增加圖表間的交互功能
目前,各種可視化圖表是通過瀏覽器頁面截圖的方式保存或者插入到報告模板中來進行使用,用戶對圖表沒法進行進一步的操作,從而實現圖表間的交互功能。比如,通過某區域某年級各校學生的各科百分等級圓點圖(見圖2),能夠看到當年某校各科學業水平的情況,但如果要看該校某學科各年的發展情況,就只能去找對應的其他不同圖表,而不是通過點擊該圖中的某個地方切換到對應的其他圖表,對于用戶想要更深層次地了解某個數據的情況帶來了諸多不便。
基于此,為了提高用戶使用數據的便捷性,需要開發基于Web的動態圖表,增加圖表間的交互功能。例如,把鼠標放到某個數據點上能夠獲得該處的信息提示,點擊某個數據點后可以跳轉到新的界面,查看相對應的其他數據,用戶可以根據需要在界面上選擇呈現哪些類型的數據或者哪些學校、哪些學科的數據。目前監測中心的數據可視化僅運用在學業質量監測數據的呈現中,希望未來能夠將數據可視化深入運用到學生的學習、管理和過程評價中,以及教育管理和教育治理的過程中,使之更好地服務于教育決策的改進和教育質量的提升。
參考文獻:
[1]王媛媛,丁毅,孫媛媛,等.數據可視化技術的實現方法研究[J].現代電子技術,2007(4):71-74.
[2]裴丹丹.基于ECharts的數據可視化實現[D].北京:北京郵電大學,2018:7.
[3]毋曉志.空間優化的圖可視化方法研究[D].太原:山西大學,2011:5-6.
[4]張金磊,張寶輝,劉永貴.數據可視化技術在教學中的應用探究[J].現代遠程教育研究,2013(6):98-104,111.
[5]彭蘭.社會化媒體、移動終端、大數據:影響新聞生產的新技術因素[J].新聞界,2012(16):3-8.
[6]高科.基于HTML5的數據可視化實現方法研究[J].科技傳播,2013,5(1):186-187.
[7]姜趙,謝曉偉.基于Python的數據可視化應用與研究[J].科學技術創新,2020(30):88-89.
[8]彭煥卜,謝志昆.基于Python的學習者基本數據分析與可視化研究[J].中國教育信息化,2021(15):60-64.
[9]田偉,楊麗萍,辛濤,等.科技賦能教育監測與評價:現狀與前瞻[J].中國遠程教育,2022(1):1-11,92.
作者簡介:
羅強,主任,正高級教師,本科,主要研究方向為基礎教育測量與評價,郵箱:452384761@qq.com;
馮杰,助理研究員,碩士,主要研究方向為基礎教育測量與評價,郵箱:fengj@suzhou.edu.cn。
Exploration and Practice of Data Visualization of Regional Education Quality Monitoring
Qiang LUO, Jie FENG
(Suzhou Education Quality Monitoring Center, Suzhou Jiangsu 215000)
Abstract: In the era of educational big data, data visualization, as an important means of? educational data presentation, can clearly and intuitively present educational laws and conclusions. Suzhou Education Quality Monitoring Center has actively explored and applied data visualization technology, developed a series of intelligent systems such as chart integration system, report generation system, and big data display system. It realized multi-dimensional data presentation, dynamic tracking, horizontal comparison, problem early warning etc. Through the practical application in Suzhou Education quality monitoring, the problems existing in providing the basis for the teaching improvement and the decision making of education department. Finally, three suggestions that can be further optimized and improved in the future are put forward, they are, optimize the big data display platform to meet users needs, encapsulate the chart generation code to reduce the user threshold, design the dynamic web charts to increase the interactive function between charts.
Keywords: Data visualization; ECharts technology; Intelligent system; Visual chart
編輯:李曉萍? ?校對:王天鵬