楊健
【摘 要】數據是信息技術學科大概念,數據處理分析是中學信息技術學科教學的重要內容。伴隨人工智能的發展,涌現出了一批有別于傳統教學中數據分析的新技術、新方法。為了讓學生通過信息技術課的學習了解這些前沿知識,掌握數據分析的新方法,落實學科核心素養,本文以文本數據挖掘為例,從教學設計的主題、教學內容和教學過程三個方面進行闡述。
【關鍵詞】數據分析;文本數據挖掘;詞頻統計分析;問題鏈
【中圖分類號】G434 【文獻標識碼】A
【論文編號】1671-7384(2021)011-050-03
數據是信息技術學科大概念,數據處理是貫穿初、高中信息技術教學的重要內容。初中學段數據處理的教學內容是應用Excel表格處理軟件對數據進行獲取、編輯、統計分析、繪制圖表,并依據數據表和圖表進行數據分析。數據處理對象是以數值型數據為主。高中階段的相關教學強調要應用不同數據分析工具,對多種類型數據進行處理。隨著人工智能技術的發展和應用,生活中出現了很多對各種數據類型進行處理和分析的新技術與新方法。如何在初中信息技術課堂上引導學生學習這些前沿知識,應用新技術,感悟信息技術學科數據分析的新方法,并與高中階段數據處理的教學做好銜接,落實學科核心素養呢?經過教學實踐的探索,本文以初中信息技術課“挖掘數據‘金礦—— 在線詞頻統計分析”為例進行闡述。
以應用新技術分析數據為出發點,確定文本數據挖掘的教學主題
文本是數據的一種形式,文本內容的分析是數據處理的內容之一。文本的詞頻統計分析是應用人工智能技術對文章中重要詞匯出現的次數進行統計,進而根據統計的結果簡要分析文章內容。應用在線詞頻統計分析工具對文本內容進行挖掘、預測文章主旨、形成詞云圖,是數據分析和可視化表達的一種新技術、新方法、新觀念。這種應用與《高中信息技術課程標準(2017年版2020年修訂)》(以下簡稱“高中課程標準”)對數據處理分析相關內容的要求相一致。雖然課程標準的要求是針對高中信息技術學科教學的,但是初、高中的課程在知識體系、教學內容、教學方法等方面具有一致性與連續性。因此,高中課程標準對初中的信息技術教學具有一定的指導意義。
現階段,教育部的相關文件要求初中學生要進行大量課外閱讀,并在有限時間內比較準確地把握文章的主旨。而詞頻統計分析工具恰恰能夠為學生快速、恰當地分析文章提供一種新的輔助性技術手段和思路。
以培養學科核心素養為核心,選擇組織文本數據挖掘的教學內容
教學內容是課堂教學中落實學科核心素養、體現學科育人價值的重要載體。學生的學科核心素養綜合表現在知識與技能、過程與方法、情感態度與價值觀三個方面。信息技術學科又具有理論性、工具性、實踐性的特點。因此,教學內容要包括理論知識、操作技能、應用知識技能解決問題的思想方法及其相關的價值觀念,要借助生活情境和實踐活動等形式呈現。
“挖掘數據‘金礦——在線詞頻統計分析”一課參考了九年義務教育地方教材《人工智能》七年級上冊(人民出版社)“人工智能應用”單元第2課的內容。第2課主要介紹了大數據概念、數據挖掘的基本方法、非結構化數據(文本數據)挖掘、在線詞頻統計分析系統和結構化數據挖掘以及電商平臺的推薦系統。
根據教學主題,本節課的教學內容聚焦非結構化數據即文本數據的挖掘。教材中呈現的相關內容為高頻詞、詞頻分析的概念和詞頻分析工具使用的一般方法。從落實學科核心素養的角度考慮,結合學生已有的知識基礎(已學Excel電子表格數據處理與分析及智能處理與編程),對教材進行延伸和拓展,增加詞頻分析技術原理的探究和對詞頻分析工具作用的理性判斷,形成了四部分教學內容,即詞頻統計分析工具使用的意義、詞頻統計分析工具的使用方法、詞頻統計分析技術實現原理和對應用詞頻統計分析工具的理性認識。其中,使用在線詞頻統計分析工具幫助理解文本內容是應用人工智能技術解決實際問題的一項重要技能,而詞頻統計分析技術的實現原理蘊含了計算機科學領域解決文本挖掘的基本思想和基本方法。這兩項教學內容是這節課的教學重點。
四個教學內容分別要落實一個學科核心素養的培養。詞頻統計分析工具使用的意義要引導學生聯想使用人工智能工具找出文章中的高頻詞,將問題的解決與信息技術建立聯系,從而體會新技術應用的作用,發展學生的信息意識學科核心素養。詞頻統計分析工具的使用方法是讓學生學會使用詞頻統計分析工具,掌握概括文章主題的文本數據分析方法,從而以新視野解決學習中遇到的問題,發展學生的數字化學習與創新學科核心素養。詞頻統計分析技術實現原理是讓學生歸納出文章高頻詞的統計流程和構成詞頻統計分析過程的功能模塊,理解計算機解決問題的方法和思想,從而發展學生的計算思維學科核心素養。對應用詞頻統計分析工具的理性認識是通過采用兩種不同閱讀方式的對比,客觀地認識人工智能應用,引導學生逐漸形成正向的價值取向,從而發展學生的信息社會責任學科核心素養。
以核心問題構建問題鏈,設計文本數據挖掘的教學活動
《高中信息技術課程標準(2017年版2020年修訂)》提倡學生在教師引導下發現問題,以解決問題為導向開展方案設計、新知學習、實踐探索等具有創新特質的學習活動。這種形式的學習活動要求教學以問題為中心,把教學內容化作問題,引導學生通過解決問題來掌握知識、形成能力、養成心理品質[1]。在教學實踐中,教師要將教學內容與具體應用聯系起來而提出一個要解決的核心問題,再把核心問題分解為若干個具有內在關聯的子問題,構成一個問題鏈,形成問題框架。針對問題框架中問題鏈上的每個子問題的解決都要設計教學活動。這個教學活動要包含與該子問題解決密切相關的教學知識和明確的教學目標。隨著教學活動依次展開,問題鏈上的子問題逐一解決,最終學生完成核心問題的解決。學生在這個過程中學習知識,鍛煉解決問題的能力,發展學科核心素養。
“挖掘數據‘金礦——在線詞頻統計分析”一課的主要教學內容是文本數據的分析方法,具體應用是使用詞頻統計分析工具統計文本的高頻詞,輔助分析文本主旨。結合教學內容和具體應用,提出本節課的核心問題:如何進行文本數據挖掘。將核心問題分解為四個子問題:為什么要使用詞頻統計分析工具進行文本挖掘、如何使用詞頻統計分析工具快速挖掘文本信息、詞頻統計分析技術的原理是什么和如何理解詞頻統計分析工具在文本挖掘中的作用。圍繞著核心問題構建了一個具有內在聯系的問題鏈,其中每個子問題又可以細分為若干個小問題。針對問題鏈上的四個核心子問題,設計以下四個教學活動。
活動1:閱讀短文,找出高頻詞
請學生在1分鐘之內閱讀短文“人工智能的應用”,找出短文中出現次數最多的5個詞語,同時思考問題:短文的主要內容是什么?如果沒有在規定時間內完成,有什么方法手段可以幫助我們嗎?
該活動的意圖是引導學生通過找出文章中出現次數最多的詞語,理解高頻詞的含義,知道高頻詞在理解文章時所起的作用。同時,體驗用人工閱讀的方法在短時間內無法完成指定任務時,聯想使用人工智能技術幫助解決問題,從而將問題解決與信息技術建立聯系,逐步形成信息意識。
活動2:應用詞頻統計分析工具
借助幫助文檔(教師給出的工具使用說明),使用紐扣詞云詞頻統計分析工具統計短文“人工智能的應用”中的高頻詞,根據統計結果分析文章的主要內容。思考問題:使用詞頻統計工具統計高頻詞,分析短文內容經歷了哪些步驟?
該活動意圖是利用幫助文檔,學生要學會使用紐扣詞云詞頻統計分析工具。借助紐扣詞云詞頻統計分析工具,統計短文中的高頻詞,根據統計的高頻詞概括短文主題,歸納使用詞頻統計分析工具分析短文的步驟,以此發展學生使用數字化工具輔助學習,創新性解決問題,培養數字化學習與創新學科核心素養。
活動3:探究詞頻統計分析的原理
學生閱讀一段文字,分析使用人工方法找出文字中高頻詞的過程。以此類比,推斷出構成在線詞頻統計分析工具的5個功能模塊。以其中“詞頻統計”功能模塊為例,學生使用自然語言描述模塊實現的流程,并以流程圖的形式進行表達。
該活動意圖是在教師的引領下,學生能夠歸納出構成詞頻統計分析過程的5個功能模塊,并使用自然語言描述實現模塊的方案,發展學生的計算思維學科核心素養。
活動4:思考詞頻統計分析工具的作用
學生應用紐扣詞云或圖悅詞頻統計分析工具,歸納文章“我的一位國文老師”中的國文老師的特征。然后,學生對比通過自己閱讀文章總結出的國文老師的特征,分析兩者之間的差別及產生原因,從而思考詞頻統計分析工具應用的價值。
該活動意圖是讓學生熟練掌握應用詞頻統計分析工具進行文本挖掘的方法,并通過使用不同方法,對比文章分析得到的不同結果,理性認識詞頻統計分析工具的應用價值,發展學生的信息社會責任學科核心素養。
當今社會,人們生活在充滿數據的世界。利用信息技術手段和方法,特別是人工智能技術,認識數據、分析數據、處理數據并分享其中的價值是學生在信息社會生存發展必備的能力。因此,信息技術課堂教學要結合技術變革的前沿知識,增加以應用人工智能技術為代表的新技術處理數據的教學主題和教學內容。在教學活動中,要以問題為導向,引導學生學習數據分析的新方法,理性認識新技術、新方法的價值,發展學科核心素養。
基金項目:北京市教育科學“十三五”規劃2018年度一般課題“高中信息技術教學中計算思維培養的教學案例研究”(立項編號:CDDB18183)
參考文獻
鄭金洲. 教學方法應用指導[M]. 上海: 華東師范大學出版社,2006.
作者單位:北京市西城區教育研修學院