尹湘鋒,張志武,李亮
(1.湖南科技大學 數學與計算科學學院,湖南 湘潭 411201;2.湘鄉市第一中學,湖南 湘潭 411400)
?
大數據背景下中學生統計思維培養探討
尹湘鋒1,張志武2,李亮1
(1.湖南科技大學 數學與計算科學學院,湖南 湘潭 411201;2.湘鄉市第一中學,湖南 湘潭 411400)
摘要:信息技術的發展讓互聯網數據快速增加,這些數據給社會生活帶來巨大的變化,同時也影響著傳統的統計學教學,探討了大數據背景下中學生統計思維培養的必要性,提出了改進中學生統計思維培養的4點建議:一是讓學生通過簡單數據描述統計來理解抽樣與簡單推斷的統計思維;二是參與統計實踐,了解數據收集和分析推斷的統計思維;三是熟悉幾種統計軟件的應用從整體上理解隨機思維;四是提高教師的統計思維能力,使教師更好地幫助學生進一步理解統計思維和大數據。
關鍵詞:大數據;統計思維;統計教學
隨著信息技術的進一步發展,大數據已成為繼互聯網之后的一個重要熱點問題,大數據在社會各個方面起著重要的作用,同時也有著重大應用前景。世界各國和各個企業都非常重視大數據產業發展,布局大數據戰略。根據Gartner公司的調查結果,目前全球64%的企業已開始向大數據項目注資,或者打算在2015年6月之前將計劃付諸實踐。我國政府和各個科研單位以及互聯網企業對大數據也非常重視,到2014為止,中國大數據技術大會(BDTC 2014)已經召開了兩屆,每一屆會議都發布了中國大數據技術與產業發展白皮書,同時,近2年來,我國建立了多個大數據應用研究中心。
由上面的信息可以看出,大家對大數據非常的重視。那么到底什么是大數據?它究竟有著什么樣的特點和用途呢?這里就一些文獻的理解,對這些問題做出簡單的回答。所謂大數據,通俗地說就是一切可記錄信號的集合,大的意思不光是海量的信息,同時也是蘊含著復雜的意思,這些數據和統計學中基于人工設計、借助傳統統計方法獲得的少量的結構型數據不同,它們大多是基于現代互聯網技術與工具進行自動記錄與儲存的一切類型的數據。《大數據時代》一書中,作者將大數據的特征歸結為4V(Volume,Variety、Velocity 和Value),可見大數據的數據巨大在根本上就是數字化基礎上的數據化。
1中學生統計思維培養的必要性
1.1統計思維培養有利于提高中學生的學習興趣
大數據主要來源于互聯網,由于數據量大,有人提出了大數據與統計數據的不同:傳統統計要用抽樣產生樣本,而大數據不用樣本,數據本身就是總體[1]。因而就有人提出:在大數據時代大數據對中學的概率統計教學有沒有影響?如果有,該怎么去修改教學方式使得更加適合新時代的教學要求?當然也有很多教師認為,大數據對中學的概率統計教學基本沒有多少影響,因為中學數學中概率統計內容不多,高考考試分值不多也不是很難,學生一般不會在這塊失分;同時大數據的應用和研究是高等學校和各個科研院所的事情,高中生也沒有那個基礎和能力對大數據深入的了解,要了解大數據也要等他們考上大學再說。筆者認為,現在的中學生是學習能力很強的一代,尤其是對互聯網的應用,而大數據就是來源互聯網,這一熱點時刻影響著新一代的中學生們,為了讓他們能更好地利用互聯網來幫助學習,很有必要考慮在大數據背景下的中學生概率統計教學。下面用互聯網上的一些調查數據來說明新一代的中學生已經與互聯網聯系非常緊密。根據寶泉嶺中學13級20班張鑫宇的《關于中學生上網情況的調查報告》中的結論:在調查的有效樣本中有94.6%的中學生在上小學時就開始接觸網絡,僅僅有5.4%的中學生是在上中學后才接觸網絡的,上網的中學生有84%大多數是查資料,只有16%的用于qq聊天或者影音應用以及玩游戲等。由此可見中學生已經能夠充分地利用網絡進行學習,那么教師們就必須要緊跟潮流,思考在新的環境下的統計內容教學。
1.2概率統計教學需要培養中學生的統計思維
從中學的概率統計的教學內容來看,似乎這些內容還沒有和大數據有著很緊密的聯系,反而讓人覺得有些內容提了大數據對學生的學習反而不好,如統計中的抽樣思維,在大數據時代由于數據量已經很大,表面上看來是不用抽樣了,這樣就會讓學生覺得抽樣只存在于傳統的統計學中,也就是只能在小數據時代適用。其實這只是一種表面現象,大數據時代中數據的量大了,數據的分析也變得更加復雜,但是它還是數據分析,和傳統的統計分析的重要應用數據分析有著重要的交集[1]。而且統計思維的培養不是一朝一夕就可以培養起來的,而是一個長期的任務,隨著大數據時代的到來,原來的統計思維要在原有基礎上進行加強和提高,以利于大數據的數據分析的應用,因此我們必須要在中學階段開始進行統計教學改進,思考大數據背景下的統計思維培養。

2統計思維的特點和中學統計內容的關系
美國著名的社會學家韋爾斯有一句名言:“統計思維總有一天會像讀和寫一樣成為一個有效率的公民的必備能力”[2]。這說明了統計思維的重要性,同時也說明統計思維和讀寫能力一樣不是能夠一蹴而就的,也正是因為這個原因,概率統計的內容才被加入到中小學數學中。那么什么是統計思維?統計思維包括哪些內容?重慶大學統計學院院長陳正偉教授對統計思維的定義為:統計思維是研究從個別表現到一般特征的認識事物整體狀況和發展過程的一種思維模式。 統計學家Allen B.Downey在他的書《統計思維:程序員數學之概率統計》中對統計思維的介紹中寫道:This book is about turning data into knowledge. Data is cheap (at least relatively ); knowledge is harder to come by[3].簡單說來統計思維就是通過收集數據并將數據轉化為知識的一種思維過程,它和數學中的確定性思維模式不同的是,它時時刻刻都伴隨著隨機性,因而它提示的知識也不是確定性的知識,有著一定的錯誤可能。總之統計思維是從數據到知識的過程中的一種思維模式,它包括了數據抽取、從數據中估計和推斷結論。統計思維的特征主要表現在:數量性、總結性(總體性)、實踐性和不確定性[2]。
統計思維實際上是一個歸納、辯證的思維過程,面對眾多的數據,中學生應該有好的統計思維過程和通過數據分析對事物有著正確的認識,從而樹立正確的人生觀和世界觀。
中學數學課程中,在必修3中的統計內容就有了抽樣、估計和相關分析的內容,而概率內容中介紹了概率的簡單定義和幾種常見的概念定義。這些內容中已經大致涵蓋了統計思維的基本內容:不確定性、數據的收集和簡單處理、根據分析給出判斷。在選修2~3內容中更是增加了在社會統計決策中常用到的統計分布和它們一些數字特征、回歸分析與假設檢驗的基本思想。從內容可以看出,中學數學中基本上對統計思維方式的整個過程有著一個整體的介紹,只是所用的理論和模型相對比較簡單,但是這并不影響通過一些統計實踐來培養學生的統計思維[4]。
3大數據背景中學生統計思維培養的探討
第一,增加學生對簡單數據的收集和處理,讓學生在簡單數據的處理實踐中提升傳統抽樣描述和簡單推斷的統計思維能力。大數據時代,數據量大而復雜,對這些數據的分析,首先要做的事情就是進行數據的預處理,這個預處理當然不能完全排除數據的抽樣,為了讓學生能夠理解大數據中的預處理,必須要學生對傳統統計的抽樣和描述統計有著充分的理解和掌握。高中數學必修3和選修中對傳統統計中的抽樣理論作了介紹,為了使學生理解抽樣對隨機性數據的重要作用,從而養成正確利用樣本得到總體性質的思維習慣,很有必要讓學生由簡單的數據處理去對這些思想有著直觀和具體的認知。適當增加一些簡單的實際數據,讓學生能夠在對這些數據的分析中理解和掌握統計抽樣的作用以及統計假設和統計推斷思想在分析中的作用和可能犯錯誤的情況,同時教師也可以針對各種統計思維設計一些實際情景讓學生分析,如:街頭抽獎時,如果宣稱中獎的概率很小,但是卻連續多人中獎;網絡上對高考取消數學的調查結果可信不?
第二,在老師指導下學生自己設計問題并收集數據進行分析,使學生對統計分析的定性-定量-定性的分析過程有著切實經歷,對整體的統計思維有著更深一步的理解,從而對大數據分析有著初步的了解。傳統的統計學中的數學分析的過程,本質上就是一個定性分析問題[5],根據分析結果,提出解決問題所需要的結構性數據,然后根據分析進行抽樣調查,抽樣調查以后的數據進行描述性統計和相關的推斷統計,通過這一定量分析后,會得到一些數據結果,針對這些具有一定統計意義的結果,結合問題的背景給出數據所反映的定性結論。這一過程只有在具體的統計實踐中才會對中間的統計思想有著較深入的理解和掌握,因此有必要讓學生參與統計實踐,提高學生分析實際問題和通過統計分析進行解決實際問題的能力。為了使學生理解對大數據背景下的統計思維和傳統統計思維的差異,可以鼓勵學生通過互聯網尋找自己設計問題的大數據分析結果,進行對比和分析,從而進一步理解和掌握統計思維。
第三,加強學生對統計軟件應用的教學,提高學生的統計實踐能力,讓學生在統計軟件的應用中整體的理解隨機性思維。統計軟件中的每一項分析都對應著一種統計分析結構模型,學生可以在使用統計軟件的過程中對統計分析過程和統計思想有著進一步的了解。前面提到的統計實踐,如果讓學生自己對數據進行計算的話,一方面會增加學生的計算任務,另一方面也加大了統計實踐的難度,讓學生對統計實踐有畏難情緒,從而降低統計思維能力的培養。中學生的統計實踐應該主要讓學生從總體上理解和掌握統計思維,而不是糾結于具體的統計思維方式和統計理論,如讓學生檢驗某一結論是否正確時,不需要學生給出檢驗統計量和計算統計量的臨界值,再根據臨界值做統計決策,只需要學生能針對數據,利用統計軟件計算出所需要的p值,從而根據p值和顯著性水平作出統計決策就行。充分地利用統計軟件,會使學生體會學習統計分析的樂趣,同時也讓學生在統計軟件的應用中進一步的理解和掌握統計思維。
第四,加強教師的統計應用和理論的培訓,使得教師在學生的統計思維培養中起到非常重要的指導作用。由于中學統計內容相對較少,高考時候占分比不大,而且相對得分較容易,從而使得很多教師為了應付考試,對學生的概率統計內容的教學采用傳統的數學教學方式。即理論為主,同時讓學生通過做習題而不是統計實踐來達到考試得高分的目標。一方面,這種方式不利于學生對統計思維的理解,同時也使得學生難以應對進入大學以后的大數據環境下的統計學習;另一方面,教師們的教學方式也降低了統計學內容對教師知識和能力的要求。因此為了提高學生的統計思維能力,有必要讓老師們對大數據有著更好的認識,同時也要求老師們對傳統的統計思維有著更深入的理解和掌握,只有這樣,老師們才能在指導學生的統計實踐中發揮重要的作用,真正為學生指點迷津,讓學生的統計思維能力大大的提高。全日制義務教育《數學課程標準》明確指出:“要使學生經歷運用數據描述信息,做出推斷的過程,發展統計觀念”,統計思維的培養應該是義務教育階段數學課程的重要組成部分[5]。隨著大數據時代的到來,改變統計思維是大數據時代的必然要求。
參考文獻:
[1] 耿直. 大數據時代統計學面臨的機遇與挑戰[J]. 統計研究,2014,31(1),5-9.
[2] 李金昌. 大數據與統計新思維[J]. 統計研究,2014,31(1),10-17.
[3] Allen B,Downey.統計思維:程序員數學之概率統計[M].張建鋒,陳鋼,譯.北京:人民郵電出版社,2013.
[4] 曾希. 高中數學統計內容的教學研究[D].武漢:華中師范大學,2013.
[5] 王麗穎. 中學統計與概率教學重點問題探究[J]. 數學通報,2012,51(2):16-19.
(責任校對晏小敏)
中圖分類號:G633.6
文獻標志碼:A
文章編號:1674-5884(2016)02-0008-03
作者簡介:尹湘鋒(1976-),男,湖南邵陽人,副教授,博士,主要從事隨機分析及其應用研究、概率統計教學研究。
基金項目:湖南省自然科學基金(12JJ4001);湖南科技大學校級教改項目(G31416)
收稿日期:20150920
doi:10.13582/j.cnki.1674-5884.2016.02.003