李 丹
(華中師范大學 數學與統計學學院,湖北 武漢 430079)
自從高中新課程標準確立了統計學在高中數學中的重要地位之后,人們對其愈益重視,但是在教學中也相應出現一些需要思考和解決的問題。統計學與高中生長期接觸的確定性數學不同,并非純粹的數學公式推導與計算,其思維方式也自有特點,只有對統計學的學科特征有所理解,才能夠在教學中完成新課程標準中對于統計學學習的要求——不僅掌握各種統計技術,更要形成統計思維。因此,如何在高中統計教學中實現這一教學的雙重目標,正是本文要探討的問題。
其實,已有研究已經在強調高中教學要注意數學與統計學的不同。如針對教學內容,王奮平通過對中、英高中教材概率統計內容中有關學習要求、知識量以及概率論與數理統計安排順序的比較研究,提出統計學教材的編寫應當適當增加概率統計的內容、概率論與數理統計的融合以及按照知識模塊來組織教材結構[1]。針對教學過程,王建波通過對高、初中統計差異、高中的統計概念、相關性分析和案例教學的研究,提出高中教師在教學中應注重與義務教育階段銜接,讓學生體會統計思維與確定性思維的差異,并把握線性相關性,引導學生形成對數據處理過程進行初步評價的意識[2]。針對學生學習過程,張德然,茆詩松從宏觀思維方式到具體的包含隨機性思維的數學題目的分析提出了適合學生形成統計思維的方法,讓學生從理解隨機性到認識隨機性思維下的推理過程,讓學生結合實際生活來運用和發展隨機性數學思維[3]。總之,如何在教學內容、教學過程和學生學習中培養統計思維的問題,已經引起了一些一線教師和學者的關注,但即便如此,相關研究還主要是圍繞高中統計的教學教法來談問題,尚未進入到對統計學自身的學科特性中去思考。因此,雖然人們都知道統計學是以實際事物為對象,與數學有不同的規律[4],如果不對其特性進行探討,很難在教學中體現學科規律性。但事實是能自覺依據統計學的學科特點來分析如何從事高中統計教學的研究仍然不足,這就為研究的深化留下了空間。
高中的統計學是統計學的一部分,而非高中數學體系中的一個簡單的拼盤。所以,理解統計學的學科特性,是教好和學好統計學的前提。如布魯納所說,懂得基本原理可以使得學科更容易理解,而在教學中強調結構和原理則有助于教授學科的基本結構[5]。那么,如何去探尋統計學的特點呢?不妨讓我們到統計學的發展中去尋找答案。因為統計學的學科特征,正是在其發展與演變的過程中,尤其是在其初期發展和幾個重大的關鍵轉變期所形成的。所以,了解統計學的歷史,對于我們了解其基本特征,提高高中統計教學質量會有重要幫助。此外,我們還需要對統計思維的概念給出一個明確的定義,以方便后續的研究。所謂統計思維,是指人們自覺運用數字對客觀事物的數量特征和發展規律進行描述、分析、判斷和推理的思維方式。這里最難的就是如何自覺地形成這種思維方式。此前,高中生所熟悉的是直接針對數字的運算處理,而不習慣于通過對數據的描述、分析、判斷和推理去理解復雜的社會事實。因此,要從數學思維轉入統計思維,就要求師生雙方都必須正確認識統計這門學科。
M·克萊因說過,對于統計學來說,如果僅僅進行收集、統計并不是一種新思想,它的新穎之處在于統計方法能夠作為一個重要的方法來處理社會科學問題[6]。
陳希孺指出,大量的原始數據如果不經過整理、分類、排比、分析,并通過適當的形式表示出來,就好比一堆沒有經過冶煉的礦物[7]。格朗特1662年發表的《關于死亡公報的自然與政治觀察》稱得上是統計學歷史上的第一塊里程碑,也是關于描述性統計的開山之作。該著作的創新在于把大量的數據根據研究對象的種類進行分類,并整理成意義清晰的表格,并舉例處理了數據的可行性問題和分析統計比率以及得到生命表。這些工作,對于早期的統計發展起到了非常重要的作用。如果說,這些工作還主要是針對人口問題,那么,統計學的發展則源于對范圍更加廣泛的社會科學研究的定量化思考。W·佩蒂的“政治算術”就是統計學在這方面的最初運用,他通過“數字、重量和尺度”的研究,拓寬了人們對政治與社會經濟現象的理解。由此,統計的發展便與社會科學建立起了緊密的聯系。統計科學中的數量性體現在對社會現象的數字抽象,即通過對數據進行數學分析,得到研究所需要的信息。這是一個對復雜的社會現象進行不斷抽象、提煉、濃縮和普遍化的過程,強調通過數據來解釋社會,因此,統計中的計算方法其實只是理解研究對象的工具,而數據所反映出來的社會事實,才是統計學的實質和基礎。可見,統計思維中的數字與形象思維和邏輯思維中的數字是有所區別的,形象思維的數字是一種符號“表征”,統計思維的數字則是其所揭示的某類社會現象的內在規律和性質;邏輯思維的數字強調計算,統計思維的數字則是對相關現象進行分析和判斷的手段[8]。而且,由于社會現象的復雜和多面性,統計中對于數量的分析結果在不同的背景環境中可能有不同的解釋,呈現出意義的多樣性。記住這些特點,對于我們厘析統計學和數學思維中數量性差異,意義極大,也是我們養成統計思維的基礎。
魁特奈特在1835年發表的《論人類及其能力的演化或社會物理學實驗》中提到了“普通人”的概念。其啟示性在于:將社會現象定量后,接下來要思考的就是如何去描述數據的特征,即尋找數據的社會意義——代表性。要想從數據中得到相關現象的代表性信息,最簡單的就是算術平均數,算術平均數有著“取大補小”的特點,因此,當一組數據中出現一些數比其他數大很多或小很多時,算術平均數就不是一個具有代表性的數據。為了探求數據的代表性,又出現了中位數的理論,就是將一組數據按一定的順序排列后取中間位置的那個數。這在一定程度上彌補了算術平均數的缺陷,但是,中位數所能代表的信息比較少,我們無法清除其他數據與之的差異性。而眾數又是另一種平均的體現,它表示一組數據中出現次數最多的數字。算術平均數、中位數和眾數都可以反映一組數據的部分平均的特征,可是對于整組數據在這樣的平均值下的分布情況還不清楚。后來人們開始尋找整組數據與平均值的關系,于是出現了離差,即單項的數據與平均值的差值。為了更好地反映數據的特征,統計學家又提出了標準差,也就是一組數據中每個數據與該組數據的算術平均數之差的平方和的平均值的根。張獻民提到統計平均數就是將被研究的同類現象的某個數量指標的各個體數量差異抽樣化,用一個概括的指標綜合說明現象有代表性的典型水平[9]。并且,代表性不僅體現在代表性數據,還表現為代表性的思想。后來發展的大數定理、中心極限定理、正態誤差理論和最小二乘法等,其實都是代表性思想的發展。
統計學的代表性思想還體現在抽取樣本數據的過程中。拉普拉斯提出的“比例法”可以稱得上是抽樣方法的起點,但是當時抽樣調查的理論和方法還沒有發展起來,直到1895年挪威統計學家凱爾把代表性抽樣作為一般方法提出后,抽樣調查才被大家所熟知。所謂代表性抽樣,就是指從總體中抽出的一組可代表該總體(在選定的指標上)的樣本,是個“小型化”了的總體。1924年國際統計協會對抽樣方法做出了界定,即隨機抽樣和目的性抽樣兩種,主要思想都是抽樣數據的代表性的體現。可見,學習統計學,就要理解其對代表性的追求。
阿布茲諾特在1710年發表的論文《神定法則: 男女出生性別比例恒定的規律性》,試圖使用二項分布模型對男女出生性別比例為1的假設進行檢驗(實際上也是一個符號檢驗),不少著作認為這是現代假設檢驗理論的最早起源[7]。假設檢驗就是提出一個總體的特征假設,然后利用樣本對總體的統計特征提供信息,并建立一個統計量來判斷假設是否成立。建立這樣的假設檢驗的模型是基于對總體符合正態分布的基本假設。繼高斯提出觀測誤差符合正態分布后,統計學家魁特奈特將正態分布的規律推廣到社會科學中的更多數據。假設檢驗中建立的統計量是一個隨機變量,應當服從概率中的某一分布。而后,費歇爾提出方差分析,把F分布引入到統計的假設檢驗中。而判斷假設是否成立的依據是小概率事件原理,即小概率事件在一次實驗(觀察)中是幾乎不可能發生的。因此,古典概率逐漸走出以賭博游戲為主要研究對象的小狹范圍,并推動了推斷統計學的發展。推斷統計是在搜集、整理觀測的樣本數據基礎上,對有關總體作出推斷,其特點是根據帶隨機性的觀測樣本數據以及問題的條件和假定(模型),而對未知事物作出的以概率形式進行表述的推斷。這些假定模型都是對現實社會在不同程度上的簡化過程,并且是基于樣本隨機現象的事實。所謂隨機現象,即是在一定條件下進行試驗或觀察會出現不同的結果,而且在每次試驗之前都無法預言會出現哪一個結果。社會科學研究中就經常會碰到這種現象,這也為對此一問題的推進提供了空間。正是因為社會中存在著大量的隨機問題,才促使統計學家運用概率研究的方法去深化思考。推斷統計領域擴大的基礎是隨機現象存在的范圍。統計假設檢驗是基于隨機現象的研究,也是人們基于經驗進行假設后進行的探討。
概率和統計中同樣都有假設檢驗,概率關注其計算過程,而統計更加關注假定模型的意義構建以及對結果的現實意義分析。概率論和統計學都是研究隨機現象,概率論更注重用已知的條件分析結果,而統計更加關注的是已存在結果背后的原因以及基于這個原因對未來進行推測,統計在過程中更加關注一個歸納推理的過程。因此,推斷統計中我們需要特別注意其隨機性和假定性的特點,這樣才能在得到結果的情況下更加合理地去解釋背后的數字意義。
高中階段對統計學知識的掌握主要涉及到兩個方面,即統計方法的操作和統計思維能力的培養。在《普通高中數學課程標準(實驗)》(教育部,2003)中強調讓學生經歷“收集數據——整理數據——分析數據——作出推斷”的數據處理過程,這里強調對具體統計方法的掌握。但我們知道,支配各種不同方法的是不同的統計思維,如果不對方法技術的相應思維基礎進行理解,統計學的方法就容易混同于數學的計算,讓學生知其然卻不知其所以然。所以,教授統計知識,需要更多地思考如何讓學生形成用統計方法分析問題的意識,培養他們的統計思維,這就需要培養學生對統計學四個特征的理解。
我們首先需要對小學、初中和高中階段的統計知識有一個結構上的整體把握,以便能從中找出各自的知識遞進關系及其與不同統計思維的關聯。統計學的教學內容在不同階段的要求不同,相關內容所體現的學科特性也不同。小學和初中階段主要是描述性統計,其所突出的是統計學的數據含義和代表性追求,高中階段的重點是推斷統計的初步,突出的是統計學的隨機性和假定性內含。而平均數的教學貫穿于整個小學、初中和高中,因為它是統計學的學科基礎。這樣,在高中階段的統計教學中,就應該注意在學生前期學習的基礎上,著力培養其對隨機性和假定性等原理的掌握,不僅要求他們掌握相關技術,更著重要求理解技術背后的精神和理論。
對數據不同于一般數學的理解是統計學的基礎,因此,對其理解應貫穿在整個學習過程中。統計學數據的深度理解可以分為:對統計數字的關注、探討數字的意義、對統計數字的質疑、對數字的判別分析、統計數字所對應的社會現象及其分析。
小學階段主要是平均數、中位數和眾數的學習,這個過程是讓學生接觸到統計學中的數字,關注不同數字的意義,培養學生對統計數字的關注并試圖去理解不同的統計數字。初中階段則是在理解統計數字的意義上進行探討,初步運用樣本估計總體的思想來理解統計數字,從少量的數據上升到大量數據,擴寬統計中數據的理解范圍。
高中生的認識和理解能力相對提升,此時學生要學習對數據進行質疑和分析。高中講授的隨機抽樣不僅是一種方法,還可以視為減少誤差而采取的措施,此時,統計中不可避免的誤差問題可以在隨機抽樣教學中提出來。隨機抽樣中的簡單隨機抽樣、分層抽樣和系統抽樣都是希望最終獲得的統計數字誤差最小。這也是讓學生理解統計中的誤差,培養他們對統計數字的質疑,讓他們理解統計中經由任何抽樣方法得到的數據都只有相對,而非絕對的準確性。高中階段講授的以樣本估計總體和兩個變量的相關關系就是對數據進行推斷的初步分析,了解樣本的數字特征可以在一定程度上反映總體的數字特征,這個過程對學生數字分析能力的要求更高,而這個過程需要結合統計學中其他特征共同實現,但對于數據的理解是基礎。因此,對數據的理解將貫穿整個高中統計教學,學生對于數據的理解層次的提高是教學中要著力解決的問題。
要注意讓學生體會統計思維中的數字與確定性數學思維中的數字的區別。確定性數學中的“數”與“量”是兩個簡單的組合,而統計思維中的“數量”是結合在一定的背景下進行的一種分析。例如:一份報紙賣三元錢.確定性數學中會注意到“一份”和“三元”,那么接下來可能就是思考通過計算能夠得到什么樣的結果,它關注的是計算過程和結果。而在統計思維中,我們需要思考的則可能是這是一份什么主題的報紙,為什么需要三元錢,和與其他報紙相比有什么值得購買之處等等,這里更加注重的是對數據所反映的研究對象的相關社會性特征的分析。
從對小學、初中和高中階段關于統計知識的歸納中發現,統計平均數的思維一直貫穿始終,根據不同階段學生的認知水平的提高而將要求提高,其體現統計中求平均思想的本質沒有變。因此,教學中教授平均數時就不僅要傳授相關計算方法,更應當培養學生理解平均數的思想,并在理解其意義的基礎上進行應用。教學中,要強調不同平均數的代表性以及其應用的條件。當然,要理解相關內容,還是需要學生處于一種假設環境中去親身感受。因此,高中區別與此前平均數教學之最重要的地方,就是要讓學生能夠理解代表性的意義。
對統計學每一個特征的理解都是基于一個生活背景,并且這個過程更加注重學生自己根據問題去發現和探索。統計來源于對日常生活的總結和提煉,也有利于學生感受其作用。布魯納指出,學習的方式在學習統計過程中能夠比較好地發揮其作用,布魯納的情節教學運用于統計教學時主要體現在案例的設置分析,讓學生在一個個案例所設定的情節中進行學習[5]。這對于理解和掌握統計學尤為重要。
在高中階段的代表性教學還體現在獲得代表性數據,也就是如何運用抽樣調查獲得數據。要讓學生理解抽樣的代表性,首先需要學生理解為什么要進行抽樣,如何進行抽樣。這個過程需要學生自己思考,也需要教師用具體的案例設置情節對學生進行引導。例如,我們要調查某高中15歲學生的身高,如何設計調查過程?調查某市的15歲學生身高,如何設計調查?調查全國15歲學生的身高,如何調查?讓學生思考這一系列問題后,再提出怎樣去獲得能盡可能代表我們需要代表的總體的數據。只有經歷了類似的訓練,學生才能對以抽樣調查來體現代表性的方法有更加深刻的體會。
隨機現象是概率論研究的對象,也是推斷統計中的一個重要部分。學生習慣了確定性思維的學習,對隨機性現象的理解要有一個過程,也就是說,僅僅知道隨機概念,還是未必能理解現實生活中的隨機現象。張德然認為,所謂隨機性數學思維是以隨機性問題為載體,通過發現問題、解決問題的形式,達到對現實世界的空間形式和數量關系的本質的一般性的認識的思維過程[3]。我國高中數學教材安排是先統計后概率,這與大多數國家中學階段的概率和統計內容安排順序不同,這可能是考慮到高中的統計內容只局限于簡單的概念和性質,不需要較為復雜的概率知識[1]。但是,回顧統計學的發展,要理解和形成統計思維,就需要理解統計的知識結構,而這個結構的構建是需要概率知識作為一種支撐的。因此,在高中階段,學生先學統計再學概率,在知識接收上會有一定的結構性障礙,不利于完整的統計思維的形成。另外,高中統計在教授“樣本估計總體”時涉及到了頻率圖,并且讓學生嘗試從頻率圖中得到結論。但我們知道在統計學的發展中,是先有正態分布曲線,然后才發現頻率圖和正態分布曲線的相似性,它們存在著一種知識理解上的遞進關系。不知前者,又如何理解后者?因此,在學生沒有理解概率分布的情況下,便無法很好理解頻率圖與正態分布之間的關系。可見,對于每一個教學內容的組織,都需要去貼近統計學的邏輯特點,只有在教學體系組織上體現出統計學的知識遞進關系,才能讓學生更好地理解與掌握。
統計中的分析和判斷帶有很明顯的不確定,需要結合數據背景才能夠解釋結果。學生要形成隨機性思維,需要他們自己在發現問題解決問題的過程中形成一個認知圖式,且是區別于確定性數學的認知圖式。
統計學的假定性表現在整體數據的假設和分析模型的假設兩個方面。在高中階段,整體數據的假設其實是體現在每個過程中的,盡管教材通常不會去刻意強調我們所進行的分析是基于對現實生活現象進行簡化的假定這一點。統計學分析模型的假定性在高中階段主要是回歸分析,教材設計的內容主要是讓學生明白如何建立模型,卻忽略了假定的過程的交待。但是,恰恰假定的思想在推斷統計中非常重要,它是區別于確定性數學,可以進行主觀判斷的基礎。在教學的過程中需要特別注意統計學中的假定思想,推斷統計的分析是建立在高度濃縮的信息以及假定的基礎上。高中階段兩個變量的相關關系的教學過程中,我們在理解了兩個變量之間的相關性后,還需要讓學生知道在其中一個變量變化后不一定導致另一變量的變化,其結論是建立在假設的基礎之上,因此要將統計中的相關關系區別于因果關系。
統計學中的假定性理解在高中教學目標中沒有明確提出,有可能導致教師對于假定性的忽略。因此,筆者建議在教授推斷統計時要首先由假設檢驗開始,這也符合學生對事物的認知特點,對一個新鮮事物我們會先有一個最初的判斷,然后再進行驗證并得到最后的結論。例如我們看到一個果子,一眼看上去和梨子長得很像,但也有不同的地方,但我們還是初步判斷它為梨子,然后再進行驗證,最后的結果可能是梨子也可能不是。因此,高中對于這部分的教學需要讓學生根據自己的經驗進行假設,然后進行驗證.這個階段注重驗證分析的過程,并讓學生體會和理解假設是我們進行推斷和分析的基礎,如果假設改變,可能結果也隨之變化。
總之,統計學的四性——數據特性、代表性、假定性和隨機性,非常凝煉地概括出了統計學的發展史,揭示了統計學的學科特征,這無疑為高中教學更好地教授和學習統計學,理解其神髓,提供了入門的鑰匙,這把鑰匙的功用在于:學習統計學,首先要理解統計的思想及其原理,要養成統計思維,以此為基礎,方法和技術的教與學才有根基。高中階段無疑是形成統計思維的基礎和關鍵階段,因此,在整個教與學的過程中,都必須好好地把握這一點。
參考文獻:
[1]王奮平.中、英高中教材概率統計內容比較研究——以英國AQA數學課本和北師大版數學課本為例[J].數學通報,2012,51(4):32-36.
[2]王建波.高中數學新課程統計內容的問題關注和教學建議[J].課程·教材·教法,2011,31(3):51-54.
[3]張德然,茹詩松.高中概率統計教學中關于隨機性數學思維的培養[J].課程·教材·教法,2003,(9):39-42.
[4]劉超,吳喜之.統計教學面對的挑戰[J].統計研究,2012,29(2):105-108.
[5]布魯納.教育過程[M].北京:文化教育出版社,1982.
[6]M·克萊因,西方文化中的數學[M].上海:復旦大學出版社,2004.
[7]陳希孺.數理統計學簡史[M].長沙:湖南教育出版社,2002.
[8]惠琦娜.從統計思維培養看統計教學改革[J].統計與決策,2010,(3):168-170.
[9]張獻民,統計平均數的統計學機理研究與應用[J].統計與信息論壇,2006,21(5):43-47.