邵兵 代麗靜



關鍵詞 證據意識,數據史料,大數據,小樣本
中圖分類號 G63文獻標識碼 B文章編號 0457-6241(2020)05-0042-06
目前,中學教學和大規模的考試越來越重視證據意識的培養和考查,教與考都普遍使用文獻史料。數據史料是文獻史料的一種,近年高考和各地中考經常用之考查學生理解歷史問題的能力。筆者發現,運用數據史料存在一些明顯的誤區,會影響試題的效度和信度;在教學中使用則不利于培養學生辨析史實及史論之間邏輯關系的能力。本文試舉例說明三個誤區的具體表現,就教方家。
誤區一:將數量等同于質量
數量和質量是人們認識歷史事物、歷史現象必不可少的兩個維度。通常情況下,質量必須要以一定的數量為基礎,質量的提升源自數量的積累。在一般的教學和命題中,往往只關注二者的聯系,而忽視二者的區別,將數量直接等同于質量。這是以數據為證據需要注意的問題。
案例1:講授部編初中教材《中國歷史》八年級上冊第18課“從九一八事變到西安事變”,有位教師在課堂上呈現了下列一組數據:
設置問題:面對日本的侵略行為,蔣介石政府采取了什么政策?結果如何?在解讀數據后,教師引導學生得出結論:東北軍的軍事實力明顯優于日軍,蔣介石政府是在軍事實力占優勢的情況下,實施不抵抗政策,進而導致東北大片國土在四個多月內淪喪的慘痛后果。
分析:毫無疑問,“九一八事變”后,蔣介石政府奉行不抵抗政策,要為東北地區大片國土淪喪承擔主要責任。但是,我們不能僅以這些數據判斷東北軍的實力。假定上述數據準確,授課教師單獨用以解讀事變前的力量對比,也會走入將數量直接等同于質量的誤區,從而得出東北軍實力占優的結論。
軍事實力是一個國家硬實力的重要組成部分,屬于支配性實力。對于一支軍隊來說,軍事實力顯然屬于質量范疇,其構成要素具有豐富性、復雜性和動態性等特征,絕非某一個或幾個要素的數量能簡單反映的。影響軍隊實力的要素,除了軍隊規模、武器數量、指揮力量,還包括兵員素質、訓練水平、后勤保障、裝備水平、作戰經驗、兵源體系等方面。事實表明,抗日戰爭期間中國軍隊整體實力非但不占優,還明顯處于劣勢。主要表現在以下幾個方面:
第一,兵員文化素質情況。戴旭在《國力懸殊?戰力何在?抗戰前中日軍備對比》一文中指出,截至1936年底,中國具備高中學歷并參加了完整軍事訓練的預備兵人數僅17490人(注:約占現役常備軍人數的1%),候補軍官中達到大專及以上學歷的僅880人。很多基層軍官連花名冊都認不全,平日很少研究戰術,戰時全憑血氣之勇。①全國情況如此,東北軍的情況也好不到哪兒去。
第二,后勤保障情況。古人云:兵馬未動,糧草先行。后勤保障對軍隊戰斗力十分重要。抗日戰爭時期,因為經費緊張,軍事工業水平落后,國民政府腐敗等原因,中國軍隊平時大多打空槍訓練射擊。中央軍的物質條件最好,練習射擊時單兵配發的子彈也只有15發,作戰時單兵配發20發子彈。與之相比,日軍規定,新兵訓練射擊時,單兵每月配發步槍子彈不得低于150發,機槍子彈不得低于300發。據統計,1/3的日軍士兵使用步槍可以達到優秀射手的水平。②后勤保障水平直接影響訓練水平,中國軍隊單兵訓練水平明顯落后于日軍。
第三,作戰經驗情況。“九一八事變”發生時,駐扎在長春的東北軍約為5840人,分別駐在城內、南嶺、寬城子三個區域。駐扎于此的日本關東軍約為900人。③早在1931年7月,駐寬城子的東北軍就在營區開挖了工事;駐南嶺的東北軍則放言只需兩個小時就可讓日本駐長春軍隊潰滅。這表明駐扎在長春的東北軍對日軍早有戒備。然而,當日軍于9月19日凌晨分別向寬城子和南嶺發起攻擊時,東北軍奮勇抵抗,卻“終因麻痹輕敵,防御設施形同虛設,對日軍的突襲始料未及,以致喪失了有利戰機。其所進行的無序抵抗,顯得異常混亂,死傷、被俘、逃亡更是無法統計”。④另有研究表明,單就作戰經驗一項對比,徐州會戰時期中國軍隊二至三個軍,才能應對日軍的一個師團。⑤
僅以這三個方面例證,即可知單純依據中日雙方的兵力、武器裝備等數據,不能得出中國軍隊實力占優的結論。如果單憑數量多就認為中國軍隊實力占優,那就無法解釋全面抗戰以來正面戰場一系列重大戰役的結果。具體數據見表2:
在這個因果邏輯中,如果把中國軍隊的兵力規模、武器數量、政治立場等三個要素視為自變量,那么戰事結果則為因變量。比較“九一八事變”和上述重大戰役,我們發現自變量中兵力規模(和武器數量)優勢沒有變,戰事結果這個因變量也沒有變。至于國民政府的抗戰立場應該說沒有變,政治腐敗對豫湘桂戰役的影響明顯,在之前的戰役中戰略失誤較多,但主要還是實力不如人。
誤區二:將相關性等同于因果性
洞察歷史事物、歷史現象之間的因果關系,是探索歷史發展規律的必然要求,也是中學歷史教學的重點目標之一。因為“有三件很重要的事只有在清楚原因的情況下才能做到,或者做到最好,這三件事是:預測、解釋和干預”。⑥在揭示歷史事物、歷史現象之間的因果關系時,數據往往具有不可替代的證據力,因而備受重視。但是,在使用數據過程中,常常出現將因果關系與相關性等同視之的情況。
說到相關性,人們常常用“雄雞一唱天下白”這句詩來打比方。詩中提到的兩個現象,即雞鳴和天亮兩個變量之間存在關聯,但是它們之間不存在因果關系。就是說,雞鳴并不是造成天亮的條件,或者天亮并非雞鳴造成的后果。以此來說明相關性和因果性的區別,很容易被理解。但是,現實情況卻比這個例子要復雜得多。通常我們觀察到的因果關系中的變量都具有相關性,但是,反之則不能說具有相關性的變量之間一定存在因果關系。將相關性等同于因果性,是將數據轉化為證據過程中需要避開的誤區之二。
案例2:1923—1929年間,美國制造業工人工資增長了8%,工人每小時的效益卻增加了32%。這組數字資料可用來說明美國
A.最低工資標準已失去作用
B.工業生產持續快速發展
C.加緊占領殖民地取得海外市場
D.經濟危機出現的主要原因
答案:D
分析:該題通過材料呈現了美國歷史上的兩個數據:制造業工人工資的增速和他們創造效益的增速。比較這兩個數據可以發現一個現象:制造業工人工資的增速遠低于他們創造效益的增速。結合選項內容,可知命題者的結論是:上述現象是美國經濟危機出現的主要原因。這是一個確定的因果關系表述,兩個數據在此充當了論據。該結論對應的教科書內容是:“生產力不斷提高,企業利潤大幅增加,但工人的工資卻增長緩慢,購買力嚴重不足,導致出現生產過剩。”①
進一步分析,我們會發現該題的邏輯中包含了三對因果關系。其一,因為存在制造業工人工資增速低于他們創造效益增速的現象,所以可以得出企業利潤大幅增加、工人工資增長緩慢的結論;其二,因為工人的工資增長緩慢,所以(社會)購買力嚴重不足;其三,因為生產力提高和購買力不足,所以出現生產過剩,即經濟危機發生的直接原因。不難發現,在這個邏輯鏈條中,材料呈現的兩個數據與經濟危機發生的直接原因(不是題目所述的主要原因)之間并不存在確定的因果關系,而只是相關性關聯。本文試從兩方面來說明這個觀點。
第一,經濟危機發生的主要原因。眾所周知,按照馬克思主義觀點,資本主義經濟危機發生的主要原因是生產社會化與生產資料資本主義私有制之間存在不可調和的矛盾。歷史發展進程顯示,“生產力必然朝向社會化的方向發展,而資本主義生產關系卻以生產資料的資本主義私人占有制度為核心”。這就會導致“生產力朝向社會化方向越是發展,越是要求生產資料共同所有、全面所有;而資本主義生產方式越是發展,越是強化資本主義所有制,即越是導致生產資料愈發集中于少數人手中”。②
馬克思主義的這一科學論斷早已被經濟社會實踐所證明。這一論斷中的自變量是生產社會化與生產資料私有制之間的矛盾,因變量則是資本主義經濟危機。危機的程度隨著矛盾激化程度的變化而變化,當矛盾激化到一定程度時,經濟危機隨之爆發,二者之間是確定的因果關系。抓住了主要矛盾和矛盾的主要方面,我們才可能走在探索歷史規律的正確道路上,做出合乎歷史真實的解釋、預測。
只有清晰地認識到資本主義經濟危機發生的主要原因,我們才能符合邏輯地解釋二戰結束以來資本主義世界的變與不變。二戰結束后,為了緩和社會矛盾,以美國為代表的西方主要國家紛紛建立和完善社會保障制度體系,這一進程至20世紀六七十年代基本完成。其效果表現為提升國民生活質量,其抓手主要有兩個:一是增加國民收入,如美國兩次修訂《社會保障法》,擴大受益群體,提高最低工資水平;二是減少國民開支,如資助貧困學生,提供醫療保障、住房、養老等公共服務。簡而言之,就是政府通過立法、提供公共服務等手段,實現讓國民開源節流、增加收入的效果,也就是壯大中產階級群體,打造橄欖型社會的思路。此為資本主義世界的新變化。
二戰結束至20世紀末,資本主義世界還存在一個不變的特征,就是周期性發生經濟危機。具體發生時間為:1957—1958年,1973—1975年,1980—1982年。這些經濟危機的發生誘因、外在特征、持續時間和危害程度等存在差異,但是其本質沒有變化。
綜合二戰后資本主義世界的變與不變,我們可以看到,主要資本主義國家增加國民收入的措施,并沒有改變經濟危機周期性發生的情況。這表明,該題材料中的數據不能用來說明經濟危機發生的主要原因。
第二,材料中的數據與經濟危機發生的相關性。馬克思經濟學關于資本主義經濟危機發生的具體機理存在四種理論假說,其中“資本有機構成提高危機理論”和“消費不足危機理論”都指向同一種狀況,即工人的收入與資本收入增長,形成一體兩面的邏輯結構關系。①這種狀況里隱含了一個前提,就是企業創造的財富是一個定量,在財富分配過程中,工人的收入與資本收入此消彼長,二者的關系具有零和博弈特征。
如此說來,是不是說明材料中的數據與經濟危機發生存在因果關系呢?答案依然是否定的。因為材料中的數據反映的是工人工資和工人每小時創造效益的增長率,而非增加值,更非工資總數和效益總數。這三種數據在上述邏輯關系中的證據力不可同日而語,甚至是有無證據力的差別。我們可以通過一道河北省中考試題(2009年第18題)來說明:
由下圖得出的結論,不正確的是
A.日本經濟增長速度最快
B.聯邦德國在西歐四國中經濟增長速度最快
C.各國經濟增長速度不均衡
D.美國失去了世界經濟霸主的地位
答案:D
該題顯然是圍繞統計對象設置了干擾。材料提供的數據反映的是各國經濟發展速度,卻不能反映各國的經濟總量。而美國能否保有世界經濟霸主地位,取決于經濟總量,所以無法依據材料提供的數據得出相關結論。同理,工人工資和工人每小時創造效益的增長率,可以確定與工人收入和企業效益相關,卻不具備證明二者具體狀況的效力。
誤區三:用小樣本數據解讀
大范圍現象特征
利用數據解讀歷史現象,歸納歷史發展規律,需要經過收集數據和篩選、整理數據兩個程序。數據的廣泛性、完整性和準確性等特征直接關乎解讀結論的效度和信度。在這方面,大數定律是我們可以使用的權威理論工具。它是概率論歷史上第一個極限定理,它依據大量的觀察,使得個別的、偶然的差異性相互抵消,顯示出總體的必然的規律性,揭示了大量隨機變量的平均趨勢,為研究隨機現象的規律性提供了科學的依據。②由大數定律可知,如果不斷地增加樣本數量,那么與客觀存在的結果之間的差異也會減小,而最終這個差異將會趨向于零。③但是,在教學和命題實踐中,存在只用小樣本數據就做結論判斷的情況。用小樣本數據解讀大范圍現象特征,是將數據轉化為證據過程中需要避開的誤區之三。
案例3:表Ⅰ川沙縣部分名人簡歷表
表Ⅰ是19世紀末20世紀初毗鄰上海的川沙縣部分名人的簡歷,說明當時國內
A.科舉取士轉向選拔實務人才
B.傳統社會結構受到沖擊
C.儒家的義利觀念被拋棄
D.新式工業在經濟中居于主導
答案:B
分析:該題旨在以川沙縣三位名人的簡歷為據,說明19世紀末20世紀初國內社會士農工商分立的結構已受到沖擊的特征。若單從獲取正確答案的需求,或單從考查知識目標和識記能力的角度考慮,只需依據題干中19世紀末20世紀初這個時間要素,結合基本常識并運用排除法即可,無須關注材料呈現的現象內容。具體而言,排除A的理由有二:一是在清朝科舉制度體系中,國學生、監生、生員等均屬身份,而非功名,是否可以列入被“取”之“士”的序列有待商榷;二是材料未說明這些名人取得上述身份與他們的事跡之間的時間關系,無從判斷他們取得身份與所做事跡之間的關系,進而無從反映當時取士的標準。排除C的理由是,“義利觀念”未作為一個概念在教材中出現過,考生只有根據選項提示,用它的上位概念“儒家觀念”來替代,而常識是儒家觀念在19世紀末20世紀初未被拋棄過。排除D的理由無須贅言了。
作為大型教育考試(2019年全國高考)的試題(全國Ⅰ卷28題),其命制原則要求試題材料提供的信息應該能夠滿足考生完成應答的需要。①那么,拋開根據已知結論解讀材料的思路,我們來看一看情境材料能否為結論提供充分證據。材料中雖然沒有出現數字,但是依然包含了數據信息,即人物數量為三人,地域數量為一個。那么用一個縣里三個人的情況,能否說明一個廣土眾民國家的社會結構特征呢?
清嘉慶十五年(1810年)置川沙廳時,編有戶口99964人。民國三十六年(1947年)戶口調查為135147人。②川沙鄰靠上海市區,1840年至1949年的百余年中,人口流動頻繁。據此可以判斷,19世紀末20世紀初川沙縣人口規模應該不低于10萬人,也就是說材料提供的3人之數只在川沙縣人口總數的10萬之中,占極小比例。據此斷言川沙縣社會結構發生變化,已屬依據小樣本數據得出統計推斷,又怎能據此斷言全國情況?
案例4:1915—1918年,《新青年》中“革命”“科學”“平等“民主”等詞出現頻次大體相當:1919—1922年,“民主”出現次數不到“科學”的1/10,不及“革命”的1/20。這種變化可說明
A.新文化運動主流思想發生轉變
B.國民革命運動受到民眾普遍擁護
C.資本主義政體模式被知識界否定
D.中國社會主要矛盾發生改變
答案:A
分析:該題旨在通過材料呈現一個現象:1919—1922年,《新青年》中“革命”一詞的出現頻次遠高于“民主”一詞,而在此之前兩個詞的出現頻次大體相當。據此推斷新文化運動主流思想已發生轉變。其考查的知識內容是,“五四”運動的興起,極大地促進了馬克思主義在中國的傳播,新文化運動主要內容也隨之改變。若單從獲取正確答案的需求,或單從考查知識目標和識記能力的角度考慮,只需關注材料提供的現象發生時間即可,無須關注現象內容。具體分析思路參看案例3。
該題是2019年高考文綜全國Ⅰ卷29題。我們同樣要看情境材料能否為結論提供充分證據。情境材料中包含的數據有:雜志1本,次數比值3個,詞匯3個。其中變化內容是通過次數比值反映的,即由約為1/1/1,變為小于1/10和小于1/20。雜志數量和詞匯數量均未變化。首先,我們知道比值和比率都是用來表示部分與部分、部分與整體數量關系的。在這個情境里,3個比值能夠說明的是3個詞出現頻次的關系,而不是它們出現頻次的確切數量,更不能反映是否還有其他出現頻次更高的詞匯,以及這些詞是什么。所以,對于1本雜志的用詞量來說,3個也屬小樣本數據。其次,我們知道《新青年》是新文化運動的主陣地,我們也應該知道《新青年》不是新文化運動的唯一雜志,或者為數不多的幾本雜志之一。據統計,1919年至1920年,全國發行的報刊有400余種。③可見,1/400又是一個小樣本數據。第三,即使1919—1922年“革命”一詞出現的頻次遠高于“民主”這一現象與新文化運動主流思想發生轉變這一判斷,在史實角度存在一致性,但是,按照大規模教育考試試題命制的基本邏輯,試題材料提供的數據依然無法說明上述判斷。
歷史教學的任務不僅是幫助學生認識歷史發展規律,更要培養學生形成收集證據,驗證規律的能力。初中歷史課標要求,“了解以歷史材料為依據來解釋歷史的重要性;初步形成重證據的歷史意識和處理歷史信息的能力”;①普通高中歷史教學的目標則進一步明確,“通過對史料的搜集、整理和辨析,辯證、客觀地理解歷史事物,不僅要將其描述出來,還要揭示其表象背后的深層因果關系。通過對歷史的解釋,不斷接近歷史真實”。②因為即使規律是正確的,也會因為采用了錯誤的驗證方法、使用了不真實的論據而受到人們的懷疑。③方法是建立在認識基礎之上的。希望筆者的粗淺認識能夠起到拋磚引玉的作用,引起更多同行對正確使用數據證據的關注,避開誤區,行穩致遠。
【作者簡介】邵兵,中學高級教師,石家莊市裕華區教研中心歷史教研員。
代麗靜,中學一級教師,邯鄲市第十中學歷史教師。
【責任編輯:王雅貞】