陸峰 王愛軍



我們正處于一個信息爆炸的時代,每天都會被各種各樣的“大數據”包圍著,面對著紛繁冗雜的各種數據,具備“數據分析”能力就顯得尤為重要,“數據分析”是指從研究對象獲得相關數據,運用統計分析等數學方法對數據中的有用信息進行分析和推斷,形成知識的過程,主要包括:收集數據,整理數據,提取信息,構建模型對信息進行分析、推斷,獲得結論,數據分析是大數據時代數學應用的主要方法,已經深入到現代社會生活和科學研究的各個方面,在數據分析核心素養的形成過程中,要求我們要提升數據處理的能力,增強基于數據表達現實問題的意識,養成通過數據思考問題的習慣,積累依托數據探索事物本質、關聯和規律的活動經驗。
一、直觀感知數據,“初加工”后嘗試進行“毛估"
毛估是一種快速的近似估算,它的基本特點是對數值作擴大或縮小,從而對運算結果確定出一個范圍或作出一個估計,更本質地看毛估,它應該是直覺基礎上的一種數學意識,是在蜂擁而來的眾多信息面前,迅速捕捉一批有用或關鍵信息的那種數學素質。
二、慧眼看待數據,勿讓數據蒙蔽了我們的雙眼
對于同一個數據,不同的人往往有不同的解讀,這是由于為了論述自己的論點是正確的,不少人總喜歡從自己的角度帶有感情色彩地看待手中的數據,這時你怎么辦?是人云亦云、鸚鵡學舌嗎?當然不能!借用那英的歌詞:給我給我一雙慧眼吧,讓我把這紛擾看個清清楚楚明明白白真真切切,
例3(2016年第19屆北京高中數學知識應用競賽第3題)2015年11月4日,某媒體北京報道:在2013年3月13日曾經報道過京城“菜籃子”,記者在一個菜市場調查,用10元錢可以買3.3斤油麥菜,或者10斤胡蘿卜,或者4根大蔥;現在記者又來到菜市場調查,用10元錢買同樣的三種蔬菜,可以買3.3斤油麥菜,或者5斤胡蘿卜,或者10根大蔥,記者由此給出結論:現在京城“菜籃子”物價水平與兩年前變化不大。
嚴同學看到上述信息,指出:這樣的結論不可靠,(1)你同意嚴同學的觀點嗎?為什么?(2)如果同意嚴同學的觀點,請你為“某媒體”作出2015年11月4日報道新方案,并對“菜籃子”物價水平作出可靠分析,
(注:“斤”為舊的市制質量單位,1斤=0.5千克)
解(1)同意,原因是以下兩方面:①蔬菜是季節性商品,不同季節的物價差異很大,2013年3月13日是冬末春初,而2015年11月4日為秋末冬初,這兩個季節的蔬菜價格沒可比性;②報道中作出的結論只依據了10元錢購買三種蔬菜價格變化情況,品種太少,權威部門的蔬菜價格指數涉及到近20個蔬菜品種,可見用三種蔬菜不足以說明問題,
(2)為了作出“現在”(2015年11月4日)的京城“菜籃子”物價水平與兩年前比較的可靠的結論報道,要分以下幾步來做,
第一步:直接采集官方公布的2013年11月初的某一天和2015年11月初的某一天的多種蔬菜價格數據,由于權威部門的蔬菜價格指數涉及到近20個蔬菜品種,所以這里數據涉及的品種也要十幾種才能說明一些問題,下面是來自中國好鮮生網WWW,guoshul23,cn新發的農產品有限公司在2013年11月3日16種蔬菜的中間批發價數據,單位為元/斤。
第三步:計算16種蔬菜的平均變化率P.P=-29.6%。
第四步:得出結論,2015年11月3日的物價(批發價)水平比兩年前同期下降了約29.6%。
需要說明的是,蔬菜價格數據應當是某一個具有代表性的農貿市場的零售價格,或是多個農貿市場的零售價格的平均值,現在的數據可以通過市場調查得到,但是,一般人想拿到兩年前的相關數據很困難,所以這里采用了可以查到的批發價格。
按照批發價的數據表,油麥菜和大蔥的兩年價格基本相當,而除了這兩種蔬菜,其他14種蔬菜降幅百分比都是兩位數,平均降幅為33%。
而在查找數據時,發現2015年11月3日有“胡蘿卜(洗)”的中間批發價為0.85元/斤,價格顯然比“胡蘿卜”的高很多,也比兩年前的“胡蘿卜”高,而在2013年11月5日的資料中沒見“胡蘿卜(洗)”這個品種,如果不注意胡蘿卜是否“洗”過,就會出現價格誤解。
由此可見,即便使用兩年11月初(同期)油麥菜和大蔥的價格比較來評價整體物價水平,也是不對的,它們的價格水平變化不具有代表性!“某媒體”對京城“菜籃子”的價格水平比較方法是錯誤的,而且結論也是錯誤的。
三、實際收集數據,學會分析其中蘊涵的規律
現實生活中與我們密切相關的數據有很多,有時候直接采集會有困難,但我們可以從資料上收集,并進行整理、分析,尤其要關注社會熱點問題,在數據中我們可以進一步探究其中蘊涵的規律性的東西,積累依托數據探索事物本質、關聯和規律的活動經驗,以下這道與“環?!毕嚓P的問題就很有現實意義。
例4某化工企業每月收入為80萬元,從今年起,若不改善生產環境,則在生產過程中產生的污水由污水廠處理,每月上交定額5萬元的治污費,如果該企業從今年1月份起投資300萬元增加回收凈化設備以改善生產環境,降低企業生產成本,已知該設備每月的運轉費用是0.2萬元,問:經過多少個月,投資開始見效,即投資改造后的月累計純收入多于不改造時的月累計純收入?
因此在短時間內,企業采取節能減排措施需要的投資是一筆不小的數目,甚至會對企業資金的周轉產生一定的影響,故一些企業不愿積極主動采取措施,但從長遠來看,若企業采取了節能減排措施,不但改善了生產環境,而且還為企業帶來了更大的經濟效益和更強的市場競爭力,應值得推廣。
5.模型的評價與改進,
模型最大優點在于對原始數據擬合時,采用多種方法進行,使之愈來愈完善,具有很高的擬合精度,但沒有考慮眾多的實際因素的影響,只是出于一種相對理想的狀態下進行分析求解,可能投入現實中達不到預想的結果,若考慮由于原材料價格變化,以及設備老化而產生的維修費用等眾多的實際因素的影響,并采用整個行業平均數據作為樣本進行建模,所得模型可能更具有代表性。