當“大數據”這個概念開始進入我們視野的時候,我們還是一個不折不扣的“小數據”社會——我們每年新增的數據量不足美國的十分之一。這里面當然有技術和管理上的原因,但更重要的是我們數據意識的淡漠。在這個背景下,毛澄潔老師開設的“數字科學家”校本課程可謂大膽而且超前,對于大數據時代學生應該具備什么樣的能力、素養,課程給出了自己的回答??赐昝蠋煹恼n程設計與案例,我不禁想起了和大數據有關的三個故事:
第一個故事來自美國西雅圖的一家公司。2011年,西雅圖一家叫Decide.com的科技公司推出了一個網站,最初它想做的是為顧客收集產品的價格數據和產品信息,然后發布給顧客,這樣的大數據網站可謂比比皆是。在第一年,Decide.com分析了和近400萬件產品相關的250億條價格信息,結果卻發現了一些怪異的現象。比如,其中的一個不合理現象是:每當新產品發布的時候,舊產品反而會經歷一個短暫的價格上浮。這是由于大部分人都會習慣性地認為新產品發布了,舊產品會降價,所以如果你這時候購買舊產品的話,可能比購買新產品還要貴。于是,Decide.com開始告知用戶購買產品的最佳時機,以避開不正常、不合理的價格高峰。它的預測準確率達到了77%,使每個顧客在購買產品時平均節省了100美元,網站迅速異軍突起、大獲成功。
Decide.com成功的關鍵是“大數據”嗎?當然,離開數據,Decide.com不可能成功。但真正讓它成功的并不是那些數據,而是思想,是人的創新思想。
第一個故事告訴我們,對于大數據教育,人,也就是我們的學生,永遠比數據本身重要。
第二個故事是著名作家劉震云講述的,劉震云到德國杜塞爾多夫訪問的時候,一次德國朋友請他在萊茵河邊吃飯。賓主閑聊之際,劉震云順嘴問了一句:“萊茵河有多深?”幾個德國朋友一下子就緊張起來了,湊在一塊兒交頭接耳、嘀嘀咕咕。劉震云好奇地問是怎么回事,德國朋友解釋說,因為這個問題特別難回答,萊茵河春天的河水深度和夏天不一樣,夏天和秋天不一樣,秋天和冬天又不一樣,很難說出一個確切的數據來。劉震云說,這個問題要是換作問我們村兒的人,他知道不知道都會馬上告訴你:“大概五米吧。”
這正是百年前胡適先生給中國人起的綽號“差不多先生”,著名歷史學家黃仁宇也說中國最缺乏的就是“數目字管理”。對于張口閉口“大概”、“差不多”、“少許”、“若干”、“一些”的我們,養成用數據說話的意識和習慣恐怕更為重要。
第二個故事告訴我們,對于大數據教育,讓學生養成用數據說話的習慣是最重要的,這比讓學生掌握多少數據分析的方法都重要。
第三個故事的主角是大家耳熟能詳的沃爾瑪。沃爾瑪是世界上最大的零售商,擁有超過200萬的員工,銷售額約4500億美元,理所當然的,它也是美國企業中擁有數據資源最豐富的。沃爾瑪的歷史交易記錄是一個龐大的數據庫,它記錄了每一個顧客的購物清單、消費額、具體購買時間,直至購買物品當日的天氣。通過對數據的分析,沃爾瑪公司發現了有趣的現象:每當季節性颶風來臨前,看似無關的手電筒和蛋撻的銷量同時增加。此后,沃爾瑪就在季節性颶風來臨的時候,把庫存的蛋撻放在靠近手電筒等防颶風用品的旁邊,果然使銷量更上一層樓。
第三個故事告訴我們,當你對大數據進行分析時,會發現很多類似的有趣、出乎意料的現象,它們是那么具有挑戰性,以至于對數據進行分析真正成為一件樂此不疲的事情。而樂趣才是讓學生養成數據意識最有效的法寶。
大數據教育,我們關注的永遠都應該是學生而不是數據;要讓學生養成用數據說話的習慣;讓他們感受到對數據的分析其樂無窮。而這些也正是毛老師的課程要告訴我們的。