十分感謝《管理學家》雜志給我這個難得的機會,來分享在數據分析與應用方面的心得。 比起“大數據”,我更喜歡“數據科學”的提法,這是因為:第一,在今后的分享中,我會更偏向于從技術層面探討如何利用數據優化管理決策;第二,數據量的大小固然重要,然而數據能否提升管理水平,更取決于管理者能否從經驗思維轉變為科學思維,或者更確切地說,轉變為實證思維。所以我想在這管理學家的領地上多談談科學。
中國人多以經驗思維為主,其特點是判斷多而論證少。即便有論證,也是基于邏輯的辯證多,基于數據的實證少。只要留意一下每天的新聞,就會發現經驗思維的例子比比皆是。拿最近的一條新聞“北京中秋前進入最堵一周”來說,媒體的普遍判斷是中秋前堵車是因為人們節前紛紛跑到北京去送禮。這一判斷符合我們的經驗,似乎也符合邏輯,但是卻恰恰缺乏實證。若從實證的角度驗證這一判斷,我們要回答以下兩個問題:為什么說這是最堵的一周?如何證明這最堵的一周是由人們從外地到北京送禮造成的?
要從實證的角度來回答第一個問題,首先要確定“堵”的衡量方式,比如說是以平均車速,或者平均車流量;“平均”又是在哪些時段上,哪些地區內,針對哪些車型(是否包括公交車)。然后,我們需要足夠多年份的每周“堵車”數據來支持我們的說法。最后,我們還需要收集盡可能多的控制變量數據,譬如每年中秋與國慶的間隔天數、天氣狀況、重要會議及活動、道路施工情況、北京的擁車情況、街道面積、高速里程、地鐵線路演變等等,因為這些因素都有可能影響堵車并影響我們對“中秋前是最堵一周”的證明。
可見,要從數據科學的角度很好地回答第一個問題并不容易,而要實證地回答第二個問題就更困難了。我們需要知道:每周有多少外地車輛進北京?是否中秋前的一周外地車最多?這些外地車輛是不是來送禮的?來送禮的外地車輛都在什么時間,什么地點出現?當他們出現時,是否直接觀測到了擁堵?如果沒有直接觀測到來送禮的外地車輛造成了擁堵,是否是本地車輛為了避開這些來送禮的外地車造成了其他時間,其他地點的擁堵?
從實證的角度做了這番思考,我們會發現,一個憑經驗得出的判斷竟然如此難以證明。其實,如果我們嘗試用數據科學的方法論來審視一下我們在管理中所做的判斷,我們同樣會吃驚于很多判斷極度缺乏實證依據。而這種將經驗思維轉變為實證思維所帶來的陣痛與震撼,卻是我們通向數據科學時代,通向數據驅動的管理決策必經的關鍵一步。
這種從經驗思維到實證思維的轉變,不僅是管理觀念的轉變,還會帶來操作層面和技術層面上的轉變。從對“北京中秋前進入最堵一周”的實證思考,我們實際上也對哪些數據會有用,哪些數據需要進一步收集,數據分析中哪些因素需要得到控制等等,有了更清晰的認識。并且,在對收集到的數據進一步做實證分析的過程中,我們的原有認識有可能會被顛覆,從而成為展開新一輪實證思考和數據收集的起點。比如說,通過對各主要路口的監控視頻進行分析,我們可能并沒有發現外來車輛的增加,但是卻發現本地公車牌照的出現頻率比往常要高。如果有這樣的發現,我們對擁堵成因的判斷就要修正,進一步的數據收集重點也會隨之轉到公車使用上了。
尤為重要的是,從經驗思維到實證思維的轉變,還能幫助我們找到更為高效和低成本的解決方案。還是拿堵車作為例子,基于經驗思維的判斷,往往會導致興師動眾、社會成本很高的解決方案,譬如限制外來車輛入京。而基于數據和實證分析的解決方案可能會是提高某些時段,某些區域內的停車費用;或是調節相應時段區域內的左轉和右轉限制及紅綠燈的間隔等。相比之下,這樣做的成本要小很多。
一直在用堵車說事,這看似只是政府公共管理的范疇,但其實解決堵車問題對企業的運營和營銷也會有影響。中秋節大家都要吃月餅,而這些年來,哈根達斯冰淇淋月餅已經成為一線城市中月餅的新寵兒。在促進哈根達斯月餅成功的因素中,其團隊運用實證思維來解決堵車問題也功不可沒。一開始,團隊選在離高速公路出口很近的地點建立臨時月餅領取點。從經驗思維的角度,這似乎很有道理,因為方便了消費者。但是團隊很快發現這樣做導致了交通阻塞,不僅降低了顧客的滿意度,也招來了政府交通部門的抱怨。之后其團隊從實證思維的角度,通過對顧客流量的時間空間分布的分析,優化了領取點的設置、產品配送和領取流程。 顧客的體驗和忠誠度自然也提升了。
令人高興的是,實證思維和基于數據的管理決策觀念正慢慢地深入人心。大家可能注意到臨近中秋時,不少網友吐槽“五仁月餅”難吃,并將其炒成了一個熱門話題。然而媒體朋友們并非人云亦云,而是通過問卷調查、銷量統計的方法為“五仁月餅”正了名。據9月18日《新京報》報道,消費者對五仁月餅評價排名第二,銷量良好,甚至部分店鋪都脫銷了。媒體需要這樣的實證思維,企業管理者也需要這樣的實證思維。過完中秋,品嘗完月餅,讓我們再更深入地分享數據科學的那些事兒。