流行大數(shù)據(jù)已經(jīng)有一段時(shí)間了。隨手翻翻,就能看到,諸如“大數(shù)據(jù)教你史上最快升職方法”、“大數(shù)據(jù)教你怎么選購房子”,甚至還有“大數(shù)據(jù)教你怎么選女朋友”……以前筆者一直抱著看過笑笑的態(tài)度,直到有天,在筆者從事的行業(yè)里,用“大數(shù)據(jù)做的新聞”也上了電視、登了版面,并且據(jù)說,一些國外的經(jīng)濟(jì)學(xué)院、金融學(xué)院還有新聞學(xué)院,也都開出了大數(shù)據(jù)課程。讓人真真感到,大數(shù)據(jù)改變我們的生活,不再是一句口號(hào)。
讓這種感慨更強(qiáng)烈的,是在今年“全國兩會(huì)”上,李克強(qiáng)總理在政府工作報(bào)告中指出,制定“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃,推動(dòng)移動(dòng)互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合,促進(jìn)電子商務(wù)、工業(yè)互聯(lián)網(wǎng)和互聯(lián)網(wǎng)金融健康發(fā)展,引導(dǎo)互聯(lián)網(wǎng)企業(yè)拓展國際市場。
確實(shí),大數(shù)據(jù)之于經(jīng)濟(jì),之于決策,之于傳媒,都是個(gè)偉大的工具。有人評(píng)價(jià)說,解決由大規(guī)模數(shù)據(jù)引發(fā)的問題,探索以大數(shù)據(jù)為基礎(chǔ)的解決方案,是中國產(chǎn)業(yè)升級(jí)、效率提高的重要手段。數(shù)據(jù)挖掘不僅能夠成為公司競爭力的來源,也將成為國家競爭力的一部分。甚至,有人對(duì)于我們當(dāng)前面臨的教育、交通、醫(yī)療保健等各方面挑戰(zhàn),也將希望寄托于“大數(shù)據(jù)”來解決。
筆者之前不甚喜歡“大數(shù)據(jù)”,或許出于一種自我保護(hù)的本能。在一次會(huì)議上,某電信公司高管談起大數(shù)據(jù),他說,目前的技術(shù)手段可以測算出停留在某塊戶外廣告牌的人流量,以及停留的時(shí)間——通過我們每個(gè)人的手機(jī)。他更講到這些信息經(jīng)過脫敏,若作為商業(yè)用途,是不錯(cuò)的廣告位流量計(jì)算方式。言下之意,這些原始信息是可以看到個(gè)人隱私的。聽到這些,我小心翼翼關(guān)了手機(jī)里智能軟件的所有定位功能——盡管知道這其實(shí)沒什么用。誠然,對(duì)于個(gè)體來講,要便利還是要隱私,可以是個(gè)人選擇,但當(dāng)前的數(shù)據(jù)生產(chǎn)者的我們卻無法選擇、無處遁形。有一個(gè)形象又略帶幽默的說法,隨著大數(shù)據(jù)的廣泛應(yīng)用,這個(gè)世界越來越透明,我們就像生活在玻璃魚缸里。
不管大數(shù)據(jù)、云平臺(tái)給個(gè)體帶來的是積極幫助還是無奈甚至是消極影響,它已經(jīng)來了。甚至還有人鼓吹“得數(shù)據(jù)者得天下”。不過,撇開情感上的好惡,筆者想要說的是,大數(shù)據(jù)固然好,但也有教不會(huì)你的事。數(shù)據(jù)不會(huì)說謊,但數(shù)據(jù)很可能“失靈”,對(duì)于一些與人打交道的行業(yè),尤其值得注意。
《黑天鵝:如何應(yīng)對(duì)不可知的未來》的作者,納西姆·塔勒布認(rèn)為,數(shù)據(jù)會(huì)制造出更大的“干草垛”。隨著我們掌握的數(shù)據(jù)越來越多,可以發(fā)現(xiàn)的統(tǒng)計(jì)上顯著的相關(guān)關(guān)系也就越來越多。這些相關(guān)關(guān)系中,有很多都沒有實(shí)際意義,在真正解決問題時(shí)很可能將人引入歧途。這種欺騙性會(huì)隨著數(shù)據(jù)的增多而指數(shù)級(jí)地增長。在這個(gè)龐大的“干草垛”里,我們要找的那根針被越埋越深。
是的,就像數(shù)據(jù)記錄下筆者每天會(huì)經(jīng)過某座商廈,有時(shí)會(huì)停留在那里用餐,數(shù)據(jù)可能會(huì)分析出筆者去過的哪家餐廳次數(shù)最多,甚至能據(jù)此分析出筆者最愛哪家餐廳的哪個(gè)套餐,但事實(shí)上,這并不準(zhǔn)確,計(jì)算機(jī)數(shù)據(jù)分析擅長的是測量“量”而非“質(zhì)”,它永遠(yuǎn)分析不出,筆者是罵罵咧咧吃完這一餐的,還是在贊美中吃完的。而很有可能,筆者喜愛的一家餐廳,因?yàn)槁吠具h(yuǎn),去的次數(shù)反而少。
即便大數(shù)據(jù)分析得都十分正確,但結(jié)果可能走向哪里呢?說一個(gè)熟悉的例子,某個(gè)新聞產(chǎn)品的微信公眾號(hào),早期還以民生服務(wù)為主打,慢慢地,當(dāng)大量數(shù)據(jù)告訴內(nèi)容生產(chǎn)者,兇殺、情感糾紛、家庭倫理、地域紛爭是讀者最偏愛的內(nèi)容,于是,這個(gè)公眾號(hào)接受了數(shù)據(jù)分析的建議,修正自己的產(chǎn)品供應(yīng)來迎合讀者。在筆者看來,原本更有益的、也更有用的內(nèi)容卻被拋開了。很多人說的大數(shù)據(jù)“偏愛潮流,忽視杰作”。當(dāng)大量個(gè)體對(duì)某種產(chǎn)品迅速產(chǎn)生興趣時(shí),數(shù)據(jù)分析可以敏銳地偵測到這種趨勢。但一些重要的產(chǎn)品在一開始就被數(shù)據(jù)擯棄了。
牛津大學(xué)教授維克托·邁爾·舍恩伯格熱切支持大數(shù)據(jù),但他也說,應(yīng)該專注于對(duì)人們有益的領(lǐng)域,有的時(shí)候數(shù)據(jù)可能不會(huì)告訴我們哪些是對(duì)于我們?nèi)颂貏e重要的地方,但這就是人和電腦之間的差異。人可以更好理解世界,我們有理解能力,所以也要變得更加謙遜。數(shù)據(jù)只是對(duì)于一個(gè)事實(shí)的體現(xiàn),數(shù)據(jù)經(jīng)常是不完整的,也經(jīng)常是不完美的,所以做大數(shù)據(jù)分析,不僅僅是以謙遜的態(tài)度去做,而且要以人性化的態(tài)度去做。