T:大數據這個概念自誕生以來,深受輿論追捧,但也存在種種誤讀,如何準確而言簡意賅地定義大數據?
F:簡單說,大數據關乎那些可以改變我們生活的應用,比如運動健康、食品運輸、零售、智能城市等。能否成為“大數據”的關鍵在于,你能否將這些數據真實運用到現實中。不能用的話,數據本身無意義,并不能保證讓你做出更好的決定。
關于大數據最大的誤解我想在于“大”這個概念。雖然叫做“大數據”,但不一定要“大”才會產生影響。切入的視角和分析手段更重要,真正有意義的并非數據的規模,而是它能如何產生影響。

T:大數據真的會改變很多行業嗎?具體來說,它究竟是怎樣改變行業既定規則的?
F:IT業當然是最明顯的,大數據可以影響服務器、基礎設施、計算機的管理等。
另一個是零售行業,尤其是電商,交易規模、消費偏好、購物興趣等,大數據都可以在你做決策時給出參考。
此外還有健康管理。醫生可以根據大數據來監測病人的健康情況,你也可以監測自己的健康。
還有可能涉及教育產業,去發現一種更具自我驅動力的學習方式,定制化的APP可以知曉如何用更好的方式去教育特定的學生。
教育產業獲得數據的方式可能有兩種:其一,當學生在學校遇到困難時——完成作業通常很慢,在測試中表現不佳,逃課,這些都是學生的數據碎片。如果你擁有了成百上千個學生的數據碎片,就可能預測在哪些時間段哪種學生會需要何種幫助,從而讓老師能更合理有效地分配工作時間。
其二,紙質材料已經很傳統了,更有自我驅動力的個性化數字教材,可以在你學習的過程中“學習”你。
不過,與其探討大數據會最多改變哪些行業,不如探討,大數據會以怎樣的順序改變這些行業。因為現在幾乎所有領域都看到了大數據的影響力。我的書名副標題是“大數據如何改變我們的學習、生活甚至愛”,這是個大題目,但這是真的。生活的衣食住行和教育都顯現出大數據的作用了,至于愛這個話題——社交媒體、在線約會,人與人之間的關系在這些工具和數據上都有點滴積累,據此可以更了解你的愛好。
T:創業者和大公司對大數據的利用有何不同?
F:大公司很有錢、有很多人、有很多數據。這是他們最有利的一點,也是最薄弱的一點,因為無法像創業者那樣很快推進。非常有自我驅動力的創業者可以在自己的領域找到缺口,迅速行動。人們之所以認為速度對大數據應用很重要,一個原因在于,當你去和客戶談合作時,他們已經準備好大數據方面的預算了。能快速建立起你的數據庫,就容易賣出產品。
另一個原因是,現在獲得數據的成本比以前低很多,廉價渠道為大數據生意制造了很多利潤空間。
比如,我認為Netflix就是一家了不起的公司,有非常龐大的數據分析部門,很多聰明人根據數據來推薦電影和電視劇。在他們根據數據制定電視劇拍攝計劃后,數據有效性會自動體現在股市上,股市可以作為數據有效的一個映射。我完全相信Netflix的數據是有效的。他們在搭建數據平臺和分析方面都十分有創意。
T:公司在利用大數據做決策時,有哪些方式可以考量數據的有效性?
F:這是個很好的問題。在20年前,人們也同樣懷疑過電子郵件在工作中是否真能提高效率,怎么測量這種有效性。有一部分公司選擇觀望,也有公司比如微軟,大膽擁抱了這項新技術。他們也沒有什么量化途徑,只是堅信會帶來改觀。
我認為,大數據現在也面臨同樣情形。有人懷疑,有人擁抱,但最終事實會證明它的確有效。當然,對大數據的評估當然也同樣重要,你得經?;仡櫮愕臄祿?/p>
T:影響大數據發揮更大作用的關鍵因素有哪些?
F:我認為,成本是首要因素。當分析數據的成本變得越來越便宜時,數據影響力也會更大。
另外,獲取數據的移動設備也會發揮很大作用。人們越黏在手機上玩各種APP,手機就會越了解你,數據對你的影響就會越大。
同時,也需要更多創業者去創造更多有趣的APP,挖掘更多層面的數據。
在云服務更普及時,數據應用會更快捷。云端存儲、計算會省去數據應用者很多硬件麻煩。
T:在大數據概念興起的同時,一些全新的細分行業也在IT業中崛起,以可穿戴設備為例,大數據將在其中扮演什么角色?
F:谷歌眼鏡、智能手表、運動手環等已有移動端,會更主動地收集數據。
這個領域還在起步,但5至10年后會是我們生活的一部分。智能硬件是軟件和硬件的結合,硬件可能發展出很多形態,穿戴式的甚至植入式的,對消費者最有吸引力。但硬件傳感器只是收集數據的工具,數據分析還要依靠軟件完成。
大數據給智能硬件創業者帶來的機會可能是,他們不必費心想該如何分析數據,就像蘋果不會自己塞滿APP Store一樣,會有很多APP創業者基于可穿戴設備硬件這個平臺,利用其收集的數據,來做出很多你想象不到的分析和用途。在大數據的思路下,智能硬件就是新平臺。
T:大數據,從某種層面可看做是互聯網技術把人的信息存留于網絡上,隨之引發的問題是,該如何保護人的隱私?
F:隨時在線的最大問題就是,你隨時都會留下很多數據,有很多公司都在收集。我認為,公司必須對所收集的數據,以及這些數據可能的用途,非常透明地告訴給用戶。在這一點上,眼下的很多公司還有極大的改進空間。
但進入可穿戴時代,比如,你不想被谷歌眼鏡認出時,這個辦法未必奏效,所以可穿戴時代中,大數據隱私問題非常復雜。
或許,我們正在進入一個全新的紀元,人們為了使用這些新設備,必須共享更多信息。隱私的邊界可能要被重新定義了。