
2017年11月30日,在“2017陸家嘴新金融全球峰會”上,紅杉中國專家合伙人,阿里巴巴集團原副總裁、首任阿里數據委員會會長車品覺于會后接受了《陸家嘴》雜志記者的專訪,講述了他與大數據之間的淵源及對于大數據行業現狀和未來發展的看法。
數據的本質不在于數量
《陸家嘴》:你為什么對數據感興趣?
車品覺:說起來有些奇特,從小我就很好奇未來。長大以后我便開始探索有沒有一種方法,無論量化與否,能讓我早一點比別人知道這個世界的未來。
我大學的畢業項目是做外匯的預測,當時連我老師都訝異我為什么要挑選難度那么大的項目,因為我的專業是計算機,完全可以選一個在我能力范圍內的項目去做論文,而非超出能力范圍的。但我一直有一個想法就是只有做自己喜歡的事情才能做好。所以,在大學期間,通常當我的老師布置給我一些編碼任務的時候,我只喜歡寫兩種,一種是病毒,另一種是預測。幸運的是,恰好因為這個畢業項目我順利拿到了很多人都夢寐以求的匯豐銀行的錄取信。
后來,我離開了匯豐去做產品經理。我是一個沒有數據不知道怎么做產品的產品經理。從香港電信到MSN到eBay,我都是一進去就問數據在哪里,而且我在做每一個項目的時候都對數據布點是十分清楚的。其實這些都能歸于一點,我好奇未來的初心。
《陸家嘴》:你認為數據的本質是什么?
車品覺:在《數據的本質》一書中,我其實有講到,首先數據不是要大。數據更像是一個拼圖一樣,每個拼圖都有一個主題,我們需要根據場景去判斷你的數據到底夠不夠,而不是在于數量多不多。
這些數據有了以后,你就可以開始做數據引擎。什么叫做數據引擎?用簡單的話來解釋就是,你有一個任務,這個任務會產生更多的數據,這些數據又會幫助你把任務完成得更好,這樣一來就會形成一個循環。然而,不是所有的場景在這個循環里都能走得很順利。在這個循環里,很可能會有斷點,也就是一些數據的空白,導致這個循環不能順利運作。一般來說,斷點越少,循環越快,
算法優化越快。
《陸家嘴》:現在你看到數據行業的哪些問題?
車品覺:現階段,人們已經廣泛意識到了數據的價值,因為有價值,數據本身的保護在現階段變得特別重要,包括有沒有人為了數據的“多”或者造成某種影響在數據里面灌水。我覺得整個數據行業是需要整治的,未來我們將會看到更多的治理機構出現。
另外,人工智能發展到現在,狹義的人工智能已經成功了,因為它所需要的數據量相對比較少,但是當擴大到廣義的人工智能時,它所需要的數據的數量和質量會出現一個非常大的跨越,這時大數據就需要不斷信息化、被治理。我們非常期待下一個新科技的出現。
如果你問我未來幾年會看到什么趨勢,我認為,未來幾年機器人將會充斥在這個世界的不同角落里,只是這些機器人并非有四肢,而是有著不同的形態。所以與其說是機器人,不如說是機器智能與人之問的交互,在未來幾年一定會大量出現。
數據隱私問題尚待解決
《陸家嘴》:哪些行業可以從大數據挖掘中受益?如何從海量數據里找到商業活動中最有價值的數據?
車品覺:總體來說,第一個是廣告及媒體行業,因為廣告和媒體自身的特殊屬性和形態變化本身就需要更精準的用戶數據群;第二個是金融行業,金融行業在識別一個人的征信方面就像是放款和借貸中的中轉站,需要大量的用戶數據;第三個是醫療行業,醫療行業應該在這幾類行業當中是對人類最有意義的。這并不是說前兩者沒有意義,只是醫療行業致力于讓每個人更長壽、更健康,能讓人活得更有意義;第四個是政府事務,政府為了提升和改善公共事務使用大數據,本質上和企業利用大數據提高利潤是同一個道理。比如說在鐵路修建等方面,大數據如何去賦能整個中國的經濟,這一點我覺得是要爆發的,但是具體在哪個時間節點尚不清楚。《陸家嘴》:你認為大數據時代下,企業應該如何守護用戶的隱私?
車品覺:之前我在美國的時候,見到一個在隱私問題上給美國總統提意見的專家,當時和他對于這個問題也進行過深入的探討。他說,關于個人隱私會有一個顛覆性的變化,這一變化在歐洲已經開始了,現在美國開始緊隨其后。比如說,當用戶使用某一個應用時,都會和應用方簽訂一個協議,表明白己同意將自己的數據交給應用方來改善用戶體驗,但大部分人都不知道自己同意的是什么,而僅僅是點擊了“同意”。美國的法律對此準備有所修改,這可能會改變大數據產業使用數據時的權利。
互聯網數據分為可識別數據和不可識別數據兩種類型。有的數據能夠識別出來使用主體,有的識別不出來。遇到不可識別數據的時候,你不能完全知道使用主體是誰,也沒有辦法告訴他你是否同意。這是一個比較頭疼的問題,現在美國正在對這一塊進行討論和改善。
還有另一個問題就是,數據的擁有權在誰手里。之前大家對數據擁有權是用實物來制定法律,后來發現這條路行不通。數據的奇特之處就是看見就看見了,不在于你拿著還是我拿著。
涉及隱私問題,大部分用戶更多的是希望在隱私和數據間找到一個平衡點。你拿到我的數據,是需要用一些好處來交換的,數據分享是互惠互利的。你用我的數據卻不告訴我,這樣是不行的。美國有些法案,個人數據的隱私問題不是放在單獨的方案當中,而是放在行業里面。為什么放在行業里面?因為個人隱私和行業有關,如果是賣藥品的,個人隱私的監管會非常嚴格。如果是游戲類的個人數據,則會相對簡單一些。而歐洲,整個法律體系是一樣的,不分行業。歐洲人認為,隱私是一個人的底線。而美國,認為價值和隱私之間可平衡,在中國,現在這個問題也越來越受重視。這些都是未來亟待解決的問題。