從默默無聞到成為所有頭版頭條的標題,愛德華·斯諾登只用了幾天時間。這個同時被稱為“叛徒”和“英雄”的人,揭開了美國引以為傲的人權幕布,讓互聯網透過“棱鏡”折射出“數據”與“隱私”的色彩。
在這場眾說紛紜的羅生門中,拋開籠罩的政治色彩,爆發的大數據帶給IT產業的究竟是無價的礦山還是隱私的黑洞,還是讓我們換個角度重新看待一切——
數據礦山 黃金還是黑金
早在19世紀,“百貨商店之父”約翰·沃納悔克便提出了:“我在廣告上的投資有一半是無用的,但是問題是我不知道是哪一半?”這也是對經典商業模式下供需不對稱的典型描述。直到1998年《哈佛商業評論》刊登的沃爾瑪“尿布與啤酒”的案例,才算是較為完滿地回答了這一問題:擺在尿布旁邊的啤酒會因為潛藏的用戶購物模式而提升各自的銷量——這不僅是CRM數據挖掘的成功,也是大數據創造價值時代來臨的信號。
隨著互聯網、移動互聯、物聯網等技術的不斷發展,人們生活的方方面面都在被各式各樣的數據不間斷地記錄下來:網頁瀏覽記錄、社交分享內容、購物刷卡記錄、GPS定位信息……這些飛速增長的數據中所蘊含的價值,早已成為無數商家試圖發掘的巨大金礦。
去年,西班牙電信推出了名為“智慧足跡”的大數據服務,通過向數據挖掘公司等合作方提供定向人流的移動數據,為零售客戶開店選址和促銷提供借鑒。而今年4月底,阿里巴巴以5.86億美元入股新浪微博,聲稱“雙方將在用戶賬戶互通、數據交換、在線支付、網絡營銷等領域進行深入合作,并探索基于數億的微博用戶與阿里巴巴電子商務平臺的數億消費者有效互動的社會化電子商務模式。”
從以上的例子不難看出,借助大數據,商家可以有效地改善服務質量,為客戶帶來更為豐富的消費體驗。但有的數據挖掘公司則選擇了不同的著力方向——2004年,幾位PayPal的老員工成立了一家名為Palantir Technologies的數據公司,公司主業是研發能夠在多種類型的數據庫中搜索信息和定位信息類型的軟件,而該軟件平臺的名稱正是“棱鏡”(Prism)。這并不是巧合。Palantir正是美國情報機構成立的風投公司In-Q-TeL所資助的企業,其技術在日前被曝光的“棱鏡門”中發揮了巨大的作用。
數字化背后的隱私危機
事實上,除了“棱鏡門”曝光的內容,互聯網用戶早已或多或少受到了隱私被侵犯造成的困擾。例如,人們在購買汽車數年之后仍然持續收到各種保險和維修同類產品的廣告推薦;消費者一些基于私人愛好的搜索會在大庭廣眾之下出現在令人難堪的大幅廣告中等等。
如果這些還只算是令人困擾或者不悅的內容的話,那么隨著數據搜索和挖掘技術的進一步發展,大數據勢必將對人們的生活施加更為巨大的影響。復雜網絡研究大師巴拉巴西在其著作《爆發:大數據時代預見未來的新思維》中提出,93%的人類行為能夠通過有效的數據分析而進行預測。之后,統計學家Nate Silve墑過海量數據分析對美國50個州選舉結果的成功預測佐證了這一說法。
在互聯網不斷擴張的時代,用戶隱私本身就在不斷縮小。電商網站上的個人資料、即時溝通通訊軟件的聊天記錄、社交網絡中的照片分享等等已經將用戶完整地“數字化”,再加上搜索引擎抓取、專業數據統計與挖掘公司的分析,個人信息、聯系方式、社交關系,以至于興趣愛好、政治傾向等等都能夠通過這些記錄在案的數據得出結果。如果大數據的未來如同大片《少數派報告》中描述的一樣,人類的信息、行為甚至思想都成為可以用來分析的數據,對于每一個人來說都將會是一幅刻板而可怕的圖景。
在中國,由于數據挖掘方面的技術發展尚不充分,一些中小企業難以通過對手中的數據進行有效挖掘以獲取價值,便通過直接出售用戶數據來牟利,從而造成大量隱私泄露等狀況的發生,更為大數據時代的到來蒙上了一層隱私危機的陰影。
趨利避害責任共擔
大數據蘊含的豐富價值,是每一家企業都不愿意放棄的巨大蛋糕。而對于隱私敏感用戶來說,大數據時代對隱私數據的保管顯得尤為重要。價值與隱私,如同大數據這枚硬幣的兩面。用戶該如何保護自己的隱私?手握用戶數據的互聯網企業又該如何在發掘大數據價值的同時,盡量不去碰觸到那條敏感的隱私紅線?
“棱鏡門”爆發后,一家名不見經傳的互聯網搜索引擎DuckDuckGo瞬間爆紅,搜索量增長達到30%以上。相比搜索巨頭谷歌,這家搜索引擎以“從不追蹤用戶”且“從不過濾信息”為賣點,強化基于網頁相關性的搜索結果。雖然在搜索結果針對性方面有所欠缺,卻贏得了諸多隱私敏感用戶的支持。目前,越來越多的個人隱私保護產品不斷上線,從網站反追蹤、瀏覽信息清理、加密傳輸等方面加強對用戶數據的保障。事實上,除了選擇更具安全性的產品之外,注重個人的隱私信息保管同樣重要,如避免使用公共電腦、進入來源不明的網站、隨意填寫敏感信息等等。
而對于互聯網企業,在開采大數據這一金礦的同時,也需要選擇合適的方式和落腳點,包括投入挖掘和分析的數據范圍、數據分析過程的保密、數據對外開放的程度等。對于掌握數據規模越大的企業,這一問題就顯得愈發重要。
不僅如此,互聯網企業對于用戶數據的操作方式、使用范圍和保障等信息也需要更加公開、透明。2011年,Facebook因為保留用戶已刪除的好友、信息和相關資料收到投訴;去年蘋果也因為Siri能夠保留用戶語音數據長達兩年而飽受指責……這些正是由于用戶數據對于用戶本身的不透明所致。在用戶向企業提供自身信息的同時,同樣希望這些信息能夠處于可控范圍內。對于用戶數據的留存和使用既沒有按照用戶意愿執行,又沒有提供相應說明,造成用戶意料之外的隱私數據操作,其結果就是給用戶帶來隱私受到侵犯的不良感受。
在榜樣另一方面,避免對用戶形成“意料之外”的隱私侵犯的重要方法,就是培養用戶價值觀念。對于用戶有價值的數據應用,能夠有效減弱甚至抵消隱私數據的采集造成的影響。
例如中國最大的即時通訊軟件——騰訊QQ,掌握著國內最為龐大的用戶關系網,對于QQ侵犯用戶隱私的質疑聲一直沒有間斷。然而,QQ的好友生日提醒、空間/微博話題推送等基于用戶關系的特色服務帶來的用戶忠誠度,始終保證了其國內第一即時通訊軟件的大哥大頭把交椅。
同樣,微軟也曾大肆批判谷歌Gmail通過過濾分析用戶私人郵件內容進行廣告投放的行為。事后,谷歌解釋說稱,數據采集、分析和廣告投放是完全的機器行為,沒有人為干預和隱私泄露。而谷歌更是憑借包括Gmail在內的眾多相互關聯的定制化服務,為用戶提供了一整套移動、辦公、娛樂環境,手機應用Google Now更能通過對用戶行為的學習。為用戶提供提醒、導航、推薦等智能化服務,受到業界的一致好評。
由此可見,大數據為用戶帶來的價值是毋庸置疑的,同時背后所包含的隱私風險也是切不可忽視的。對于商家而言,如何有效地控制用戶數據應用范圍、保障用戶數據安全、利用大數據提供對用戶有價值的服務,才是從大數據這個富礦座礦山中開掘真金的可靠途徑。