

2012年,如果評選一個年度最火的IT詞語,那么非大數據莫屬,而進入2013年以來,這一局面似乎也得到了延續。大數據具有大價值,這似乎是每個人都認同的觀點,直到“棱鏡門”事件的出現。
2013年6月5日,愛德華·斯諾登把“棱鏡門”的秘密曝光于大庭廣眾之下。此后,一石激起千層浪,美國政治界、外交界和軍界均受到不同程度的沖擊。
在這一事件中,被直接點名的幾大IT公司——蘋果、Facebook、微軟、谷歌、雅虎、YouTube、Skype、AOL和PalTalk——已紛紛展開公關攻勢;美國的智慧產品出口復興計劃,以及歐美自由貿易協定的談判進程,也必將受到“棱鏡門”的影響。
據了解,美國代號為“棱鏡”(PRISM)的高度機密行動此前從未對外公開。據《華盛頓郵報》獲得的文件顯示,美國總統的日常簡報內容也部分來源于此項目,另一份文件指出,“美國國家安全局的報告越來越依賴‘棱鏡’,其已經成為他們的主要信息來源。”而大數據則被認為是獲得這類信息的主要方式。該報道刊出后各界一片嘩然。美國保護公民隱私組織予以強烈譴責,表示不管奧巴馬政府如何以反恐之名進行申辯,其都侵犯了公民基本權利。與此同時,“棱鏡門”也將大數據技術是否威脅公民信息安全的問題推上了風口浪尖。
安全威脅
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。而大數據來源就是每個個體,無論個人的生活、消費,抑或是身份特征等信息,最終都會變成以各種形式存儲的數據。通過運用大數據分析工具對海量數據進行分析,企業可以從中獲取價值,但是對于個人用戶來說,卻是個不得不被動接受的事實,并且在數據收集、分析、傳輸等過程中,如果遇到保護不利的情況都可能對用戶帶來影響,增加個人信息泄漏的可能。
在中國,大數據技術的運用其實已悄悄地來到我們身邊。例如,在某聊天工具上,當你增加一個好友的時候,會隨之而來顯示“你可能認識的人”。在微博上,也會顯示“共同關注的人”,微關系等。以上兩種情況都是通過大數據分析工具而實現的服務。但這些看似非常方便的功能,在現實生活中卻有可能遭遇尷尬。比如,之前的戀人總出現在“可能認識的人”中,這種使雙方都感到尷尬的局面對某些人來說就是麻煩。
清華大學國際傳播研究中心副主任、西南政法大學副教授郭曉科告訴《中國經濟信息》,國內外科學家研究大數據技術后,發現大數據所產生的問題往往很嚴重,主要是對個人信息安全的威脅,其中既包括隱私、財產安全,也包括個人信息不被暴露。例如,美國已有的一項大數據技術顯示,根據某人在Google上的檢索情況或微博的發言,就能推測出其真實信息。
針對這種局面,各國學界一直在研究解決對策。根據郭曉科的介紹,現在主要采取三種策略保護個人信息。第一種是知情同意。但實際上沒人會去通篇閱讀這些條款,或者拒絕,致使其成為企業的保護傘,而流于形式。第二是模糊策略,即打馬賽克。比如在谷歌街景中,通過網民的舉報,把某些圖片模糊處理,這無異于亡羊補牢。第三是匿名化策略,即網絡服務商有義務提供匿名服務,保護網民信息。但在大數據技術的背景下,以上種種手段往往收效甚微。
“尤其是采用匿名化上網策略,我認為并不能保護信息安全。因為這種匿名上網實際上是在實名上網。當網民網絡購物時,必然輸入地址、姓名、手機等重要信息,這些信息一經登記便無法抹去,等于是在實名上網,而犯罪分子則是匿名搜集信息。”郭曉科無奈的說。
價值遭疑?
大數據技術最大的價值是什么?毋容置疑,是人類的決策的方式和方法的變革,這種決策既包括政府、企業,也包括個人。“在整個人類的決策史上,最初是通過經驗依靠直覺判斷,后來人類學會了統計分析,學會了用數據說話,但依然屬于描述的范疇,主觀性比較強。大數據時代核心則是讓數據說話,這樣的決策才是相對最科學的。”郭曉科認為。
從2009年,美國人首先提出大數據概念后,相關的業界領袖便預言,大數據將引發新的“智慧革命”。自從互聯網、物聯網、云技術等技術產生以來,整個世界在不停地產生、紛繁復雜的,依靠常人的能力和常規技術無法處理的巨量信息。大數據技術最大的價值就是從海量數據中,幫助人類發現知識、提升智能、創造價值。自此,世界的整體結構將越來越具備“智慧”特征,人類將更“智慧”地利用信息,對世界和他人作出更加“智慧”的判斷與回應,甚至整個城市也將智慧起來,而智慧城市的“智慧”主要出自對大數據的處理。
眼下,大數據的智慧功能在很多項目中已看到了成果。2013年4月,《科學》雜志上還發表了運用維基百科等大數據庫的關鍵詞來預測股市波動的文章。
但“棱鏡門”事件之后,人們開始關注被忽略已久的大數據的另一面——所謂弊端。
國內某機構研究大數據問題的專家司啟昌告訴《中國經濟信息》,大數據并不完全等于大價值。在企業中,大數據分析設備往往對企業IT設備有更高的要求。當數據達到一定值時,投入的價值甚至超過所得數據價值。當企業注意力被分散到很多碎片化的信息上時,這種技術害處便顯現了。
此外,很多廠商都針對大數據推出了自己的解決方案。而這些方案雖然號稱兼容性非常強,但企業卻往往容易被供應商綁定,這就大大地限制了企業IT基礎的靈活性。
“負面問題是有的,但總的來說,根據麥肯錫研究所的研究報告顯示,在美國運用大數據的企業中,其所創造的價值遠遠超出了投入。對于企業提升生產效率,產品升級換代,以及幫助企業制定核心策略都具有非常高的價值。”郭曉科說。
達爾文在《進化論》中闡述了這樣的觀點,最終能生存下來的是最靈敏能夠適應變化的生物。“對于企業也是如此,如果能夠找到與大數據的結合點,就能為其生存和發展帶來先機,所以絕對不能否認大數據的積極意義。”郭曉科說。
他認為,只要企業有分工的概念就可以解決這一問題。“未來或許會出現一批新型的數據管理公司,他們可以部分取代企業的IT部門,企業只需要以服務外包的形式,把這種工作委托給專門公司,而自己只需要保留最能體現其核心競爭力的人才。云計算則完全可以解決企業遭到綁定的問題。”郭曉科自信地說。
“未來,企業運用大數據的成本主要是購買數據的費用,數據挖掘費用則非常低。”郭曉科認為。
“棱鏡”的啟示
“棱鏡門”事件帶來公眾對公權力的擔憂,主要是擔心個人的信息安全,包括企業信息安全。郭曉科說:“政府處于社會公權力金字塔的頂尖,所以該事件對于政府的啟示應該是以立法的形式保障信息主權。”
過去,主權更多指政治主權,經濟主權,領土,領海,領空的安全。現在,由于網絡虛擬空間的崛起,國家的信息主權受到廣泛關注。
郭曉科向記者分析道,如果我們把信息主權作為一種主權的話,從國際法的角度,“棱鏡門”事件就是美國侵犯了其他國家的主權。從政府的角度,應該確立政府對保護公民信息安全的責任和義務,當政府的利益與公民信息安全發生矛盾沖突時,政府的權利邊界和義務是什么。只有以這種立法的方式才能打消公眾的疑慮。
“棱鏡門”事件給全世界敲響了警鐘,過去全世界都指責中國對互聯網的管制。棱鏡門曝光后讓我們看到信息主權提出是當務之急。
郭曉科說:“與立法同步的應該是政府信息的公開以及國家戰略的確定,因為各國政府手中往往撰有最豐富、最有價值的信息富礦。例如,美國data.gov網站就是美國政府分批次、有目的、有計劃地公布政府掌握數據的網站。讓企業進行挖掘。”去年6月,美國總統奧巴馬簽署了一個大數據國家戰略,認為美國未來要保持經濟、科技、軍事霸主地位,就要在大數據方面搶占先機。
對于中國而言,首先就是政務信息、氣象資料等公共信息的公開。同時制定專門的支持大數據的計劃,包括資金政策等,為企業運用大數據技術提供良好的平臺。
“大數據技術的特征是依靠人的智力而非機器設備,只要有立法作為保障,對于像北京這樣的城市乃至整個中國都是千載難逢的機遇。”郭曉科肯定的說。