姚祖文,葉曉慧,張旭輝
(1.中國人民解放軍75831部隊,廣州 510510;2.海軍工程大學,武漢 430033)
什么是大數據?信息技術革命與人類經濟社會活動的交匯融合,引發了數據爆炸式增長,大數據的概念應運而生。“大數據”廣義上可以理解為信息化發展過程中伴隨產生的海量數據的集合,是在信息時代可以被利用的全部數據資源。按數據來源,大數據可以大致分為政府數據、行業數據以及互聯網數據等。鑒于大數據技術正處于高速發展階段,目前大部分人對于大數據的概念還是理解得不是很透徹,其實,在我們的日常生活當中,通過挖掘、收集、存儲、分析海量數據,很多人利用這些大數據做了很多事情,大數據應用案例真實的反映在各行各業,大數據的身影無處不在。
海量數據對于得出正確的分析結論有著積極意義,而數據收集的目的則是為挖掘隱含在數據之外的信息資源。林彪司令員在解放戰爭期間高度重視數據收集。在指揮遼沈戰役期間,林彪要求隊伍進行日常的“每日軍情匯報”。林彪要求值班參謀匯總電臺報道的下屬師團的每日戰況及戰利品繳獲信息。這些軍情數據非常瑣粹并且枯燥無味,例如需要匯報每支隊伍的傷亡情況、殲敵及俘虜情況、繳獲戰利品的門類和數量等。其中某日值班參謀例行匯報當日戰況,林彪突然打住并問在場是否聽清“胡家窩棚”的戰利品繳獲情況。眾人對于林彪司令員的問題非常疑惑,眾人面對每日的幾十起的枯燥數據都沒有引起足夠的重視。林彪見眾人無一應答,便繼續指出“胡家窩棚”軍情的三點不同。其中“繳獲的短槍長槍比例”、“繳獲或者炸毀的小車大車比例”以及“繳獲或者擊斃的軍官士兵比例”這三項都明顯高于其他區域。林彪據此非常篤定地斷定敵人的指揮所在“胡家窩棚”。林彪就是通過對大數據的比對分析,對軍事指揮做出了正確的判斷。果然,部隊根據林彪司令員對戰場態勢大數據的分析,很快就抓住了敵方的指揮官廖耀湘,并取得這場重要戰役的勝利。國際事件中也有此類的案例。例如在發生“911”事件前,美國的情報人員其實事先已經獲取了可能預警恐怖事件的海量數據,然而卻并沒有深入挖掘其中有價值的戰略情報。美國政府高度重視,并在“911”事件后的美國國防部項目年度研討會上,不少專家均建議利用數據挖掘技術對統一集成的數據庫進行系統分析。其中“交易空間”概念是此觀點的重要論斷。所謂“交易空間”是指恐怖分子在進行恐怖行為預謀時,是需要通過“交易”行為在信息空間下留下蛛絲馬跡的所謂“數據痕跡”,即所謂的“交易空間”的概念。“交易空間”涵蓋的數據非常廣泛,即可能通過旅行、住宿、出入境、交通方式或者通訊、醫療以及財務等方面。隨后,美國政府高度重視“交易空間”理論,并將數據挖掘技術廣泛應用于“交易空間”,通過監控恐怖分子的行為實現反恐。2013年美國波士頓連續爆炸案的偵破,是大數據技術應用于反恐領域的成功案例。連續爆炸案的偵破過程中,充分體現了大數據技術具備的5V特征。
位于拉斯維加斯的哈拉斯賭場對于大數據的應用非常在行,賭場內實行所謂的“完全回饋”的會員卡制度。顧客在賭場內停車、賭博、餐飲以及住宿均需要使用會員卡。例如在賭場內的各種消費可以產生一定的積分,而積分便可作為折扣繼續參與消費。按照這種會員卡回饋制度,哈拉斯賭場累積了大量的會員數據庫信息,當前會員人數高達5000萬,堪稱博彩界最珍貴的會員信息數據庫。賭場會對數據庫會員信息進行追蹤,根據會員近一兩年的消費信息,分析出用戶個人消費喜好、消費水平以及賭博習慣等相關信息。賭場按照數據庫為客戶提供最優質的個性化服務。很多客戶難以想象自其進入賭場的一刻,享受到的服務質量甚至小到每個服務人員的微笑都是按照大數據建模精心設計的。這種數據追蹤記錄服務還能結合客戶消費習慣以及個人背景信息模擬出所謂的“痛點”。一旦顧客輸錢總數超過其 “痛點”,顧客將視今晚在哈拉斯的賭博為所謂的“痛點”,顧客將會永遠的離開該賭場,那么就不能有效率地賺錢。因此通過會員卡大數據,對客人秘密了解得越詳細,賭場就能有效的賺錢。早在上世紀90年代,很多賭場運營商便通過信用卡公司以及部分營銷人員渠道獲取顧客信息,尋找賭博欲望極度強烈的名單。很多賭場都非常重視自身數據庫的建設,并竭盡全力的獲取自身客戶的信息數據。
大數據時代的背景下,人們的日常生活無不例外中會與數據緊密相連。日常生活一切行為難免會留下數據信息痕跡,而呈現為不同的形態結構各異的數據。而將多種不同形態的數據匯集則形成規模更為龐大的海量數據,即所謂“大數據”。交通管理過程中的大數據分析,可以有效地獲取實時交通路況信息,能對于緩解交通壓力及突發事件的處理均能提供科學合理的決策。以2013年春運為例,該年份春運期間共計超過1400萬人次使用阿里集團的支付寶進行購票,日均高達17萬。以1月9日為例,中國鐵路客服服務中心官網(12306網站)及手機端app的訪問量達到84億。鐵路部門及阿里集團的數據中心是可以匯總獲得大量旅客的數據信息,例如個人身份信息、背景信息、旅行信息等。通過對上述大數據的分析,鐵路部門便可對熱點線路進行針對性部署,高峰時段科學地調配鐵路運力,從而確保春運安全有序。2014年的春運期間,央視與百度地圖合作收集春運期間我國人口流動的大數據項目。基于收集百度地圖用戶的基于地理位置的LBS服務(location based service)的大數據,通過大數據技術進行分析,對我國春運前后人口流動實現全程、動態以及可視化地展示,也是展現了大數據分析技術對于交通管理方面又一成功案例。
基于大數據分析做出正確商業決策而獲得盈利的企業不在少數,的模式已經為不少的企業帶來了盈利和聲譽。而擁有大數據思維的人,可以將大數據的潛在價值轉化為實際利益。Target超市是美國非常重視大數據應用的零售業巨頭。Target超市以20多種備孕期間可能購買的商品的全部購買記錄作為大數據來源,通過相應的數據模型分析孕婦購買行為的關聯性,并據此推測孕婦的懷孕時間及分娩時間。并根據孕婦實際孕期狀態,根據不同階段不同需求的特征向每個孕婦寄出富于個性化需求的產品優惠券,能長久的吸引孕婦到它的超市消費。維克托·邁爾舍恩伯格認為,尋找出相關性的事件并長期監控,是便于對未來行為的預測。而Target的市場營銷案例很好地驗證了該理論。Target超市通過分析顧客購買商品的時間及品種對孕期進行預測是非常典型的對大數據進行二次利用案例。再者,廣告投放商可以充分利用司機手機的GPS大數據。不同司機的GPS匯總是可以實時反應交通狀況,而通過分析GPS數據可以確定哪些區域的停車更多,活躍人群信息也便對廣告投放商有極大的商業價值。作為零售行業的領頭人,Wal-Mart超市對于每個階段的銷售記錄均會進行系統的數據挖掘。Wal-Mart超市的數據分析人員偶然間發現蛋撻以及抵御颶風的物品在颶風爆發期間銷量大增。Wal-Mart便將蛋撻的銷售貨架轉移到颶風物品銷售貨架相鄰。結果意外地發現蛋撻的銷售量得到了極大的提高。
從上面的大數據實例可以看出,大數據的價值不僅僅在于大數據本身的價值,更重要的是大數據的思維模式才是觸發價值增長的關鍵,探求數據價值取決于把握數據的人。未來時代將是大數據的時代,會無時無處充斥著大數據的身影。盡管暫時無法斷定大數據對于人類社會的發展推動到何種程度,但基本可以斷定大數據會在很長一段時間內伴隨著人類社會的發展腳步而出現了社會變革的各個方面。