劉峻江
(貴州師范大學,貴陽 550025)
在大數據的5V特點:大量、高速、多樣、低價值密度、真實性中,信息的量化,信息處理的高速化,信息的多樣化,信息的低價致密度與確保信息的真實性中,一些常規的軟件是不能在短時間內對這些信息進行處理與分析及管理,并且當這些數據信息被收集過多而未被處理將會產生所謂的“數據垃圾”。在如今大數據普及的時期,諸多大頭軟件商運用新的信息處理模式將收集到的大量數據變為了多樣化的信息資產,并且這種方法不適用原本的信息處理方法——抽樣調查,也被稱為隨機分析法,而是采用了對所有的數據進行分析處理,將信息嚴格的分類,精確到個人,也就產生了現在的大數據產業。
近年來,國內對大數據產業越發重視,歸結于大數據對于社會與生活提供的便利。大數據的發展是每個人肉眼的能夠清楚看到的,它是由小到大,由個體到群體的發展趨勢。“小”是生活中必須的購物軟件,必須的社交軟件以及必須的娛樂軟件,其中都能看到大數據被普及的影子,它們的特點甚至說它們最擅長的就是收集用戶數據以及分析用戶的數據,再根據分析結果給予用戶相關的便捷信息。“大”到現在的物流高端網絡,以及一直在致力建設的智慧城市。在特定的節日大量購物軟件的用戶會存在龐大的購物量,而這種量的商品必須依靠物流運輸來送達消費者手上,在有限的人力與物力的基礎上,依靠的就是已經建設好的物聯網,按照相關的法律與約定的協議,將所有物品與互聯網相連接,進行信息的交換和通信,以實現對物品的智能化識別、定位、跟蹤、監控與管理,這樣大大的減少了人力的介入,也有效的節省了時間以及很大程度上的增加了物流當中所存在的容錯率。而智慧城市更是利用各種信息收集、處理、分析、整合技術與創新觀念,將城市本來擁有的公共設施,公共資源,公共服務集成一個集體化的管理系統,來有效的提升設施、資源、服務的運用效率,大程度的改善城市居民的生活質量,改善或者避免“大城市病”,使城市能走上穩固的可持續發展的階段。大數據的發展不會停滯不前,相反,它正在以一種高速的姿態繼續向前進發,目前大數據仍然處于低效的數據收集與批量化的數據分析,此情況導致了數據呈現會出現很大的偏差以及局限性,而隨著大數據技術的進一步發展,人們必然會研究出更高效的數據收集方法以及更實時性的數據分析方式,將處理時效精確分鐘甚至于秒,這樣就能夠有效的達到了大數據數據處理所尊崇的“時效性”,更有利于讓人們在一些數據場合(軟件的個性化推薦,銀行的財務管理,股票的交易處理等)及時對大數據系統給人們的數據呈現來進行信息處理以進行適當的舍棄。
事物都具有兩面性,而大數據更是如此。大數據最近在社會中飽受輿論的就是在美國芝加哥2006年所建立的“虛擬防范計劃”,這個計劃是由幾臺超級計算機來控制城市的各種公共設施——公共攝像頭、道路管理系統、聯網的燃氣及水利管理系統、銀行系統、警察系統等,來同時管理和收集城市公民的所有數據信息,記錄下所被記錄公民的個人資料、喜好、習慣、醫療記錄、行駛記錄、犯罪記錄等,收集完數據并且利用高時效性的數據分析算法時時更新已經存入的后臺資料,回觀這個系統的種種功能,可以看出這就是智慧城市的最終目標,被叫停的原因是因為這樣的系統能夠窺探公民的隱私以及會讓不法分子擁有可乘之機。確實,這樣的大數據為基礎的系統對于公民的信息收集是擁有很多好處但是也是擁有不可避免的諸多壞處,當警察尋找犯罪嫌疑人時,利用這個系統可以根據已經記錄在案的嫌疑人資料來有效的實施抓捕,在管道維修時,可以運用系統快速了解到管道的問題出處,銀行存取錢出現問題也可以運用系統來妥善的進行處理。這些都是大數據給人們帶來的便利。而這些便利的背后也存在公民的信息泄露,公民的隱私被窺探,以及如果這樣的系統在一個國家甚至是世界上普及,不法分子利用這個系統可以對社會及國際造成的危害不可想象,隨著大數據產業的發展,這種智能系統也會變得越來越成熟,數據收集的廣面性,數據分析的算法都會越來越完善,類似于芝加哥這樣的系統也會在城市中運營,在現在不成熟的大數據分析面前,個人的習慣,愛好可能不會被算法解析得徹底,但是隨著算法的更新,這些習慣,愛好很可能就會變為不法分子的把柄,一個大膽的想法,一個先進成熟的大數據算法,可以通過對個人的長期的數據收集,通過數據算法,來估算這個人面對任何事情所要做出的舉措,以及估算這個人每天都要干什么。這是比對一個人進行隔絕監視所得到的數據更要詳細。大數據的發展是浪潮式的發展,人們不能左右,但是人們在享受大數據帶來的便利的同時,也要理性的去考慮到大數據給人們帶來的危害,想出對策去避免,這樣的大數據發展才會真真正正的為人們帶來一個可持續性發展的未來。