顧軍林
(淮安信息職業技術學院,江蘇 淮安 223001)
隨著科學技術的發展,人類在生產生活和科學研究中產生的數據呈指數倍增長,促進了大數據概念的形成。大數據在21世紀開始引起人們的關注,《Nature》和《Science》雜志都用專刊對其進行了論述。美國對此率先啟動了“大數據研究與開發計劃”,旨在收集處理龐大的數據信息,提高對知識的洞察能力,從而推動科學技術的創新進程[1]。
大數據的含義有多種,維基百科將其定義為無法在一定時間內用普通軟件工具進行捕獲和管理的數據集合。大數據具有規模性、多樣性和高速性的3大特點,即“3V”特性。規模是大數據的主要特點,其數據量非常龐大,一般可以達到1PB。其類型的多樣性主要體現在大數據不僅包括結構化的數據形式,還有半結構化和非結構化的數據形式。高速性是數據處理速度要足夠快,從而滿足對龐大數據量的實時分析要求。
大數據是在相應的需求下應運而生的,誕生之初應用于商業和金融,后來逐漸擴展到其它的領域,如科學研究中的地球空間信息學[2]、物流服務[3]、經濟發展狀況[4-5]和智能電網[6]等。大數據的應用也面臨一些問題和挑戰,其對公民個人信息的獲取和傳播都很便捷,由此產生了隱私安全問題。不法分子在互聯網上利用大數據對他人進行“人肉搜索”,不僅侵犯公民的個人權利,還使人們對大數據的社會影響產生疑惑[7]。即便如此,大數據仍然具有劃時代的意義,其不僅促進社會進步,還推動科學研究層次的深入,具有廣闊的發展空間和應用潛力[8]?!?br>