李嬈 索琰琰 黃建昌(通訊作者) 河北農業大學理工學院
大數據(big data),簡單說就是一個巨量的無法用傳統數據庫工具對其進行捕捉和處理的數據集合。IBM將大數據的特征總結為4v:大量性(Volume)、多樣性(Variety)、高速性(Velocity)、真實性(Veracity)。隨著計算機網絡時代的到來,截止到2016年,全世界已擁有189億個網絡連接,這使得全球數據呈爆發性增長。巨大的數據中必定潛藏著有意義的信息,如何應用現有技術對這些海量數據進行選擇、分析和處理,獲取到有價值的信息,并在實際應用中合理利用這些價值,既是大數據現在應該處理的問題,也是在未來進一步發展中所面臨的挑戰。
互聯網將各個大小不一的計算機網絡相互連接,通過多種通信模式獲取各類用戶的數據。1980年,托夫勒在其所著的《第三次浪潮》中第一次提到“大數據”一詞。2001年道格.尼指出了數據增長三個方向的挑戰和機遇:量(Volume)、速(Velocity)與多變(Variety)。2011年麥肯錫的報告《大數據:創新、競爭和生產力的下一個新領域》首次對大數據進行了全方面的介紹,大數據開始受到廣泛關注。2012年,維克托.邁爾.舍恩伯《大數據時代》的發布加速了大數據在國內的興起,各行業圍繞大數據開展了相關的技術應用與創新。科技革命帶動著信息的高速流通,生活節奏也因便利的推進更快,個體間的交流和信息交換頻率越來越高,大數據在這個高速的時代背景下應運而生。
數據讓人對復雜的事情有清楚的了解,是事物本質和規律的源頭。我們研究和發展大數據的意義其一,大數據具有的預測性可以提前展示未來要出現的數據或趨勢。例如,天貓基于大數據分析得出彩色隱形眼鏡前景可觀這一市場潮流,并于2017年9月舉辦了相關的交流藝術展,做到了最先把握商機。通過對大數據進行分析,旅游網站可以做到精準營銷,交通部門可以通過流量數據分析預判到交通擁擠或事故并及時對其進行處置服務,大數據也可以進行疾病診斷,為病人推薦治療方案。其次,大數據能夠促進中國城鎮化發展,使語音識別、機器翻譯這些技術領域在大數據時代取得新的進展,推動產業形勢轉變和中國經濟轉型,并且提升各個行業乃至整個中國在國際環境下的競爭優勢。
近些年,大數據受到各個行業的廣泛關注,使得大數據滲透到更廣闊的領域,無論在政府和醫療方面,還是在商業交通領域,大數據都有著中流砥柱的效果。
大數據可以應用于醫學界的早期診治,并發揮其特殊作用,通過分析醫學數據可以發現疾病的規律并由此制定科學高效的治療方法,從而確定正確的醫療方向和策略,提高病人的生存期。例如,谷歌曾利用大數據成功預測出了流感的爆發。我們可以利用大數據監測癌癥等疾病,防患于未然,使治療更加及時。大數據在探索疾病的機理上起著至關重要的輔助作用,通過分析醫療大數據信息,加強各種醫學科之間的融合,提高藥物作用于靶細胞的效率,擴大免疫治療的研究廣度和研究效率,找出各種病之間潛在的聯系,將疾病的治療方法融會貫通。
通過對大數據的應用,政府可以創建政務數據共享及數據服務平臺,實現各個部門之間的數據共享,政府部門的信息共享是智慧城市建設最基本的條件。政府可以通過公開和共享政務數據資源,進行有效的社會治理,從而更好的服務社會。政府可通過大數據在政法、財稅等部門的應用,推動大數據服務民生。例如,通過數據共享平臺,徐州市教育局對相關教育數據進行挖掘和分析,成功改善了教育教學的方式。此外,政府應激發民眾創新意識,推動大數據產業的創新發展。
大數據改變了傳統商業智能在數據分析方面的局限性,這表明企業通過對結構化和非結構化的數據分析能夠獲得更加全面和準確的商機。阿里巴巴旗下的淘寶基于大數據進行實時的數據分析,高效地整合數據,理解客戶需求,給客戶推送相關產品,準確把握市場的動向和機遇。大數據在企業經濟價值的策定中占據著關鍵的位置,大數據使得企業可以同時依靠企業內外部的業務數據,使得企業對數據的把握更加準確和及時。此外,大數據的合理應用不僅能使企業的交易成本大大降低,還可以幫助企業分析市場需求,提升企業的創新力,降低企業經營的風險。
交通大數據是構建智能交通的基礎,大數據在交通事故預防、資源分配上都體現了它的價值。例如,通過對海量交通數據的統計分析,利用移動地圖導航,為用戶實時提供路況及最佳行駛路線,解決道路擁擠的現狀;通過大數據分析事故高發地段,并對其加強監管,采取相應措施減少事故的發生。雖然大數據在交通領域應用廣泛,但其面臨的:如何收集管理不同環境下的交通數據,如何保障數據的準確性,如何篩選有效的交通數據等問題,仍需要政府交通部門和相關大數據工作者的不懈努力。
大數據被稱為未來的石油,只有緊跟大數據發展潮流,不斷更新技術能力,才不會被時代淘汰。大數據雖奧秘無窮,但是其中也存在著各種待解決的問題。
數據丟失在國內乃至國際上時有發生,例如2013年美國雅虎公司被黑客盜取了近十億的用戶數據;2015年京東大量用戶隱私信息泄露;還有2017年九月發生的瑞典海量公民數據信息泄漏事件等。這些教訓都說明了保障信息數據安全,加強數據安全建設,提升數據安全等級,制定相關法律法規的重要性。由于數據分析不是單一的,在進行數據分析時必然要集成分析各類典型數據,這種數據的交融訪問,使得大數據產生了一些新的安全方面的問題。
許多數據的數據保存時間長達幾年或十幾年。例如,為了保障患者的生命安全,醫療信息通常會永久保留,而財務信息通常只保存3-25年。多種數據的存在構成了歷史記錄,因此一些大數據存儲的使用者希望數據可以長時間甚至永久保存,由于基于時間段進行的數據分析耗費資源較多,要想對數據進行長期保存,還要滿足數據實時更新的特性,這要求相關企業對存儲數據的硬件、軟件和存儲設備進行相應的改進。
大數據有多種價值表現形式,例如物價指數、幸福指數、全社會固定資產增長率等統計指標,通訊信息及個人財產信息等,然而要了解這些數據背后所反映的各種現象和機理及其所蘊含的信息還需要我們對其進行進一步的分析和探究。這就需要使用者具備一定的數據挖掘和探索能力。有關報道顯示,我國目前相當缺少具有大數據分析處理及相關技術開發能力的人才,并且缺乏對新興技術和創新型人才的引進和培養,“技術+管理”人才稀缺,無法滿足大數據的發展需要。
大數據是時代發展的必然趨勢,它雖然已經逐步應用到了各個行業中,但它面臨的:如何有效保障數據安全,如何填補數據人才的缺口,如何適應大數據帶來的變革等問題還需要我們為之付出不懈的努力。在未來發展中,大數據必將成為計算機科技時代的中堅力量,集中體現智能化時代的科學與便捷。
[1]鄔賀銓.大數據時代的機遇與挑戰[J].中國經貿.2013
[2]胡泳.郝亞洲.《數據治國與數據強國——簡論我國的大數據國家戰略》[J].新聞愛好者.2013
[3]高常水.《大數據在政府部門的應用》[J].物聯網技術.2014
[4]范雷雨.《淺析高速公路管理》[J].中小企業管理與科技.2012