董云影 張紅
摘 要:隨著科學、技術和工程的迅猛發展,近20年來,許多領域(如光學觀測、光學監控、健康醫護、傳感器、用戶數據、互聯網和金融公司以及供應鏈系統)都產生了海量的數據(更恰當的描述或許是“無限”的數據,大數據的概念也隨之再次引起重視。
關鍵詞:大數據;數據獲取;數據傳輸;數據存儲;數據分析
1 引言
近年來,“大數據”已廣為人知,并被認為是信息時代的新“石油”,這主要基于兩點共識。首先,在過去20年間,數據產生速度越來越快。據國際數據公司IDC報道,2011年產生和復制的數據量超過1.8Z字節,是過去5年數據增長的9倍,并將以每兩年翻倍的速度增長。其次,大數據中隱藏著巨大的機會和價值,將給許多領域帶來變革性的發展。因此,大數據研究領域吸引了產業界、政府和學術界的廣泛關注。例如,產業界報告和公共媒體中充斥了大數據的相關信息;政府部門設立重大項目加速大數據的發展等期刊也發表了大數據挑戰相關的論點。毫無疑問,大數據時代已經到來。
2 國外研究現狀
早在2009年,聯合國就啟動了“全球脈動計劃”,擬通過大數據推動落后地區的發展,而2012年1月的世界經濟論壇年會也把“大數據,大影響”作為重要議題之一。在美國,2009年至今,Data.gov(美國政府數據庫)全面開放了40萬政府原始數據集,大數據已成為美國國家創新戰略、國家安全戰略以及國家信息網絡安全戰略的交叉領域和核心領域。2012年3月,美國政府提出“大數據研究和發展倡議”,發起全球開放政府數據運動,并投資2億美元促進大數據核心技術研究和應用,涉及NSF,DARPA等6個政府部門和機構,把大數據放在重要的戰略位置。英國政府也將大數據作為重點發展的科技領域,在發展8類高新技術的6億英鎊投資中,大數據的注資占三成。2014年7月,歐盟委員會也呼吁各成員國積極發展大數據,迎接“大數據”時代,并將采取具體措施發展大數據業務。例如建立大數據領域的公私合作關系;依托“地平線2020”科研規劃,創建開放式數據孵化器;成立多個超級計算中心;在成員國創建數據處理設施網絡。無疑,歐美等國家對大數據的探索和發展已走在世界前列,各國政府已將大數據發展提升至戰略高度,大力促進大數據產業的發展。
3 國內研究現狀
我國政府、學術界和產業界也早已經開始高度重視大數據的研究和應用的工作,并紛紛啟動了相應的研究計劃。掛一漏萬,鑒于我們的了解所限,本文僅能夠簡要介紹其中的一些。
在政府層面,科技部“十二五”部署了關于物聯網、云計算的相關專項。2012年,中國科學院院長白春禮院士呼吁中國應制定國家大數據戰略。同年3月,科技部發布的《“十二五”國家科技計劃信息技術領域2013年度備選項目征集指南》中的“先進計算”板塊己明確提出“面向大數據的先進存儲結構及關鍵技術”,國家“973計劃”、“863計劃”、國家自然科學基金等也分別設立了針對大數據的研究計劃和專項。目前已立項“973計劃”項目2項,“973計劃”青年項目2項,國家自然科學基金重點項目2項。地方政府也對大數據戰略高度重視,2013年上海市提出了《上海推進大數據研究與發展三年行動計劃》,重慶市提出了《重慶市人民政府關于印發重慶市大數據行動計劃的通知》,2014年廣東省成立大數據管理局負責研究擬訂并組織實施大數據戰略、規劃和政策措施,引導和推動大數據研究和應用工作。貴州、河南和承德等省市也都推出了各自的大數據發展規劃。
在學術研究層面,國內許多高等院校和研究所開始成立大數據的研究機構。與此同時,國內有關大數據的學術組織和活動也紛紛成立和開展。2012年中國計算機學會和中國通信學會都成立了大數據專家委員會,教育部也在人民大學成立“薩師煊大數據分析與管理國際研究中心”。近年來開展了許多學術活動,主要包括:CCF大數據學術會議、中國大數據技術創新與創業大賽、大數據分析與管理國際研討會、大數據科學與工程國際學術研討會、中國大數據技術大會和中國國際大數據大會等。
在產業層面,國內不少知名企業或組織也成立了大數據產品團隊和實驗室,力爭在大數據產業競爭中占據領先地位。
參考文獻
[1]Gantz J,Reinsel D. Extracting value from chaos. IDC iView,2011: 1-12.
[2]Manyika J,Chui M,Brown B,et al. Big data: the next frontier for innovation,competition,and productivity.McKinsey Global Institute,2011.
[3]Cukier K. Data,data everywhere. Economist,2010,394:3-16.
[4]Lohr S. The age of big data. New York Times,2012,11.
[5]Noguchi Y. Following digital breadcrumbs to big data gold. National Public Radio,2011.
[6]Noguchi Y. The search for analysts to make sense of big data. National Public Radio,2011.
[7]White House. Fact Sheet: Big Data Across the Federal Government. Office of Science and Technology Policy,2012.
[8]Howard J H,Kazar M L,Menees S G,et al. Scale and performance in a distributed file system. ACM Trans ComputSyst,1988,6:51-81.