◎王忠
3月29日,奧巴馬政府在白宮網站發布了《大數據研究和發展倡議》(Big Data Research and Development Initiative),旨在提升利用大量復雜數據集合獲取知識和洞見的能力,并將為此投入兩億美元以上資金。近年來,大數據對社會經濟發展的預測能力已經嶄露頭角。例如,利用谷歌住房搜索查詢量變化對住房市場發展趨勢進行預測,明顯比不動產經濟學家的預測更準確。因此,奧巴馬政府發布研發倡議,并公布了相關部門的在研項目。我國應充分意識到大數據技術的重要戰略價值,盡快開展戰略性研究,加大研發支持力度,加快推進應用以及加強基礎大數據集建設。
2011年,總統科學技術顧問委員會(President’s Council of Advisors on Science and Technology)曾提出一份建議,認為大數據相關技術具有重要戰略價值,而聯邦政府對其研發投資不足。作為建議的反饋,白宮科技政策辦公室發布了《大數據研究和發展倡議》,并組織了大數據高級監督小組(Senior Steering Group on Big Data)協調和拓展政府在這一重要領域的投資。
《大數據研究和發展倡議》提出,將提升美國利用收集的龐大而復雜的數字資料提煉真知灼見的能力,協助加速科學、工程領域創新步伐,強化美國國土安全,轉變教育和學習模式。《大數據研究和發展倡議》還承諾將在科學研究、環境保護、生物醫藥研究、教育以及國家安全等領域利用大數據技術進行突破。
在白宮科技政策辦公室(OSTP)發布大數據研發倡議時,美國國家科學基金會(NSF)、國家衛生研究院(NIH)、國防部(DOD)、能源部(DOE)、國防部高級研究局(DARPA)、地質勘探局(USGS)等六個聯邦部門和機構承諾,將投入超過2億美元資金用于研發“從海量數據信息中獲取知識所必需的工具和技能”,并披露了多項正在進行中的聯邦政府計劃,主要內容如下:美國國家科學基金和美國國家衛生研究院主要推進大數據科學和工程的核心方法及技術研究,項目包括管理、分析、可視化、以及從大量的多樣化數據集中提取有用信息的核心科學技術;國防部高級研究局項目主要推進大數據輔助決策,集中在情報、偵查、網絡間諜等方面,匯集傳感器、感知能力和決策支持建立真正的自治系統,實現操作和決策的自動化;美國能源部試圖通過先進的計算進行科學發現,提供2500萬美元基金來建立可擴展的數據管理、分析和可視化研究所;美國地質勘探局通過給科學家提供深入分析的場所和時間、最高水平的計算能力和理解大數據集的協作工具,催化在地理系統科學的創新思維。
隨著大數據技術研究和應用的迅速發展,奧巴馬政府意識到大數據技術的重要性,將其視為“未來的新石油”,作為戰略性技術大力推動其發展。為了動員其他的利益相關者,《大數據研究和發展倡議》提出聯邦政府希望與行業、科研院校和非盈利機構一起,共同迎接大數據所創造的機遇和挑戰。某種程度上,大數據技術在美國已經形成了全體動員的格局。
一是政府部門資助大數據技術研發和應用。研發方面,除了《大數據研究和發展倡議》中提及的六個部門,還有多項正在進行中的聯邦政府計劃,以應對大數據時代以及大數據革命帶來的機遇和挑戰。這些披露的計劃涉及面廣,研發種類很多。例如,國土安全部項目主要推進可視化數據分析,應用領域主要為自然災害、恐怖事件、邊境安全、網絡威脅等。應用方面,美國也開始啟動相關項目。例如,3月30日美國國家衛生研究院宣布世界最大的遺傳變異研究數據集——國際千人基因組項目(截至目前為止數據已經達到大約200T B),由亞馬遜網站免費云服務(AWS)提供相關支持。此外,美國科學與技術政策辦公室(OSTP)正計劃支持新建一個論壇,致力于促進公共組織和私營部門大數據方面的伙伴關系。
二是非營利機構提供公共服務。
行業協會組織積極提供公共服務,例如“數據無邊界(Data Without Borders)”通過無償的數據收集、分析,以及可視化為非營利性組織提供幫助。高等院校開始培育相關人才。有些大學也已經開始創建大數據相關的新課程,這些全部課程的學習,將培養出下一代的“大數據科學家”。
三是企業加緊開展市場布局。大數據最先被互聯網企業所重視,如網飛(Netflix)和Facebook等大型科技公司巧妙地利用用戶遺留在網絡上的數字痕跡(digital traces),通過算法分析用戶需求,然后向用戶推薦觀看電影或者與某人聯系的建議。現在,美國一些大型公司已經開始贊助大數據相關的競賽,并且在為高等院校的大數據研究提供資金。EMC、惠普(微博)、IBM、微軟(微博)在內的IT巨頭紛紛通過收購“大數據”相關企業來實現技術整合。
隨著互聯網技術的不斷發展,數據將像能源、材料一樣,成為戰略性資源。如何利用數據資源發掘知識、提升效益、促進創新,使其為國家治理、企業決策乃至個人生活服務,是大數據技術的追求目標。隨著技術不斷成熟,大數據技術將成為國家治理的重要工具。例如,聯合國已經推出了名為“全球脈動”(Global Pulse)的新項目,希望利用“大數據”預測某些地區的失業率、支出削減或是疾病爆發等現象,其目標在于利用數字化的早期預警信號來提前指導援助項目。在大數據領域的落后,意味著國家安全將在數字空間出現漏洞,國家創新能力將在未來國際競爭中落后于人。因此,我國應加快推進大數據技術研發與應用。
一是充分重視大數據的戰略價值,盡快開展戰略性研究。組織各方力量,對先發國家大數據技術研發進展進行跟蹤研究,深入分析大數據國內外發展現狀和趨勢,明確大數據關鍵技術,制定技術發展路線圖。
二是加大研發支持力度。在明確關鍵技術的基礎上,確定重點支持領域,加大研發支持力度。整合核高基、電子發展基金、云計算專項、物聯網專項等項目,支持大數據技術的開發、研究和應用示范,引導企業加大研發力度,實現關鍵技術突破。
三是加快推進應用。在政府部門和公用事業的信息化應用中采購大數據技術,以政府采購引導國內大數據發展。結合當前的云計算、物聯網等試點工程,積極開展大數據技術應用,充分發揮示范效應,帶動社會其他領域的大數據應用。根據國外應用經驗,可以確定一些重點應用領域,例如電子政務、醫療、教育、能源、交通等,以點帶面加速大數據技術的應用,并總結示范經驗予以推廣。
四是加強基礎大數據集建設。一方面,完善數據采集體系。大數據需要有大量的數據源。應建立特定主題的數據監測系統,如交通、能源、醫療、自然災害等專題建立基礎數據庫,持續不斷收集相關數據,為大數據發展提供基礎。另一方面,推動國家基礎數據開放共享。美國十分重視政府信息資源的共享和利用,將“共享第一”作為美國聯邦IT共享服務戰略的基礎范式,力推政府開放平臺(Open Government Platform)。我國應加快推進政府信息資源共享,尤其推進數據資源共建共享,給大數據技術發展提供原材料,促進大數據成果廣泛應用。