魏晨曦 (北京跟蹤與通信技術(shù)研究所)
近年來(lái),隨著全球新一代信息技術(shù)和應(yīng)用的興起,大數(shù)據(jù)浪潮席卷全球。為應(yīng)對(duì)龐雜數(shù)據(jù)挑戰(zhàn)及繼續(xù)謀求信息優(yōu)勢(shì),迎接“大數(shù)據(jù)”時(shí)代的來(lái)臨,2012年3月,美國(guó)發(fā)表了《大數(shù)據(jù)研發(fā)倡議》,美國(guó)國(guó)防部及國(guó)防高級(jí)研究計(jì)劃局(DARPA)在同期發(fā)布的大數(shù)據(jù)項(xiàng)目清單中列出了10項(xiàng)研究計(jì)劃,開(kāi)發(fā)相應(yīng)工具盒技術(shù),大力提升獲取、管理和分析大數(shù)據(jù)的能力,正式把大數(shù)據(jù)研發(fā)提升為國(guó)家戰(zhàn)略,并作為美軍建設(shè)的戰(zhàn)略重點(diǎn)。大數(shù)據(jù)項(xiàng)目作為一種新興的技術(shù)極有可能對(duì)美國(guó)的國(guó)家安全戰(zhàn)略、軍事戰(zhàn)略、軍隊(duì)建設(shè)、作戰(zhàn)理論等方面產(chǎn)生重大影響。
美軍面臨的大數(shù)據(jù)挑戰(zhàn)
對(duì)于美軍來(lái)說(shuō),隨著信息化建設(shè)的繼續(xù)深入發(fā)展,各種新技術(shù)、新武器不斷涌現(xiàn),以及各級(jí)別的“系統(tǒng)集成”越來(lái)越復(fù)雜,在處理信息以及數(shù)據(jù)方面也開(kāi)始遭遇各種挑戰(zhàn),主要有以下幾種情況:
1)海量戰(zhàn)場(chǎng)數(shù)據(jù)無(wú)法得到及時(shí)、高效的處理。信息化條件下的作戰(zhàn),戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù)呈現(xiàn)出新的特點(diǎn):來(lái)源廣泛、容量巨大、更新頻繁。為了提高對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的感知,美軍綜合運(yùn)用了無(wú)人機(jī)、傳感器等偵察手段,其雷達(dá)、光電、聲音、影像偵察能力已經(jīng)實(shí)現(xiàn)了對(duì)戰(zhàn)場(chǎng)的全覆蓋,但所帶來(lái)的問(wèn)題是:隨著數(shù)據(jù)量的大幅增加,僅僅依靠現(xiàn)有信息技術(shù),美軍已不能及時(shí)高效地分析和處理這些數(shù)據(jù),而且持續(xù)更新的數(shù)據(jù)對(duì)系統(tǒng)的存儲(chǔ)能力也提出了更高的要求,海量數(shù)據(jù)甚至?xí)斐上到y(tǒng)癱瘓。
2)數(shù)據(jù)壁壘高阻礙了數(shù)據(jù)融合。美軍認(rèn)為,影響數(shù)據(jù)融合的壁壘主要有:在體制上,相關(guān)部門(mén)往往各自為營(yíng),存在重復(fù)開(kāi)發(fā)、標(biāo)準(zhǔn)各異等問(wèn)題,而且出于對(duì)自身利益的考慮,可能會(huì)獨(dú)享情報(bào),無(wú)法做到信息共享;在格式上,隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,博客、聊天室、論壇等成為獲取情報(bào)數(shù)據(jù)的新來(lái)源。這就帶來(lái)了除結(jié)構(gòu)化數(shù)據(jù)以外的新型數(shù)據(jù)結(jié)構(gòu),如半結(jié)構(gòu)化的HTML、XML數(shù)據(jù)以及非結(jié)構(gòu)化的圖形、圖像、視頻、音頻數(shù)據(jù)。這些數(shù)據(jù)擁有自己的特性和模式。為了適應(yīng)信息集成的需要,各種數(shù)據(jù)必須建立統(tǒng)一的格式標(biāo)準(zhǔn),建立一種能夠容納和處理各種數(shù)據(jù)格式的綜合集成的數(shù)據(jù)庫(kù)。
3)數(shù)據(jù)庫(kù)漏洞增多,信息安全存在隱患。信息安全是一個(gè)存在已久的問(wèn)題,而數(shù)據(jù)則是信息的重要載體。隨著數(shù)據(jù)量的爆炸性增長(zhǎng),一方面,數(shù)據(jù)庫(kù)漏洞越來(lái)越多,可攻擊的目標(biāo)也隨之增加,且攻擊目標(biāo)將更為暴露;另一方面,隱藏在海量數(shù)據(jù)中的攻擊行為往往難以被及時(shí)探測(cè)。數(shù)據(jù)安全是大數(shù)據(jù)應(yīng)用的根本保障,核心數(shù)據(jù)的泄露將對(duì)整個(gè)戰(zhàn)局造成致命性影響。因此,必須研發(fā)出可靠的防護(hù)措施,以確保信息安全。
美國(guó)大數(shù)據(jù)政策及其軍事項(xiàng)目研發(fā)
近年來(lái),美國(guó)奧巴馬政府從戰(zhàn)略高度看待大數(shù)據(jù)問(wèn)題,出臺(tái)了相關(guān)政策文件。2010年12月,美國(guó)總統(tǒng)行政辦公室、總統(tǒng)科技顧問(wèn)委員會(huì)提交了題為“設(shè)計(jì)數(shù)據(jù)化未來(lái)”的報(bào)告。該報(bào)告通過(guò)對(duì)事關(guān)聯(lián)邦機(jī)構(gòu)未來(lái)發(fā)展的五大問(wèn)題的分析,提出國(guó)家安全和國(guó)土安全部門(mén)在網(wǎng)絡(luò)信息領(lǐng)域應(yīng)具備的能力,并進(jìn)一步闡述了大規(guī)模數(shù)據(jù)管理與分析的重要性及存在的研究挑戰(zhàn)。在上述報(bào)告的基礎(chǔ)上,奧巴馬政府綜合其他各智庫(kù)的意見(jiàn),于2012年3月29日發(fā)布了“大數(shù)據(jù)研發(fā)倡議”,將大數(shù)據(jù)研發(fā)提升為國(guó)家政策。
美國(guó)政府旨在通過(guò)此舉實(shí)現(xiàn)效率最大化,即利用較少的投入帶動(dòng)全國(guó)各部門(mén)對(duì)大數(shù)據(jù)項(xiàng)目的研發(fā)??偨y(tǒng)科技助理兼白宮科技政策辦公室主任約翰·霍爾德倫博士在“大數(shù)據(jù)研發(fā)倡議”新聞發(fā)布會(huì)上指出:正如聯(lián)邦政府過(guò)去在信息技術(shù)研發(fā)領(lǐng)域的投入,曾經(jīng)推動(dòng)超級(jí)計(jì)算機(jī)的快速發(fā)展和互聯(lián)網(wǎng)的產(chǎn)生那樣,我們今天發(fā)布的這個(gè)倡議,將確保我們有能力將大數(shù)據(jù)用于科學(xué)發(fā)現(xiàn)、環(huán)境與生物醫(yī)藥研究、教育和國(guó)家安全。目前,該文件尚處于保密階段。
根據(jù)白宮發(fā)布的新聞稿,奧巴馬政府推進(jìn)大數(shù)據(jù)研發(fā)項(xiàng)目的目的是:
1)發(fā)展前沿核心技術(shù),以滿(mǎn)足搜集、存儲(chǔ)、防護(hù)、管理、分析和共享海量數(shù)據(jù)的要求;
2)利用上述技術(shù),推動(dòng)科學(xué)與工程領(lǐng)域的發(fā)明創(chuàng)造,增強(qiáng)國(guó)家安全,轉(zhuǎn)變教育方式;
3)儲(chǔ)備人力資源,以滿(mǎn)足發(fā)展和利用大數(shù)據(jù)技術(shù)的需求。
目前,共有6個(gè)部門(mén)和機(jī)構(gòu)為推動(dòng)該倡議承擔(dān)了任務(wù),包括:國(guó)家科學(xué)基金會(huì)、國(guó)家衛(wèi)生研究院、能源部、國(guó)防部及國(guó)防高級(jí)研究計(jì)劃局、美國(guó)地質(zhì)調(diào)查局。
國(guó)防部及其下屬?lài)?guó)防高級(jí)研究計(jì)劃局現(xiàn)有的大數(shù)據(jù)項(xiàng)目共有10個(gè)。其中,具有代表性的項(xiàng)目是:數(shù)據(jù)到?jīng)Q策、網(wǎng)絡(luò)內(nèi)部威脅、影像檢索與分析和X-數(shù)據(jù)項(xiàng)目。
1)多尺度異常檢測(cè)(ADAMS)項(xiàng)目。解決大規(guī)模數(shù)據(jù)集的異常檢測(cè)與表征問(wèn)題。在此背景下,數(shù)據(jù)中的異常為在各種現(xiàn)實(shí)背景下搜集另外可操作的信息提供了線(xiàn)索。
2)網(wǎng)絡(luò)內(nèi)部威脅項(xiàng)目。該項(xiàng)目的目的是通過(guò)采用新式網(wǎng)絡(luò)威脅判斷技術(shù),提高探知網(wǎng)絡(luò)活動(dòng)的精度、頻度和速度,從而及早暴露和防范對(duì)手的破壞活動(dòng),并提升己方的網(wǎng)絡(luò)安全水平。尋求研究新的方法檢測(cè)軍方計(jì)算機(jī)網(wǎng)絡(luò)中的符合網(wǎng)絡(luò)間諜特征的活動(dòng),旨在提高檢測(cè)網(wǎng)絡(luò)威脅的準(zhǔn)確度、比例與速度。
3)洞察力項(xiàng)目。以解決當(dāng)前情報(bào)、監(jiān)視與偵察系統(tǒng)中的重要不足,旨在研發(fā)一種資源管理系統(tǒng),通過(guò)分析成像和非成像傳感器及其他來(lái)源的信息,自動(dòng)識(shí)別威脅網(wǎng)絡(luò)和非常規(guī)作戰(zhàn)行動(dòng)。
4)機(jī)器讀取項(xiàng)目。通過(guò)研發(fā)學(xué)習(xí)系統(tǒng),處理自然文本并在知識(shí)庫(kù)中插入產(chǎn)生的語(yǔ)義表示,而非依賴(lài)于當(dāng)前用于知識(shí)表達(dá)昂貴且費(fèi)時(shí)的處理過(guò)程。
5)“心靈之眼”項(xiàng)目。旨在開(kāi)發(fā)一種可在機(jī)器上應(yīng)用的“可視化情報(bào)”能力。
6)面向任務(wù)的彈性“云”項(xiàng)目。旨在開(kāi)發(fā)檢測(cè)、診斷和應(yīng)對(duì)攻擊的技術(shù),為“云”計(jì)算環(huán)境建立有效的“社區(qū)衛(wèi)生服務(wù)體系”,應(yīng)對(duì)“云”計(jì)算中固有的安全挑戰(zhàn)。
7)加密數(shù)據(jù)的編程運(yùn)算項(xiàng)目。旨在為運(yùn)算中的數(shù)據(jù)開(kāi)發(fā)其在應(yīng)用的整個(gè)過(guò)程中保持加密狀態(tài)所需的切實(shí)可行的做法與相關(guān)的現(xiàn)代編程語(yǔ)言,克服在“云”計(jì)算環(huán)境內(nèi)信息安全面臨的主要挑戰(zhàn)。
8)影像檢索與分析項(xiàng)目。其目的是開(kāi)發(fā)一套系統(tǒng),使軍事圖像分析員有能力開(kāi)發(fā)收集到的大量視頻內(nèi)容,使分析員能夠?yàn)橛袃r(jià)值的活動(dòng)與事件建立起預(yù)警功能。該項(xiàng)目一旦取得成功,分析人員將能從海量視頻庫(kù)中快速、精確地檢索特定的視頻內(nèi)容,由此便能充分、高效地挖掘影像中隱藏的有用信息。
9)X-數(shù)據(jù)項(xiàng)目。該項(xiàng)目的主要內(nèi)容是:通過(guò)開(kāi)發(fā)大容量數(shù)據(jù)分析所需的可擴(kuò)展算法,以便處理分布式數(shù)據(jù)存儲(chǔ)庫(kù)中的不規(guī)則數(shù)據(jù);通過(guò)開(kāi)發(fā)高效的人機(jī)互動(dòng)設(shè)備和可視用戶(hù)界面技術(shù),以便在多樣化任務(wù)中更好、更快地執(zhí)行操作。旨在為分析大量半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)開(kāi)發(fā)計(jì)算技術(shù)和軟件工具,主要解決處理分布式數(shù)據(jù)存儲(chǔ)中不完整數(shù)據(jù)的可擴(kuò)展算法,以及用于各種任務(wù)、可迅速定制,方便視覺(jué)推理的有效的人機(jī)交互工具。
10)數(shù)據(jù)到?jīng)Q策項(xiàng)目。該項(xiàng)目的主要內(nèi)容是:首先,通過(guò)各種新途徑充分利用海量數(shù)據(jù),整合感知、認(rèn)知和決策保障系統(tǒng),以創(chuàng)造一種真正自主的系統(tǒng),使之可以自主機(jī)動(dòng)作業(yè)并做出決策;其次,提高態(tài)勢(shì)感知水平,以協(xié)助作戰(zhàn)人員和分析人員,并為作戰(zhàn)行動(dòng)提供更好的保障。國(guó)防部正在研發(fā)新技術(shù),以使分析員從各種語(yǔ)言的文本中獲取信息的能力提高100倍,目的是使分析員查知各類(lèi)目標(biāo)、活動(dòng)和事情的能力取得相似程度的提升。
目前,在《大數(shù)據(jù)研發(fā)倡議》中,國(guó)防部?jī)H負(fù)責(zé)數(shù)據(jù)到?jīng)Q策這一個(gè)項(xiàng)目;國(guó)防高級(jí)研究計(jì)劃局負(fù)責(zé)其余的9個(gè)項(xiàng)目,并已經(jīng)開(kāi)始啟動(dòng)X-數(shù)據(jù)項(xiàng)目。
美軍大數(shù)據(jù)項(xiàng)目研發(fā)的進(jìn)展
美國(guó)政府除正式出臺(tái)了大數(shù)據(jù)研發(fā)政策文件外,還在組織機(jī)構(gòu)上對(duì)大數(shù)據(jù)研發(fā)項(xiàng)目加強(qiáng)了管理,在資金上加大了投入。
美國(guó)白宮科技政策辦公室專(zhuān)門(mén)成立了“大數(shù)據(jù)高級(jí)指導(dǎo)小組”,以協(xié)調(diào)和推動(dòng)政府在這一關(guān)鍵領(lǐng)域的投入。
報(bào)告“設(shè)計(jì)數(shù)據(jù)化未來(lái)”認(rèn)為,聯(lián)邦政府在大數(shù)據(jù)相關(guān)技術(shù)上投入不足。針對(duì)此問(wèn)題,國(guó)防部除了承擔(dān)在“大數(shù)據(jù)研發(fā)倡議”中的任務(wù)外,每年還將通過(guò)一系列項(xiàng)目,在軍事部門(mén)中投入約2.5億美元用于大數(shù)據(jù)研發(fā),其中6000萬(wàn)美元用于新設(shè)立的研究項(xiàng)目。此外國(guó)防高級(jí)研究計(jì)劃局已開(kāi)始研發(fā)的X-數(shù)據(jù)項(xiàng)目每年耗資約2500萬(wàn)美元,并將持續(xù)4年。
國(guó)防部還與一些知名大學(xué)和大型企業(yè)簽訂了有關(guān)大數(shù)據(jù)項(xiàng)目的合同,以便充分利用知名大學(xué)的人才資源和大型企業(yè)的技術(shù)優(yōu)勢(shì),提高研發(fā)效率。例如,2011年,國(guó)防高級(jí)研究計(jì)劃局同佐治亞理工學(xué)院簽訂了一份價(jià)值270萬(wàn)美元的技術(shù)研發(fā)合同,以幫助解決大數(shù)據(jù)的技術(shù)挑戰(zhàn)。該合同屬于X-數(shù)據(jù)項(xiàng)目的組成部分,以解決可擴(kuò)展分析和數(shù)據(jù)處理技術(shù)難題。2013年2月5日,連續(xù)體分析公司(Continuum Analytics)宣布,已收到計(jì)劃局300萬(wàn)美元的研究經(jīng)費(fèi),為大型多維度數(shù)據(jù)集的交互搜索開(kāi)發(fā)Numpy、SciPy和可視化技術(shù)。
此外,為了推動(dòng)大數(shù)據(jù)領(lǐng)域的創(chuàng)新,以滿(mǎn)足各類(lèi)要求,美國(guó)國(guó)防部還將舉辦一系列公開(kāi)的大獎(jiǎng)賽,以提高科技人員的積極性和主動(dòng)精神。
美軍大數(shù)據(jù)項(xiàng)目研發(fā)的影響
目前,大數(shù)據(jù)項(xiàng)目作為一種新興的技術(shù)極有可能同其他技術(shù)一樣,對(duì)美國(guó)的國(guó)家安全戰(zhàn)略、軍事戰(zhàn)略、軍隊(duì)建設(shè)、作戰(zhàn)理論等方面產(chǎn)生重大影響。
(1) 推動(dòng)大數(shù)據(jù)在美國(guó)國(guó)家層面的應(yīng)用
人類(lèi)歷史上很多新興技術(shù)都是首先在軍方應(yīng)用,然后推廣到民間應(yīng)用,并對(duì)整個(gè)社會(huì)的發(fā)展起到了重大影響,例如雷達(dá)技術(shù)、電子計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)和航天技術(shù)都是如此。大數(shù)據(jù)在社會(huì)層面擁有巨大的應(yīng)用空間,一旦其技術(shù)成熟,將會(huì)給經(jīng)濟(jì)、醫(yī)療、教育等領(lǐng)域帶來(lái)革命性變革。此外,美國(guó)在大數(shù)據(jù)領(lǐng)域擁有的絕對(duì)性?xún)?yōu)勢(shì)將有助于其制定國(guó)際標(biāo)準(zhǔn),這將牽制其他國(guó)家在該領(lǐng)域的發(fā)展,在國(guó)家安全戰(zhàn)略上具有重要意義。
(2)推動(dòng)云計(jì)算、物聯(lián)網(wǎng)技術(shù)的進(jìn)一步完善
物聯(lián)網(wǎng)實(shí)現(xiàn)了所有能夠主尋址的普通物理對(duì)象的互聯(lián)互通,使各行各業(yè)有了大量的數(shù)據(jù)“發(fā)生器”;云計(jì)算則提供了更加廣泛的資源共享,解決了數(shù)據(jù)、服務(wù)和計(jì)算資源的共享問(wèn)題。而大數(shù)據(jù)的實(shí)質(zhì)則是更好地獲取、管理、使用這些數(shù)據(jù),深入挖掘其中蘊(yùn)藏的知識(shí),使其效用最大化。物聯(lián)網(wǎng)和云計(jì)算的軍事價(jià)值已經(jīng)初顯端倪,美軍利用軍事物聯(lián)網(wǎng)實(shí)現(xiàn)了戰(zhàn)場(chǎng)人員、資源的實(shí)時(shí)感知,對(duì)戰(zhàn)場(chǎng)感知、決策支援和資源優(yōu)化配置發(fā)揮了重要作用,美國(guó)國(guó)防部2012年7月11日發(fā)布的《云計(jì)算戰(zhàn)略》指出,云計(jì)算將為美軍建立一種靈活、安全和有效的服務(wù)環(huán)境,以對(duì)改變的任務(wù)需求做出快速響應(yīng)??梢哉f(shuō)這三大技術(shù)是互為補(bǔ)充的,大數(shù)據(jù)的進(jìn)一步發(fā)展將為物聯(lián)網(wǎng)、云計(jì)算提供更為強(qiáng)大的技術(shù)支持,推動(dòng)其進(jìn)一步發(fā)展。
(3)確保美軍在信息領(lǐng)域的絕對(duì)優(yōu)勢(shì)
通過(guò)大數(shù)據(jù)研發(fā),美軍將會(huì)在數(shù)據(jù)獲取、存儲(chǔ)、管理、分析和分發(fā)等方面取得質(zhì)的飛躍,進(jìn)而提升美軍戰(zhàn)場(chǎng)態(tài)勢(shì)感知、情報(bào)分析、智能決策以及安全防護(hù)能力,大大縮短決策循環(huán)(OODA)周期,以便迅速做出正確的決策,這對(duì)于掌握戰(zhàn)場(chǎng)主動(dòng)權(quán)和最終奪取勝利至關(guān)重要;此外,美軍率先在大數(shù)據(jù)領(lǐng)域占領(lǐng)先機(jī),將會(huì)全面拉開(kāi)與其他國(guó)家在信息戰(zhàn)領(lǐng)域的差距,確保戰(zhàn)場(chǎng)信息主導(dǎo)權(quán)。
由于美國(guó)聯(lián)邦政府曾運(yùn)用類(lèi)似的研發(fā)方法在信息技術(shù)研發(fā)領(lǐng)域進(jìn)行投資,并獲得巨大成功,此次美國(guó)通過(guò)“大數(shù)據(jù)”研發(fā),有可能帶來(lái)一系列關(guān)鍵技術(shù)上的突破,引領(lǐng)信息化競(jìng)爭(zhēng)進(jìn)一步從軟硬件、網(wǎng)絡(luò)領(lǐng)域向信息認(rèn)知躍升。
美軍采取的具體措施
為解決軍事應(yīng)用中的大數(shù)據(jù)問(wèn)題,美軍著眼于系統(tǒng)性、全方位解決方案,采用了統(tǒng)一規(guī)劃、分步實(shí)施的具體措施。
(1) 改革編制體制,為大數(shù)據(jù)技術(shù)的開(kāi)發(fā)與利用提供高效的運(yùn)行機(jī)制
在國(guó)防部層面,原負(fù)責(zé)網(wǎng)絡(luò)與信息一體化的前助理部長(zhǎng)辦公室(NII/CIO)更名為首席信息官辦公室,原辦公室的一些采購(gòu)職能轉(zhuǎn)交給負(fù)責(zé)采購(gòu)、技術(shù)與后勤的副部長(zhǎng),但保留對(duì)采購(gòu)程序的建議權(quán)。這樣可使首席信息官專(zhuān)注于信息管理、信息技術(shù)、信息保障等的頂層設(shè)計(jì)與全局性指導(dǎo)。另?yè)?jù)《防務(wù)系統(tǒng)》網(wǎng)站2013年6月29日?qǐng)?bào)道,為實(shí)現(xiàn)作戰(zhàn)與情報(bào)的融合,構(gòu)建聯(lián)合信息環(huán)境,聯(lián)合參謀部也正在進(jìn)行聯(lián)合。
參謀部的信息技術(shù)轉(zhuǎn)型,計(jì)劃重建指揮、控制、通信與計(jì)算機(jī)系統(tǒng)部(J6),并與國(guó)防部長(zhǎng)首席信息官辦公室一道共同領(lǐng)導(dǎo)國(guó)防部的“信息技術(shù)效能”工作。為了有效整合網(wǎng)絡(luò)空間作戰(zhàn)資源,作為美國(guó)網(wǎng)絡(luò)作戰(zhàn)體系的最高指揮機(jī)構(gòu),美軍網(wǎng)絡(luò)司令部的成立則被譽(yù)為“美國(guó)國(guó)防的重要里程碑”。在軍種層面,為整合情報(bào)、監(jiān)視和偵察資源,美軍于2007年6月8日成立了美國(guó)空軍情報(bào)、監(jiān)視和偵察局(AFISRA),從而將情報(bào)、監(jiān)視和偵察作為一個(gè)整體來(lái)分配、計(jì)劃和運(yùn)用,這樣無(wú)疑將充分發(fā)揮情報(bào)、偵察和監(jiān)視的巨大合力優(yōu)勢(shì)。對(duì)這些相關(guān)機(jī)構(gòu)的相應(yīng)調(diào)整,為大數(shù)據(jù)技術(shù)的開(kāi)發(fā)與利用提供了一套高效的運(yùn)行機(jī)制。
(2)以大數(shù)據(jù)為核心構(gòu)建國(guó)防部企業(yè)化體系架構(gòu)
基于國(guó)防部指令《在以網(wǎng)絡(luò)中心的國(guó)防部?jī)?nèi)部數(shù)據(jù)共享》規(guī)定了國(guó)防部首席信息官進(jìn)行數(shù)據(jù)資源管理的政策及其職責(zé),為進(jìn)一步優(yōu)化國(guó)防部信息技術(shù)體系架構(gòu),由國(guó)防部首席信息官牽頭,國(guó)防部信息系統(tǒng)局具體負(fù)責(zé),在網(wǎng)絡(luò)服務(wù)、計(jì)算服務(wù)、應(yīng)用與數(shù)據(jù)服務(wù)、終端用戶(hù)服務(wù)和IT業(yè)務(wù)程序等五大職能領(lǐng)域推行改革,合并數(shù)據(jù)中心并使各軍種更加標(biāo)準(zhǔn)化,以提高網(wǎng)絡(luò)安全與任務(wù)效果。2011年9月6日,國(guó)防部首席信息官簽署發(fā)布的《美國(guó)國(guó)防部信息技術(shù)體系戰(zhàn)略與路線(xiàn)圖》,標(biāo)志著利用新技術(shù)來(lái)建設(shè)新的國(guó)防部信息體系的開(kāi)始。該戰(zhàn)略計(jì)劃整合所有IT設(shè)施,為國(guó)防部打造一個(gè)更有效、更安全的國(guó)防部信息體系確立了戰(zhàn)略規(guī)劃和初期發(fā)展路線(xiàn)圖。為進(jìn)一步落實(shí)國(guó)防部改革措施,國(guó)防部信息系統(tǒng)局于2012年發(fā)布了《2013-2018年戰(zhàn)略規(guī)劃》,以“確保建立一個(gè)統(tǒng)一的、合作的、保密的聯(lián)合信息環(huán)境(JIE),實(shí)現(xiàn)整個(gè)國(guó)防部端對(duì)端的信息共享和獨(dú)立企業(yè)服務(wù);為國(guó)防部提供快速的云服務(wù)。”以此作為戰(zhàn)略目標(biāo),通過(guò)合并數(shù)據(jù)中心、網(wǎng)絡(luò)作戰(zhàn)中心向云計(jì)算過(guò)渡,將企業(yè)化系統(tǒng)的各個(gè)組成部分融合成為更高效、廉價(jià)的架構(gòu)。通過(guò)對(duì)海量數(shù)據(jù)搜索、挖掘、存儲(chǔ)、分析、安全等的大數(shù)據(jù)技術(shù)開(kāi)發(fā),為美軍提供大數(shù)據(jù)能力,以支持美軍的全球作戰(zhàn)。
(3)合并全球數(shù)據(jù)中心,向數(shù)據(jù)中心戰(zhàn)過(guò)渡
當(dāng)前,美軍在極力強(qiáng)調(diào)基礎(chǔ)網(wǎng)絡(luò)的彈性和可信性的同時(shí),大規(guī)模削減分散于全球的數(shù)據(jù)中心,大力推進(jìn)網(wǎng)絡(luò)云計(jì)算項(xiàng)目。目的是在“形成靈活、智能、自適應(yīng)的物理網(wǎng)絡(luò)的基礎(chǔ)上,將網(wǎng)絡(luò)空間工作的關(guān)注點(diǎn)調(diào)整到‘改造網(wǎng)絡(luò)化服務(wù)模式’”上來(lái),直接以企業(yè)化的作戰(zhàn)應(yīng)用服務(wù)支撐作戰(zhàn)過(guò)程。從“提供物理網(wǎng)絡(luò)服務(wù)”到“提供網(wǎng)絡(luò)應(yīng)用服務(wù)”的轉(zhuǎn)型,是從“網(wǎng)絡(luò)中心戰(zhàn)”向“數(shù)據(jù)中心戰(zhàn)”軍事作戰(zhàn)理論轉(zhuǎn)型的基礎(chǔ)和實(shí)質(zhì)性目標(biāo)。在可預(yù)期的未來(lái),隨著web3.0技術(shù)的發(fā)展、成熟與軍事應(yīng)用的廣泛展開(kāi),美軍軍隊(duì)建設(shè)理論也將發(fā)展變化:作戰(zhàn)過(guò)程控制將日趨自動(dòng)化,指揮官將直入作戰(zhàn)主題,將關(guān)注焦點(diǎn)逐漸提升到核心的作戰(zhàn)目標(biāo)。
美軍2013財(cái)年重點(diǎn)將現(xiàn)有的數(shù)據(jù)中心合并為三類(lèi)數(shù)據(jù)中心。第一類(lèi)為核心數(shù)據(jù)中心,用于國(guó)防部各部門(mén)都必須使用的信息服務(wù)與應(yīng)用,以及用于國(guó)防部與工業(yè)部門(mén)和公眾交互的對(duì)外服務(wù)與應(yīng)用。第二類(lèi)為地區(qū)性數(shù)據(jù)中心,主要用于滿(mǎn)足距離終端用戶(hù)更近的信息服務(wù)與應(yīng)用需求。第三類(lèi)為部署在前方的前方數(shù)據(jù)中心,這類(lèi)數(shù)據(jù)中心很靈活,可以存放地區(qū)性與全局性的服務(wù)與信息,適合各種任務(wù)情況,速度更快,網(wǎng)絡(luò)可靠性更好。這些數(shù)據(jù)中心的服務(wù)器將普遍高度虛擬化,這樣可以更靈活地加入新的信息服務(wù),提供最大的效率。這些新的數(shù)據(jù)中心與網(wǎng)絡(luò)結(jié)構(gòu)的重要改進(jìn)得益于遠(yuǎn)程防御行動(dòng)、網(wǎng)絡(luò)、數(shù)據(jù)中心、服務(wù)器以及其他應(yīng)用的技術(shù)標(biāo)準(zhǔn)化,這些極大地提高了國(guó)防部信息技術(shù)控制系統(tǒng)的網(wǎng)絡(luò)安全性。
(4)投入重金開(kāi)發(fā)大數(shù)據(jù)技術(shù)
針對(duì)大數(shù)據(jù)所面臨的帶寬稀缺、適應(yīng)性和安全性、存儲(chǔ)等問(wèn)題,美軍與IT界在“云”計(jì)算環(huán)境與協(xié)作、非結(jié)構(gòu)化數(shù)據(jù)的整合、超越數(shù)據(jù)倉(cāng)庫(kù)等方面進(jìn)行了廣泛的合作并已取得了一定的成效。例如,2010年美國(guó)動(dòng)態(tài)研究公司與美國(guó)陸軍合作開(kāi)發(fā)的構(gòu)建基于“云”計(jì)算環(huán)境的智能系統(tǒng)“求雨者”(Rainmaker)已部署到了阿富汗戰(zhàn)場(chǎng)。
在前沿技術(shù)研究方面,國(guó)防高級(jí)研究計(jì)劃局在大數(shù)據(jù)工作中計(jì)劃每年投入2500萬(wàn)美元,著手研發(fā)大數(shù)據(jù)處理分析所必要的硬件與智能化分析軟件,以解決非結(jié)構(gòu)化數(shù)據(jù)的組織積累、數(shù)據(jù)庫(kù)關(guān)聯(lián)等問(wèn)題。具有代表性的項(xiàng)目是:數(shù)據(jù)到?jīng)Q策、網(wǎng)絡(luò)內(nèi)部威脅、影像檢索與分析、X-數(shù)據(jù)項(xiàng)目等。
當(dāng)今世界正處于信息爆炸時(shí)期,社會(huì)步入了大數(shù)據(jù)時(shí)代。航天領(lǐng)域也正在沐浴著大數(shù)據(jù)的朝陽(yáng),潛在地引導(dǎo)科學(xué)工程技術(shù)的創(chuàng)新和人類(lèi)思維的變革。
美國(guó)航空航天局(NASA)在保持美國(guó)民用和軍用航空航天優(yōu)勢(shì)的同時(shí),繼續(xù)進(jìn)行科學(xué)探索以及加強(qiáng)對(duì)宇宙、太陽(yáng)系和地球環(huán)境的了解,并將航天技術(shù)和知識(shí)轉(zhuǎn)移用于一般工業(yè)。NASA在利用航空航天技術(shù)以滿(mǎn)足國(guó)家需要方面起領(lǐng)導(dǎo)作用,在新技術(shù)研究和應(yīng)用方面處于行業(yè)內(nèi)國(guó)際領(lǐng)先地位。
NASA的大數(shù)據(jù)發(fā)展計(jì)劃
美國(guó)《大數(shù)據(jù)研發(fā)倡議》,展示了大數(shù)據(jù)研發(fā)應(yīng)用將從以往的商業(yè)行為上升到美國(guó)國(guó)家戰(zhàn)略部署的總體藍(lán)圖。其中,關(guān)于NASA大數(shù)據(jù)發(fā)展計(jì)劃的闡述:
NASA的先進(jìn)信息系統(tǒng)技術(shù)(AIST)旨在降低其信息系統(tǒng)的風(fēng)險(xiǎn)和成本,以支持未來(lái)的地球觀(guān)測(cè)任務(wù),并轉(zhuǎn)化為NASA氣候中心預(yù)測(cè)的地理信息。該技術(shù)方案將有助于尋求成熟的大數(shù)據(jù)能力,以減少地球科學(xué)部空軍基地和陸軍基地信息系統(tǒng)的風(fēng)險(xiǎn)、成本、規(guī)模和開(kāi)發(fā)時(shí)間,從而提高科學(xué)數(shù)據(jù)的獲取和實(shí)用性。
NASA的地球科學(xué)數(shù)據(jù)和信息系統(tǒng)(ESDIS)項(xiàng)目持續(xù)用超過(guò)15年的時(shí)間從空中和外地活動(dòng)中對(duì)地球衛(wèi)星數(shù)據(jù)和數(shù)據(jù)進(jìn)行處理、存檔和發(fā)布,并從提升用戶(hù)滿(mǎn)意度出發(fā),努力確??茖W(xué)家和公眾在從地球到太空的研究中的數(shù)據(jù)訪(fǎng)問(wèn)功能,從而提升地球科學(xué)在應(yīng)對(duì)氣候和環(huán)境變化挑戰(zhàn)中的能力。
全球地球觀(guān)測(cè)系統(tǒng)(GEOSS)通過(guò)國(guó)際之間合作進(jìn)行地球觀(guān)測(cè)數(shù)據(jù)共享和整合。NASA已經(jīng)與美國(guó)環(huán)境保護(hù)署(EPA)、美國(guó)國(guó)家海洋和大氣管理局(NOAA)以及其他機(jī)構(gòu)和國(guó)家的力量強(qiáng)強(qiáng)聯(lián)手,整合衛(wèi)星、地面監(jiān)測(cè)和建模系統(tǒng),評(píng)估環(huán)境條件和預(yù)測(cè)包括森林火災(zāi)、人口增長(zhǎng)等結(jié)果。研究人員將在短期內(nèi)整合各種復(fù)雜的空氣質(zhì)量信息,從而更好地了解和解決空氣質(zhì)量對(duì)環(huán)境和人體健康的影響。
由NASA和克雷公司制定的太空行動(dòng)協(xié)議,將允許一個(gè)或多個(gè)項(xiàng)目集中發(fā)展和應(yīng)用低延遲“大數(shù)據(jù)”系統(tǒng)。特別是,該項(xiàng)目測(cè)試的混合計(jì)算機(jī)系統(tǒng)的應(yīng)用程序,能夠以高度集成的非結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)數(shù)據(jù)庫(kù)作為數(shù)據(jù)傳輸?shù)氖侄?,以加?qiáng)建模和分析軟件。
NASA的行星數(shù)據(jù)系統(tǒng)(PDS)是美國(guó)NASA行星任務(wù)的數(shù)據(jù)檔案。目前,系統(tǒng)已經(jīng)成為了世界各地科學(xué)家的基本檔案數(shù)據(jù)資源。所有的系統(tǒng)生產(chǎn)的產(chǎn)品通過(guò)同行評(píng)審,進(jìn)行歸檔,可以很容易通過(guò)一個(gè)行星學(xué)科提供的在線(xiàn)目錄系統(tǒng)進(jìn)行訪(fǎng)問(wèn)。
空間望遠(yuǎn)鏡科學(xué)研究所(MAST)作為NASA的分布式空間科學(xué)數(shù)據(jù)服務(wù)的一個(gè)組成部分,主要側(cè)重于光學(xué)、紫外線(xiàn)和近紅外部分頻譜等相關(guān)的科學(xué)數(shù)據(jù),支持和提供各種天文數(shù)據(jù)檔案。研究所支持多種工具,可以對(duì)各種光譜圖像數(shù)據(jù)進(jìn)行訪(fǎng)問(wèn)。
地球系統(tǒng)電網(wǎng)聯(lián)邦公共檔案是一個(gè)公共的數(shù)據(jù)存檔服務(wù),支持由國(guó)際小組研究并在2014年完成對(duì)氣候變化的第五次評(píng)估報(bào)告(如同第四次評(píng)估報(bào)告的存檔一樣)。美國(guó)NASA聯(lián)合會(huì)通過(guò)與美國(guó)能源部合作,能夠促進(jìn)數(shù)據(jù)觀(guān)測(cè)和模型的輸出。
NASA的大數(shù)據(jù)云平臺(tái)
(1)云服務(wù)平臺(tái)
2008年,NASA埃姆斯研究中心使用自開(kāi)發(fā)的開(kāi)源綜合云服務(wù)平臺(tái)“星云”(Nebula)來(lái)協(xié)助完成對(duì)月球和火星的探索任務(wù)。該項(xiàng)目需要對(duì)大量高分辨率影像進(jìn)行儲(chǔ)存和處理。在傳統(tǒng)的環(huán)境中,為此構(gòu)建IT基礎(chǔ)設(shè)施及配置設(shè)備需要花費(fèi)近150~180天;同時(shí),大數(shù)據(jù)交互需要接入內(nèi)部載體或網(wǎng)絡(luò)。采用“星云”平臺(tái)取代昂貴的數(shù)據(jù)中心,對(duì)科學(xué)數(shù)據(jù)提供基于網(wǎng)絡(luò)的應(yīng)用環(huán)境及可伸縮的計(jì)算和存儲(chǔ)能力,NASA因此不用為新增的大數(shù)據(jù)構(gòu)建IT基礎(chǔ)設(shè)施,研究人員可以在幾分鐘內(nèi)通過(guò)云完成所需要的存儲(chǔ)和計(jì)算資源的構(gòu)建、配置、監(jiān)視與升級(jí)等一系列任務(wù);“星云”平臺(tái)提供框架、代碼庫(kù)、接口數(shù)據(jù)裝置和網(wǎng)絡(luò)服務(wù),使用安全的方法使云上的數(shù)據(jù)接入不同研究子部門(mén)或合作單位,避免對(duì)內(nèi)部載體網(wǎng)絡(luò)的大量接入。勇氣號(hào)和機(jī)遇號(hào)任務(wù)為在軌運(yùn)行空間任務(wù)中試驗(yàn)云計(jì)算提供資源,其低成本、高效率的數(shù)據(jù)處理能力在空間任務(wù)中得到良好的體現(xiàn)。
同時(shí),NASA對(duì)開(kāi)源綜合云服務(wù)平臺(tái)“星云”進(jìn)行評(píng)估,以確定一系列科學(xué)云方案用以建設(shè)任務(wù)級(jí)企業(yè)數(shù)據(jù)中心以應(yīng)用于眾多數(shù)據(jù)任務(wù),包括:
1)為地球觀(guān)測(cè)科學(xué)開(kāi)發(fā)網(wǎng)(SERVIR.net)、短期預(yù)報(bào)研究和轉(zhuǎn)折中心(SPoRT)服務(wù),通過(guò)天氣預(yù)報(bào)(WRF)模型來(lái)完成高分辨率短期天氣預(yù)報(bào)圖像合成工作,以在不中斷其他業(yè)務(wù)行為的情況下,快速部署標(biāo)準(zhǔn)模型以應(yīng)對(duì)自然災(zāi)害;
2)為廣域紅外探索項(xiàng)目WISE服務(wù),以提高高分辨圖像處理能力與存儲(chǔ)能力;
3)艾姆斯(Ames)研究中心飛行運(yùn)載技術(shù)部考慮采用昂貴的普雷亞(Pleiades)設(shè)備,節(jié)約設(shè)備組建的時(shí)間和維護(hù)的經(jīng)費(fèi);
4)對(duì)巨大存儲(chǔ)體和存儲(chǔ)空間具有需求的組織考慮采用“星云”平臺(tái),以實(shí)現(xiàn)為其虛擬機(jī)隨時(shí)指定需要的存儲(chǔ)體和存儲(chǔ)空間;
5)借助“星云”平臺(tái)為軟件開(kāi)發(fā)者建立虛擬工作站來(lái)測(cè)試、編譯其代碼,給開(kāi)發(fā)者共享運(yùn)行在各自桌面上更多的模塊和庫(kù)。美國(guó)加州理工學(xué)院(Caltech)可視與自主探索系統(tǒng)研究實(shí)驗(yàn)室利用云技術(shù)通過(guò)互聯(lián)網(wǎng)實(shí)現(xiàn)在地球表面任何地方對(duì)移動(dòng)平臺(tái)近實(shí)時(shí)的數(shù)據(jù)交互與控制,以完成供遙實(shí)驗(yàn)、自主監(jiān)視與探索偵察的多巡視器技術(shù)的支持。通過(guò)無(wú)線(xiàn)局域網(wǎng)在移動(dòng)平臺(tái)終端處理器與采用云技術(shù)的主機(jī)前端控制軟件之間建立連接。其中,移動(dòng)平臺(tái)連接到1個(gè)或多個(gè)通信服務(wù)器上,運(yùn)用云計(jì)算實(shí)現(xiàn)對(duì)連接的多個(gè)移動(dòng)機(jī)器人平臺(tái)的遙控。遙控用戶(hù)云服務(wù)自行建立連接,連接一旦建立成功,地面代理即可發(fā)送打包并壓縮的視頻幀與傳感器數(shù)據(jù)。
(2)云計(jì)算平臺(tái)iRODS
NASA噴氣推進(jìn)實(shí)驗(yàn)室從2007年開(kāi)始致力于在行業(yè)中發(fā)揮云計(jì)算優(yōu)勢(shì)的途徑,以找到可行、成本合理的任務(wù)應(yīng)用。其中,“火星漫游車(chē)”項(xiàng)目的“云應(yīng)用”是一個(gè)以結(jié)果為導(dǎo)向的示例。實(shí)驗(yàn)室還在云計(jì)算平臺(tái)iRODS上對(duì)其行星任務(wù)數(shù)據(jù)系統(tǒng)進(jìn)行實(shí)踐性實(shí)驗(yàn)。云計(jì)算平臺(tái)iRODS使用并行傳輸控制協(xié)議以及大數(shù)據(jù)移動(dòng)優(yōu)化技術(shù)。通過(guò)iRODS提供的并行傳輸協(xié)議,可以實(shí)現(xiàn)大數(shù)據(jù)在網(wǎng)絡(luò)間的快速遷移。云計(jì)算平臺(tái)iRODS可以用來(lái)將分布式的計(jì)算機(jī)整合成一個(gè)龐大的存儲(chǔ)資源,用于存儲(chǔ)、統(tǒng)一管理和共享數(shù)據(jù),客戶(hù)端通過(guò)訪(fǎng)問(wèn)這臺(tái)虛擬服務(wù)器可以獲取所有的數(shù)據(jù),而不必關(guān)心數(shù)據(jù)存放在哪臺(tái)計(jì)算機(jī)上。使用大數(shù)據(jù)云平臺(tái)技術(shù)的行星任務(wù)數(shù)據(jù)系統(tǒng),其擴(kuò)展性、可靠性大大提高,同時(shí),大幅度降低系統(tǒng)對(duì)基礎(chǔ)設(shè)施建設(shè)、監(jiān)控和維護(hù)的成本。在不增加新的IT基礎(chǔ)設(shè)施的情況下,系統(tǒng)在該平臺(tái)上數(shù)據(jù)存儲(chǔ)、備份、傳輸和計(jì)算的效率分別提高50%以上;同時(shí),該實(shí)驗(yàn)室與微軟的“云工作組”進(jìn)行合作,采用微軟MS Azure云計(jì)算平臺(tái),以尋求增加其教育的影響和促進(jìn)推廣計(jì)劃。該平臺(tái)提供統(tǒng)一應(yīng)用程序編程接口,可以訪(fǎng)問(wèn)超過(guò)25萬(wàn)幅高分辨率火星圖像而無(wú)需在實(shí)驗(yàn)室的計(jì)算機(jī)上存儲(chǔ)任務(wù)附加數(shù)據(jù)。
NASA的大數(shù)據(jù)應(yīng)用實(shí)例
(1)月球計(jì)劃中的計(jì)算模型
NASA的“月球勘測(cè)軌道器”(LRO)發(fā)回大量高分辨率月球表面影像,每天生產(chǎn)的數(shù)據(jù)可達(dá)到TB級(jí)規(guī)模,且還在不斷增長(zhǎng)。NASA噴氣推進(jìn)實(shí)驗(yàn)室與加州理工學(xué)院在“月球表面測(cè)繪與建模”項(xiàng)目中進(jìn)行合作,采用云計(jì)算架構(gòu)對(duì)月球表面高分辨率照片進(jìn)行高可靠、高效率的圖像分塊處理。該項(xiàng)目選用開(kāi)源云計(jì)算平臺(tái)Hadoop以及計(jì)算模型映射和簡(jiǎn)化(Map-Reduce),可以在37s內(nèi)完成對(duì)2.7GB大小的高分辨率圖像的分塊處理。美國(guó)亞利桑那大學(xué)的研究人員使用涅盤(pán)科斯公司(Nirvanix)的云存儲(chǔ)平臺(tái)來(lái)傳遞、存儲(chǔ)備份這些數(shù)據(jù)。傳回的影像數(shù)據(jù)先分別拷貝到亞利桑那州立大學(xué)研究項(xiàng)目學(xué)院的主數(shù)據(jù)中心的美國(guó)網(wǎng)域存儲(chǔ)技術(shù)有限公司(NetApp)磁盤(pán)陣列上。然后,再?gòu)?fù)制到Nirvanix存儲(chǔ)傳遞網(wǎng)絡(luò)。涅盤(pán)科斯公司網(wǎng)絡(luò)儲(chǔ)存裝置(Nirvanix CloudNAS)取代以往的磁帶存儲(chǔ),提供可靠的、規(guī)模靈活的、可訪(fǎng)問(wèn)的企業(yè)級(jí)數(shù)據(jù),長(zhǎng)期保留以供訪(fǎng)問(wèn)、瀏覽甚至再加工處理等。
(2)NASA“火星勘測(cè)軌道器”中的應(yīng)用
2013年8月,自2006年起一直執(zhí)行火星探測(cè)任務(wù)的NASA“火星勘測(cè)軌道器”(MRO)返回的科學(xué)數(shù)據(jù)突破25TB。從規(guī)模上來(lái)看,該獨(dú)立任務(wù)產(chǎn)生的數(shù)據(jù)量已經(jīng)超過(guò)近10年間NASA噴氣推進(jìn)實(shí)驗(yàn)室深空網(wǎng)所有數(shù)據(jù)量總和的3倍還多。該25TB數(shù)據(jù)包包括在火星表面工作的機(jī)器人探測(cè)車(chē)返回的數(shù)據(jù),99.9%則來(lái)自MRO上的6個(gè)科學(xué)觀(guān)測(cè)設(shè)備。值得注意的是,該數(shù)據(jù)量的統(tǒng)計(jì)并未包含實(shí)驗(yàn)室用于操作的遙控?cái)?shù)據(jù)。
“火星勘測(cè)軌道器”具有面積約20m2的太陽(yáng)能電池板,用以為其星上發(fā)射機(jī)供電,并通過(guò)自帶的3m拋物面天線(xiàn)向地球方向源源不斷發(fā)送數(shù)據(jù)。NASA則通過(guò)位于加州、西班牙以及澳州的深空網(wǎng)接收來(lái)自不同科學(xué)任務(wù)的數(shù)據(jù)波洪流。

美國(guó)“火星勘測(cè)軌道器”在軌飛行示意圖
“火星勘測(cè)軌道器”任務(wù)科學(xué)家,來(lái)自噴氣推進(jìn)實(shí)驗(yàn)室的Rich Zurek表示,25TB任務(wù)數(shù)據(jù)中的每一比特的傳輸均經(jīng)過(guò)一條復(fù)雜的路徑。實(shí)驗(yàn)室借助數(shù)據(jù)軟件平臺(tái)的處理能力,按日處理10GB左右的速度將接收的任務(wù)數(shù)據(jù)分割成小塊再分別處理,以保證及時(shí)為科學(xué)家提供還原的數(shù)字信息和其他數(shù)據(jù)產(chǎn)品。
位于“火星勘測(cè)軌道器”上科學(xué)設(shè)備收集的數(shù)據(jù)首先被記錄在火星軌道器的主存儲(chǔ)器中。軌道器環(huán)繞火星軌道周期約2h,在每次繞火星環(huán)繞中,MRO與地球的通信線(xiàn)路往往會(huì)被火星本身阻擋。當(dāng)?shù)厍蛱幱凇盎鹦强睖y(cè)軌道器可視窗口”時(shí)段,深空網(wǎng)的天線(xiàn)將對(duì)準(zhǔn)火星并偵聽(tīng)“火星勘測(cè)軌道器”的信號(hào)。在每月多達(dá)32次探空任務(wù)的情況下,深空網(wǎng)的天線(xiàn)需要為此維護(hù)一個(gè)非常復(fù)雜的調(diào)度機(jī)制。引用“火星勘測(cè)軌道器”項(xiàng)目軟件工程師布萊恩·艾倫(Bryan Allen)的介紹,深空網(wǎng)將接收到的數(shù)據(jù)按30min記錄時(shí)長(zhǎng)規(guī)模分割成塊(chunk)。這些塊中可能包含來(lái)自不同任務(wù)的數(shù)據(jù),混合在一起從加州、西班牙和澳州的深空站傳輸?shù)綄?shí)驗(yàn)室。實(shí)驗(yàn)室運(yùn)用數(shù)據(jù)軟件對(duì)它們進(jìn)行分類(lèi)并生成專(zhuān)業(yè)數(shù)據(jù)產(chǎn)品,如照片、大氣測(cè)量結(jié)果、行星表面聲波偵聽(tīng)結(jié)果等。迄今為止,經(jīng)統(tǒng)計(jì)實(shí)驗(yàn)室的數(shù)據(jù)系統(tǒng)平均一天要處理58 GB的數(shù)據(jù)并生成約303項(xiàng)數(shù)據(jù)產(chǎn)品。
(3)NASA的大數(shù)據(jù)流處理
經(jīng)統(tǒng)計(jì),NASA的航天任務(wù)每小時(shí)都會(huì)產(chǎn)生總共約上百TB的數(shù)據(jù)信息,如將這些信息打印出來(lái),所需要的紙張將消耗上千萬(wàn)棵樹(shù)木。該類(lèi)大數(shù)據(jù)洪流給NASA數(shù)據(jù)處理帶來(lái)巨大挑戰(zhàn)。位于加州的噴氣推進(jìn)實(shí)驗(yàn)室為解決這些信息的存儲(chǔ)、處理和訪(fǎng)問(wèn)問(wèn)題,提供了一些行之有效的策略。實(shí)驗(yàn)室高級(jí)調(diào)研員埃里克·德·容(Eric De Jong)說(shuō):“NASA科學(xué)家們使用航天大數(shù)據(jù)做任何事情,從氣候預(yù)測(cè)到火星冰蓋監(jiān)測(cè),甚至到銀河系,無(wú)所不含?!盝ong服務(wù)于NASA的大數(shù)據(jù)項(xiàng)目—可視化太陽(yáng)系系統(tǒng)模擬器,該項(xiàng)目致力于將航天任務(wù)收集到的科學(xué)信息轉(zhuǎn)換為用戶(hù)可用的圖形圖像。在這個(gè)工作系統(tǒng)內(nèi),實(shí)驗(yàn)室是數(shù)據(jù)的持有者,用戶(hù)是需要數(shù)據(jù)代表的相片、地形紋路、地圖和視頻的天文學(xué)家和其他科學(xué)家。他們使用這些實(shí)驗(yàn)室生成的數(shù)據(jù)產(chǎn)品開(kāi)展諸如模式匹配和理論驗(yàn)證的工作,例如,在實(shí)驗(yàn)室的火星軌道任務(wù)中,Jong小組負(fù)責(zé)從大量數(shù)據(jù)集中生成分辨率高達(dá)120M像素的照片并將之拼接起來(lái)做成視頻。
實(shí)際上,從來(lái)自NASA或其他國(guó)際宇航機(jī)構(gòu)的任務(wù)中獲取大量數(shù)據(jù)并將之存檔本身就是一項(xiàng)艱巨的任務(wù)。以“平方千米陣列”(SKA)項(xiàng)目為例,該項(xiàng)目計(jì)劃2016年在南非和澳州建立由上千射電望遠(yuǎn)鏡組成的深空探測(cè)陣列。假設(shè),該項(xiàng)目最終實(shí)施并開(kāi)始使用,它每天生產(chǎn)的數(shù)據(jù)量估計(jì)將達(dá)到700TB之多,幾乎等于當(dāng)下全球互聯(lián)網(wǎng)2天產(chǎn)生的數(shù)據(jù)量之和。對(duì)這樣龐大信息洪流或大數(shù)據(jù)的存檔處理和加工,實(shí)驗(yàn)室相關(guān)研究人員認(rèn)為存在合理的解決方案。以此項(xiàng)目為例,實(shí)驗(yàn)室中心的大數(shù)據(jù)專(zhuān)家們聲稱(chēng)可以在現(xiàn)有的硬件設(shè)備基礎(chǔ)上,利用云計(jì)算技術(shù)并配合開(kāi)源軟件程序來(lái)滿(mǎn)足項(xiàng)目需求而非為之設(shè)計(jì)新的數(shù)據(jù)處理新產(chǎn)品,實(shí)驗(yàn)室的另一位大數(shù)據(jù)高級(jí)調(diào)研員克里斯·麥特曼(Chris Mattman)表示肯定:“可以對(duì)開(kāi)源程序進(jìn)行修改,使之成為更快且成本更小的大數(shù)據(jù)解決方案?!?/p>
“大數(shù)據(jù)”不僅是一個(gè)概念,更是給當(dāng)代科學(xué)研究帶來(lái)了巨大的挑戰(zhàn),是科學(xué)研究范式的一場(chǎng)變革。目前,大數(shù)據(jù)仍處于一個(gè)初級(jí)階段,還有很多問(wèn)題需要解決。美國(guó)大數(shù)據(jù)戰(zhàn)略和相應(yīng)的做法為我國(guó)開(kāi)展大數(shù)據(jù)工作提供了有意義的啟示和借鑒。
1)重視頂層設(shè)計(jì),積極制定大數(shù)據(jù)發(fā)展戰(zhàn)略和規(guī)劃。將大數(shù)據(jù)戰(zhàn)略提升至國(guó)家戰(zhàn)略高度,確定我國(guó)發(fā)展大數(shù)據(jù)的方向和重點(diǎn),從保障國(guó)家安全、推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展、提高企業(yè)競(jìng)爭(zhēng)力等多個(gè)方面出發(fā),確定政府優(yōu)先支持的大數(shù)據(jù)發(fā)展方向,引導(dǎo)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展。
2)加大研發(fā)支持力度,推動(dòng)應(yīng)用。在明確關(guān)鍵技術(shù)的基礎(chǔ)上,確定重點(diǎn)支持領(lǐng)域,加大研發(fā)支持力度。整合相關(guān)專(zhuān)項(xiàng)資金和項(xiàng)目,支持大數(shù)據(jù)技術(shù)的開(kāi)發(fā)、研究和應(yīng)用示范,引導(dǎo)企業(yè)加大研發(fā)力度,實(shí)現(xiàn)關(guān)鍵技術(shù)突破。同時(shí),在政府部門(mén)和公用事業(yè)的信息化應(yīng)用中積極應(yīng)用大數(shù)據(jù)技術(shù),以政府采購(gòu)引導(dǎo)國(guó)內(nèi)大數(shù)據(jù)發(fā)展。結(jié)合當(dāng)前的云計(jì)算、物聯(lián)網(wǎng)等試點(diǎn)工程,積極開(kāi)展大數(shù)據(jù)技術(shù)應(yīng)用,充分發(fā)揮示范效應(yīng),帶動(dòng)社會(huì)其他領(lǐng)域的大數(shù)據(jù)應(yīng)用。
3)推動(dòng)政產(chǎn)學(xué)研用各方參與,構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)生態(tài)。當(dāng)前全球大數(shù)據(jù)產(chǎn)業(yè)還處于起步階段,產(chǎn)業(yè)生態(tài)尚不完善。我國(guó)應(yīng)該抓住契機(jī),從數(shù)據(jù)資源建設(shè)和大數(shù)據(jù)技術(shù)研發(fā)兩方面入手,聯(lián)合政產(chǎn)學(xué)研用各方力量,共同構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)生態(tài)。同時(shí),要重視與大數(shù)據(jù)息息相關(guān)的云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)等領(lǐng)域的發(fā)展。
4)加強(qiáng)基礎(chǔ)大數(shù)據(jù)采集建設(shè)。一方面,完善數(shù)據(jù)采集體系。大數(shù)據(jù)需要有大量的數(shù)據(jù)源。應(yīng)建立特定主題的數(shù)據(jù)監(jiān)測(cè)系統(tǒng),如交通、能源、醫(yī)療、自然災(zāi)害等專(zhuān)題建立基礎(chǔ)數(shù)據(jù)庫(kù),持續(xù)不斷收集相關(guān)數(shù)據(jù),為大數(shù)據(jù)發(fā)展提供基礎(chǔ)。另一方面,推動(dòng)國(guó)家基礎(chǔ)數(shù)據(jù)開(kāi)放共享。美國(guó)十分重視政府信息資源的共享和利用,將“共享第一”作為美國(guó)聯(lián)邦I(lǐng)T共享服務(wù)戰(zhàn)略的基礎(chǔ)范式,力推政府開(kāi)放平臺(tái)。我國(guó)應(yīng)加快推進(jìn)政府信息資源共享,尤其推進(jìn)數(shù)據(jù)資源共建共享,給大數(shù)據(jù)技術(shù)發(fā)展提供原材料,促進(jìn)大數(shù)據(jù)成果廣泛應(yīng)用。
通過(guò)研究美國(guó)在軍事及民用航天領(lǐng)域中大數(shù)據(jù)技術(shù)的應(yīng)用,可縮小與世界軍事發(fā)達(dá)國(guó)家的信息化差距,掌握“大數(shù)據(jù)”資源使用主動(dòng)權(quán),提高情報(bào)信息獲取、處理、分析、防護(hù)等能力??傊?,只有敏銳地關(guān)注大數(shù)據(jù)技術(shù)的發(fā)展變化,及時(shí)掌握與了解美國(guó)在大數(shù)據(jù)技術(shù)應(yīng)用方面的最新動(dòng)態(tài),我們才能在信息資源的深度開(kāi)發(fā)利用與信息技術(shù)自主創(chuàng)新方面做出成績(jī)。