朱亞平,楊 亮,尹建平
(91001部隊(duì),北京 100841)
“大數(shù)據(jù)”(Big Data)的概念起源于美國(guó),早在20世紀(jì)80年代,未來學(xué)家阿爾文·托夫勒(Alvin Toffler)在所著的《第三次浪潮(The Third Wave)》中就將其描述為“第三次浪潮的華彩樂章”[1]。2008年,《自然》雜志開辟了名為大數(shù)據(jù)的封面專欄,大數(shù)據(jù)作為一個(gè)專用名詞首次出現(xiàn)在公共刊物上。而真正讓大數(shù)據(jù)成為互聯(lián)網(wǎng)信息時(shí)代科技界熱詞的是世界著名咨詢公司麥肯錫全球研究院,2011年5月一篇名為《大數(shù)據(jù):下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的前沿》的研究報(bào)告發(fā)布,該報(bào)告的發(fā)布引起了極大關(guān)注,推動(dòng)了大數(shù)據(jù)的迅猛發(fā)展。
大數(shù)據(jù)目前尚無統(tǒng)一公認(rèn)的定義。(1)大數(shù)據(jù)主要研究機(jī)構(gòu)之一Gartner認(rèn)為,大數(shù)據(jù)是新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。(2)根據(jù)維基百科的定義,大數(shù)據(jù)是指無法使用傳統(tǒng)和常規(guī)軟件技術(shù)和工具,在一定時(shí)間內(nèi)完成獲取、管理和處理的數(shù)據(jù)集。(3)全球著名的IT公司IBM最早在《分析:大數(shù)據(jù)在現(xiàn)實(shí)世界中的應(yīng)用》中將大數(shù)據(jù)歸納為以下4個(gè)特征:數(shù)量大(至少應(yīng)該是PB級(jí)的)、種類全(能覆蓋所研究領(lǐng)域的各種特征信息)、速度快(數(shù)據(jù)增長(zhǎng)非常快)、價(jià)值高(數(shù)據(jù)的實(shí)際應(yīng)用價(jià)值比較高,也有人把這一點(diǎn)理解為數(shù)據(jù)的真實(shí)性)。大數(shù)據(jù)一詞的重點(diǎn)并不在于數(shù)據(jù)規(guī)模的定義,更代表著信息技術(shù)進(jìn)入一個(gè)新時(shí)代,爆炸性的數(shù)據(jù)信息給傳統(tǒng)的計(jì)算技術(shù)和信息技術(shù)帶來的新挑戰(zhàn)[2-5]。
為了應(yīng)對(duì)大數(shù)據(jù)帶來的挑戰(zhàn),取得信息處理分析方面的優(yōu)勢(shì),國(guó)外較早開展了相關(guān)研究。前些年,美國(guó)國(guó)防部圍繞“大數(shù)據(jù)”展開了一系列研究項(xiàng)目,如多尺度異常檢測(cè)、影像檢索與分析、機(jī)器讀取、數(shù)據(jù)決策等,期望提高和改進(jìn)從海量與復(fù)雜數(shù)據(jù)中高效提取信息的能力,加快科學(xué)與工程領(lǐng)域的創(chuàng)新步伐。國(guó)內(nèi)基于氣象大數(shù)據(jù)的分析剛剛起步,很多機(jī)構(gòu)和學(xué)者針對(duì)大數(shù)據(jù)、人工智能、云計(jì)算等相關(guān)研究展開了積極的探索和嘗試。2014年5月,中國(guó)氣象局公共服務(wù)中心聯(lián)手阿里云計(jì)算,開展氣象大數(shù)據(jù)合作。2020年,中國(guó)氣象局氣象大數(shù)據(jù)云平臺(tái)通過業(yè)務(wù)驗(yàn)收,在全國(guó)投入業(yè)務(wù)試運(yùn)行,作為氣象部門全網(wǎng)協(xié)調(diào)互聯(lián)、信息實(shí)時(shí)互通的云平臺(tái),將對(duì)內(nèi)承載氣象業(yè)務(wù)應(yīng)用,對(duì)外提供數(shù)據(jù)共享服務(wù),為氣象業(yè)務(wù)帶來全鏈條效能提升和全流程業(yè)務(wù)優(yōu)化[6-10]。雖然目前來看,大數(shù)據(jù)和人工智能等新理念新技術(shù)尚不能顛覆傳統(tǒng)的氣象分析預(yù)報(bào)方法,但大數(shù)據(jù)處理和分析技術(shù)極有可能會(huì)突破傳統(tǒng)預(yù)報(bào)預(yù)測(cè)方式,帶來海量數(shù)據(jù)分析預(yù)報(bào)方法的思維方式突破和創(chuàng)新。
本文將分析大數(shù)據(jù)時(shí)代背景下海洋環(huán)境信息化服務(wù)面臨的種種挑戰(zhàn),著重討論氣象水文等常規(guī)觀探測(cè)傳統(tǒng)手段以及頗具代表性的衛(wèi)星遙感領(lǐng)域在數(shù)據(jù)管理、智能算法和決策服務(wù)等方面面臨的新問題,并對(duì)大數(shù)據(jù)在氣象水文信息支撐服務(wù)領(lǐng)域的應(yīng)用前景進(jìn)行了展望。
在水文氣象領(lǐng)域,常規(guī)觀探測(cè)數(shù)據(jù)的資料種類、數(shù)據(jù)體量、存儲(chǔ)分析等多方面越來越體現(xiàn)出大數(shù)據(jù)的顯著特征。(1)從種類而言,收集引接地面常規(guī)觀探測(cè)、雷達(dá)、浮標(biāo)、航空?qǐng)?bào)等多種觀探測(cè)手段的信息數(shù)據(jù),同時(shí)提供全球范圍內(nèi)各種時(shí)空尺度從大氣到海洋到空間的多達(dá)上百種環(huán)境要素,預(yù)報(bào)尺度從遠(yuǎn)至幾個(gè)月的氣候預(yù)測(cè)到中小尺度的幾個(gè)小時(shí)預(yù)警。(2)從數(shù)據(jù)體量而言,每天接收處理制作的實(shí)時(shí)觀測(cè)數(shù)據(jù)已達(dá)幾百GB,數(shù)值預(yù)報(bào)產(chǎn)品制作每天達(dá)上百GB,再分析資料存儲(chǔ)需求已達(dá)PB級(jí)。目前,國(guó)家氣象信息中心的常規(guī)觀測(cè)數(shù)據(jù)統(tǒng)計(jì)顯示,地面觀測(cè)資料從21世紀(jì)初的不到3 000個(gè),迅速擴(kuò)展到目前的4萬(wàn)多個(gè),觀測(cè)頻度從原來的3小時(shí)一次提高到目前每5分鐘一次,未來可能繼續(xù)加密到7 000到10 000個(gè),觀測(cè)頻度有可能加密到每分鐘一次,由現(xiàn)在每天百萬(wàn)條記錄增長(zhǎng)到超過一億條。(3)在大數(shù)據(jù)接收和存儲(chǔ)呈現(xiàn)的新挑戰(zhàn)來看,水文氣象數(shù)據(jù)的空間覆蓋更廣,時(shí)間序列更長(zhǎng),觀測(cè)手段愈加豐富,異類異構(gòu)數(shù)據(jù)更加龐雜,數(shù)據(jù)的存儲(chǔ)、分析和顯示效率面臨巨大難題[11-14]。
引起數(shù)據(jù)爆炸式增長(zhǎng)的除常規(guī)觀探測(cè)數(shù)據(jù)外,具有一定代表性的是衛(wèi)星遙感信息,遙感專業(yè)的大數(shù)據(jù)處理和分析面臨巨大挑戰(zhàn)和深層次的應(yīng)用價(jià)值[15-17]。相對(duì)于傳統(tǒng)的氣象常規(guī)觀探測(cè)數(shù)據(jù),衛(wèi)星遙感數(shù)據(jù)的體量高達(dá)3~4個(gè)數(shù)量級(jí)。隨著航天、航空等多種遙感平臺(tái)的快速發(fā)展,遙感數(shù)據(jù)空間分辨率、時(shí)間分辨率、光譜分辨率和輻射分辨率越來越高,數(shù)據(jù)類型越來越豐富,多源遙感信息愈發(fā)體現(xiàn)出大容量、多類型、難辨識(shí)、高價(jià)值的大數(shù)據(jù)特征。如國(guó)家新一代風(fēng)云四號(hào)衛(wèi)星相對(duì)上一代風(fēng)云二號(hào),載荷由兩個(gè)增加到4個(gè),成像儀光譜通道從原來的5個(gè)增加到14個(gè),空間分辨率從原來的1.25 km提高到最高500 m,每天接收的數(shù)據(jù)量是原來的幾十倍。高分系列衛(wèi)星的傳感器種類包括全色、多光譜、高光譜、合成孔徑雷達(dá)(SAR)等,獲取的數(shù)據(jù)反映了不同目標(biāo)物的特征,異類異構(gòu)的數(shù)據(jù)加劇了遙感數(shù)據(jù)的復(fù)雜性。這些高維、多尺度的巨量遙感數(shù)據(jù)也帶來了存儲(chǔ)、管理、處理分析上的難題。
另外,更高頻次分布式雷達(dá)站數(shù)據(jù)和更加精細(xì)化的數(shù)值預(yù)報(bào)產(chǎn)品也愈發(fā)體現(xiàn)出大數(shù)據(jù)的顯著特征。在海洋環(huán)境信息化服務(wù)的其它領(lǐng)域(如測(cè)繪、導(dǎo)航等),隨著信息化進(jìn)程的加快,“地理大數(shù)據(jù)”“環(huán)境大數(shù)據(jù)”等也將引起重點(diǎn)關(guān)注,各類氣象、水文、遙感等數(shù)據(jù)的信息快速匯集、產(chǎn)品加工處理分析、信息傳播訪問服務(wù)等大數(shù)據(jù)的應(yīng)用技術(shù)必將成為新信息時(shí)代海洋環(huán)境信息服務(wù)的趨勢(shì)[18-20]。
大數(shù)據(jù)既指海量數(shù)據(jù),也指處理技術(shù)和工具,還指利用海量數(shù)據(jù)的思維方式。大數(shù)據(jù)的戰(zhàn)略意義不僅僅在于掌握龐雜的信息,更在于以嶄新的思維和技術(shù)去分析海量數(shù)據(jù),對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專業(yè)化處理。所以,海洋環(huán)境數(shù)據(jù)的多類異構(gòu)數(shù)據(jù)的收集、處理和分析,對(duì)軟、硬件的要求更為苛刻,傳統(tǒng)的處理設(shè)備和算法如何突破大數(shù)據(jù)處理的功能,如何利用云計(jì)算、人工智能等算法快速?gòu)亩喑叨榷嗑S度的水文氣象信息中深入分析挖掘有價(jià)值信息,并高效反應(yīng)服務(wù)于用戶并及時(shí)做出響應(yīng)決策將是一項(xiàng)新挑戰(zhàn)[21-24]。
從技術(shù)上看,大數(shù)據(jù)管理應(yīng)用將依托分布式處理和云計(jì)算技術(shù)已基本成為共識(shí)。在云計(jì)算日益成熟和深入應(yīng)用的當(dāng)下,計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源的應(yīng)用服務(wù)已不僅僅局限于能夠提供精準(zhǔn)的計(jì)算、彈性的存儲(chǔ),而應(yīng)包含對(duì)現(xiàn)有和在建新信息化業(yè)務(wù)系統(tǒng)進(jìn)行云端改造,以及分布式計(jì)算、人工智能分析等專業(yè)性很強(qiáng)的技術(shù)處理。當(dāng)前的業(yè)務(wù)系統(tǒng)在操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件、GIS平臺(tái)、繪圖軟件甚至開發(fā)語(yǔ)言等方面或多或少存在差異,系統(tǒng)間存在交叉重疊、重復(fù)開發(fā)的情況,系統(tǒng)彼此有效地移植或整合成果還存在一定困難。
值得注意的是,當(dāng)前關(guān)于大數(shù)據(jù)云平臺(tái)、云計(jì)算、人工智能等智慧學(xué)習(xí)和高速響應(yīng)的新興技術(shù)尚處于探索試用階段,還不能完全替代傳統(tǒng)的機(jī)理分析和復(fù)雜的科學(xué)研究。探求科學(xué)機(jī)理是非常艱難的,在沒有把握科學(xué)機(jī)理的情況下,復(fù)雜的精確計(jì)算和深度分析即使能夠提供“大價(jià)值”的客觀信息,也不能完全替代自然規(guī)律的科學(xué)研究。由大數(shù)據(jù)直接分析的客觀結(jié)果與傳統(tǒng)業(yè)務(wù)系統(tǒng)的復(fù)雜機(jī)理分析結(jié)果之間還存在很大的不確定性,如何利用大數(shù)據(jù)云平臺(tái)、人工智能算法與傳統(tǒng)專業(yè)領(lǐng)域業(yè)務(wù)系統(tǒng)有效結(jié)合,促進(jìn)傳統(tǒng)專業(yè)信息應(yīng)用價(jià)值深度挖掘和有效發(fā)展,是未來一段時(shí)間內(nèi)信息化保障面臨的新課題。
大數(shù)據(jù)對(duì)信息化決策服務(wù)的作用很重要的在于事前預(yù)測(cè)、事中感知和事后反饋。大數(shù)據(jù)增強(qiáng)了對(duì)決策場(chǎng)景和活動(dòng)的預(yù)測(cè)功能,在行動(dòng)開展之前,能夠綜合利用多維度多種類環(huán)境信息進(jìn)行模擬與預(yù)測(cè);同時(shí),大數(shù)據(jù)可以根據(jù)動(dòng)態(tài)數(shù)據(jù)的變化情況,及時(shí)高效追蹤時(shí)態(tài)演變情況,從而把握進(jìn)展細(xì)節(jié),有助于隨時(shí)調(diào)整計(jì)劃和決策;由于大數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)能力,可以隨時(shí)了解行動(dòng)或計(jì)劃行動(dòng)的時(shí)效性,事后進(jìn)行效能反饋。
由此可見,大數(shù)據(jù)信息化決策服務(wù)不再追求數(shù)據(jù)的準(zhǔn)確性,而是接受數(shù)據(jù)管理的復(fù)雜性和結(jié)構(gòu)的多樣性,其決策思維方法更在于靈活應(yīng)用,決策方式由業(yè)務(wù)經(jīng)驗(yàn)驅(qū)動(dòng)向數(shù)據(jù)量化驅(qū)動(dòng)轉(zhuǎn)型,通過對(duì)海洋數(shù)據(jù)進(jìn)行挖掘,形成非線性的、面向不確定性的決策模式。其關(guān)鍵技術(shù)要在信息采集和管理的基礎(chǔ)上,通過云計(jì)算和人工智能技術(shù),為用戶提供決策輔助的可視化圖形和數(shù)據(jù)展示,提高信息感知和應(yīng)急響應(yīng)能力。大數(shù)據(jù)信息化決策服務(wù)存在不確定性、動(dòng)態(tài)性、全局性以及各專業(yè)間的關(guān)聯(lián)性,如何處理好大數(shù)據(jù)信息化決策服務(wù)帶來的不確定性和復(fù)雜性發(fā)揮效能和作用,將是一項(xiàng)巨大的挑戰(zhàn)[25-26]。
大數(shù)據(jù)蘊(yùn)含著豐富的信息資源,其科學(xué)有效的技術(shù)應(yīng)用能夠?yàn)楹Q蟓h(huán)境信息化服務(wù)領(lǐng)域帶來巨大的經(jīng)濟(jì)效益,具有廣闊的應(yīng)用前景。
(1)大數(shù)據(jù)開發(fā)將為傳統(tǒng)觀測(cè)方式和信息處理技術(shù)帶來創(chuàng)新性發(fā)展,引發(fā)新時(shí)代信息技術(shù)革命,物聯(lián)網(wǎng)、云計(jì)算、人工智能等新興技術(shù)將對(duì)海洋環(huán)境的認(rèn)知帶來深遠(yuǎn)改變。一方面,物聯(lián)網(wǎng)、5G、人工智能等技術(shù)賦予了未來終端設(shè)備的感知能力,各類車載終端、無人機(jī)、手持移動(dòng)終端等均可提供快速、靈活、高分辨率的觀測(cè)信息。另一方面,支撐AI算法將成為數(shù)據(jù)處理、產(chǎn)品加工的重要工具,未來的氣象水文信息中心不僅是數(shù)據(jù)存儲(chǔ)、產(chǎn)品加工和服務(wù)提供者,更是態(tài)勢(shì)感知、預(yù)警發(fā)布等創(chuàng)新技術(shù)的重要組成部分,云計(jì)算將是未來基礎(chǔ)資源、數(shù)據(jù)資源和應(yīng)用資源存在和應(yīng)用的主要形式。
(2)大數(shù)據(jù)應(yīng)用促進(jìn)信息數(shù)據(jù)各領(lǐng)域深度融合,傳感器、智能終端、高速網(wǎng)絡(luò)、云平臺(tái)、地理信息技術(shù)等多種技術(shù)領(lǐng)域的交叉融合將對(duì)多領(lǐng)域造成深遠(yuǎn)影響,加速各保障職能的調(diào)整和重構(gòu)。海洋環(huán)境信息化將突破基礎(chǔ)資源建設(shè)管理服務(wù),觸及各部門頂層設(shè)計(jì)、標(biāo)準(zhǔn)規(guī)范、科學(xué)管理等領(lǐng)域,打破學(xué)科領(lǐng)域壁壘,歸并同類功能,優(yōu)化標(biāo)準(zhǔn)規(guī)范,加速各學(xué)科之間的信息融合,有效發(fā)揮其應(yīng)用領(lǐng)域的交叉。
(3)大數(shù)據(jù)將成為提升海洋環(huán)境信息化綜合決策能力的新途徑,管理決策部門可以透過大數(shù)據(jù)揭示傳統(tǒng)技術(shù)難以展現(xiàn)的關(guān)聯(lián)關(guān)系,并對(duì)環(huán)境形勢(shì)和動(dòng)態(tài)做出準(zhǔn)確預(yù)判,從而在復(fù)雜情況下做出合理優(yōu)化的決策。信息化時(shí)代、互聯(lián)網(wǎng)時(shí)代、大數(shù)據(jù)時(shí)代需要用更科學(xué)的頂層設(shè)計(jì)和管理思維來思考,從固有的技術(shù)層面突圍,向上延伸到管理層面和決策層面。
大數(shù)據(jù)是信息化發(fā)展的新階段,大數(shù)據(jù)浪潮洶涌來襲,與互聯(lián)網(wǎng)的發(fā)明一樣,這絕不僅僅是信息技術(shù)領(lǐng)域革命,更是在全球范圍內(nèi)加速科學(xué)技術(shù)革命、引領(lǐng)社會(huì)變革的利器。未來的海洋環(huán)境信息服務(wù)可以把大數(shù)據(jù)技術(shù)融入“態(tài)勢(shì)分析”,通過對(duì)氣象、水文、測(cè)繪、導(dǎo)航等多種來源數(shù)據(jù)進(jìn)行綜合分析,提煉海洋環(huán)境中多源信息中本質(zhì)性的事實(shí)和趨勢(shì),揭示信息中含有的隱藏內(nèi)容,對(duì)事態(tài)發(fā)展做出預(yù)報(bào)預(yù)測(cè),實(shí)現(xiàn)海洋環(huán)境信息服務(wù)的快速反應(yīng),助力行動(dòng)感知決策,有效提升海洋環(huán)境智慧認(rèn)知和應(yīng)用能力,在海洋氣象防災(zāi)減災(zāi)、公共服務(wù)、氣候預(yù)測(cè)等方面發(fā)揮重要作用。