廖方宇 汪 洋 馬永征 王彥棡 周園春 許海燕中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心 北京 100190
國(guó)家科研信息化基礎(chǔ)環(huán)境建設(shè)與實(shí)踐*
廖方宇汪洋馬永征王彥棡周園春許海燕
中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心北京100190

科研信息化基礎(chǔ)環(huán)境是在科研信息化勞動(dòng)工具中,滿(mǎn)足共享需求、提供共享服務(wù)、支撐科研活動(dòng)的軟硬件系統(tǒng)和信息化環(huán)境。它涵蓋了以硬件設(shè)施為主的“硬”服務(wù)環(huán)境、以軟件和數(shù)據(jù)為主的“軟”服務(wù)環(huán)境,以及包括協(xié)同工作環(huán)境、運(yùn)維平臺(tái)在內(nèi)的運(yùn)行管理和服務(wù)環(huán)境。文章簡(jiǎn)要綜述了國(guó)外科研信息化基礎(chǔ)環(huán)境建設(shè)的最新進(jìn)展,闡述了我國(guó)國(guó)家科研信息化基礎(chǔ)環(huán)境的發(fā)展現(xiàn)狀,通過(guò)近年來(lái)中科院在科研信息化基礎(chǔ)環(huán)境建設(shè)中的實(shí)踐與經(jīng)驗(yàn),分析了我國(guó)國(guó)家科研信息化基礎(chǔ)環(huán)境建設(shè)中的不足,并針對(duì)問(wèn)題提出了關(guān)于我國(guó)國(guó)家科研信息化基礎(chǔ)環(huán)境發(fā)展的建議。
科研信息化,科研信息化基礎(chǔ)環(huán)境,科研網(wǎng)絡(luò),高性能計(jì)算,科學(xué)數(shù)據(jù)
2000年,英國(guó)科學(xué)家提出了科研信息化(e-Science[1])概念,其內(nèi)涵是采用互聯(lián)網(wǎng)絡(luò)技術(shù)和廣域分布式的高性能計(jì)算環(huán)境建立的一種全新科學(xué)研究模式。隨著信息技術(shù)的飛速發(fā)展和信息化應(yīng)用在各個(gè)領(lǐng)域的滲透,本質(zhì)來(lái)看,科研信息化是科研生產(chǎn)關(guān)系的信息化[2],是指采用信息化技術(shù)和方法輔助科學(xué)研究,目標(biāo)是依靠信息化手段,以前瞻性、戰(zhàn)略性、全局性布局來(lái)優(yōu)化創(chuàng)新要素配置,加快科技生產(chǎn)力的改造和升級(jí),促進(jìn)創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略的實(shí)施。科研信息化在我國(guó)信息化體系中處于源頭創(chuàng)新的引領(lǐng)地位,是我國(guó)創(chuàng)新驅(qū)動(dòng)發(fā)展的關(guān)鍵引擎。科研信息化基礎(chǔ)環(huán)境則是指建立在信息技術(shù)和信息裝備基礎(chǔ)上,滿(mǎn)足科研活動(dòng)需求、提供共享服務(wù)、支撐科研活動(dòng)的軟硬件系統(tǒng)和環(huán)境。
國(guó)家科研信息化基礎(chǔ)環(huán)境是建立在現(xiàn)代信息技術(shù)高速發(fā)展基礎(chǔ)之上的國(guó)家級(jí)軟硬件融合服務(wù)環(huán)境,能夠?yàn)槿珖?guó)各類(lèi)科技要素機(jī)構(gòu)以及科學(xué)家群體的科技創(chuàng)新活動(dòng)提供專(zhuān)業(yè)化、集成化、自助化的科研信息化服務(wù)平臺(tái),主要包括:(1)以高速科研專(zhuān)用網(wǎng)絡(luò)、高性能計(jì)算資源、科學(xué)數(shù)據(jù)海量存儲(chǔ)資源等為代表的“硬”服務(wù)環(huán)境;(2)以計(jì)算模擬軟件、數(shù)據(jù)分析軟件、觀測(cè)數(shù)據(jù)和計(jì)算數(shù)據(jù)等為代表的“軟”服務(wù)環(huán)境;(3)以基于社會(huì)網(wǎng)絡(luò)的社交和協(xié)同工作環(huán)境、硬件運(yùn)維平臺(tái)和資源統(tǒng)一調(diào)度平臺(tái)為代表的運(yùn)行管理和服務(wù)環(huán)境。
國(guó)家科研信息化基礎(chǔ)環(huán)境的主要作用是基于高速專(zhuān)用科研網(wǎng)絡(luò),連接國(guó)家重大科技基礎(chǔ)設(shè)施集群、野外觀測(cè)臺(tái)站、各類(lèi)計(jì)算中心、存儲(chǔ)中心以及各科研院所、國(guó)家實(shí)驗(yàn)室、企業(yè)研發(fā)中心、高校等科技機(jī)構(gòu)和科學(xué)家群體,實(shí)現(xiàn)全國(guó)各類(lèi)科技要素間的集約集成、互聯(lián)互通、資源共享,形成支撐新型科研模式以及服務(wù)社會(huì)經(jīng)濟(jì)發(fā)展的科研信息化環(huán)境,促進(jìn)科技投入效用最大化,助力科技創(chuàng)新。
歐美發(fā)達(dá)國(guó)家和地區(qū)為了提升國(guó)家科技競(jìng)爭(zhēng)力,在國(guó)家科研信息化基礎(chǔ)設(shè)施方面制定了中長(zhǎng)期發(fā)展規(guī)劃,并由政府出資長(zhǎng)期穩(wěn)定支持,科研信息化基礎(chǔ)設(shè)施的服務(wù)能力得到了長(zhǎng)足的發(fā)展。主要體現(xiàn)在:科研信息采集裝置全面具備了無(wú)線傳輸能力;高速傳輸網(wǎng)絡(luò)的通用帶寬已超過(guò) 100 Gbps,骨干傳輸速度向 1 Tbps 發(fā)展;數(shù)據(jù)存儲(chǔ) I/O 吞吐速度已達(dá) 100 GB/s 級(jí);高性能數(shù)值模擬裝置向百億億次(E 級(jí))邁進(jìn);信息化基礎(chǔ)設(shè)施連接了各類(lèi)科技設(shè)施和國(guó)家級(jí)實(shí)驗(yàn)室、研究院所和大學(xué)。
(1)在科研數(shù)據(jù)的觀測(cè)采集方面,數(shù)據(jù)獲取的方式隨著技術(shù)的發(fā)展發(fā)生了巨大變化。得益于精密芯片制造和無(wú)線傳感技術(shù)的發(fā)展,科研信息采集裝置全面具備了無(wú)線傳輸能力,歐美發(fā)達(dá)國(guó)家已將無(wú)線傳感器網(wǎng)絡(luò)部署到城市、農(nóng)田以及各類(lèi)生態(tài)系統(tǒng)等科學(xué)研究區(qū)域中,全面地搜集物理世界的各種特征信息。如美國(guó)國(guó)家生態(tài)觀測(cè)站網(wǎng)絡(luò)[3](National Ecological Observatory Network,NEON)在全美范圍內(nèi)部署了約 15 000 個(gè)傳感器,采用混合組網(wǎng)方式開(kāi)展長(zhǎng)期、大尺度生態(tài)變化觀測(cè);美國(guó)海洋觀測(cè)計(jì)劃[4](Ocean Observatories Initiative, OOI)通過(guò)可靠的無(wú)線傳感器網(wǎng)絡(luò)獲取分布于海洋各處的浮標(biāo)錨泊觀測(cè)數(shù)據(jù);Argo 全球海洋觀測(cè)網(wǎng)[5]計(jì)劃組織世界各國(guó)在全球范圍內(nèi)部署 3 900 個(gè)海洋浮標(biāo),用于大尺度全球氣候變化觀測(cè),目前已經(jīng)有超過(guò) 3 900 個(gè)浮標(biāo)正通過(guò)衛(wèi)星將數(shù)據(jù)源源不斷地傳回地面,組成一個(gè)全球 Argo 海洋觀測(cè)網(wǎng)。
(2)在高速科研網(wǎng)絡(luò)方面,為應(yīng)對(duì)大數(shù)據(jù)應(yīng)用的需求,在科研網(wǎng)絡(luò)資源傾斜性支持政策的扶持下,發(fā)達(dá)國(guó)家的高速科研專(zhuān)用網(wǎng)絡(luò)傳輸能力和傳輸速度大幅提升。美國(guó)能源科學(xué)網(wǎng)(ESnet)[6]創(chuàng)建于 20 世紀(jì) 80 年代中期,是由美國(guó)能源部科學(xué)辦公室資助、勞倫斯伯克利國(guó)家實(shí)驗(yàn)室運(yùn)行和管理的一個(gè)數(shù)據(jù)通信網(wǎng)絡(luò),提供通用、有效、可靠、高性能的網(wǎng)絡(luò)基礎(chǔ)設(shè)施,促進(jìn)美國(guó)能源部的科技人員間的協(xié)作。ESnet 以打造世界領(lǐng)先的網(wǎng)絡(luò)基礎(chǔ)設(shè)施、能力和工具為目標(biāo),2009 年通過(guò)骨干網(wǎng)專(zhuān)項(xiàng)投入 6 300 萬(wàn)美元,實(shí)現(xiàn)了骨干傳輸網(wǎng)絡(luò)的 100 G 傳輸帶寬,2012 年度和 2013 年度分別投入 3 450 萬(wàn)美元和 3 200 萬(wàn)美元的運(yùn)維經(jīng)費(fèi),保障 ESnet 的安全穩(wěn)定運(yùn)行。GéANT[7]是歐盟為歐洲地區(qū)提供科研及教育信息化方面公共服務(wù)的基礎(chǔ)平臺(tái),正在計(jì)劃部署先進(jìn)傳輸設(shè)備和轉(zhuǎn)換平臺(tái),全面升級(jí)長(zhǎng)達(dá) 5 萬(wàn)公里的 GéANT 骨干網(wǎng),支持 GéANT 核心網(wǎng)絡(luò)實(shí)現(xiàn)最高達(dá) 2 Tbps 的傳輸能力,使歐洲 4 000 萬(wàn)用戶(hù)從中受益,并有望在歐盟范圍內(nèi)得到全面部署。在國(guó)際互聯(lián)方面,GéANT 通過(guò)歐盟 FP6、FP7及 Horizon 2020 計(jì)劃支持與其他國(guó)家科研教育網(wǎng)絡(luò)實(shí)現(xiàn)高速互聯(lián),包括與拉丁美洲地區(qū)網(wǎng)絡(luò)互聯(lián)的 ALICE 項(xiàng)目、與地中海地區(qū)互聯(lián)的 EUMEDCONNECT[8]項(xiàng)目、與亞太地區(qū)互聯(lián)的 TEIN 項(xiàng)目、與中國(guó)互聯(lián)的 ORIENTplus[9]項(xiàng)目等。僅中歐合作的 Orient 一條線路 GéANT 獲得歐盟 FP6 與 FP7 計(jì)劃每年 100 萬(wàn)歐元的穩(wěn)定支持。GéANT 內(nèi)部骨干網(wǎng)建設(shè)和國(guó)際互聯(lián)戰(zhàn)略的實(shí)施,為歐洲各科研領(lǐng)域數(shù)據(jù)平臺(tái)建設(shè)和國(guó)際合作的有效開(kāi)展提供了良好基礎(chǔ)和堅(jiān)實(shí)保障。
(3)在科研數(shù)據(jù)存儲(chǔ)及數(shù)據(jù)中心方面,數(shù)據(jù)存儲(chǔ)?I/ O?吞吐速度已達(dá)?100?Gb/s?級(jí),在數(shù)據(jù)管理方面,朝著模式自由、易于復(fù)制、提供簡(jiǎn)單?API?以及支持海量數(shù)據(jù)的方向發(fā)展,以支持科學(xué)大數(shù)據(jù)的分析處理、高通量高性能科學(xué)計(jì)算。以 Google、Facebook 為代表的互聯(lián)網(wǎng)創(chuàng)新企業(yè)在數(shù)據(jù)中心建設(shè)的技術(shù)創(chuàng)新上取得了巨大成功。整個(gè)數(shù)據(jù)中心系統(tǒng)的硬件環(huán)境、軟件系統(tǒng)都應(yīng)圍繞應(yīng)用需求來(lái)設(shè)計(jì),數(shù)據(jù)中心技術(shù)創(chuàng)新也帶動(dòng)了應(yīng)用模式的創(chuàng)新。Google 發(fā)明了 M apReduce 處理框架、GFS 存儲(chǔ)體系,建立了支持橫向擴(kuò)展的應(yīng)用架構(gòu)。與上述應(yīng)用架構(gòu)相匹配,采用 DIY、ODM 模式自行設(shè)計(jì)設(shè)備機(jī)柜、服務(wù)器及存儲(chǔ)設(shè)備等,在低成本條件下滿(mǎn)足應(yīng)用要求,并實(shí)現(xiàn)了高可用、高能效的目標(biāo)。同時(shí),在數(shù)據(jù)中心選址、建筑設(shè)計(jì)、內(nèi)部布局、模塊化設(shè)計(jì)、可再生能源、自然冷卻等方面的一系列技術(shù)革新,都體現(xiàn)了創(chuàng)新顛覆的思想,極大提升了能效比,為環(huán)境保護(hù)做出了表率。
(4)在高性能計(jì)算方面,研發(fā)具備百億億次(E?級(jí))計(jì)算能力的高性能計(jì)算機(jī)正成為各國(guó)及其科研機(jī)構(gòu)的追求目標(biāo),美國(guó)、歐盟和日本均已啟動(dòng)了面向E級(jí)超級(jí)計(jì)算機(jī)的研究計(jì)劃。據(jù)估計(jì),E 級(jí)超級(jí)計(jì)算機(jī)極有可能在 2020 年研制成功。美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室、阿貢國(guó)家實(shí)驗(yàn)室、勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室于 2014 年 2 月宣布,將聯(lián)合研制峰值性能達(dá) 20 億億次的下一代超級(jí)計(jì)算機(jī),其速度將是目前最強(qiáng)超級(jí)計(jì)算機(jī)的 10 倍,預(yù)計(jì)2017 — 2018 年完成。“歐洲百億億次級(jí)軟件計(jì)劃”將聯(lián)合產(chǎn)業(yè)界和政府機(jī)構(gòu),幫助用戶(hù)在未來(lái) 10 年內(nèi)從千萬(wàn)億次(P 級(jí))超級(jí)計(jì)算提升至 E 級(jí)超級(jí)計(jì)算。“歐洲先進(jìn)計(jì)算合作伙伴(PRACE)”[10]計(jì)劃部署一個(gè)泛歐 Peta-Scale 生態(tài)系統(tǒng),并計(jì)劃在 2020 年前達(dá)到 E 級(jí)的運(yùn)算性能。2013 年,日本文部科學(xué)省表示計(jì)劃從 2014 年春季開(kāi)始,將著手研發(fā)擁有超級(jí)計(jì)算機(jī)“京”100 倍性能的“E級(jí)超級(jí)計(jì)算機(jī)”,力爭(zhēng)在 2020 年前后完成研發(fā)任務(wù)并投入使用,日本政府?dāng)M為此項(xiàng)目投入總額 1 000 億日元的研發(fā)經(jīng)費(fèi)。
(5)基于國(guó)家科研信息化基礎(chǔ)設(shè)施提供的服務(wù),歐美發(fā)達(dá)國(guó)家通過(guò)連接和融合各類(lèi)科技設(shè)施和國(guó)家級(jí)實(shí)驗(yàn)室等科技創(chuàng)新機(jī)構(gòu),逐步打造完善的、全鏈條的國(guó)家科技創(chuàng)新生態(tài)協(xié)作系統(tǒng)。美國(guó)通過(guò) ESnet,在能源部所有的實(shí)驗(yàn)室以及由能源部支持的大學(xué)之間建立高速連接,并與 100多個(gè)其他網(wǎng)絡(luò)進(jìn)行互聯(lián),以便科學(xué)家們擺脫時(shí)間和地理位置的困擾,有效地利用能源部的研究設(shè)備和計(jì)算資源開(kāi)展研究工作。ESnet直接接入了美國(guó)能源部下屬的十大國(guó)家實(shí)驗(yàn)室,連接泰坦(Titan,橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室)、米拉(M ira,阿貢國(guó)家實(shí)驗(yàn)室)、NERSC中心(勞倫斯伯克利國(guó)家實(shí)驗(yàn)室)、Cascade(西北太平洋國(guó)家實(shí)驗(yàn)室)、紅杉(Sequoia,勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室)和Vulcan(勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室)等數(shù)據(jù)中心和計(jì)算系統(tǒng)。美國(guó)能源部依托 ESnet 實(shí)現(xiàn)了計(jì)算資源和存儲(chǔ)資源的聚合,構(gòu)建了面向國(guó)家重大任務(wù)的一流科研信息化基礎(chǔ)設(shè)施。歐盟的 GéANT 已連接了歐盟 40 個(gè)國(guó)家的 8 000 個(gè)研究機(jī)構(gòu),支持的應(yīng)用包括從醫(yī)學(xué)、氣象到行為藝術(shù)等廣泛的應(yīng)用領(lǐng)域。
2.1 我國(guó)國(guó)家科研信息化基礎(chǔ)環(huán)境的發(fā)展與現(xiàn)狀
過(guò)去 20 多年來(lái),我國(guó)科研工作者逐步建設(shè)了一批科研信息化基礎(chǔ)環(huán)境,不斷嘗試將信息技術(shù)和信息化手段應(yīng)用到科學(xué)研究和工程建設(shè)中,極大改善了我國(guó)科技創(chuàng)新的信息化環(huán)境,促進(jìn)了科研模式的變革。
近年來(lái),我國(guó)在超級(jí)計(jì)算機(jī)方面投入較大,突破了異構(gòu)融合體系結(jié)構(gòu)、高性能處理器、高速互連、高密度組裝、高效冷卻、系統(tǒng)可靠性、并行系統(tǒng)軟件等關(guān)鍵技術(shù),成功研制了天河、神威、曙光、深騰等系列高性能計(jì)算機(jī)[11]。特別是自 2010 年以來(lái),“天河 1 號(hào)”和“天河 2 號(hào)”6 次在世界超級(jí)計(jì)算機(jī)排行榜“TOP 500”中占據(jù)第 1,在國(guó)際上引起高度關(guān)注。
在高速網(wǎng)絡(luò)方面,我國(guó)的科研機(jī)構(gòu)和高校主要接入中國(guó)科技網(wǎng)、中國(guó)教育網(wǎng)和其他商業(yè)網(wǎng)絡(luò)。中國(guó)科技網(wǎng)是中科院領(lǐng)導(dǎo)下的全國(guó)性計(jì)算機(jī)互聯(lián)網(wǎng)絡(luò),是學(xué)術(shù)性、非贏利性的信息化基礎(chǔ)設(shè)施。中國(guó)科技網(wǎng)(圖 1)已形成具有萬(wàn)兆交換能力的核心網(wǎng)、包括 12 個(gè)地區(qū)分中心的長(zhǎng)途骨干網(wǎng)和 1G-10Gbps 城域網(wǎng),全面支持 IPv4 和 IPv6 雙棧接入,與國(guó)內(nèi)互聯(lián)網(wǎng)服務(wù)提供商之間互聯(lián)帶寬已達(dá) 40 G,國(guó)際出口帶寬已達(dá) 47 G,接入科研機(jī)構(gòu) 400 余家,服務(wù)科技工作者超過(guò) 100 萬(wàn)。中國(guó)教育網(wǎng)是由教育部負(fù)責(zé)管理,清華大學(xué)等院校建設(shè)和運(yùn)行的全國(guó)性計(jì)算機(jī)互聯(lián)網(wǎng)絡(luò)。中國(guó)教育網(wǎng)覆蓋全國(guó) 31 個(gè)省市自治區(qū),長(zhǎng)途骨干網(wǎng)帶寬達(dá) 100 G,全面支持 IPv4 和 IPv6 雙棧接入,國(guó)際出口帶寬已達(dá) 61 G,連接國(guó)內(nèi)院校超過(guò) 2 000 個(gè),服務(wù)學(xué)生、教師等超過(guò) 2 500 萬(wàn)。

圖1 中國(guó)科技網(wǎng)
國(guó)家科技部支持構(gòu)建的國(guó)家科技基礎(chǔ)條件共享平臺(tái)[12]由研究實(shí)驗(yàn)基地、大型科學(xué)設(shè)施和儀器裝備、科學(xué)數(shù)據(jù)與信息、自然科技資源等科技資源組成,通過(guò)有效配置和共享,服務(wù)于全社會(huì)科技創(chuàng)新的支撐體系。近 10 年來(lái),啟動(dòng)了 40 余項(xiàng)平臺(tái)建設(shè)項(xiàng)目,其中 23 項(xiàng)經(jīng)過(guò)多年運(yùn)行成為國(guó)家科技基礎(chǔ)條件平臺(tái),目前共整合參建單位 708 家,包括各級(jí)各類(lèi)科研院所 574 家、高校 99 家和部分企業(yè)。涉及教育部、衛(wèi)計(jì)委、農(nóng)業(yè)部、中科院、國(guó)家質(zhì)檢總局、國(guó)家林業(yè)局等 20 余個(gè)部門(mén)、地方和企事業(yè)單位,推動(dòng)了我國(guó)的科技基礎(chǔ)資源開(kāi)放與共享。
隨著科技國(guó)際合作的不斷深入,科研信息化的作用也不斷得到科學(xué)家群體的重視,在不同方面不同程度地采用了先進(jìn)的信息化手段,來(lái)促進(jìn)各學(xué)科信息化的“軟”環(huán)境發(fā)展。在高能物理、核安全、微生物學(xué)以及氣象、地震監(jiān)測(cè)等領(lǐng)域,我國(guó)科研信息化程度基本達(dá)到國(guó)際先進(jìn)水平。
隨著“硬”環(huán)境的發(fā)展,我國(guó)在基礎(chǔ)設(shè)施運(yùn)行管理和服務(wù)環(huán)境方面也取得了進(jìn)步。如中國(guó)國(guó)家網(wǎng)格(CNGrid,圖 2)在“863”計(jì)劃的長(zhǎng)期支持下,突破了資源共享與協(xié)同工作的關(guān)鍵技術(shù),形成了國(guó)家級(jí)的高性能計(jì)算環(huán)境,并正在從“可用”向“好用”邁進(jìn)。目前 CNGrid 包含分布在全國(guó)各地的 14 個(gè)節(jié)點(diǎn),聚合計(jì)算能力 8 千萬(wàn)億次以上,部署了 450 多個(gè)應(yīng)用軟件和工具軟件,支持了 1 000 余項(xiàng)國(guó)家各類(lèi)科技計(jì)劃和重要工程項(xiàng)目的研究工作,用戶(hù)覆蓋基礎(chǔ)研究、工業(yè)設(shè)計(jì)、能源環(huán)境和信息服務(wù)等眾多領(lǐng)域。

圖2 中國(guó)國(guó)家網(wǎng)格(CNGrid)
但在“軟”服務(wù)環(huán)境方面,目前在大多數(shù)學(xué)科領(lǐng)域,科研人員所采用的計(jì)算軟件和主要科學(xué)數(shù)據(jù)庫(kù)都是由國(guó)外研發(fā)或擁有的,我國(guó)在大部分學(xué)科領(lǐng)域尚未有自主研發(fā)的軟件與算法,各學(xué)科領(lǐng)域的科學(xué)數(shù)據(jù)庫(kù)集中度不足、數(shù)據(jù)質(zhì)量不高,缺乏權(quán)威的自主數(shù)據(jù)庫(kù)。特別是在對(duì)網(wǎng)絡(luò)動(dòng)態(tài)調(diào)度、分布式高性能計(jì)算、學(xué)科數(shù)據(jù)存儲(chǔ)及容災(zāi)、各類(lèi)模擬計(jì)算軟件、數(shù)據(jù)分析處理等軟硬一體的整體信息化基礎(chǔ)環(huán)境的管理、運(yùn)行和服務(wù)平臺(tái)系統(tǒng)才剛剛開(kāi)始規(guī)劃和設(shè)計(jì)。
《國(guó)家“十二五”科學(xué)和技術(shù)發(fā)展規(guī)劃》[13]中明確指出了“重視建設(shè)信息化基礎(chǔ)設(shè)施”, 但國(guó)家層面尚未出臺(tái)與科研信息化相關(guān)的具體計(jì)劃。總體來(lái)看,我國(guó)還未形成國(guó)家層面統(tǒng)一的科研信息化基礎(chǔ)環(huán)境,主要以各部委的發(fā)展規(guī)劃和重大專(zhuān)項(xiàng)的形式來(lái)牽引科研信息化的發(fā)展,但各規(guī)劃和專(zhuān)項(xiàng)之間缺乏統(tǒng)籌協(xié)調(diào),客觀上形成了資源投入分散、政策滯后等問(wèn)題,制約了國(guó)家科研和創(chuàng)新能力的提升。
2.2 中科院科研信息化基礎(chǔ)環(huán)境的建設(shè)和實(shí)踐
在過(guò)去的 20 余年里,中科院通過(guò)持續(xù)實(shí)施院級(jí)信息化專(zhuān)項(xiàng),逐步形成了中科院信息化基礎(chǔ)環(huán)境。建設(shè)了覆蓋我國(guó)主要地區(qū)、連接國(guó)內(nèi)主要科研院所的中國(guó)科技網(wǎng),通過(guò)與歐美主要科研學(xué)術(shù)網(wǎng)絡(luò)的高速互聯(lián),為科研機(jī)構(gòu)和科學(xué)家提供了高速、安全和可靠的優(yōu)質(zhì)網(wǎng)絡(luò)服務(wù);建設(shè)了服務(wù)全院的超級(jí)計(jì)算環(huán)境,并作為科技部指定的中國(guó)國(guó)家網(wǎng)格北方主節(jié)點(diǎn)承擔(dān)中國(guó)國(guó)家網(wǎng)格的運(yùn)行與管理工作,聚合通用計(jì)算能力超過(guò) 2 PFLOPS,GPU 計(jì)算能力超過(guò) 3 PFLOPS,支持了 2 000 余個(gè)國(guó)家自然科學(xué)基金、“973”計(jì)劃、“863”計(jì)劃、中科院戰(zhàn)略性先導(dǎo)科技專(zhuān)項(xiàng)等重大項(xiàng)目,累計(jì)提供超過(guò) 2.5 億 CPU 機(jī)時(shí);自1986 年啟動(dòng)“科學(xué)數(shù)據(jù)庫(kù)”工作以來(lái),積累和整合了一批寶貴的科學(xué)數(shù)據(jù)資源,建設(shè)了包括北京中關(guān)村數(shù)據(jù)中心、懷柔備份中心和 12 個(gè)分布全國(guó)的區(qū)域分中心,形成達(dá) 50 Pb 的分布式海量存儲(chǔ)與處理環(huán)境,面向全院提供云存儲(chǔ)、云歸檔和云處理等服務(wù),支撐重要數(shù)據(jù)資產(chǎn)的容災(zāi)備份、長(zhǎng)期保存、共享服務(wù)與增值應(yīng)用。
“十二五”期間,中科院初步建成科研信息化云服務(wù)體系,有效支撐中科院乃至全國(guó)科研創(chuàng)新活動(dòng)。為院內(nèi)各類(lèi)用戶(hù)提供公共的基礎(chǔ)設(shè)施服務(wù)、平臺(tái)服務(wù)、軟件服務(wù),重點(diǎn)建設(shè)了“科學(xué)計(jì)算子云、科研軟件服務(wù)子云、科學(xué)數(shù)據(jù)子云”等云服務(wù),以重大科研活動(dòng)需求為牽引,以面向科技創(chuàng)新的需求為核心,構(gòu)建了一批跨機(jī)構(gòu)、跨地域和跨領(lǐng)域的科研信息化應(yīng)用平臺(tái),強(qiáng)化中科院信息化基礎(chǔ)設(shè)施之間的相互操作性,實(shí)現(xiàn)信息化環(huán)境與重大科研項(xiàng)目(工程)有機(jī)融合。結(jié)合有關(guān)學(xué)科領(lǐng)域及重大科研項(xiàng)目的需求,定制和擴(kuò)展出一批面向重大領(lǐng)域科技整體創(chuàng)新活動(dòng)的云服務(wù)平臺(tái),通過(guò)整合計(jì)算、數(shù)據(jù)、模型等學(xué)科領(lǐng)域的科研資源,直接服務(wù)于某種類(lèi)型或某一領(lǐng)域科技創(chuàng)新活動(dòng)。

圖3 中科院數(shù)據(jù)存儲(chǔ)環(huán)境基礎(chǔ)設(shè)施
中科院科研信息化基礎(chǔ)環(huán)境在互聯(lián)網(wǎng)絡(luò)、計(jì)算、數(shù)據(jù)硬件能力 3 個(gè)方面均基本形成了多級(jí)架構(gòu)和云化環(huán)境建設(shè),初步實(shí)現(xiàn)了全院的資源整合與優(yōu)化調(diào)度,并培養(yǎng)了一支經(jīng)驗(yàn)豐富的信息化運(yùn)維與服務(wù)團(tuán)隊(duì),不僅能為中科院的科學(xué)家群體提供信息化基礎(chǔ)環(huán)境服務(wù),而且向全國(guó)科技界輻射了科研信息化在當(dāng)今大數(shù)據(jù)驅(qū)動(dòng)科技創(chuàng)新中的巨大作用和影響。
2.3 國(guó)家科研信息化基礎(chǔ)環(huán)境建設(shè)中的不足
過(guò)去 20 多年,以中科院為代表的國(guó)家科研機(jī)構(gòu)緊跟國(guó)際科研信息化的步伐,邊建設(shè)邊探索,建設(shè)了一批科研信息化基礎(chǔ)環(huán)境,取得了一系列進(jìn)展。但仍然在諸多方面存在問(wèn)題。
(1)科研信息化是信息化的先導(dǎo)力量。當(dāng)前,我國(guó)經(jīng)濟(jì)正處于從要素驅(qū)動(dòng)、投資規(guī)模驅(qū)動(dòng)為主向以創(chuàng)新驅(qū)動(dòng)為主的發(fā)展轉(zhuǎn)型期,信息化已成為驅(qū)動(dòng)國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展的重要先導(dǎo)力量,科研信息化更是整個(gè)信息化的先導(dǎo)力量。然而,通觀我國(guó)信息化發(fā)展現(xiàn)狀,科研信息化卻成為我國(guó)唯一沒(méi)被“叫響”的信息化領(lǐng)域。科研信息化的重要作用未能在全社會(huì)得到共識(shí),其公益性定位也沒(méi)有得到國(guó)家層面的認(rèn)同,導(dǎo)致許多科研信息化基礎(chǔ)環(huán)境的依托單位仍然需要通過(guò)承擔(dān)其他項(xiàng)目為信息化基礎(chǔ)環(huán)境的運(yùn)維籌措資金,國(guó)家科研骨干網(wǎng)絡(luò)每年仍需要向商業(yè)運(yùn)營(yíng)商繳納數(shù)千萬(wàn)元的信道費(fèi)。
(2)由于歷史原因以及科技管理體制的特點(diǎn),我國(guó)缺乏科研信息化的頂層設(shè)計(jì)。各主管部門(mén)主要在各自工作范疇內(nèi),部署并開(kāi)展了科研信息化的一些應(yīng)用,且傾向于將科研信息化視為一般信息化工作進(jìn)行管理,客觀上造成了投入資源分散、共享不足、數(shù)據(jù)封閉、政策滯后等問(wèn)題,導(dǎo)致科研信息化基礎(chǔ)環(huán)境各元素之間沒(méi)有完全打通,而且服務(wù)能力不相匹配。如目前我國(guó)高性能計(jì)算能力已達(dá)世界領(lǐng)先水平,但在計(jì)算算法、模擬軟件、科學(xué)數(shù)據(jù)等方面遠(yuǎn)落后于國(guó)際先進(jìn)水平,削弱了整個(gè)信息化基礎(chǔ)環(huán)境應(yīng)有的服務(wù)交付能力和對(duì)科技創(chuàng)新的實(shí)際支撐作用。
(3)科技創(chuàng)新活動(dòng)和科研信息化未能協(xié)同發(fā)展。由于缺乏國(guó)家層面的統(tǒng)籌考慮與頂層設(shè)計(jì),各個(gè)分散的科研信息化基礎(chǔ)環(huán)境缺乏與國(guó)家的重大科技布局相對(duì)接,形成了科技創(chuàng)新活動(dòng)和科研信息化基礎(chǔ)環(huán)境支撐“兩張皮”的現(xiàn)象。現(xiàn)有不多的科研信息化基礎(chǔ)環(huán)境,沒(méi)有能與一些重大科技基礎(chǔ)設(shè)施和科技布局形成匹配的網(wǎng)絡(luò)環(huán)境、數(shù)據(jù)存儲(chǔ)環(huán)境以及高性能計(jì)算環(huán)境,缺乏學(xué)科領(lǐng)域的自主的高性能計(jì)算模擬軟件、大數(shù)據(jù)分析處理軟件對(duì)學(xué)科領(lǐng)域科技創(chuàng)新活動(dòng)的支持。
(4)尚未形成健全的科研信息化基礎(chǔ)環(huán)境建設(shè)與運(yùn)行維護(hù)的投入機(jī)制,對(duì)于信息化運(yùn)維服務(wù)以及服務(wù)團(tuán)隊(duì)的評(píng)估、評(píng)價(jià)體系不明確。
習(xí)近平總書(shū)記指出:“沒(méi)有信息化就沒(méi)有現(xiàn)代化”。當(dāng)今科技創(chuàng)新必然站在信息化的肩膀上來(lái)發(fā)展,能夠適應(yīng)科研范式的變革才能贏得競(jìng)爭(zhēng)的優(yōu)勢(shì)。世界各發(fā)達(dá)國(guó)家在實(shí)施科技發(fā)展戰(zhàn)略中,無(wú)一例外都將國(guó)家科研信息化基礎(chǔ)環(huán)境作為國(guó)家科技創(chuàng)新布局中重要的、不可或缺的基礎(chǔ)設(shè)施。我國(guó)應(yīng)更加充分重視科研信息化基礎(chǔ)環(huán)境的戰(zhàn)略意義,盡快出臺(tái)能夠?qū)嵤┑慕ㄔO(shè)計(jì)劃,建設(shè)國(guó)家級(jí)的科研信息化基礎(chǔ)環(huán)境,促進(jìn)科技創(chuàng)新,提升科技競(jìng)爭(zhēng)力。
國(guó)家科研信息化基礎(chǔ)環(huán)境應(yīng)從國(guó)家層面進(jìn)行進(jìn)行頂層設(shè)計(jì)、統(tǒng)籌布局,在建設(shè)過(guò)程中充分考慮國(guó)家重大科技布局的地域和學(xué)科上的分布特點(diǎn),合理規(guī)劃、集約資源,加強(qiáng)基礎(chǔ)性、戰(zhàn)略性、前沿性科學(xué)研究和共性技術(shù)信息化基礎(chǔ)環(huán)境的持續(xù)投入,建設(shè)與國(guó)家重大科技布局相匹配的國(guó)家科研信息化基礎(chǔ)環(huán)境。
國(guó)家科研信息化基礎(chǔ)環(huán)境作為國(guó)家公益性的戰(zhàn)略平臺(tái),應(yīng)納入國(guó)家科技專(zhuān)項(xiàng)中予以考慮,建立一套可評(píng)估、可考核的評(píng)價(jià)機(jī)制,保障國(guó)家科研信息化基礎(chǔ)環(huán)境的長(zhǎng)期穩(wěn)定運(yùn)行。
國(guó)家科研信息化基礎(chǔ)環(huán)境一方面結(jié)合國(guó)家重大科技布局,面向國(guó)家重大戰(zhàn)略和重大科學(xué)問(wèn)題需求,支撐國(guó)家科技創(chuàng)新。另一方面,通過(guò)信息化基礎(chǔ)環(huán)境匯聚科技界的資源,面向企業(yè)乃至全社會(huì)提供科技知識(shí)服務(wù),降低企業(yè)創(chuàng)新和大眾創(chuàng)新所必須的資源獲取、加工處理和創(chuàng)新應(yīng)用等門(mén)檻,推動(dòng)信息化與經(jīng)濟(jì)社會(huì)各領(lǐng)域深度融合,服務(wù)“雙創(chuàng)”和經(jīng)濟(jì)社會(huì)發(fā)展。
1 桂文莊. 什么是e-Science?. 科研信息化技術(shù)與應(yīng)用, 2008, 1(1): 1-7.
2 張亞平, 譚鐵牛. 國(guó)家科研信息化戰(zhàn)略研究咨詢(xún)報(bào)告. 2015. 4-13.
3 National Ecological Observatory Network. [2016-02-01]. http:// www.neonscience.org/ .
4 Ocean Observato ries Initiative. [2016-02-01]. h ttp:// oceanobservatories.org/ .
5 Argo. [2016-02-01]. http://www.argo.net/ .
6 Strategic Plan FY 2014-FY2023 ESnet, 2013, 1-3.
7 GéANT pan-European network. [2016-02-01]. http://www. geant.org/Networks.
8 EUMEDCONNECT. [2016-02-01]. http://eumedconnect1. archive.dante.net/.
9 ORIENTplus project. [2016-02-01]. http://www.orientplus.eu/.
10 Partnership For Advanced Computing in Europe. [2016-02-01]. http://www.prace-ri.eu/.
11 謝向輝, 胡蘇太. 中國(guó)“863計(jì)劃”高性能計(jì)算的發(fā)展. 科研信息化技術(shù)與應(yīng)用, 2015, 6 (4): 3-10.
12 葉玉江. 國(guó)家科技基礎(chǔ)條件共享平臺(tái)現(xiàn)狀與發(fā)展. 中國(guó)科研信息化藍(lán)皮書(shū). 北京: 科學(xué)出版社, 2016: 325-331.
13 科技部. 國(guó)家“十二五”科學(xué)和技術(shù)發(fā)展規(guī)劃. 2011.
廖方宇中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心主任,研究員,中國(guó)計(jì)算機(jī)學(xué)會(huì)計(jì)算機(jī)安全專(zhuān)業(yè)委員會(huì)副主任委員,中科院計(jì)算科學(xué)應(yīng)用研究中心理事長(zhǎng)。曾擔(dān)任中科院信息辦副主任,負(fù)責(zé)中科院信息化工作的組織協(xié)調(diào),組織編制了《中科院“十二五”信息化規(guī)劃》;曾長(zhǎng)期從事空間科學(xué)與探測(cè)的工程任務(wù)和型號(hào)管理,擔(dān)任國(guó)家“863”計(jì)劃“深空探測(cè)”重大項(xiàng)目專(zhuān)家組成員等。E-mail: fyliao@cnic.cn
Liao FangyuThe professor and the director of Computer Network Information Center, Chinese Academy of Sciences (CAS). He is also the vice chairman of Professional Comm ittee of Com puter Security of China Com puter Federation, and the director of Center of Scientific Computing Applications & Research, CAS. As the former deputy director of the Informatization Office of CAS, he was in charge of informatization affairs of CAS. He organized the Twelfth Five-year Plan of Informatization Development of CAS. He was engaged in space science and exploration project and project management in long term. He was also a member of expert panel of deep space exploration project of the National 863 Program. E-mail: fyliao@cnic.cn
Construction and Practice of National Cyberinfrastructure for Scientific Research
Liao FangyuWang YangMa YongzhengWang YangangZhou YuanchunXu Haiyan
(Computer Network Information Center, Chinese Academy of Sciences, Beijing 100190, China)
The cyberinfrastructure for scientific research is a suit of hardware and software system s which can provide general information services and sharing services for scientific research activities. It mainly includes three parts, (1) hardware services, such as high speed scientific research network, high performance com puting resources, and mass storage resources for scientific data; (2) software services, for exam ple,calculation and simulation software, data analysis software, and scientific data services; (3) collaboration and resource management platforms,for instance, social network environment, collaboration working environment, operation and maintenance of the hardware platform, and resource unified platform. This article briefly introduces the important status of cyberinfrastructure in national strategic infrastructure around the world, and reviews the latest progress and state-of-the-art of National Cyberinfrastructure for Scientific Research (NCSR). In China, scientific researchers have constructed several cyberinfrastructures for scientific research over the past twenty years. This article concludes the practice and experiences of establishing cyberinfrastructure for scientific research in Chinese Academy of Sciences, and discusses the major problems faced in the development of NCSR: (1) NCSR has not been considered as the public welfare at the national level and reflected its strategic importance; (2) Compared w ith other fields in our country, NCSR lacks of overall planning; (3) NCSR's distribution and ability do not match w ith the national key science and technology infrastructures; (4) The investment mechanism of infrastructure construction, the mechanism of operation and maintenance, and the evaluation system of service and career development have not been formed. This article also suggests for the development of NCSR: (1) NCSR is the key infrastructure for promoting scientific and technological innovation-driven development strategy. Our country should invest and construct NCSR as soon as possible; (2) It is im portant to consider the geographical and disciplinary distribution of national key science and technology infrastructures when constructing NCSR; (3) As a public welfare platform, NCSR should be considered in national science and technology projects; (4) NCSR can also provide scientific and technological know ledge service for companies and public, reducing the threshold of scientific and technological innovation, and serving mass entrepreneurship and innovation strategy.
e-Science, cyberinfrastructure, scientific research network, high performance com puting, scientific data
10.16418/j.issn.1000-3045.2016.06.006
*修改稿收到日期:2016年4月22日