張新興
〔摘要〕我國(guó)的科學(xué)數(shù)據(jù)共享平臺(tái)建立了完善的管理機(jī)制,基于分布式組織架構(gòu)整合海量科學(xué)數(shù)據(jù),利用元數(shù)據(jù)對(duì)科學(xué)數(shù)據(jù)進(jìn)行全方位的描述,提供多種資源組織方式、檢索方式、結(jié)果排序方式、數(shù)據(jù)獲取方式。科學(xué)數(shù)據(jù)共享平臺(tái)的用戶數(shù)和使用量逐年擴(kuò)大,為科技、經(jīng)濟(jì)、社會(huì)發(fā)展做出了重要貢獻(xiàn)。今后科學(xué)數(shù)據(jù)共享平臺(tái)應(yīng)拓展和深化數(shù)據(jù)資源、加強(qiáng)服務(wù)能力建設(shè)、提高定制化服務(wù)水平。
〔關(guān)鍵詞〕科學(xué)數(shù)據(jù);共享平臺(tái);資源建設(shè);用戶服務(wù)
DOI:10.3969/j.issn.1008-0821.2016.11.020
〔中圖分類號(hào)〕G311〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2016)11-0109-05
〔Abstract〕Scientific data sharing platforms in our country have established perfect management mechanism.Scientific data sharing platforms integrate massive scientific data through distributed structure.Scientific data sharing platforms descript scientific data comprehensively using metadata,offer a variety of resources organization methods,retrieval methods,sorting methods of retrieved result,data access methods.Users and usage of scientific data sharing platforms increased year by year,make a significant contribution for science and technology,economic and social development.Scientific data sharing platforms should expand and deepen scientific data resources,strengthen the construction of service capability,improve the level of customization service in the future.
〔Key words〕scientific data;sharing platform;resource development;user service
我國(guó)的數(shù)據(jù)庫(kù)數(shù)量約占全球數(shù)據(jù)庫(kù)總數(shù)的十分之一,而科學(xué)數(shù)據(jù)共享所產(chǎn)生的效益僅占全球科學(xué)數(shù)據(jù)共享效益的千分之一[1]。為了促進(jìn)科學(xué)數(shù)據(jù)共享,科技部于2002年啟動(dòng)了科學(xué)數(shù)據(jù)共享工程。經(jīng)過(guò)十余年的發(fā)展,基本建成了覆蓋全面、結(jié)構(gòu)合理的科學(xué)數(shù)據(jù)共享網(wǎng)絡(luò)體系,形成了科學(xué)數(shù)據(jù)的良性匯交與更新機(jī)制。本文以首批8個(gè)科學(xué)數(shù)據(jù)共享工程試點(diǎn)(名單見表1)為例,分析我國(guó)科學(xué)數(shù)據(jù)共享平臺(tái)的組織管理、資源建設(shè)與用戶服務(wù)情況,指出科學(xué)數(shù)據(jù)共享平臺(tái)存在的不足與發(fā)展方向,以期為今后的科學(xué)數(shù)據(jù)資源共享工作提供參考。
1科學(xué)數(shù)據(jù)共享平臺(tái)的組織管理
11運(yùn)行機(jī)制
科學(xué)數(shù)據(jù)共享平臺(tái)以數(shù)據(jù)源單位為主體,通過(guò)集成、整合、引進(jìn)、交換等方式聚合國(guó)內(nèi)外的科學(xué)數(shù)據(jù)資源,并進(jìn)行規(guī)范化加工處理、分類存儲(chǔ),形成覆蓋全國(guó)、聯(lián)結(jié)世界,可提供科學(xué)數(shù)據(jù)共享服務(wù)的網(wǎng)絡(luò)體系。為保證科學(xué)數(shù)據(jù)共享平臺(tái)的規(guī)范化建設(shè)和可持續(xù)發(fā)展,平臺(tái)實(shí)行理事會(huì)領(lǐng)導(dǎo)下的平臺(tái)中心主任負(fù)責(zé)制。如國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心由平臺(tái)管理中心主任統(tǒng)籌管理,下設(shè)服務(wù)組、資源組、系統(tǒng)組、綜合組,負(fù)責(zé)平臺(tái)具體的運(yùn)行維護(hù)和管理。平臺(tái)的資源建設(shè)則主要采取項(xiàng)目協(xié)作制,即若干相互獨(dú)立、功能互補(bǔ)的平行工作組共同負(fù)責(zé)平臺(tái)的資源建設(shè)工作,以提高資源建設(shè)效率。如國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)基于項(xiàng)目協(xié)作的方式共建共享資源,主節(jié)點(diǎn)和分節(jié)點(diǎn)分別設(shè)置專門的資源建設(shè)小組,負(fù)責(zé)各項(xiàng)資源建設(shè)與管理工作。
12平臺(tái)架構(gòu)
科學(xué)數(shù)據(jù)共享平臺(tái)通常采取分布式系統(tǒng)架構(gòu),由1個(gè)總中心(認(rèn)證中心)和若干個(gè)分中心(各參加單位)構(gòu)成。其中中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)的分中心數(shù)量最多,包括31個(gè)省級(jí)分節(jié)點(diǎn)和若干專題節(jié)點(diǎn)(見表1)。平臺(tái)分中心又可以劃分為地區(qū)分中心、學(xué)科分中心、專題分中心等多種類型。地區(qū)分中心如國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心和林業(yè)科學(xué)數(shù)據(jù)中心的省級(jí)分中心,學(xué)科分中心如國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)的學(xué)科分節(jié)點(diǎn)和地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)的學(xué)科子平臺(tái),專題分中心如中國(guó)氣象數(shù)據(jù)網(wǎng)的專題節(jié)點(diǎn)和林業(yè)科學(xué)數(shù)據(jù)中心的基礎(chǔ)數(shù)據(jù)分中心、行業(yè)發(fā)展數(shù)據(jù)分中心。“總中心—分中心”的分布式系統(tǒng)架構(gòu)能夠?qū)崿F(xiàn)分散的科學(xué)數(shù)據(jù)資源整合與“一站式”的科學(xué)數(shù)據(jù)資源共享服務(wù),避免科學(xué)數(shù)據(jù)共享服務(wù)可能給單點(diǎn)式共享平臺(tái)造成的網(wǎng)絡(luò)堵塞和服務(wù)器負(fù)擔(dān)過(guò)重問(wèn)題。
13制度建設(shè)
為了保證科學(xué)數(shù)據(jù)共享平臺(tái)資源建設(shè)與用戶服務(wù)的常態(tài)化、制度化,科學(xué)數(shù)據(jù)共享平臺(tái)在規(guī)章制度、標(biāo)準(zhǔn)體系建設(shè)方面取得了大量成果。國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)特設(shè)專門的標(biāo)準(zhǔn)化工作小組,制定了數(shù)據(jù)類、管理類、服務(wù)類、質(zhì)量控制類、安全類等10余項(xiàng)標(biāo)準(zhǔn)。其中,《醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)數(shù)據(jù)元標(biāo)準(zhǔn)化原則與方法》、《醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)數(shù)據(jù)集分類與編碼原則與方法》、《醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)數(shù)據(jù)集元數(shù)據(jù)標(biāo)準(zhǔn)》、《醫(yī)藥衛(wèi)生科學(xué)數(shù)據(jù)共享網(wǎng)數(shù)據(jù)模式描述規(guī)則與方法》4項(xiàng)標(biāo)準(zhǔn)已經(jīng)推廣成為衛(wèi)生行業(yè)標(biāo)準(zhǔn)[2]。國(guó)家地震科學(xué)數(shù)據(jù)共享中心也頒布了《地震科學(xué)數(shù)據(jù)共享管理辦法(試行)》及其實(shí)施細(xì)則——《地震科學(xué)數(shù)據(jù)共享匯交管理規(guī)定》、《地震科學(xué)數(shù)據(jù)共享分級(jí)分類指南》、《地震科學(xué)數(shù)據(jù)共享運(yùn)行管理規(guī)定》、《地震科學(xué)數(shù)據(jù)共享用戶服務(wù)規(guī)定》,并編制了12個(gè)標(biāo)準(zhǔn)規(guī)范。這些規(guī)章制度和標(biāo)準(zhǔn)規(guī)范在科學(xué)數(shù)據(jù)共享平臺(tái)的數(shù)據(jù)整合、數(shù)據(jù)交換、數(shù)據(jù)共享中發(fā)揮了重要作用。
2科學(xué)數(shù)據(jù)共享平臺(tái)的資源建設(shè)
21元數(shù)據(jù)建設(shè)
科學(xué)數(shù)據(jù)共享平臺(tái)以元數(shù)據(jù)為核心實(shí)現(xiàn)科學(xué)數(shù)據(jù)的描述、分類、搜索、關(guān)聯(lián),借助技術(shù)手段實(shí)現(xiàn)數(shù)據(jù)的物理存儲(chǔ)與邏輯表達(dá)的分離。元數(shù)據(jù)作為描述科學(xué)數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù),包含了數(shù)據(jù)的標(biāo)識(shí)信息、內(nèi)容信息、時(shí)間和空間覆蓋信息、人員和權(quán)責(zé)信息、關(guān)聯(lián)信息、技術(shù)信息等各個(gè)方面[3]。平臺(tái)使用較多的元數(shù)據(jù)是數(shù)據(jù)庫(kù)(集)名稱、數(shù)據(jù)摘要、數(shù)據(jù)內(nèi)容、時(shí)間范圍、數(shù)據(jù)質(zhì)量信息、標(biāo)識(shí)信息、分類信息。中國(guó)氣象數(shù)據(jù)網(wǎng)、國(guó)家地震科學(xué)數(shù)據(jù)共享中心、國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心、林業(yè)科學(xué)數(shù)據(jù)中心的元數(shù)據(jù)較為詳細(xì),元數(shù)據(jù)數(shù)量都達(dá)到了10個(gè)或10個(gè)以上(見表2)。
為了提高元數(shù)據(jù)的針對(duì)性,提高服務(wù)效率,林業(yè)科學(xué)數(shù)據(jù)中心根據(jù)元數(shù)據(jù)的詳細(xì)程度將元數(shù)據(jù)劃分為兩級(jí)——核心元數(shù)據(jù)和詳細(xì)元數(shù)據(jù)。核心元數(shù)據(jù)定義了描述數(shù)據(jù)集最關(guān)鍵的信息內(nèi)容。在核心元數(shù)據(jù)的基礎(chǔ)上,充分考慮林業(yè)科學(xué)數(shù)據(jù)中各類數(shù)據(jù)的特點(diǎn),建立了滿足林業(yè)科學(xué)數(shù)據(jù)共享建設(shè)需要的詳細(xì)元數(shù)據(jù)。核心元數(shù)據(jù)包括元數(shù)據(jù)參考信息、元數(shù)據(jù)聯(lián)系方信息、標(biāo)識(shí)、數(shù)據(jù)集限制信息、數(shù)據(jù)質(zhì)量信息,詳細(xì)元數(shù)據(jù)除此之外還包括內(nèi)容信息、分發(fā)格式等19個(gè)元數(shù)據(jù)。先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)根據(jù)資源對(duì)象類型,將元數(shù)據(jù)劃分為資源對(duì)象元數(shù)據(jù)和資源集合元數(shù)據(jù)。資源集合元數(shù)據(jù)包含一般描述信息、關(guān)聯(lián)信息、訪問(wèn)信息,資源對(duì)象元數(shù)據(jù)除上述元數(shù)據(jù)之外,還包括實(shí)例信息、產(chǎn)權(quán)信息、使用信息、其他說(shuō)明。
22資源整合
經(jīng)過(guò)10余年的建設(shè),科學(xué)數(shù)據(jù)共享平臺(tái)開發(fā)和整合了大量的科學(xué)數(shù)據(jù)資源,資源統(tǒng)計(jì)情況見表2。(1)資源類別方面,平臺(tái)整合的資源類別介于6種到14種之間,其中國(guó)家地震科學(xué)數(shù)據(jù)共享中心涵蓋的數(shù)據(jù)類別最多,達(dá)到了14種。先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)的資源種類最少,但也有6種。(2)數(shù)據(jù)庫(kù)(集)方面,平臺(tái)數(shù)據(jù)庫(kù)(集)的數(shù)量介于100~800個(gè)之間,地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)的數(shù)據(jù)庫(kù)(集)數(shù)量高達(dá)1 157個(gè),數(shù)據(jù)庫(kù)(集)數(shù)量最少的國(guó)家地震科學(xué)數(shù)據(jù)共享中心,其數(shù)據(jù)庫(kù)(集)也有54個(gè)之多。(3)資源總量方面,平臺(tái)的數(shù)據(jù)資源總量大都在1 000GB以上,其中中國(guó)氣象數(shù)據(jù)網(wǎng)的資源總量更是達(dá)到了118 784GB。
如此引人矚目的資源建設(shè)成就,得益于平臺(tái)高效的資源整合方式。以地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)為例,該平臺(tái)按照“總中心-分中心-數(shù)據(jù)資源點(diǎn)”的三級(jí)架構(gòu)模式,整合分散在國(guó)內(nèi)外40多個(gè)單位的科學(xué)數(shù)據(jù)資源。通過(guò)區(qū)域和學(xué)科分中心的設(shè)置,推動(dòng)區(qū)域和學(xué)科數(shù)據(jù)資源的建設(shè)。其資源整合方式如下:(1)通過(guò)適當(dāng)?shù)慕?jīng)費(fèi)支持,整合參與單位已有的科學(xué)數(shù)據(jù)資源;(2)通過(guò)科學(xué)數(shù)據(jù)服務(wù),接收和集成數(shù)據(jù)用戶單位的科學(xué)數(shù)據(jù)資源;(3)通過(guò)共享軟件的服務(wù),自動(dòng)收割和整合軟件用戶單位的科學(xué)數(shù)據(jù)資源;(4)通過(guò)開放交換,與其他數(shù)據(jù)管理機(jī)構(gòu)交換科學(xué)數(shù)據(jù)資源,建立資源鏡像[4]。
23資源檢索
科學(xué)數(shù)據(jù)共享平臺(tái)提供數(shù)據(jù)導(dǎo)航和數(shù)據(jù)檢索兩種資源查詢方式(見表3)。數(shù)據(jù)導(dǎo)航又包括3種類型:(1)主題分類導(dǎo)航(專題分類導(dǎo)航)。如先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)將平臺(tái)數(shù)據(jù)劃分為現(xiàn)代設(shè)計(jì)技術(shù)、先進(jìn)制造工藝、自動(dòng)化技術(shù)、通用技術(shù)、現(xiàn)代管理5個(gè)主題。(2)學(xué)科分類導(dǎo)航(中圖數(shù)據(jù)分類導(dǎo)航)。如國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心的中圖數(shù)據(jù)分類導(dǎo)航,參照中圖法將平臺(tái)數(shù)據(jù)劃分為自然科學(xué)總論、農(nóng)業(yè)科學(xué)、交通運(yùn)輸、工業(yè)技術(shù)、綜合性圖書等13種類目。(3)因應(yīng)具體學(xué)科特點(diǎn)的特色導(dǎo)航。如中國(guó)氣象數(shù)據(jù)網(wǎng)的數(shù)據(jù)定位導(dǎo)航,國(guó)家地震科學(xué)數(shù)據(jù)共享中心的地域?qū)傩詫?dǎo)航。
數(shù)據(jù)檢索功能包括簡(jiǎn)單檢索、高級(jí)檢索、組配檢索、數(shù)值檢索、條目檢索、專業(yè)檢索等諸多方式。中國(guó)氣象數(shù)據(jù)網(wǎng)的資源檢索功能異常強(qiáng)大,能夠?qū)崿F(xiàn)檢索范圍、數(shù)據(jù)類別、網(wǎng)站節(jié)點(diǎn)之間的組配檢索,并提供層次分類、關(guān)鍵詞匹配、條件組合和地圖可視化等多種數(shù)據(jù)查詢方式。地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)提供即點(diǎn)即找檢索功能,即通過(guò)在頁(yè)面中點(diǎn)擊數(shù)據(jù)貢獻(xiàn)者、數(shù)據(jù)貢獻(xiàn)單位、空間位置、主題詞、學(xué)科類別、主題分類等位置進(jìn)行數(shù)據(jù)的查找。除了檢索總平臺(tái)數(shù)據(jù)之外,通過(guò)總平臺(tái)還能夠檢索特定分平臺(tái)的數(shù)據(jù)資源。
為了便于用戶快速獲取所需數(shù)據(jù),科學(xué)數(shù)據(jù)共享平臺(tái)提供多種檢索結(jié)果排序方式,包括發(fā)布時(shí)間、下載次數(shù)、訪問(wèn)量、結(jié)果相關(guān)度、資源類型、數(shù)據(jù)大小等。其中,發(fā)布時(shí)間和更新時(shí)間是最常用的檢索結(jié)果排序方式。國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)、國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心、交通科學(xué)數(shù)據(jù)共享網(wǎng)均提供發(fā)布時(shí)間排序途徑,中國(guó)氣象數(shù)據(jù)網(wǎng)、地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)則都提供更新時(shí)間排序功能。林業(yè)科學(xué)數(shù)據(jù)中心的檢索結(jié)果根據(jù)資源類型分類排列,即元數(shù)據(jù)、庫(kù)數(shù)據(jù)、表數(shù)據(jù),是一種較為特殊的檢索結(jié)果排序方式。
3科學(xué)數(shù)據(jù)共享平臺(tái)的用戶服務(wù)
31數(shù)據(jù)服務(wù)
為了確保數(shù)據(jù)的安全性和完整性,更好地保證系統(tǒng)中信息交流、數(shù)據(jù)檢索的有序性,平臺(tái)大多實(shí)行會(huì)員注冊(cè)制服務(wù),將用戶區(qū)分為注冊(cè)用戶和非注冊(cè)用戶。非注冊(cè)用戶可以游客身份瀏覽平臺(tái)科學(xué)數(shù)據(jù),注冊(cè)用戶則具有科學(xué)數(shù)據(jù)的瀏覽、查詢、下載等權(quán)限。中國(guó)氣象數(shù)據(jù)網(wǎng)、國(guó)家地震科學(xué)數(shù)據(jù)共享中心、林業(yè)科學(xué)數(shù)據(jù)中心、先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)等4個(gè)平臺(tái)根據(jù)用戶來(lái)源和可獲取的數(shù)據(jù)范圍,對(duì)注冊(cè)用戶做了進(jìn)一步劃分。如中國(guó)氣象數(shù)據(jù)網(wǎng)將注冊(cè)用戶分為普通注冊(cè)用戶、個(gè)人實(shí)名注冊(cè)用戶、單位實(shí)名注冊(cè)用戶、教育科研實(shí)名注冊(cè)用戶。平臺(tái)根據(jù)注冊(cè)用戶類型,為其提供不同權(quán)限的數(shù)據(jù)服務(wù)。普通注冊(cè)用戶和教育科研實(shí)名注冊(cè)用戶具有獲取指定氣象數(shù)據(jù)和產(chǎn)品的權(quán)限,個(gè)人實(shí)名注冊(cè)用戶除此權(quán)限外,還具有獲取中國(guó)氣象局最新公布的《基本氣象資料和產(chǎn)品開放清單》內(nèi)的氣象數(shù)據(jù)和產(chǎn)品的權(quán)限,單位實(shí)名注冊(cè)用戶除上述權(quán)限外還具有獲取標(biāo)準(zhǔn)、開放的數(shù)據(jù)接口服務(wù)的權(quán)限。
科學(xué)數(shù)據(jù)共享平臺(tái)為規(guī)范科學(xué)數(shù)據(jù)的共享服務(wù)工作,并能及時(shí)向各類用戶提供所需數(shù)據(jù),對(duì)科學(xué)數(shù)據(jù)資源實(shí)行分級(jí)共享。如先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)根據(jù)數(shù)據(jù)的價(jià)值、獲取難度及重要程度,將科學(xué)數(shù)據(jù)劃分為7級(jí):經(jīng)元數(shù)據(jù)規(guī)范的初加工數(shù)據(jù);經(jīng)元數(shù)據(jù)規(guī)范和質(zhì)量檢驗(yàn)規(guī)范的精加工數(shù)據(jù);獲取難度較大的加工數(shù)據(jù);有自籌資金投入的數(shù)據(jù);應(yīng)用戶需求,專門為之整理、加工和生產(chǎn)的科學(xué)數(shù)據(jù);為使用者帶來(lái)直接或巨大商業(yè)利益的關(guān)鍵數(shù)據(jù);影響國(guó)際競(jìng)爭(zhēng)力的關(guān)鍵數(shù)據(jù)(影響國(guó)家安全的重要數(shù)據(jù))。平臺(tái)根據(jù)用戶級(jí)別,為其提供相應(yīng)等級(jí)的數(shù)據(jù)服務(wù)。
平臺(tái)的資源獲取方式主要是在線下載,對(duì)于一些重要數(shù)據(jù)或數(shù)據(jù)量較大的數(shù)據(jù)資源提供光盤(拷貝),另外還提供數(shù)據(jù)傳遞、復(fù)印等服務(wù)。為提升用戶體驗(yàn),地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)在用戶申請(qǐng)數(shù)據(jù)方面引入了數(shù)據(jù)訂單概念。數(shù)據(jù)獲取均以數(shù)據(jù)訂單方式處理,用戶可以在一個(gè)訂單中申請(qǐng)多個(gè)數(shù)據(jù)。數(shù)據(jù)申請(qǐng)?zhí)幚磉^(guò)程通過(guò)電子郵件主動(dòng)通知用戶每步的數(shù)據(jù)處理情況,用戶可以跟蹤訂單的狀態(tài)獲知數(shù)據(jù)申請(qǐng)?zhí)幚淼娜^(guò)程[5]。
32延伸服務(wù)
延伸服務(wù)指除了操作數(shù)據(jù)實(shí)體之外的一種增值性服務(wù)。科學(xué)數(shù)據(jù)共享平臺(tái)主要提供數(shù)據(jù)定題服務(wù)和嵌入式數(shù)據(jù)服務(wù)兩類延伸服務(wù)。(1)數(shù)據(jù)定題服務(wù)根據(jù)用戶的需求組織相關(guān)資源并進(jìn)行適當(dāng)處理,以用戶需要的形式定期或不定期持續(xù)提供數(shù)據(jù)支持服務(wù)。國(guó)家地震科學(xué)數(shù)據(jù)共享中心提供中國(guó)臺(tái)網(wǎng)地震目錄、國(guó)家臺(tái)網(wǎng)連續(xù)波形、國(guó)家臺(tái)網(wǎng)事件波形、國(guó)家臺(tái)網(wǎng)震相數(shù)據(jù)等地震科學(xué)數(shù)據(jù)產(chǎn)品定制服務(wù)。林業(yè)科學(xué)數(shù)據(jù)中心為用戶提供特定專業(yè)領(lǐng)域的專題數(shù)據(jù)及技術(shù)服務(wù),根據(jù)用戶提出的數(shù)據(jù)類別及技術(shù)指標(biāo)要求,提供特定數(shù)據(jù)產(chǎn)品。(2)嵌入式數(shù)據(jù)服務(wù)是針對(duì)用戶個(gè)性化需要提供的科研支持服務(wù),如根據(jù)用戶的需要,派遣領(lǐng)域?qū)<液蛿?shù)據(jù)專家加入用戶團(tuán)隊(duì),主動(dòng)發(fā)現(xiàn)用戶的信息需求并開展數(shù)據(jù)服務(wù)。交通科學(xué)數(shù)據(jù)共享網(wǎng)針對(duì)研究課題開展定題服務(wù),為用戶提供從課題前期調(diào)研、開題立項(xiàng)、項(xiàng)目開展和成果驗(yàn)收全過(guò)程的科學(xué)數(shù)據(jù)檢索和提供服務(wù)。
33服務(wù)統(tǒng)計(jì)
科學(xué)數(shù)據(jù)共享平臺(tái)的社會(huì)效能主要體現(xiàn)在注冊(cè)人數(shù)、訪問(wèn)量、被鏈接次數(shù)等方面,被引次數(shù)、對(duì)科研項(xiàng)目的支撐則在一定程度上體現(xiàn)了平臺(tái)的科研效能。筆者于2016年4月1日通過(guò)各科學(xué)數(shù)據(jù)共享平臺(tái)網(wǎng)站查詢其注冊(cè)人數(shù)和訪問(wèn)量(見表4),發(fā)現(xiàn)除先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)和交通科學(xué)數(shù)據(jù)共享網(wǎng)外,其余平臺(tái)網(wǎng)站均提供相關(guān)信息。科學(xué)數(shù)據(jù)共享平臺(tái)的注冊(cè)人數(shù)大都在萬(wàn)人以上,訪問(wèn)量更是超過(guò)了百萬(wàn)次。國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)的注冊(cè)人數(shù)最多,達(dá)31萬(wàn)人。國(guó)家地震科學(xué)數(shù)據(jù)共享中心的注冊(cè)人數(shù)最少,但也有近7 000人。中國(guó)氣象數(shù)據(jù)網(wǎng)的訪問(wèn)量最大,達(dá)124 746 363次。國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心的訪問(wèn)量為1 448 632次,在所有平臺(tái)中訪問(wèn)量最少。利用“站長(zhǎng)之家”網(wǎng)站的“友情鏈接查詢”功能,查詢各平臺(tái)網(wǎng)站的被鏈接次數(shù)(見表4)。其中,國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心和地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)的被鏈接次數(shù)都在30次以上,國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)和交通科學(xué)數(shù)據(jù)共享網(wǎng)的被鏈接次數(shù)最少,但也有1家友情鏈接網(wǎng)站。
在中國(guó)知網(wǎng)的“參考文獻(xiàn)”字段檢索各個(gè)科學(xué)數(shù)據(jù)共享平臺(tái)的名稱,調(diào)查其被引情況(見表4),檢索時(shí)間為2016年4月1日。調(diào)查發(fā)現(xiàn),地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)的被引次數(shù)高達(dá)96次,被引次數(shù)最少的先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)也有4次被引記錄。由于無(wú)法全面獲取各平臺(tái)精確的科研支撐信息,故僅以地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)為例,分析該平臺(tái)的科研支撐情況。據(jù)統(tǒng)計(jì),地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)共為2 384項(xiàng)國(guó)家重大科研項(xiàng)目/課題,青藏鐵路、載人航天工程等35項(xiàng)國(guó)家重大工程建設(shè)項(xiàng)目,汶川地震急應(yīng)決策與災(zāi)后規(guī)劃、北京奧運(yùn)空間環(huán)境保障等34個(gè)民生工程提供了數(shù)據(jù)支撐服務(wù)[6],向全社會(huì)無(wú)償提供了從國(guó)外引進(jìn)的陸地資源衛(wèi)星影像21 726景,僅此一項(xiàng)就為應(yīng)用部門節(jié)省經(jīng)費(fèi)約8 256萬(wàn)元[7]。在該平臺(tái)的支撐下,各參加單位共申請(qǐng)到各類科技項(xiàng)目67項(xiàng),合計(jì)經(jīng)費(fèi)12 1402萬(wàn);發(fā)表科技論文/專著572篇;獲得國(guó)家、省部各類科技獎(jiǎng)勵(lì)19項(xiàng),申請(qǐng)專利12項(xiàng),申請(qǐng)軟件著作權(quán)27項(xiàng)[8]。通過(guò)以上數(shù)據(jù)不難發(fā)現(xiàn),科學(xué)數(shù)據(jù)共享平臺(tái)在用戶的工作、學(xué)習(xí)、科研中所發(fā)揮的巨大作用。表4科學(xué)數(shù)據(jù)共享平臺(tái)的用戶服務(wù)統(tǒng)計(jì)
平臺(tái)注冊(cè)人數(shù)(人)訪問(wèn)量(次)被鏈接次數(shù)(次)被引次數(shù)(條)中國(guó)氣象數(shù)據(jù)網(wǎng)96 011124 746 3632416國(guó)家地震科學(xué)數(shù)據(jù)共享中心6 9513 782 8052264國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)310 0001 540 000125國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心25 5901 448 6323345林業(yè)科學(xué)數(shù)據(jù)中心30 0003 000 000464地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)94 21218 133 2433196先進(jìn)制造與自動(dòng)化科學(xué)數(shù)據(jù)共享平臺(tái)——49 733 482144交通科學(xué)數(shù)據(jù)共享網(wǎng)————119
4結(jié)語(yǔ)
41平臺(tái)存在的不足
我國(guó)的科學(xué)數(shù)據(jù)共享平臺(tái)經(jīng)過(guò)十余年的建設(shè),形成了較為完備的科學(xué)數(shù)據(jù)資源共享體系,取得了顯著的經(jīng)濟(jì)社會(huì)效益,但仍然存在一些不足。
411安全性有待提高
科學(xué)數(shù)據(jù)共享平臺(tái)整合了海量的科學(xué)數(shù)據(jù)資源,其中包含很多涉及經(jīng)濟(jì)、科技命脈乃至國(guó)家安全的重要數(shù)據(jù),以及注冊(cè)用戶的大量私人信息,因此極易遭受黑客攻擊。農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心、交通科學(xué)數(shù)據(jù)共享網(wǎng)都發(fā)生過(guò)SQL注入漏洞,導(dǎo)致網(wǎng)站癱瘓,用戶信息大量泄漏。今后應(yīng)加強(qiáng)平臺(tái)的網(wǎng)絡(luò)與信息安全技術(shù)防范,建立政治類、災(zāi)害類、黑客攻擊類網(wǎng)絡(luò)安全分類管理措施和應(yīng)急保障體系[9],進(jìn)一步優(yōu)化和完善平臺(tái)數(shù)據(jù)容災(zāi)系統(tǒng)。
412資源更新滯后
科學(xué)研究和科技創(chuàng)新對(duì)科學(xué)數(shù)據(jù)的時(shí)效性有著較高的要求,但平臺(tái)的網(wǎng)站內(nèi)容和數(shù)據(jù)資源更新頻率較低。以國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)為例,其現(xiàn)有資源中,有明確更新維護(hù)方案的數(shù)據(jù)集僅200余個(gè),尚不足資源總數(shù)的1/3[2]。為提高平臺(tái)的資源共享效果,保證服務(wù)的長(zhǎng)期可持續(xù)發(fā)展,平臺(tái)應(yīng)對(duì)匯交和整合的數(shù)據(jù)資源,以及平臺(tái)的管理、業(yè)務(wù)、服務(wù)等新聞信息進(jìn)行及時(shí)更新,確保資源的時(shí)效性。
42今后的改進(jìn)方向
從進(jìn)一步充實(shí)科學(xué)數(shù)據(jù)共享平臺(tái)的數(shù)據(jù)資源,提升科學(xué)數(shù)據(jù)共享平臺(tái)的服務(wù)能力,改善用戶體驗(yàn)的角度考慮,平臺(tái)建設(shè)者今后還需要努力做好如下3個(gè)方面的工作。
421豐富數(shù)據(jù)資源
平臺(tái)的數(shù)據(jù)資源以國(guó)家和地方科研項(xiàng)目產(chǎn)生的科學(xué)數(shù)據(jù)為主,今后須進(jìn)一步拓展數(shù)據(jù)資源整合的區(qū)域范圍和數(shù)據(jù)類型,加強(qiáng)國(guó)際數(shù)據(jù)資源的引進(jìn),重視網(wǎng)絡(luò)數(shù)據(jù)資源的收集組織,提高數(shù)據(jù)資源形成、成長(zhǎng)、成熟、衰亡過(guò)程的全鏈條式管理,為用戶提供更加豐富的數(shù)據(jù)資源。
422提升服務(wù)能力
隨著數(shù)據(jù)密集型應(yīng)用的發(fā)展,科研人員在科學(xué)研究的各個(gè)環(huán)節(jié)都更加依賴系統(tǒng)和專業(yè)的、經(jīng)過(guò)科學(xué)分析和整理的科學(xué)數(shù)據(jù)[10]。平臺(tái)應(yīng)加強(qiáng)以用戶為中心聚合資源和服務(wù)的能力,力爭(zhēng)成為用戶工作環(huán)境和科研流程的有機(jī)組成部分[11]。平臺(tái)需以可視化和智能化的數(shù)據(jù)獲取為目標(biāo),研制在線數(shù)據(jù)處理分析工具,實(shí)現(xiàn)以數(shù)據(jù)內(nèi)容服務(wù)為核心,向“數(shù)據(jù)—工具”一體化服務(wù)轉(zhuǎn)變。
423完善定制化服務(wù)
針對(duì)平臺(tái)的建設(shè)信息、新聞信息、數(shù)據(jù)資源等的頻繁更新,平臺(tái)可以結(jié)合用戶的興趣愛好以及行為特征,采用基于RSS的聚合方式,為不同的用戶群組織不同結(jié)構(gòu)的RSS文件,并推送給對(duì)應(yīng)用戶[12];或者為數(shù)據(jù)需求量大的機(jī)構(gòu)建立機(jī)構(gòu)門戶,及時(shí)發(fā)布和推送相應(yīng)的數(shù)據(jù)資源,方便用戶便捷地管理資料,及時(shí)高效地利用資源。
參考文獻(xiàn)
[1]胡兆珀.科學(xué)數(shù)據(jù)共享工程啟動(dòng)[N].科技日?qǐng)?bào),2002-02-06.
[2]李贊梅,孫海霞.國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)資源建設(shè)模式分析[J].醫(yī)學(xué)信息學(xué)雜志,2015,(10):72-76.
[3]王亮緒,吳立宗,南卓銅.基于B2C架構(gòu)的綜合性科學(xué)數(shù)據(jù)共享系統(tǒng)[J].遙感技術(shù)與應(yīng)用,2013,(3):355-361.
[4]諸云強(qiáng),劉潤(rùn)達(dá),馮敏,等.分布式地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,(1):245-248.
[5]苗茹,宋佳,王卷樂(lè),等.地球科學(xué)數(shù)據(jù)共享平臺(tái)建設(shè)思路與實(shí)踐[J].中國(guó)科技資源導(dǎo)刊,2014,(4):64-72.
[6]國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái).國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)簡(jiǎn)介[EB/OL].http:∥www.geodata.cn/aboutus.html,2016-03-21.
[7]地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái).地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)簡(jiǎn)介[EB/OL].http:∥www.geodata.cn/Portal/aboutWebsite/aboutus.jsp,2016-03-21.
[8]諸云強(qiáng).地球系統(tǒng)科學(xué)數(shù)據(jù)共享平臺(tái)建設(shè)與服務(wù)[J].中國(guó)科技投資,2011,(12):27-29.
[9]王蓉,廖明丹,劉磊.國(guó)家自然科技資源共享平臺(tái)安全保障措施研究[J].中國(guó)科技論壇,2007,(7):26-30,144.
[10]宋立榮.我國(guó)科學(xué)數(shù)據(jù)共享項(xiàng)目建設(shè)中存在的問(wèn)題及對(duì)策建議[A].International Conference on Engineering and Business Management(EBM2010)[C].2010:5141.
[11]趙勝鋼.國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享平臺(tái)體系結(jié)構(gòu)研究[D].北京:中國(guó)農(nóng)業(yè)科學(xué)院,2009:127.
[12]韓厚繼,肖慧,楊寧生,等.個(gè)性化服務(wù)在漁業(yè)科學(xué)數(shù)據(jù)平臺(tái)中的應(yīng)用探索[J].廣東農(nóng)業(yè)科學(xué),2012,(2):151-154.
(本文責(zé)任編輯:郭沫含)