司 莉,劉 莉
2013年9月習近平總書記首次提出“一帶一路”倡議,提出要打造“政策溝通、設施聯通、貿易暢通、資金融通和民心相通”新合作格局。實現“五通”必須保持信息暢通,作為“一帶一路”信息基礎設施建設的組成部分,“一帶一路”專題數據庫整合沿線國家多種數據資源,為“一帶一路”數據流通和共享搭建了橋梁。政府機構、科研機構與信息服務機構也紛紛依托自身資源和技術優勢,主持建設并開發具有多種服務功能的“一帶一路”專題數據庫。
“一帶一路”專題數據庫建設起步晚,研究集中在需求調研與資源建設方面。在需求調研方面,嚴丹等分析“一帶一路”研究的學科分布與信息資源需求狀況[1];李娟以西安交通大學絲路科技知識服務系統為例,探討“一帶一路”數字資源建設思路[2]。在資源建設方面,丁波濤構建了基于數據銀行的“一帶一路”資源整合模型[3];于施洋等歸納資源歸集思路與數據資源歸集類型,針對歸集難點提出解決措施[4]。已有研究為“一帶一路”專題數據庫建設提供了一定參考,但對“一帶一路”專題數據庫服務功能全面調研的較少,僅調研某一個或幾個數據庫[5-6],或僅對某項服務功能進行調研[7]。
2015年國務院發展研究中心信息網率先推出“一帶一路”研究與決策支撐平臺。2017年3 月由國家信息中心主辦的中國一帶一路網上線,旨在為沿線企業、社團和公民參與“一帶一路”建設提供信息服務[8]。隨后浙江一帶一路網、江蘇一帶一路網、陜西一帶一路網、湖北省一帶一路公共服務平臺等地方政府部門主導建設的專題數據庫平臺上線。科研機構、出版社、商業公司也進行了“一帶一路”專題數據庫建設探索。2015年西安交通大學主導建設的一帶一路專題庫上線,致力于服務“一帶一路”沿線工程科技人才[9]。2015 年7 月新華社推出“新華絲路”信息產品,提供一系列涵蓋“一帶一路”的個性化產品和服務。2016年中經網打造的“一帶一路”統計數據庫上線,旨在為政府部門戰略決策、政策制定以及學術研究提供數據支持[10]。“一帶一路”數據庫功能設計是實現數據庫服務的關鍵要素,為全面了解我國“一帶一路”專題數據庫服務功能開發狀況,筆者采用網站調查法和內容分析法,從數據導航、數據獲取、數據分析、數據服務、互動與幫助等維度入手,調研“一帶一路”專題數據庫服務功能開發現狀,分析存在問題,提出優化策略。
“一帶一路”專題數據庫是相關機構著眼于服務“一帶一路”倡議,利用資源優勢和技術優勢,通過收集和整合“一帶一路”沿線國家和地區政治、經濟、文化等領域的數據而搭建的數據資源服務平臺。截至2020年10月20日,我國共有43個“一帶一路”專題數據庫上線。筆者逐一登錄數據庫網站,發現有5 個數據庫無法訪問,因此將38 個專題數據庫列為最終調查對象,從數據導航、數據獲取、數據分析、數據服務、互動與幫助等方面進行調研,時間為2020年10月20日-11月10日,調研結果見表1。在數據導航方面,38個(100%)數據庫提供分類導航服務,17 個(45%)提供可視化導航服務。在數據獲取方面,32 個(84%)提供數據檢索功能,26 個(68%)提供數據下載服務。在數據分析方面,15 個(39%)具有主題數據分析功能,17 個(45%)提供檢索結果分析功能。在數據服務方面,15 個(39%)提供多語種服務,8 個(21%)具有個性化服務功能,9 個(24%)通過新媒體開展服務。在交互與幫助方面,12 個(32%)提供交流互動功能,13個(34%)具有幫助功能。“一帶一路”專題數據庫建設已取得一定進展,少數數據庫已通過多類型、多渠道的方式全方位為用戶提供服務,下文具體分析數據庫的服務功能建設情況。
(1)分類導航。38個數據庫均提供分類導航服務,其中27個根據資源組織方式設置二級導航菜單。根據本課題組前期研究,“一帶一路”專題數據庫的信息組織方式可以總結為資源-主題型、區域-主題型、功能-主題型、主題-主題型以及多維度綜合型5種。據此標準,對數據庫的信息組織形式進行調查,結果見表2。多維度綜合型是使用最多的二級分類導航方式,不采用單一資源組織標準,而是根據多維資源歸集方法進行導航,類目設置靈活,可擴展性較強,多適合大型數據庫平臺對多區域、多領域、多類型資源的導航,目前有16個數據庫采用該方式;6個采用資源-主題型二級導航方式;4個采用主題-主題型資源導航方式,香港貿發局“一帶一路”資訊網采用功能-主題型導航方式。

表2 “一帶一路”專題數據庫二級導航設置情況(部分)
(2)可視化導航。“一帶一路”數據資源涉及的國家(區域)多、時間跨度大,為使用戶準確快速地定位到所需信息,17個數據庫設置可視化導航功能,包括地圖、時間軸、主題詞云圖、知識圖譜4種可視化方式。地圖導航可以實現某地區信息的準確查找,時間軸導航可以實現某時間節點信息的快速查找,社會科學文獻出版社“一帶一路”數據庫采用地圖導航全景展示絲路沿線國家,用戶點擊地圖上某個國家便可了解該國的政治、經濟、社會、文化等信息,用時間軸記錄絲路大事記;主題詞云圖使熱點話題更突出,“一帶一路”冶金專題知識服務平臺的海外資訊模塊通過詞云圖方式可視化呈現熱點內容;知識圖譜可以使搜索更有深度和廣度,西安交通大學“一帶一路”專題庫課程資源模塊提供知識圖譜可視化展示功能,用戶使用圖譜便可了解視頻站點內容全貌,定位自己喜歡的課程視頻[9]。
(1)數據檢索。38個數據庫中,32個提供數據檢索功能,其中10個提供高級檢索功能。一些數據庫還設置其他檢索方式。比如,西安交通大學“一帶一路”專題庫提供知識圖譜智能搜索功能,實現視頻、文本等異構資源的高效管理與檢索[9];色諾芬(SINOFIN)一帶一路專題庫提供了擴展檢索和關聯檢索等功能。未設置檢索窗口的有6個平臺,分別是“走出去”公共服務平臺、上海市與“一帶一路”國家經貿合作信息服務平臺、張家港走出去服務平臺、西安財經大學“一帶一路”大數據平臺、清華控股“一帶一路”、金準“一帶一路”國別經濟數據平臺。從檢索結果處理情況看,大部分數據庫沒有對檢索結果進行處理,只能點擊檢索結果進入詳情頁面。僅7個數據庫可以對檢索結果進行處理,主要包括聚類、排序、篩選等。此外,個別數據庫還支持檢索記錄數統計、顯示檢索用時、相關檢索等。
(2)數據下載。26個數據庫提供數據免費下載、付費下載。大部分政府部門、科研機構提供免費下載服務,其中有些僅提供部分數據下載功能,如上海市與“一帶一路”國家經貿合作信息服務平臺中數據圖表不可下載。部分出版社或商業機構數據庫提供付費下載,如新華絲路網、“一帶一路”投資與貿易法律服務平臺、色諾芬(SINOFIN)一帶一路專題庫、RESSET一帶一路數據庫系列。
(1)主題數據分析。15個數據庫具有主題數據分析功能,通過對某一主題的數據進行統計分析,使用戶了解主題現狀和發展趨勢。上海社會科學院絲路信息網建立分類統計數據庫,對“一帶一路”沿線國家的產業、投資、貿易、金融、園區等數據通過折線圖、柱狀圖、餅圖進行分析。陜西一帶一路網通過柱狀圖、折線圖等方式對交通物流、對外經濟、宏觀基礎數據進行分析。
(2)檢索結果分析。該功能可實時處理用戶請求,允許用戶隨時更改分析數據的內容約束和限制條件。有17 個數據庫提供檢索結果分析功能,其中15個可以對數據內容進行分析。一帶一路統計數據庫提供多種分析工具,用戶可以根據自身需求選擇分析工具對檢索數據的某一指標進行分析[10]。一帶一路基礎知識庫、一帶一路資源中心數據庫可以對檢索結果文獻類型、來源期刊、學科分布等數據的外在信息進行統計分析。
(1)多語種服務。“一帶一路”涉及官方語言50多種,一些數據庫通過多語種服務功能來解決語言障礙問題。15個數據庫提供多語種服務,包括多語種轉換界面、翻譯服務、多語種資源同步提供3種方式。在多語言轉換界面方面,13個數據庫具有此功能,其中支持中(簡體)、英文轉換的數據庫最多——有8個,支持中(簡體、繁體)、英轉換的3個,提供4種及以上語言轉換的共有4個,詳見表3。

表3 多語言轉換界面的數據庫統計表
從多語種轉換界面的實現方式來看,部分數據庫只對題錄元數據進行語種轉換,字段值及原文是原有的語言。在翻譯服務方面,“一帶一路”共建國家標準信息平臺開發了翻譯云平臺,采用神經網絡翻譯技術和計算機輔助譯后編輯技術,提供多種格式標準文本、標準化文件資料和其他領域資料的快速中英互譯[11]。湖北省一帶一路公共服務平臺聯合傳神-語翼Woordee多語言在線人工翻譯平臺,提供一站式全場景翻譯服務[12]。在多語種資源同步提供方面,西安交通大學“一帶一路”專題庫宏觀經濟數據模塊提供中、英、俄、阿等語言類型的數據,新文圖信區域研究數據庫部分模塊資源可以同時用中英文顯示。
(2)個性化服務。數據庫平臺的個性化服務是指以用戶為中心,以網絡與信息技術為支撐,為用戶提供滿足其個體需求的一種集成性信息服務[13]。8個數據庫具有個性化服務功能,服務項目主要包括數據定制、產業研究、數據庫產品等。新華絲路網針對用戶具體需求,提供新華絲路海外活動、新華絲路教育與培訓、新華絲路產業研究等個性化服務[14]。“一帶一路”研究與決策支撐平臺可以針對用戶的個性化需求,依托權威專家資源和專業研究團隊,提供信息定制、宏觀經濟軟件解決方案、課題研究等專項服務[15]。社會科學文獻出版社“一帶一路”數據庫針對用戶研究課題與投資方向,對內容資源進行深度整合,創建符合用戶要求的個性化數據庫產品[16]。
(3)新媒體服務。在38個樣本中,9個建設主體專門為“一帶一路”專題數據庫開設新媒體服務功能。微信公眾號是數據庫使用最多的新媒體服務方式,已有8個數據庫開通微信公眾號,部分數據庫還提供多種新媒體服務方式,中國一帶一路網擁有App、微信公眾號、微博、知乎、抖音5種新媒體服務方式。“一帶一路”生態環保大數據服務平臺、亞太日報一帶一路服務平臺具有App、微信公眾號2種新媒體服務方式。陜西一帶一路網、新華絲路網、“一帶一路”產業地圖資源平臺可通過微博、微信公眾號進行服務。而湖北省一帶一路公共服務平臺、“一帶一路”工業和信息化產業資源平臺僅通過微信公眾號進行服務,新華絲路數據庫僅通過App進行服務。
(1)交流互動。12個數據庫提供交流互動功能。實現交流功能的主要方式有互動留言、在線咨詢、意見反饋、話題討論等。湖北省一帶一路公共服務平臺通過咨詢建議、話題討論2種方式實現與用戶交流,新華絲路數據庫提供記者觀察、推薦專家、研究機構3類咨詢服務。
(2)用戶幫助。13 個數據庫具有幫助功能。“一帶一路”專題數據庫主要通過常見問題解答FAQ、用戶使用手冊以及幫助中心為用戶提供幫助。新華絲路網提供一帶一路問答、絲綢之路問答以及海上絲綢之路問答3種常見問答。“一帶一路”經濟信息共享平臺(BRInfo)通過視頻和文檔的形式為用戶提供BRInfo平臺概述,指導用戶登錄和使用。
在多維度的資源組織中,分級導航方式可以更加精確地定位到所需信息,但目前建有的“一帶一路”數據庫最多采用二級導航方式,有待進一步細化。可視化導航方式能更加生動形象地展現資源特征,既增加數據表示的視覺效果,又增加用戶體驗。雖然地圖、時間軸、主題詞云圖以及知識圖譜等可視化導航方式已在部分“一帶一路”專題數據庫中得到了應用,但應用的數據庫數量較少,形式單一。
用戶知識需求具有多元化與精細化的特點,通過細粒度的“知識單元”發現更廣泛更適用的數字資源可以有效提高用戶的滿意度[17]。因此數據庫在分類導航設置上,可根據所收錄資源的內容和特點進行系統梳理,根據數據來源、數據類型、語種等進行細分,采用多重列類的導航方式,多視角、多層次、全方位地呈現數據庫資源。“一帶一路”數據資源具有覆蓋范圍廣、時間跨度大、異源異構異質等屬性[18]。可視化工具通過重新組織客觀知識,將資源按其屬種關聯以層次結構展現給用戶,并通過節點的展示和鏈接幫助用戶獲取具體資源[19]。為使用戶迅速定位到所需信息,“一帶一路”數據庫可基于數據覆蓋范圍繪制導航地圖,基于時間跨度繪制時間軸,基于主題熱度繪制詞云圖、基于“知識圖譜”組織數據生成可視化圖表等多種可視化導航方式全方位展示數據庫資源,如西安交通大學“一帶一路”專題庫。數據庫還應采用分類導航與可視化導航相結合的方式,使用戶對資源存儲情況一目了然,更加快速地定位到所需信息。
數據獲取方式直接影響用戶對數據庫資源的使用,便捷友好的數據獲取途徑更能吸引用戶,滿足用戶的數據需求[20]。大多數據庫檢索功能較為簡單,僅有10 個數據庫提供高級檢索功能,有6個數據庫甚至未設置檢索窗口。數據可下載率也不高,部分數據庫未提供數據下載功能,因此在數據庫建設時,應注重數據獲取功能的開發。在數據檢索方面,首先應加強對高級檢索功能的開發。高級檢索通過整合布爾邏輯算符、語種、顯示條數、發布時間等,實現對資源內容、數據量和時間的限定,提高資源查找的準確性,提升用戶體驗的滿意度[21]。同時,可根據數據庫特點采用專業檢索、對比檢索、擴展檢索、關聯檢索等多種檢索功能。此外,還應引入跨語言檢索功能,跨語言信息檢索旨在以某一語種構建查詢條件從多語種信息集合中檢出另一語種的信息[22],跨語言檢索系統可以幫助用戶克服“一帶一路”多語種數據資源檢索障礙,提高信息系統檢索的易用性和檢索效率[23]。數據獲取是數據重用的基礎,因此在數據下載方面,數據庫應盡可能提供數據下載鏈接,如不能提供可以將數據鏈接至所在網站;在格式方面,應盡量提供xlsx、csv、txt、xml、HTML等多種數據下載。
“一帶一路”相關信息缺乏關聯性,具有不連續、不系統、碎片化等特點,急需將動態資訊與結構化數據有機關聯,進行深度信息挖掘和分析[24]。但當前提供數據統計分析服務的數據庫較少,僅有15 個數據庫提供主題統計分析功能,17個數據庫可以對檢索結果進行統計分析,且多是將某一主題的數據以圖表方式呈現,以展現該主題的發展趨勢,沒有更加深入地對某一具體指標進行分析。
數據智能分析工具可實現異源異構異質數據集成,為深度挖掘和釋放多源匯聚的數據資源價值提供抓手[25]。數據庫可通過數據挖掘、機器學習、可視化分析等技術提升數據庫分析能力,提供多維度、多指標的交叉分析功能,以多種形式呈現數據分析結果,來全面支撐用戶的數據決策需求,驅動業務決策。此外,也要強化分析結果的加工,形成具有核心競爭力的“一帶一路”信息產品。可參考上海社會科學院絲路信息網,發布《“一帶一路”國家月度動態報告》《“一帶一路”節點城市系列報告》,從而為各級政府部門、企業界、研究人員等提供兼具時效性和專業性的動態分析報告[16]。
數據服務功能是“一帶一路”專題數據庫的重要服務模塊,也是體現“一帶一路”數據庫特色的重要功能。有部分數據庫提供3種以上服務功能,仍存在一定問題:(1)提供的語言種類有限,僅有4 個數據庫提供4 種以上語言轉換服務,且提供翻譯服務、實現多語種資源同步提供的數據庫有限;(2)新媒體服務方式單一,大部分數據庫僅使用微信、微博、App 中的一種或兩種進行服務;(3)提供個性化服務的數據庫較少,僅有8 個數據庫具有個性化服務功能。多語種服務可以有效促進數據庫的易用性[26],如Word Wide Science通過提供中、英、法等10多種語言檢索和翻譯服務,實現對70多個國家61 個數據庫及門戶的一站式搜索[23]。“一帶一路”專題數據庫可通過建立語料庫的方式,采用智能翻譯、神經網絡翻譯、人機交互機器翻譯等技術,提供智能、交互的多語種資源供給、轉換、翻譯等功能。新媒體服務方式可以滿足用戶對服務的及時性、互動性和移動性訴求,已成為用戶獲取資訊、參與閱讀活動的重要渠道和工具[24]。數據庫可借助App、微博、微信等多個平臺開展服務,同時也要注重數據庫與新媒體服務內容的相互銜接和融合,實現傳統數據庫服務平臺與新媒體服務平臺之間的聯動、信息互通和資源共享。此外,在信息爆炸的今天,用戶需求已不僅僅滿足于信息獲取,而是追求更個性化的服務[27],個性化服務是提高數據庫資源與每個用戶之間相關度的重要途徑[28]。因此數據庫應根據用戶需求,創新服務形式,對數據資源進行整合與深度分析,創建滿足用戶要求的個性化產品。如借鑒新華絲路數據庫的經驗,為各級黨政機關、企事業單位提供企業投融資分析、行業發展趨勢分析、項目風險評估與建議等個性化定制咨詢服務。
在Web2.0環境下,數據庫應當完善平臺的交互性能,提升交互服務的完備性和多樣性,采用好的交互工具、新的交互技術為用戶提供高質量的服務[27]。目前數據庫提供的互動交流服務大都采用留言方式,缺乏實時在線交流功能,且多為商業機構所建,數據庫大部分通過用戶使用指南、常見問答為用戶提供幫助,缺少智能問答功能。因此,“一帶一路”專題數據庫要加強互動交流功能,尤其要注重交互的實時性。
數據庫要提高“服務體驗”,應盡量滿足用戶交互需求[29]。數據庫可通過建立專業咨詢服務團隊,采用實時交流方式解答用戶疑問,通過互動留言、在線咨詢、意見反饋、評價等多種渠道引導用戶主動參與互動,如參考湖北省一帶一路公共服務平臺,設置包括咨詢建議、話題討論功能的互動服務模塊。在幫助功能設計上,智能問答系統由于能夠理解用戶自然語言提問,并將答案反饋給用戶,目前已在圖書館、電商平臺、公司網站等得到普遍的應用[30]。因此,數據庫建設者可以在優化原有功能的基礎上開發智能問答系統,將數據庫常見問題及其解答整理為規范的問答庫形式,以支撐各種形式問題的問答。
如何更好地為用戶服務是數據庫建設的關鍵問題,“一帶一路”專題數據庫功能設置是為用戶服務的基礎。本文對“一帶一路”專題數據庫的數據導航、數據獲取、數據分析、數據服務、互動與幫助等功能進行調研,發現“一帶一路”專題數據庫建設取得了一定進展,但同時也存在一些不足。“一帶一路”專題數據庫建設時可采用多維度的資源導航系統,準確定位數據資源;增強數據檢索功能,擴展數據獲取途徑;采用多樣化的分析工具,多角度呈現統計分析結果;擴展數據服務形式,深化服務內容;明確數據庫定位,加強互動溝通功能。在增強傳統服務的基礎上,“一帶一路”專題數據庫應基于數據庫服務定位開發特色服務功能,實現由單語種服務向多語種服務,從傳統的單向決策服務向雙向個性化服務轉變,由單渠道的數據庫服務模式向多渠道的新媒體服務模式轉變。