關鍵詞:智庫;信息資源保障;資源建設;工程化思維
中圖分類號:S126 文獻標識碼:A 文章編號:2095-1795(2023)05-0027-07
DOI: 10.19998/j.cnki.2095-1795.2023.05.006
0引言
智庫( Think tank)又稱思想庫,是獨立于政治體制之外的政策研究和咨詢機構,為政府和委托機構提供一系列有價值的信息和決策支撐。智庫已成為決策者在處理重大問題時所依賴的重要社會力量。而智庫研究成果的得出,需要大量的信息資源作支撐。全面、及時、準確的信息資源保障體系可提高智庫成果的科學性和有效性,否則,智庫研究成果就會成為無源之水,產出效率和質量將大打折扣。可以說,信息資源已成為智庫的核心競爭力,建立一個可支撐智庫研究與服務的信息資源保障體系已成為智庫的一項重要工作。
學者們也在智庫的信息資源體系建設上做了初步研究。劉巖等在研究國內科技智庫建設現狀和特點的基礎上,分析了科技創新智庫的信息需求,從宏觀、中觀和微觀3個層面提出了建立科技創新智庫的信息保障體系。任福兵等構建了基于主客體信息需求的智庫資源保障體系,并提出了相關運行措施。黃曉斌等對蘭德公司的信息保障體系進行分析探討,提出了我國智庫信息保障體系建設的相關啟示。邱韻霏等提出了支撐智能情報分析服務的大數據資源體系框架結構及建設原則。然而,對信息資源保障體系研究較少,提出的智庫保障體系建設多為建設原則、措施和啟示。本研究構建了一個可支撐智庫研究的信息資源保障體系架構,以滿足智庫對資源的廣度、深度、響應速度等方面的需求。同時,低價值密度的海量數據,以及云計算、人工智能等技術的發展,也給資源體系的建設方式、流程、機制等帶來了革命陛的沖擊。將工程化思維引入信息資源建設過程,資源建設流程化、規范化,可有效提高智庫的信息資源保障能力和快速響應能力,大大提高資源建設效率和質量。
1信息資源保障體系構建原則
1.1目標明確
資源建設部門應緊密圍繞機構定位和智庫研究方向確定資源建設目標和方向,開展針對性、儲備性、前瞻性的信息資源保障體系建設,提出專業化、建設性、切實管用的信息資源保障解決方案,著力提高信息資源綜合保障能力和支撐能力。
1.2需求導向
智庫的核心工作是為政府決策、產業布局、科研部署等提供決策咨詢服務。信息資源保障體系建設的目的是為智庫及時提供完整、可靠、準確、及時和全面的信息資源保障服務。資源建設應以智庫長短期需求為導向,構建一個資源配置合理、能快速響應智庫全方位需求的優質資源保障體系。
1.3經濟性
信息資源建設需要大量的資金作支持。要充分評估資源建設各環節資金投入的必要性,特別是資源購置環節。在商業數據購置和開放資源本地化時要充分考慮資源獨占性、資源獲取難易程度、本地化必要性等因素,選擇最經濟實用的資源建設方案,實現數據獲取最優化。
1.4規范統一
信息資源來源廣泛、資源結構不一、形式多樣,需要采取統一的標準和規范進行處理和存儲。只有統一規范的數據資源才能進行下一步的分析利用、組織揭示。
2信息資源保障體系建設要素構成
在建設信息資源保障體系過程中,需涉及資金支持、人員保障、技術支撐和信息平臺等多個要素,這些要素相互依存、相互支撐,共同支撐資源保障體系的有序運轉。缺少任何一個要素,信息資源保障體系都難以建成并發揮其作用。信息資源保障體系建設構成要素如圖1所示。
2.1資金保障
充足的資金支持是信息資源保障體系建設的前提條件。信息資源保障體系涉及資源采購、數據采集分析工具研發、平臺運維及團隊建設等一系列工作,這些都離不開充足的資金作保障。情報機構在政府財政支持的基礎上,應積極探索多渠道、多層次、多元化的資金投籌措渠道,為資源建設提供充足的資金保障,在資金使用方面,應將資金投入到資源購置、技術研發、人才培養等自身信息資源保障體系建設的薄弱環節。同時,建立和完善符合信息資源保障體系運行特點的經費管理制度,嚴控資金使用,切實提高資金使用效率。
2.2人員保障
高質量的信息資源保障體系的建設離不開高素質的資源建設人才。新的科研范式及大數據環境的到來,對資源采集、處理、整合等環節都產生了顛覆性影響,對資源建設人員提出了更高的要求。為適應新時代資源建設的需要,應培養組建一支復合型、協同合作、結構合理的專業資源建設隊伍,特別是掌握大數據采集、建模、軟件研發等方面的信息技術人才。
2.3技術支撐
信息資源保障體系建設離不開強大的技術支撐。大數據技術、數據挖掘、人工智能等新興技術已滲透到資源建設的各個環節,借助現代信息技術方法研發網絡爬蟲工具、數據清洗工具、海量數據智能分析模型等,可大幅度提高資源建設效率,創新資源的建設與分析模式。因此,信息資源保障體系建設應注重新技術在資源建設各環節的應用。
2.4信息平臺
信息平臺是資源存儲、分析和使用的重要載體。資源批量采集、自動化處理、數據存儲、調用和分析工具嵌入等需要專業的數據建設平臺做支撐;同時,資源也需要一個對外開展服務的窗口,通過信息平臺將信息資源保障體系與服務對象建立連接,為用戶提供個性化的數據支持和知識服務;此外,還可通過平臺搜集用戶行為,分析發現用戶潛在資源需求,為前瞻性、儲備性資源建設找準方向。
3信息資源保障體系構建
建設高質量的信息資源保障體系是智庫開展研究與服務的基礎。在明確資源構建原則和各要素支撐下,資源建設部門應盡可能全面集成各領域、各類型、各層次的數據,構建一個具有前瞻性、儲備性、類型完整、內容全面、統一規范、深度知識化組織及持續動態更新的優質資源保障體系,以實現對情報研究和服務對象資源需求的快速響應和高效知識服務。資源保障體系架構如圖2所示。
3.1原始數據層
根據數據獲取手段,將原始數據分為直接獲取資源和間接獲取資源。
(1)直接獲取資源包括調研數據、訪談數據、試驗數據及通過人際關系網絡獲得的一手數據。調研數據和訪談數據是研究人員通過實地調研、問卷調研、直接訪談等方法獲得的一手資源;試驗數據是指研究人員為完成數據分析和情報研究形成的算法、模型、統計預測等試驗數據;人際網絡數據是指在與人交流過程中獲得的相關數據源或情報線索。
(2)間接獲取資源包括公開資源、商業資源、灰色資源、共建資源、內部資源和其他間接來源。公開資源包括公開發行的圖書報刊等印刷資源和互聯網資源。其中,互聯網已成為政府.組織、機構等發布信息的重要平臺,是信息資源保障體系建設的重要渠道。商業資源通常具有資源獨有、數據權威、連續性好、完整度高和數據質量高等特點,如中國知網、SCI、德溫特等商業數據庫,購買引進商業數據庫是信息資源保障體系建設的重要組成部分。灰色資源是指通過非公開渠道獲得的非密級限制、非公開的資源,灰色資源往往具有較高的情報價值,可通過與政府機構、相關研究機構及權威專家建立友好合作關系,以及對機構官網、論壇、社交網絡資源深度挖掘而獲得。內部資源是指在情報分析研究過程中形成的研究報告、數據分析等研究成果。這些資源可作為未來相關研究的信息源。除以上集中方式外,還可通過與其他機構合作共建、參加相關會議、舉辦研討會和論壇等方式獲取相關資源。
3.2基礎數據庫
各類原始數據通過數據采集、數據處理、數據集成和數據審核等一系列流程和質量控制規范,形成標準化、規范化的數據資源,建成支撐情報研究的基礎數據庫。此過程需要大數據采集技術、數據自動清洗技術、數據自動標注及數據智能分類等技術做支撐。基礎數據庫按資源在智庫研究中的不同作用可分為內容類數據庫群和輔助類數據庫群。內容類數據是支撐智庫研究的主要數據,可根據資源內容類型分為政策規劃類、新聞資訊類、人才類、機構類、科技投入類、科技產出類和產業數據類7大類數據庫集,每類下設若干小類。輔助類數據包含數據源指向庫和工具類數據庫。數據源對資源保障體系建設至關重要,數據源指向庫是對數據源內容、來源機構、網址等進行詳細記錄,可輔助資源建設人員和情報人員快速定位相關信息源。同時,針對開放共享、長期維護、來源權威和功能滿足情報分析需求的專業數據庫,沒必要重復性本地化資源建設,可通過建立數據源指向庫為智庫研究人員提供支撐。工具類輔助數據是在情報分析研究過程中對內容類數據進行分析、組織等需要的輔助性數據,如詞表庫、領域本體庫、數據分析模型及算法等。
3.3專題知識庫
智庫研究要注重將數據向知識轉化,以提高資源利用價值,更好地為情報研究提供支撐。基礎數據庫可為智庫研究提供基礎數據支撐,但此時資源是按資源類型分散存儲于數據庫中的數據,尚未轉化成用戶可理解與有價值的知識。為此,應在匯聚豐富數據資源的基礎上,運用本體、文本挖掘、多源數據融合等技術方法,對不同資源間進行聚合關聯,挖掘資源之間的關系,形成細粒度語義化知識網絡,并圍繞智庫研究重點、服務對象需求和項目需求,靈活構建專題知識庫。如圍繞政府部門產業決策需求,構建人工智能、生物醫藥、現代種業和智能裝備等高端產業專題知識庫,建設覆蓋產業鏈條、實現深層知識組織與知識發現的資源體系,為政府決策和智庫研究提供專題數據支撐和知識服務。
4信息資源保障體系工程化建設流程
信息資源保障體系框架為資源建設指明了方向,資源建設部門應有計劃、分階段地逐步推進資源建設工作。大數據時代,要做好支撐智庫研究的信息資源保障體系,需將工程化思維引入其中。工程化思維是一種在目的導向下,通過把經驗、技巧、常識和知識進行固化、理論化、規范化,建立起一個可重復創造有價值產品的最優系統。工程化思維下的資源保障體系建設是將資源建設制度化、流程化、標準化。資源保障體系建設一旦得以工程化運作,將有效提高智庫的信息資源保障能力和快速響應能力。本研究提出了一套信息資源工程化建設流程,如圖3所示,將資源建設內容確定、數據源獲取與甄選、數據采集、數據處理、數據組織和數據服務等流程進行規范與固化,從而提高資源建設的質量和效率。
4.1明確資源建設內容
根據資源建設框架、智庫研究需求、項目任務等明確資源建設內容,并由資源建設負責人分解細化成一個個具體的資源建設任務,清楚闡明任務的具體要求和目標。
4.2數據源獲取與甄選
數據源對資源建設至關重要。在接到具體的資源建設任務后,數據源分析人員根據自身經驗積累、網絡調研、專家調研和人際網絡等方式摸排獲取相關數據源。其中,針對任務領域完全不了解、無相關數據源積累的建設任務,網絡調研是了解任務、獲取信息的重要渠道。數據源分析人員通過各類搜索引擎發現任務相關蛛絲馬跡,通過其引導抽絲剝繭獲得任務相關數據源。當一個任務出現多個數據源時,需通過數據源甄選指標體系,從數據可獲取性、權威性、相關性、完整性和延續性等指標遴選出優質數據源,以確保資源的權威可靠、及時全面。
4.3數據采集
在明確數據源的基礎上,根據資源來源機構、資源是否公開、資源獲取難易程度、是否有商業數據庫、商業數據報價等情況進行綜合分析評估,選取網絡資源采集、人工自建、商業數據購買、數據交換、合作共建和內部渠道獲取等多元化采集方式進行數據采集。其中,網絡信息資源采集是資源采集的主要渠道。數據源確定后,數據源分析人員對采集網站結構、資源分布、目標資源特征等進行深入分析,協助技術人員確定采集策略、采集內容和采集周期,技術人員根據要求選擇合適的采集工具或方法對目標資源實現針對性、批量采集。
4.4數據處理
數據處理包括數據清洗、數據標引、數據分類、數據集成和數據組織等流程。隨著大數據、人工智能等新一代信息技術的發展,給數據處理方式帶來了革命性的沖擊,數據處理朝著自動化、智能化方向發展。利用機器學習、文本挖掘等智能化技術研發一系列相關模型工具,可實現資源自動化深層次的分類、標引、抽取、轉換融合與語義化組織。
4.5數據審核
嚴格科學的程序規范是確保資源建設質量的重要保證。資源建設各環節應嚴格執行相關建設標準與質量控制規范,加強過程質量把控,資源建設完成后要實行系統自測、審核人員二審和數據負責人終審的三審機制。通過對過程和結果的全程把控確保資源建設質量。
4.6數據服務
信息資源可通過知識服務平臺、知識庫產品和數據定制3種形式為智庫研究和服務對象提供數據支持和知識服務。一是通過數據服務平臺這種自助式數據服務形式為用戶和內部研究人員提供基礎數據服務和專題知識服務。用戶可通過平臺自主查詢獲取所需數據。智庫內部研究人員具有更高權限,可查看更多未對社會開放的內部資源,數據篩選、可視化、分析功能也更為強大。二是建成知識庫產品,以商業化運營的形式提供專業數據服務。三是根據用戶需求,開展數據定制服務,為用戶提供個性化的知識服務。
5農業信息資源保障體系建設實踐
北京市農林科學院是一所市級農業科研院所,其情報學科歷史悠久。近年來,北京市農林科學院知識管理與情報研究團隊逐步向智庫轉型,初步建立了“智庫型”農業情報服務體系,建成了北京農業智庫平臺和數據中心,逐步探索出一套工程化的農業信息資源建設模式,取得了一定的成效,有力支撐了農業科技情報研究與服務。
5.1初步建成農業信息源庫
以“支撐智庫研究、支撐政府決策、形成數據產品”為目標,以政府決策和農業科技創新需求為中心建立信息資源建設框架,開展資源保障體系建設。信息源的搜集與篩選則是資源建設的基礎。團隊對國內外政府部門、國際組織、學協會、科研機構及大型企業等進行全譜系掃描,梳理出中國、美國、英國和日本等19個國家和聯合國糧食及農業組織(FAO)、國際種子聯盟(ISF)等國際組織,以及大型企業、科研機構、新聞網站共547個農業相關信息源,形成數據源指向庫,為農業科技信息檢測及資源建設奠定基礎。
5.2建立“機器+人工”農業信息監測與采集機制
搭建了農業科技信息監測系統,實現對目標源的7×24 h實時監測與資源自動采集。情報人員采用“國別+農業細分領域”矩陣形式進行人工監測。通過“機器與人工相結合”的農業信息監測與采集機制,實現對全球農業科技信息的及時、高效監測與采集。
5.3建立北京農業智庫平臺數據中心
通過監測系統、人工自建、商業數據購買和數據交換等方式采集到的農業信息資源,經過一系列數據處理流程,轉換成規范化數據。在數據處理過程中,研發應用了關鍵詞自動標引、農業信息資源自動分類、地域信息自動提取等智能化工具,有效提高了數據處理效率。
初步建成了北京農業智庫平臺數據中心,如圖4所示,形成了覆蓋全球重要國家和國際組織的政策規劃、資訊報告、人才機構、科技數據和產業數據等8大類15小類豐富優質農業信息資源,形成30余個專題數據庫,數據量達100余萬條,為農業智庫研究與服務提供基礎數據支撐。在此基礎上,圍繞北京市和北京市農林科學院農業科技創新重點方向,運用文本挖掘、多源數據融合、知識關聯等技術方法,對農業信息資源主題進行抽取、匹配、重組,構建了現代種業、農業生態環境等農業細分領域專題知識服務門戶,如圖5所示,實現專題資源的聚合關聯、集中展示和專題知識服務。
6結束語
全面優質的信息資源保障體系能夠為智庫提供強大的資源保障和信息搜集、處理和分析功能,有效提升智庫的研究能力、成果質量、服務質量和競爭力。闡明了信息資源保障體系的建設原則、構成要素,搭建了原始數據、基礎數據和專題知識3層信息資源保障體系框架,明確了資源工程化建設各環節標準流程,以期對支撐智庫的信息資源保障體系建設提供方案,并對北京市農林科學院的農業信息資源保障體系建設實踐做了介紹。信息資源保障體系建設是一個復雜的工程,資源建設制度保障、各環節攻堅難點、新技術應用等方面仍需進一步研究與探討。
行業動態
農業農村部部署開展全國糧油等主要作物大面積單產提升行動
近日,農業農村部召開視頻會議,部署開展全國糧油等主要作物大面積單產提升行動。會議強調,要充分認識開展大面積單產提升行動的重要性和緊迫性,科學確定單產提升的思路目標和技術路徑,強化措施保障,扎實推進單產提升工作盡快落地見效。
會議指出,我國農業生產仍是“單技術為主、小面積示范”的傳統推廣模式,大田生產技術到位率不高,主要糧油作物的單產還有較大提升空間。要采取分層次推進的方式,將產能提升最為迫切、單產提升潛力最大的大豆和玉米作為2023年單產提升行動的重點作物,通過充分挖掘地種肥藥各要素、耕種管收各環節的增產潛力,加快把先進實用的高質高效品種技術由點及線到面推廣開來,將試驗田示范田產量轉化為大田產量。
會議要求,各地要迅速行動,抓緊制定工作方案,明確技術路徑,加大政策支持,強化指導服務,分品種、分區域、分要素、分環節扎實推進各項任務落實落地。有玉米和大豆整建制推進任務的省份,要做到“一縣一方案”,列出實打實的保障措施,確保2023年單產提升工作取得明顯成效,打牢中長期單產持續提升基礎。
(來源:中國農業信息網http://www.agri.cn/V20/ZX/nyyw/202304/t20230423 7976737.htm)