郭亞平

[摘 要]數據作為基礎性戰略資源,已經成為社會發展的必然趨勢和社會變革的驅動力。本文介紹了大數據的產生背景、概念內涵和主要特點,提出了大數據背景下推進信息資源開發與利用面臨的問題,探討我國科技信息資源開發與利用的發展思路和初步進展,旨在為開展后續信息服務工作奠定基礎。
[關鍵詞]大數據;信息資源;信息管理人員
doi:10.3969/j.issn.1673 - 0194.2019.12.083
[中圖分類號]G322[文獻標識碼]A[文章編號]1673-0194(2019)12-0-02
0? ? ?引 言
隨著大數據時代的到來,數據不僅推動社會發展與變革,也提高了國家、軍隊各方面的競爭力和保障水平,給信息資源開發與利用帶來機遇的同時也帶來了挑戰。
1? ? ?大數據概述
1.1? ?產生背景
大數據產生的背景包括以下幾方面。第一,信息科技進步。信息科技的3個最核心基礎能力(信息處理、信息存儲和信息傳遞)飛速進步。第二,互聯網把每臺計算機連接起來,成為人們獲取各類數據的首要渠道。第三,云計算將分布式、高性價比的大量計算、網絡和資源集成管理,并將應用軟件簡化為服務。云計算是大數據處理的重要支撐,大數據依托云計算挖掘海量數據。第四,物聯網是互聯網的延伸和擴展,通過智能感知、識別等信息技術,廣泛應用于網絡中,在物與物間進行信息交換和通信,產生大量數據,其中,一些數據被持續收集起來成為大數據的重要來源之一。
1.2? ?概念內涵
“大數據”術語最早出現在apache org的開源項目中。大數據的意義是提高對巨量數據的專業化處理能力,實現數據增值,而不是掌握這些數據信息。大數據的概念是一種規模大到在獲取、存儲、管理、分析方面遠遠超出傳統數據庫軟件工具范圍的數據集集合,是海量資源和技術構架的統稱。大數據以海量數據為核心,泛指在以網絡為基礎,智能分析為手段,輔助決策為目標的資源、技術和應用的統稱。
1.3? ?特征
大數據的特征就是眾所周知的“4V標準”。第一,數量(Volume),即數據規模巨大,從現在的TB/PB級體量,很快進入ZB時代。第二,多樣性(Variety),即數據類型多樣,包括結構化數據和非結構化數據。第三,速度(Velocity),即數據處理快速,數據采集和處理時效性強。第四,真實性(Veracity),即追求高質量的數據。
2? ? ?大數據背景下推進信息資源開發利用存在的問題
2.1? ?數據管理與呈現數據面臨困難
信息管理人員面臨的首個難題是數據管理。各個單位的不同部門產生的數據形式多樣,結構復雜,標準不同,往往包括異構多源的各型數據,增加了數據采集、編輯與整合的困難。此外,網絡數據信息量大、價值密度低,干擾和劣質的信息影響了信息資源開發與利用的質效。在管理過程中,管理人員不僅要收集數據,還要通過集成和模型分析,呈現數據。
2.2? ?大數據技術要求高
數據管理依賴先進的技術手段。目前,大多數數據挖掘算法的計算復雜度高,計算任務耗時長,非常迫切地需要相關企業掌握適應大數據特征的新型加工處理技術。只有借助符合大數據特征的數據分析工具提供技術層面的支持,才能及時分析利用數據,抓住數據最佳時效,不影響人們對事物的認知與判斷,滿足數據的準確性、完整性、全面性要求,才能批量挖掘大數據信息,獲得有價值的數據,滿足動態數據處理需求。
2.3? ?信息安全問題頻發
隨著信息技術的不斷發展,網絡系統防護,專業數據備份、還原等信息要求越來越高,信息安全地位日顯突出。網絡信息泄露與竊密問題時有發生,網絡病毒層出不窮。信息技術的發展引起了信息內容、載體和傳遞方式的變化,也引起了很多意想不到的問題和糾紛。
3? ? ?在大數據背景下進行科技信息資源開發與利用的發展思路和內容架構
3.1? ?發展思路
在大數據背景下,緊緊圍繞科技信息工作的任務,針對基于大數據的資源體系構建、知識體系構建、情報智能分析等開展研究,收集各種渠道的信息,利用多種途徑推動應用技術發展,提高應用大數據作戰能力、情報感知能力,不斷完善自身建設,爭取在前沿研究等方面取得突破,形成有效信息挖掘與情報分析支撐能力,推動科技信息工作的發展與進步。
3.2? ?內容架構
目前,筆者所在單位還處于信息資源開發與利用的初級階段。信息中心購置服務器,搭建了服務器集群,基礎條件支撐環境已經實現高性能計算和高帶寬網絡通信,正在構建科技信息獲取平臺和信息重構與融合平臺,逐步實現科技信息采集、處理、管理和轉播服務,以及信息抽取、聚合服務。現急需建立一種有效的服務機制,在應用層面提升信息服務質量,實現信息資源互聯互通、資源共享和服務創新。應用體系架構如圖1所示。
4? ? ?信息資源開發與利用在大數據背景下的初步進展
云計算等新型信息技術推動了信息資源開發與利用的快速轉型,尤其是在大數據背景下,已經實現了數據轉換、傳輸、存儲、遠程獲取以及各類數據的分析與統計。此外,信息網絡和數據平臺已有一定規模,具備數據開發與利用基礎。目前,筆者所在單位在數據工程項目建設的基礎上持續開展數據采集與處理工作,為科研課題、裝備建設等工作提供信息支撐。
4.1? ?建立個性化服務系統
應用大數據技術提高了數據開發與利用能力,也提高了科技信息服務水平。筆者所在單位的信息中心每年根據工作重點確定服務主題內容,面對快速增長的數據,提煉有價值的信息,提供準確的信息資源。目前,筆者所在單位深度分析數據,建立個性化的數據分析模型,提供個性化信息服務。個性化服務系統主要包括用戶分析系統、信息推送系統、定題跟蹤系統等。
4.2? ?課題跟蹤服務
課題跟蹤服務涵蓋了信息搜集、傳遞及分析等多個方面。作為一種新型信息服務形式,打破了被動提供參考咨詢的傳統模式。目前,筆者所在單位指定信息服務人員為科研課題項目組搜集信息,專職人員跟蹤項目進度,獲得項目實時需求,利用現有資源與平臺搜集提供前沿性的信息資源,有效參與到單位建設中。
4.3? ?云搜索服務
云搜索是專業站內搜索和內容推薦系統,在分布式搜索引擎的基礎上,提供更穩定、實時、可靠的個性化、智能化信息。筆者所在單位定制開放云搜索服務,信息檢索人員可根據自己的需求尋找各種類型的相關數據信息,搜索方式靈活、搜索結果精準、搜索速度更快。
5? ? ?結 語
大數據為科技信息資源的開發與利用提供了信息平臺、技術支撐和保障,有助于解決信息管理服務效率低、信息資源分散、深層次開發不足、共享不足等問題。因此,要不斷提高信息資源開發與利用的廣度和深度,加大對大數據技術的扶持與投資,推動信息傳遞的共享化,充分發揮信息資源在推動科研、裝備建設等方面發展中的作用,不斷提高科技信息資源的價值。
主要參考文獻
[1]姜虹.大數據背景下圖書館信息資源的管理及利用[J].黑河學院學報,2016(7).
[2]李雪森,佟琳.淺談大數據時代信息技術的機遇與挑戰[J].信息安全與技術,2013(11).
[3]鄔賀銓.大數據時代的機遇與挑戰[J].唯實:現代管理,2013(5).
[4]曾方,黃紹斌,黃璐.大數據背景下政府信息資源開發利用供給機制探討[J].唯實:現代管理,2016(7).
[5]高峰,王劍.大數據背景下科技信息資源創新支撐能力研究[J].情報雜志,2018(10).
[6]黃雙穎.大數據環境下網絡信息資源的管理與利用研究[J].科技情報開發與經濟,2014(21).
[7]袁偉,石蕾.大數據背景下科技資源信息挖掘與利用的思考[J].中國科技資源導刊,2017(49).
[8]王學琴,楊劍,康磊,等.大數據驅動科技信息資源市場化開發利用[J].中國科技信息,2015(5).
[9]周萍.大數據背景下醫院檔案信息資源利用問題研究[J].檔案天地,2016(4).