陳婭婷,張淑鳳,李佳澤,單琳
(中核戰略規劃研究總院,北京,100043)
自20世紀50年代起步以來,裝備科技信息工作發揮了重要的“耳目、尖兵和參謀”作用,為全面推進國防和軍隊武器裝備現代化建設做出重大貢獻[1]。目前,國家安全環境日趨復雜,傳統的裝備科技信息工作面臨著巨大挑戰,正處于創新發展的新時代。隨著信息技術飛速發展,大數據等前沿技術在軍事領域的廣泛應用,裝備科技信息工作也迎來了新的機遇[2,3]。如何在當前復雜環境下推動裝備科技信息工作創新發展,如何利用先進的信息技術手段從海量數據中獲取有價值的信息,如何借助大數據技術構建有效的裝備科技信息服務系統架構,是裝備科技信息工作當前亟待研究的問題。
裝備科技信息是指與武器裝備建設、管理和運用直接相關的可供交流的科技信息或科技知識,包括國內外武器裝備建設、軍事技術發展以及國防科研、生產活動中產生的科技報告、技術資源等各類科技信息[4]。國防科技和武器裝備發展建設規劃、計劃的制定,軍事技術發展方向、重點的確定,武器裝備和技術發展項目的擬定,都要有相應的科技信息作為依據[5]。裝備科技信息工作對于提高裝備管理決策效率、促進裝備科技創新發展和加快新裝備形成戰斗力等方面發揮著重要作用。當前,在裝備科技信息工作實際研究過程中,仍存在一系列阻礙因素和問題困難。
在大數據時代,數據成為了整個時代發展的核心,為加速裝備科技信息工作的進步提供了前所未有的機遇[6]。數據急劇增多使得裝備科技信息工作擺脫了信息匱乏的局面,但涉及不同領域和平臺、分布廣泛的信息資源大大增加了信息采集、分析處理的難度。目前,裝備科技信息工作技術手段落后,科研工作人員人工處置應接不暇,疲于奔命,無法全面搜集、深入處理信息,導致出現信息流失、低效、重復與失真等情況。然而,裝備科技信息工作追求快速、準確和全面,迫切需要高效的信息技術手段提高工作效率和成果質量。大數據、云計算、人工智能、自然語言處理等先進的信息技術以其自動化、智能化的功能和高效性,當仁不讓地成為可靠的中堅力量。
同時,由于裝備科技信息工作所使用的信息資源分布在不同的領域和平臺上,大量信息數據掌握在部門或個人內部,形成諸多孤立的小型信息庫,信息孤島嚴重,數據利用率低,無法發揮信息資源共享共用的最大效能,使裝備科技信息工作成果缺乏準確性和可信性。因此,加強裝備科技信息資源的溝通與合作,建立資源共享平臺,擴展信息資源并實現信息資源共享共用與裝備科技信息工作協同發展至關重要。
大數據環境下的裝備科技信息工作建立在數據集中的基礎上,朝著數字化、智能化、平臺化方向邁進,如圖1所示。

圖1 大數據環境下的裝備科技信息工作全流程示意圖
為裝備科技創新發展提供準確、可靠的決策服務需要大量、全面的數據支持。在裝備科技信息工作發展過程中,已積累了很多數據,部分已形成數據庫,如裝備科技成果庫、裝備科技項目庫等結構化數據集,但大部分為半結構化、非結構化的數據集,如文本類數據、圖形圖像數據、音視頻數據等。這些數據資源規模越來越大,結構多樣,存儲位置和形式不一致,但通過關聯與融合,呈現出巨大的分析挖掘與決策的參考價值。
大數據環境下的裝備科技信息工作,依托云存儲、分布式文件存儲等大數據存儲技術,構建裝備科技信息工作統一的存儲體系,將在傳統基礎設施中長期保存的分散、多樣的電子數據和紙質文件數字化,并存儲在存儲設施中進行統一管理,取代了傳統的存儲方式,實現對非結構化數據的特征提取和半結構化數據的內容檢索,便于對裝備科技信息工作的各類數據進行整理、交叉分析、對比和深度挖掘。
裝備科技信息工作歷來以信息收集、處理、分析與提供決策服務為主。在大數據環境下,數據來源激增給裝備科技信息工作帶來了豐富的信息資源,使信息多元化、廣泛化,但規模巨量的數據、多樣的數據類型、復雜的數據來源以及數據價值密度的降低也給裝備科技信息工作帶來了新的挑戰[7,8]。傳統的分析處理手段已無法處理海量的結構化、半結構化和非結構化的數據,大數據時代開啟了裝備科技信息工作新范式,人工智能、機器學習等新興信息技術使得研究范式向著以數據分析為主導的方向轉移。從傳統的提出問題、搜集相關信息、分析并生成研究成果轉變為主動采集數據、根據規劃進行數據挖掘分析、生成研究成果。
依托大數據技術,裝備科技信息工作可以更好地構建服務系統,借助先進的信息技術和方法工具,在大量采集裝備科技信息數據的基礎上,對裝備科技信息數據進行科學有效地組織、存儲、數據分析挖掘、成果展示等,從而發現國內外武器裝備建設、軍事技術發展可能出現的變化,對國防科技和武器裝備發展建設規劃提供有力的決策支持,從而促進裝備科技信息工作創新發展。
大數據環境下,利用大數據技術開展裝備科技信息工作,建立數據驅動型智能裝備科技信息服務系統,通過知識庫、采集和處理系統精確滿足用戶需求[9]。基于大數據技術的裝備科技信息服務系統的架構如圖2所示,主要為信息采集、信息共享共用、信息智能搜索、信息智能分析和成果展示提供統一管理和使用的平臺。該系統以裝備科技信息共享共用平臺為核心,依賴于巨量數據的分析挖掘獲得研究成果,利用了機器學習、自然語言處理等信息技術,實現了裝備科技信息工作從信息采集到應用的全流程各環節的智能化、規范化功能。整個系統綜合考慮了大數據的特性以及對接第三方應用系統,使得出的結果更加貼近實際,并符合科研工作人員的需求。

圖2 基于大數據技術的裝備科技信息服務系統架構
裝備科技信息需求規劃平臺提供用戶個性化信息采集需求定制服務和海量站點統一管理服務。用戶個性化信息采集需求定制服務:用戶統一規劃信息采集需求,系統根據用戶提供的信息采集對象、類型、范圍等需求進行數據自動采集工作。海量站點統一管理服務:實現對眾多信息采集渠道進行統一管理的功能,構建官方、社會、網絡等多維度信息采集對象,采用先進的信息技術對海量站點進行統一監督和自動實時的信息采集,通過人工智能等信息技術對海量站點進行訪問結果監督和反饋,例如監督站點的可用性,自動清理故障站點;監督站點關聯站點,豐富資源獲取渠道;監督站點的訪問和資源下載效率。
裝備科技信息共享共用平臺提供知識庫管理服務和權限管理服務。知識庫管理服務:在基礎數據庫的基礎上,根據裝備科技信息資源的類別,利用深度學習算法完成關鍵詞匹配,將數據重新分類后形成知識庫。通過將所具有的信息資源以及成果按照統一的分類系統,組織和存儲到統一的信息資源庫,并對同一事項形成的系統信息進行統一存儲和管理,消滅信息孤島,實現信息的有效共享,為管理者和決策者提供全方位的信息,以便于其作出正確的決斷。權限管理服務:考慮裝備科技信息的特殊性,提供精確的信息共享服務,用戶可根據裝備科技信息資源和成果的屬性、分類、知悉范圍等要素,對裝備科技信息資源和成果進行訪問控制設置,將操作權限細粒度化,實現信息共享的同時,保障知悉范圍可控和數據安全。
裝備科技信息智能搜索平臺提供用戶個性化檢索推薦服務。系統通過記錄用戶檢索信息的行為和習慣,將這些記錄進行分類和排序,利用深度學習方法,給用戶塑造檢索行為畫像,從而根據用戶的興趣點提供檢索優先排序,達到精準推薦的目的。
裝備科技信息智能分析平臺提供在線數據加工服務。利用提供的機器學習算法,用戶自定義數據挖掘模型,對采集的數據進行智能分類、統計,根據用戶目標進行綜合態勢、重點熱點等方向的關聯分析,從時間、人物、背景、項目動態、技術動態等多維度對資源進行畫像,從而在海量數據資源中挖掘潛在信息,為科研工作人員提供內容更深入、范圍更廣闊、聯系更清晰、分析更細致的智能分析服務,從而獲得準確、科學、可信的結果
裝備科技信息成果展示平臺提供可視化服務。根據用戶需要,運用可視化技術,將裝備科技信息研究成果以圖表、報告、畫像、知識圖譜等多種形式展現,加快用戶對數據的理解,便于快捷、清晰的提供裝備科技信息服務。
信息采集是裝備科技信息工作流程中最重要的也是最基礎的環節。然而,目前裝備科技信息的采集由科研工作人員獨自組織管理,缺少系統規范的采集程序,在信息采集范圍、質量、實用性以及時效性等方面沒有明確的要求。同時,由于科研工作人員技術水平高低不同,導致采集的信息的質量、準確度和實用性難以保證,不能客觀真實地反映出數據的結果。建立規范、統一的信息采集程序,有助于保證系統能夠收集到足夠全面的信息,大大提高信息的收集速度,以及保證信息的及時性和有效性。
大數據環境下,數據的存儲和傳輸方面都存在著許多的安全問題,一旦觸發很有可能引發一系列嚴重問題,造成極大的經濟損失,因此無論是政府機關還是企業,都需要對信息安全問題加以重視[10]。裝備科技信息服務系統的開放性和共享性,會加大病毒感染、數據泄露、數據強行上傳下載、數據惡意刪除、黑客侵擾等危害發生幾率,為此需加大安全技術投入力度,降低該系統安全故障發生幾率。目前常規的運維管理方式已經無法滿足大數據環境的快速變化,在實施信息安全防護工作的時候需要考慮到當前的信息安全技術發展,利用跟蹤監測技術、加密技術、數字簽名等先進技術建立安全防范機制,對數據信息進行保護,從而確保信息系統的安全性,避免數據信息遭受到破壞和盜竊。
人才是信息化建設發展的根本,裝備科技信息服務系統的建立和維護必須要有一支集數據分析挖掘與裝備科技信息研究等方面的復合型人才隊伍。因此,要建立完善的培訓機制和人才激勵機制,在引進高技術人才的同時,積極培養能夠掌握信息化技術和裝備科技信息研究的學習型人才,使工作人員除擁有專業高效的裝備科技信息工作能力外,還善用互聯網技術,為信息資源共享共用提供良好的技術環境,確保系統的穩定、健康發展。
大數據環境下信息資源豐富,存在著巨大的價值,構建基于大數據技術的裝備科技信息服務系統,有助于高效、準確的全面收集數據,挖掘潛藏的信息,為用戶提供準確科學的裝備科技信息服務。