馬玲官 汪偉
武警安徽總隊 安徽 合肥 230031
情報服務領域如今正在面臨著服務水平與數據信息處理兩者之間的矛盾,在信息化社會的背景下,當前的所有行業都開始面對“大數據”趨勢,對數據信息的需求量逐漸加大。在情報服務領域,人們也需要對信息大數據進行深入解讀與積極引用,保證情報服務的健康發展。
如今社會正在向信息化方向快速發展,大數據已經成了關鍵戰略資源,具有極其重要的社會地位,在社會平穩發展、隱私保護以及國家穩定安全上,數據一直在發揮著極為關鍵的功效。隨著如今信息的發展,人們獲取數據信息的渠道愈發容易,傳統數據信息的搜集以及整理手段已經無法為情報服務提供太大的作用,因此,當前情報服務工作人員正在尋求一種更為先進的工具,為人們提供更為專業的服務。
通常情況下,人們認為PB以上的數據信息就可以將其稱為大數據或者運用傳統手段無法有效處理的大量數據信息稱為大數據。大數據是將通過跨域關聯、多源異構等大量數據信息進行深入分析形成的生活形式、商業模式或者決策方法的總和,從此可以看出,大數據具有時效性極強、數據龐雜以及多樣化等特征,人們需要應用新型的算法技術對大數據進行處理[1]。
大數據處理是對海量數據價值的提煉,其處理流程包括數據采集、數據預處理、數據存儲和管理、綜合分析和應用等技術。
(1)大數據采集技術。大數據采集是指通過傳感器數據、標準資源庫、內部數據庫、社交網絡交互數據及移動互聯網數據等方式獲得的各種類型海量數據。在大數據采集過程中,重點涉及網絡爬蟲、高速數據全映像等大數據收集技術。
(2)大數據預處理技術。大數據處理技術完成對已接收數據的辨析、抽取、清洗等操作。因獲取的數據可能具有多種結構和類型,數據抽取過程可以幫助我們將復雜的數據轉化為單一的或者便于處理的構型,以達到快速分析處理的目的;對于大數據,并不全是有價值的,有些數據并不是我們所關心的內容,而另一些數據則是完全錯誤的干擾項,因此要對數據通過過濾“去噪”從而提取出有效數據。
(3)大數據存儲和管理技術。大數據存儲與管理是指用存儲器將采集到的數據存儲起來,建立相應的數據庫,并進行管理和調用。由于數據來源的廣泛性,會帶來數據格式的多樣性,因此在設計數據存儲時要考慮數據庫的擴展性和兼容性。數據存儲和管理技術主要涉及分布式文件系統(DFS)、能效優化的存儲、計算融入存儲、大數據的去冗余、數據庫等技術。
(4)大數據分析及挖掘技術。大數據分析技術實現對數據的深加工,根據業務需要,建立適用于業務的數據統計分析模型,運用數據分析、數據挖掘、深度學習等算法從海量數據集中挖掘出數據內在的價值,為業務工作提供數據和決策支持[2]。
(1)應用于情報識別。信息大數據自身具有極強的工作敏感性,可以快速準確地從信息庫之中尋找到關鍵數據信息。情報識別涉及的類型與范圍都較廣,其包含情報數據、判別識別以及目標識別。情報數據主要包含背景信息、共性信息、發展現狀等信息;判別識別主要包含關鍵、敏感信息以及虛假數據信息識別等;目標識別主要包含目標特征識別、條件識別以及合作關系識別等。此類識別任務在開展過程中都需要有效應用大數據,從而對網頁、論文等信息數據進行大量搜集,并深入進行對比分析,找到真實可用的數據。
(2)應用于情報追蹤。為了充分發揮情報服務的最終功效,情報服務行業需要準確及時地獲取到最新的數據信息,對重要機構與技術進行定期持續追蹤,掌握實時方向與進展。情報追蹤主要包含對主要技術進行追蹤、對先進科技進行追蹤并對重點問題進行追蹤,像日本核泄漏的監測以及追蹤阿波羅計劃等。利用科技信息大數據技術可以對多種渠道的數據信息進行有效收集,并可以及時捕捉到最新的數據,從而保證最快捷最全面地為情報業務工作提供支撐。
(3)應用于情報比較。情報服務本身就具備濃烈的對比特征,因此,在情報服務工作之中,比較是極為重要的環節,同追蹤與識別不同,比較更注重對對手形勢與競爭地位的數據信息進行分析。情報比較包含各個區域科技比較、核心競爭力比較以及創新力比較等多個方面。
(4)應用于情報預測。情報預測包括未來機會預測、關鍵事件預測以及時間預測等,機會預測主要有市場機會預測、應用科技預測等;關鍵事件預測主要有結點事件預測以及獎項預測等;時間預測主要有峰值預測以基金申請量預測等[3]。比如若想要對我國雄安新區日后政策的發展與走向進行分析,就必須運用科技信息大數據對領導人物傳記、講話以及政策文本進行收集,對領導人的決策方向與模式進行深入分析,對政策走向的因素進行梳理,利用數據分析的總結對日后發展的方向以及趨勢進行情報預測。
在信息化的社會中開展情報服務必須要積極應用科技信息大數據技術,這不僅是社會發展的大勢所趨,更是行業發展所迫。情報行業需要依據科技信息大數據的具體特征,積極挖掘新技術,充分發揮大數據技術在情報服務中的功效,為情報工作及時精準地提供各項數據信息,有效達成跟蹤、比較以及預測等各類任務,完美體現情報服務的價值。