李汶軒
摘 要:文章論述了大數據時代航空情報信息的主要特征,分析了現有航空科技競爭情報工作模式存在的不足,從大數據環境下航空科技競爭情報工作轉型的角度出發分別對大數據開發智能化情報分析研究系統的創建和個性化延伸情報產品服務模式的轉型途徑進行了初步探索。
關鍵詞:大數據技術;航空科技;競爭情報服務;工作模式轉型
中圖分類號:G350 文獻標識碼:A 文章編號:1671-2064(2018)21-0036-02
大數據時代的到來對社會各個領域產生了巨大的影響,大數據技術的迅速發展對傳統航空工業情報工作模式產生了較大的沖擊,對航空科技情報產品和服務模式帶來了革命性的變化,傳統單緯度的基礎數據的獲取方式、靜態的分析方法已經無法滿足使用者對數據的需求。大數據技術正在協助企業不斷的發展新業務,創新運營模式,優化和提高產品銷售策略和服務模式,已經成為了重要的生產因素。因此,將大數據管理和分析的智能化技術引入到航空企業科技競爭情報服務系統中,實現情報研究的智能化,建立大數據下航空情報信息服務的新模式,實現信息資源整合,打破傳統科技情報局限于基礎的情報信息服務方式。根據大數據感知環境因素和用戶需求,重點突出為用戶提供量身定制的個性化服務并推出航空競爭情報信息的插入與推送服務,使用戶得到延伸的情報信息服務,是大數據環境下的航空科技情報工作發展的一個重要方向。
1 大數據時代航空科技信息特征
情報學作為數據驅動的典型學科,對數據的依賴尤為明顯,大數據時代的到來使得數據在數量上呈現爆炸式增長。大數據的“大”也已經從早期的PB級規模發展到了EB、ZB、YB。與此同時,大數據下的航空科技情報信息的其他特征也逐步得到了挖掘和認知,大數據中出現了結構最為復雜的數字、文本、圖像、聲音、視頻等。大數據技術需要對航空科技信息中的數字、文本、圖像、聲音、視頻等異構數據進行整合,將時間維、空間維、本性維集于一體,這體現了大數據結構及成分的復雜性,其本質是數據內部和數據之間都存在著異構,即非結構化數據的大量存在。此外,大數據環境下信息資源日益呈現出細粒化、關聯化、和隱蔽化的趨勢。在處理航空情報信息時,需要對種類多、結構復雜的數據進行清洗。大數據對于用戶來說其意義并不在大,而在于有用的價值,細化分析粒度挖掘價值成本,將隱形的數據信息變成顯性的知識。
2 現有航空科技情報工作模式的不足
現如今隨著大數據技術的不斷發展,航空科技數據幾何級數的增長使得傳統一維的情報技術無法處理縱橫交錯的數據信息,且傳統的航空科技情報學分析處理方法得到的信息產品類型比較單一,特別是對異構數據之間(視頻信息、圖片信息等)的處理方式比較薄弱,比較明顯的是在處理圖像信息和影音圖片方面顯得后勁不足。這些特點決定了傳統的人工分析為主的工作模式不僅造成浪費人力資源,而且根本無法適應高速產生的數據群,造成漏檢或者誤檢等問題,從而導致所需的信息數據不全、分析結論不準確等問題。由于信息更新速度加快,現有的航空科技情報工作模式可能無法獲取最新信息數據,而導致情報產品失去時效性。除此之外,由于信息資源的隱蔽化,傳統情報的加工及獲取方式已經不再適應龐大數據需要,挖掘有價值的信息產品,數據噪聲成為影響情報工作效率的重要問題。
3 大數據環境下航空科技競爭情報工作模式轉型
現如今隨著大數據技術的不斷發展以及航空情報產品中的不斷引入,情報學研究中數據的采集和獲取范圍將會從單一的結構化數據轉變為加入更多的非結構化數據[1]。開發計算機智能分析技術將成為大數據時代數據域信息分析的主流模式,將普通的文獻檢索服務向基于大數據發現服務轉型,逐漸推進各個航空科技情報研究所大數據智慧計算的建設,逐漸減少人力投入,實現航空科技情報智能化計算,提高競爭情報的準確性和實效性。
3.1 利用大數據開發智能化情報分析研究系統
要實現大數據技術對航空科技信息數據的快速獲取、整合、分析首先需要建立功能完整的智能化情報分析研究數據庫,滿足多種情報數據信息承載需求,并建立情報數據的快速搜索體系,強化語義推理引擎功能,利用耦合大數據智慧計算原理與方法,使得異構大數據之間可以進行有效耦合,進一步解析,提取,分析處理多樣化格式(文字、圖片、視頻)數據,利用語義推理從文檔中智能提取信息,實現多維度、多條件文獻全文檢索[2]。完成檢索后,以大數據量為基礎進行多維度統計與分析,統計條件由用戶按需設置,并將統計和分析結果自動生成列表。例如分布統計功能,可按國家、按機型、按年份不同維度進行裝備數量統計,將統計結果通過數據表格、統計圖表(包括餅圖、柱形圖、折線圖多種形式)進行展示。例如;對比2016年米-26直升機和CH-53E直升機在各個國家的銷售分布情況,根據檢索的結果自動生成折線圖。那么在海量的信息數據中靠傳統的人工手段完成信息的搜索、統計、分析對比工作不僅會造成時間上的滯后性而且得出的數據并不一定全面、準確有效,這樣的情報搜集方式不符合情報學科時效性和準確性的基本要求,所以需要建立以大數據為基礎的功能化數據庫,完善信息存取統計與分析方式,滿足情報數據信息多維度、多條件的統計要求,特別是對異構大數據的處理及分析。除此之外,建立異構數據的耦合處理功能,例如,需要對D-136發動機性能信息進行搜索,利用自動大數據智慧計算調度出該發動機所有的詳細信息,如研制信息、技術數據、技術特點等,并搜索出該機相應的外形圖、接口圖及原理圖,并支持在線播放視頻,如該機的維護拆裝、工作原理、發動機運轉等。從所有類型的資源中調度出影響發動機性能的信息,使得非結構數據之間可以連接,并根據搜索的結果自動生成文檔。同時可與其他發動機型的參數進行對比,并對得到的信息進行整合統計分析處理,提高使用者對海量信息的處理效率及有價值信息的關注度,減少漏檢和誤檢的出現。從目前的數據發展和增長情況看,結構化數據的增長速度遠不及非結構化數據的增長速度,無論是將多類型的異構數據轉化為統一標準的中間數據,還是修改處理規則以適應復雜的數據格式,情報學技術和方法終將更加強調異構數據的處理[3]。該系統對于處理海量的、異構的競爭對手的信息起到了重要作用?,F階段正在對異構數據之間的智能化耦合技術進行不斷的探索,建立多維度、全方面的情報信息統計與分析方式,這也成為了航空科技情報產品未來發展的趨勢與方向,利用該系統可以對競爭對手的發展策略精選深度挖掘和信息過濾。情報信息統計與分析路徑圖1所示:
3.2 情報信息推送方式和內容的轉變
隨著大數據技術不斷介入,情報信息產品的服務方式不僅局限于被動的推送用戶定制的信息產品,可以根據感知大數據環境因素和用戶需求為用戶提供更好的服務,即對用戶通過獲取資源占有率和資源剩余能力進行分析即可得知當前的資源能否充分滿足用戶對情報信息分析結果的要求,并進行相關類型的、有針對性的、用戶可能感興趣信息的主動推送,提高延伸情報推送的價值。大數據環境下,更加強調情報學的相關性原理,海量規模的數據需要從相關的角度有效發現彼此之間的關聯實現有效組織。相關性作為大數據的本質特征之一,將從以因果聯系為主要研究目標中轉向數據和情報之間的普遍聯系,并進一步從這些普遍聯系中發現新的指示和情報[4]。楊蔚琪等提出圖書情報部門不再局限于基礎的信息服務,而應該為用戶提供量身定制的個性化服務,通過建立信息共享空間或者虛擬空間,使用戶得到延伸的服務,這樣就可以將用戶潛在的信息需求進行進一步的挖掘,使其隱形的信息需求顯性化,用戶需要的情報信息服務進一步得到擴展。例如:收集國外重型機靜強度指標參數資料。從個性化延伸情報信息的角度出發,首先要滿足用戶對國外重型機靜強度指標參數的相關需求,即對國外各個重型機型的抗墜毀指標和應急著陸指標(墜毀發生時最大允許的速度),以及飛行時的最大正過載系數等各個方面搜索相應的數據參數,除此之外數據庫還可以利用專業的相關性原理專業對疲勞學指標參數進行相關推送,即對國內外重型直升機疲勞/損傷容限設計與驗證資料、壽命指標及實際壽命的資料進行同步推送,這些相關的信息推送可以使得用戶對國外重型直升機強度設計有更加全面的了解,得出的情報產品更加全面、專業,滿足用戶潛在的信息需求,初步掌握競爭對手的未來發展計劃。
4 結語
傳統的情報工作方式已經無法滿足大數據時代航空科技情報信息數據量龐大、涉及面廣泛、更新速度快,存在大量的非結構化數據等特征的需求,為了適應這一發展的需求,充分掌握競爭對手的發展狀況,為我國航空產業發展提供可靠、及時和精準的情報服務,必須轉變現有航空科技情報工作模式,通過開發智能情報分析研究系統,積極開展情報產品主動推送服務,可以達成以下目標;
(1)實現航空科技情報分析研究的智能化,避免傳統工作模式存在的人為誤差,逐漸減少人力投入,提高航空科技情報分析研究的效率。(2)建立以大數據為基礎的智能化數據庫,可以實現信息數據全面、實時檢索和自動分類處理,并且可以完成相應的統計分析,并自動生成文檔。(3)利用情報學的相關性原理及大數據的環境感知因素實現主動信息推送,完成情報工作模式智能化轉型,提高競爭情報產品的準確率。
大數據技術成為產業轉型升級的助推器,經濟發展的新動力,國民經濟新的增長點。大數據對于情報學的意義在于它帶來了革命性的變化,情報服務方式、情報服務手段、情報服務理念等都將隨著大數據應用而做出改變。但目前我國這方面的成果還很少,仍然處于研發階段,但以大數據為基礎的智能化數據庫的建立已經成為航空科技情報發展的必然趨勢和方向,也為我國競爭情報的發展提供了一把利器。
參考文獻
[1]董克,邱均平.論大數據環境對情報學發展的影響[J].情報學報,2017,(9):886-893.
[2]朱定局.大數據智慧計算原理方法[M].科學出版社,2015.
[3]李綱,李陽.情報視角下的智庫建設研究[J].2015,(11):36-41.
[4]楊蔚琪.現代智庫建設視域下黨校圖書館的服務創新研究[J].現代情報,2014,(9):145-148.