王 晶
(吉林省梨樹縣科技信息中心,吉林 四平 136500)
當前,大數據技術得到了快速發展,大數據技術在諸多領域起到了十分關鍵作用。大數據為科技情報研究工作指明了新的方向,應當就大數據的概念與技術手段進行充分研究,基于科技情報研究的需創新大數據技術的應用方式,總結大數據技術用于科技情報研究的有效對策。
目前,有關大數據技術的定義還處在完善階段,有關大數據的概念還未能形成統的一個標準。通常認為大數據是數量龐大、數據形式多元化和非結構化的數據。運用大數據技術可以在合理時間實現提取、管理、處理數據信息的目標,為實施科學的管理、決策、創新提供必要的依據。大數據技術具有數據容量大,數據類型多、流動速度快和價值密度低等特征。隨著數據信息海量增長,數據應用的難度日益提高,數據的流通速度不斷加快,有用信息的提取難度不斷提高。但是,大數據信息具有無限的應用價值,只有突破傳統技術思維應用的局限,能夠甄別淹沒在海量數據信息中的高價值信息,才能提出更加實用的數據信息,滿足科技情報研究的需要。
1)數據挖掘技術。數據挖掘本質上是指知識發現過程,強調從海量的、有噪聲的、不完全的數據信息中提取人們不知道的、隱含的數據信息。該過程涉及的領域較多,包括數據庫、機器學習、模式識別等技術。數據挖掘與情報研究有密切關系,運用數據挖掘技術可以發現情報研究工作中的轉換關系,發揮智能化輔助分析技術的作用,提高數據信息情報分析工作效率,縮短數據信息研究的時間。首先,應當做好數據種類劃分,運用識別功能對各種類型的數據信息進行分類整理,優化科技情感研究的適用標準。其次,數據挖掘技術具有多種組合形式,需要根據實際情況優化算法,并且進行適當的修正,同時對數據挖掘進行合理評價,從而提高數據提煉的精準性。
2)智能化研究技術。智能化技術涉及領域較為廣泛,是可以代替人工科技情報研究工作,提高科技情報研究工作的效率的方法。智能化技術主要包括了神經網絡、網絡分析、機器學習、模式識別、遺傳算法和預測建模等知識。基于智能化技術可以進行高級、深度、綜合科技情報分析,解決了復雜情報信息處理的問題。智能化技術還有樂觀于減輕科技情報研究工作強度,促進研究人員專注于優化研究方法與應用研究結果。在信息技術快速發展的背景下,科研情報研究工作不再局限于傳統的報紙書籍,還要重視網絡信息,包括圖片、音頻、視頻等信息,這樣可以拓展研究內容,運用數據信息技術對科技情報進行結構化處理,為智能化的應用科技情報做好準備工作。面對多元化數據信息,智能技術可以根據應用對象數據分析,從語義層次給予數據信息應用支持,適應了海量信息增長的需求,突破了信息識別模式的限制,消除了人為因素的干擾,保證了研究結果的準確性,而且推動科研情報研究工作更好的服務于科學技術的發展需要。
3)可視化技術。科技情報研究工作面對的數據信息具有零散、分散、類型多樣、結構復雜等問題。傳統的數據研究以人工分析為主,受到各種非結構性和不確定性因素干擾,很難形成標準化、流程化與規模化的分析研究模式,增大了科技情報研究工作的難度。大數據技術背景下可以采用可視化分析方法,構建完整的可視化圖表,通過圖表了解全部數據信息,并且可以看到數據分析的過程與數據鏈走向,這樣便于研究人員進行關聯性分析,再輔助開展人工研究。可視化工具有多種視圖,不同視圖的數據顯示功能不同,研究人員可以基于大數據技術進行網絡分析、空間分析與信息分析,并且可以實現人機交換,便于分析人員充分理解與運用數據信息。
1)強化大數據技術觀念。科技情報研究工作日益具有立體化、廣泛化、融合化的特征。應當聚焦數據信息綜合開展科技情報研究工作,逐步促進科技情報研究的深層次演進。首先,科技情報研究人員應當樹立大數據意識,認識到大數據時代科技情感研究工作的機遇與挑戰,掌握大數據技術,善于運用多種技術手段來挖掘科技情報信息。科技情報人員還要積極參與教育培訓,認真學習大數據技術,了解各種大數據技術的情報分析技術方法,不斷提高大數據技術應用水平,依托大數據準確的開展科技情感研究。從大數據技術出發積極引進先進的、專業的工具,強調科技情報研究工作人員具備專業的素養與專業技能,大力運用數據整合、合成、分析與視覺化技術。當代科技情報研究工作人員應當不斷提高專業素養,為科技情報產業化開發提供有利的條件。
2)高效利用各種數據資源。科技情報研究工作的成果對社會經濟發展產生深遠的影響,科技情報研究工作必須保證科技情報的準確性和研究結果的可靠性,做到從源頭上控制科技情報研究工作,強調在豐富的數據源基礎上開展情報研究工作。首先,綜合運用多種科技情報信息,強調依托大數據技術廣泛的汲取各方面的數據信息,針對不同的信息源采用不同的信息處理方式,正確對等科技情報研究工作的復雜性。其次,研究人員可以從問題出發,基于解決問題需要將全部信息資源融入到系統當中用于情報研究。學術論文、專利文獻,或者各種文獻、數據或非正式出版物都應當被廣泛涉獵。第三,研究人員還要熟悉各種信息資源的特性,理清不同類型資源的具體表現與不同信息源之間的聯系,根據待分析問題選取恰當的信息,研究人員還要將不同信息源分析出的結果進行綜合解釋,當出現信息矛盾時,能夠識別不當結果,從而保證分析的準確性。
3)提高數據信息提取能力。大數據時代的科技情報研究工作應當采用科學的分析方法,運用系統化的工具,高度重視提高科技情報研究工作的質量,重點加強數據的清洗與過濾工作。當代科技情報工作人員面臨著海量的數據信息,這些信息良莠不齊,有的數據信息是虛假的,有的數據信息是冗余的,還有些數據信息是不完整的,或者以特殊形式存在的。為了發揮海量數據信息的積極作用,消除不正確信息的影響,保證科技情報分析的準確性,降低決策的風險,還要提高數據信息的提取能力,充分的運用數據挖掘處理技術,扎實做好數據凈化與過濾工作,基于精準的運算分析將無關數據刪除,提高數據質量的控制,從而為提高數據分析準確性,保證情報研究工作效率奠定基礎。數據體量大僅僅是大數據時代科技情報的基本特征,還要把科技情報工作的重要點在挖掘有價值的信息方面,根據科技情報數據信息傳播速度快與持續性長的特征開展工作。
大數據時代對科研情報研究工作提出了更高要求,科技情報的呈現形式也更加的復雜,增加了科技情報研究的難度,同時了拓展了科技情報研究工作的路徑。科技情報研究人員還要學習新型工作方法,具備較強的大數據意識,圍繞著提高科技情報研究工作的準確性、科學性與合理性開展工作,最大限度挖掘科技情報內在價值,促進科技情報研究工作的轉型升級。