于洪業

【摘 要】 本文通過對數據發展歷史由淺入深的描述,闡述了大數據的來源、定義和主要特征;并通過分析大數據對情報服務事業的影響,以及將礦產資源和大數據資源模擬對比,提出了在大數據時代情報服務事業的發展方向:應將重點放在把挖掘到的有價值數據應用到情報分析研究上,這是大數據環境下情報服務由信息服務轉向高端的知識服務的一個必然的過程,也是未來情報服務發展的主戰場。
【關鍵詞】 大數據 ?情報 ?服務
【Abstract】 This article explains the origin, definition and principal characteristics of big data based on the description of the history of data development, and puts forward the development direction of intelligence service business in the big data time through the analysis of big data influence on information services and the simulation bewteen mineral resources and big data resources: the intelligence service business should focus on the intelligence analysis researches with the use of the mined valuable data, that is not only an inevitable process from informtion service to knowledge service (high-end service) under big data, but also the main battlefield for the development of the future information service.
【Key words】 big data; information; Service
1 引言
人類社會出現以后,數據就一直伴隨著社會的發展而存在,并不斷變換著它的載體和數量。比如,從遠古人們用繩子打結記事,到古代在龜甲獸骨、泥板、竹簡上刻字紀錄,到后來在絹、紙上書寫記載,以及到現在通過電子手段存儲、處理信息數據,數據隨著社會的進步而不斷增加它的種類和數量,與之相適應的是產生新的存儲、處理載體,而新的載體又激發了數據量的劇增,它們以螺旋方式循環上升。而所謂大數據是個相對的稱呼,就是其數據量超出了當時常規數據載體存儲、處理等操作的能力。目前,隨著互聯網的發展,原先分散的數據一下流通起來,并借助互聯網產生了巨量的新數據,因此大數據就是互聯網發展到現今階段的一種表象或特征,在以云計算為代表的技術創新載體支撐下,這些原本很難收集和使用的數據開始容易被利用起來了。通過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。
2 大數據定義
麥肯錫(McKinseys Global Institute,美國首屈一指的咨詢公司)是研究大數據的先驅。在其報告《Big data:The next frontier for innovation,competition,and productivity,大數據:創新、競爭和生產力的下一個前沿領域》中它給出的大數據定義是:大數據指的是大小超出常規的數據庫工具獲取、存儲、管理和分析能力的數據集。但它同時強調,并不是說一定要超過特定TB值的數據集才能算是大數據。國際數據公司(IDC)從大數據的四個特征來定義,即海量的數據規模(Volume)、快速的數據流轉和動態的數據體系(Velocity)、多樣的數據類型(Variety)、巨大的數據價值(Value)。
3 大數據環境下情報服務事業的機遇與挑戰
在20世紀50-60年代,西方國家對我國進行全面封鎖,那時的信息獲取渠道很少,因此當時的科技情報工作顯得十分重要,情報收集整理、情報編譯報道、情報分析研究等即高深莫測又成效顯著,并為我國的科學技術發展做出了卓越的貢獻并取得了令人矚目的學術研究成果。
到了20世紀80年代,各級科技情報研究機構(所)憑借著其收藏的科技報告、專利文獻、標準文獻和DIALOG之類的國際聯機檢索數據庫,特別是對科技查新的獨家壟斷,也曾在當時風光一時。
但是,進入20世紀90年代中期以后,隨著計算機和網絡的迅速普及、數據資源的易于獲得和科技工作者水平的普遍提高,使情報收集整理和情報編譯報道等信息服務已沒有了多少市場,能體現知識服務的高深的情報分析研究也失去了往日的光環。特別是在互聯網高速發展的今天,伴隨而生的大數據和云計算等在為各行各業提供機會同時也提出了挑戰,而與信息、數據密切相關的科技情報工作更是如此,如何迎接挑戰、抓住機遇,情報服務事業如何發展?是我們情報工作者亟待解決的問題。
4 探索情報服務事業的發展途徑
無論是在2014年3月在北京舉行的大數據產業推介會上,還是在2014年11月召開的世界互聯網大會上,被視為商界傳奇的中國電子商務創始人馬云在他的主題演講中均發表了他的最新觀點,即 “人類正從IT時代走向DT(Data Technology)時代。”
從上文第3部分的分析中我們可以看到,在50-60年代,情報服務工作的開展得益于當時社會對信息獲取的不易,而情報機構具有獨特的獲取信息的優勢,比如政府的扶持、中外資料的獲得、外語人才的擁有等等,也就是具有獲取信息、數據的渠道。在20世紀80年代,借助多年信息資料和渠道的積累,我們具有了某些大數據資源的前身,也正因為這些資源,使我們在當時擁有了為企事業單位提供情報服務的優勢和能力。而進入20世紀90年代中期以后,特別是到了目前的大數據時代,我們的優勢在逐漸消失,在信息服務方面主要體現在是數據源優勢的消失,而在知識服務方面主要體現在大數據環境下對數據分析的不適應。
人們現在常把大數據比作寶礦,就像蘊含著巨大價值的礦產資源一樣。下面就通過模擬礦產資源,把大數據與礦產資源在開采、生產等不同階段時期所處的狀態進行對比,分析情報工作在不同階段中可能提供的服務。
在上表1的“資源階段”,情報服務業務要想占據一席之地,當然最好是擁有自己的大數據資源,比如以前積累的文獻資料數據庫等,但這完全滿足不了情報服務于不同行業的需要。我們還需要尋找其他的大數據源來獲取所需的數據,或者根據需要建造某種平臺收集新的數據并創建成新的大數據資源,但后者實行起來難度較大,需要國家的扶持和時間的積累。因此,在這一階段情報服務工作能做的主要是繼續利用原有數據資源并加大研發、使用數據挖掘工具,爭取在原有數據資源上獲取更多的有價值數據;其次就是利用別人的大數據資源開展業務,但在獲取可行性方面,還有很多不確定因素,比如是否可以獲取(包括技術上是否能實現)、挖掘工具的使用、獲取成本、獲取程度等等。因此這一階段,我們原有情報服務業務目前優勢不是太大。
在“生產階段”,對于礦產業來說是把礦石開采出來并提煉出產品,對應于大數據就是使用數據挖掘軟件(工具)把有用的數據提取出來。由于目前大數據的產生主要是伴生于網絡及互聯網,因此現在一談到數據挖掘技術及工具,基本都是IT人士的事,而情報業務,特別是在情報分析方面的一個明顯短板是技術和工具的短缺,所以剛開始的時候,覺得大數據為情報分析提供了豐富的數據資源,可能是提升情報分析水平能力的大好機遇。但是換一個角度看,或許正因為大數據分析學技術非常先進,所以原本技術基礎較差的情報分析領域反而不容易獲益。技術轉移的歷史經驗告訴我們,技術供應方與接收方差距過大是轉移失敗的主要原因之一。許多“正統”的情報機構由于缺乏技術人才和相應的組織文化,可能與大數據帶來的機會失之交臂。Facebook對情報人員的應聘要求包括具有計算機科學或其他相關技術領域的碩士以上學位,有豐富的數據分析工作經驗,熟練掌握至少一種腳本語言,輕松自如的面對復雜大量的數據,靈活的分析手段,準確的表達等等。在這種要求下,傳統的情報人員已經不能滿足大數據環境下情報服務的需要,必須通過角色轉型才能滿足企事業單位對情報服務的需求。因此,在這一階段,短期內不是我們情報業務的長項,也是我們情報部門今后急需增強的部分。
在“應用階段”,對于礦產資源方面來說,是把已提煉出的產品,如金屬、化工原料等通過加工,應用到各個領域及行業;而對于大數據方面來說,側是把提取到的有價值的數據通過處理、編輯、分析等加工后服務于相關行業、用戶。而專業的數據分析師對具體應用到的行業就目前來看在了解上還存在著斷層,就像編程人員需要懂業務的人員配合才能編寫出某一行業的應用軟件一樣,在大數據被挖掘后到具體應用的這一過程中,也就是在專業數據分析師與各個領域具體應用之間可能還需要存在一個銜接層或中間層。麥肯錫報告指出,能提出正確問題和利用分析結果的管理者和分析師需要量將是數據分析師的10倍。因為優秀的情報人員具備對技術和產業領域的知識和洞察力、處理“零次情報(調研、考察、訪談等記錄下來成為數據前的信息)”的經驗豐富等等,因而在為數據分析建立假設,感知可能存在的關聯,以及理解關聯背后的商業邏輯方面有可能表現出其他行業人員難以匹敵的能力,這就能夠與大數據分析師互為補充、共同發展,成為大數據分析、應用過程中一個重要組成部分。此外,大數據分析也是信息分析的一種途徑和方法,大數據分析和情報分析二者在“外觀”上十分相似,而在情服務應用的高端,包括產生最大附加價值的情報分析這樣的知識服務方面,一直是情報機構的長項,并且大數據產生價值的實質性環節就是信息分析,因此,在這一階段,不論是從人才優勢、分析方法、還是從大數據價值實現環節上來看,這一階段應是我們情報服務事業今后發展的重點。
5 結語
在大數據背景下情報服務如何發展,以應對大數據帶來的機遇和挑戰,是擺在我們情報工作者面前一個亟待解決和回避不了的問題。通過上述分析,本文認為情報服務業務短期內應利用新的數據挖掘工具對原有的數據資源進行進一步的挖掘,發現并利用更多有價值的數據;長期的任務是提高情報人員挖掘、利用大數據的能力,給情報人員提供學習、培訓交流等環境,這也是關系到情報業務今后在新環境下是否被替代的問題;而今后情報服務的重點應當放到利用挖掘到的有價值數據來完成情報分析研究這樣的高端的知識服務上面。
參考文獻:
[1]楊劍.大數據開啟情報服務機構科技創新知識服務的新時代[J].科技資訊,2014(14).
[2]繆其浩.大數據將如何影響競爭情報[J].競爭情報,2013(1).
[3]James Manyika. Big data: The next frontier for innovation, competition, and productivity[EB/OL].http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation,May, 2011.
[4]吳金紅.大數據:企業競爭情報的機遇、挑戰及對策研究[J].情報雜志,2013(1).
[5]黃曉斌.大數據時代企業競爭情報研究的創新與發展[J].圖書與情報,2012(6).
[6]江俞蓉.大數據時代情報學面臨的挑戰和機遇[J].現代情報,2013(8).
[7]王勇.大數據環境下競爭情報系統的研究與實現[J].廣東工業大學學報,2014(3).