張迎
[摘要]本文首先回顧了情報學的一些定義,包括廣義的和狹義的,再介紹情報學的產生,接著介紹情報學面臨的一些困境,并對大數據時代下的情報學發展進行思考,分析大數據給情報學帶來的影響。因此,情報學雖然發展起來困難重重,但是因為大數據的出現,抓住機遇充分利用信息技術,情報學研究與工作也會得到很好的發展。
[關鍵詞]情報學 大數據
現如今,大數據是當今的熱點詞匯。無論是中國還是美國,大數據成為各個領域關注的焦點,無論是商業界還是學術界,都打算或者已經與“大數據產生關聯。情報學是以數據、信息為主要研究對象的學科。情報學在傳統領域面臨一些困境,例如學科困境、教育困境、職業困境。大數據時代給情報學研究帶來了機遇,為解決這些困境提供了條件,但是與此同時也給情報學帶來了挑戰。情報研究工作需要新的思路和研究方法來適應大數據時代的到來,并在大數據環境下得到更好的發展。
一、情報學的定義
“情報學”術語是由法國學者阿曼德,路易斯創立的,并把它定義為“計算機情報處理”,其含義是用計算機進行信息處理的手段和學科課程的總和,還包括在人類活動各個不同部門使用計算技術的廣闊領域。
情報學的狹義定義指的是科學情報學。情報是一種普遍的社會現象,科學情報學就是揭示這種現象的特性及其社會作用的學科。科學情報學的情報現象發生在科學領域內,與人類在認識和改造自然之中所積累的科學知識密切相關。科學情報學利用許多學科的理論綜合研究科學情報的產生、收集、加工傳遞和利用。
二、情報學面臨的困境
情報學發展主要面臨三大困境,即學科困境、教育困境和職業困境,Griffith作為ASIST年會的主席講演時,提到了情報學相互聯系的三個方面:學科、教育和職業。本節將具體分析這三大困境。
(一)學科困境
情報學的發展主要面臨以下兩大困境:
一方面是學科名稱與性質搖擺不定。情報一直與信息緊密相連,所以曾經“情報”被更名為“信息”,“情報學”也被叫做是“信息學”,大學里的信息學系、信息管理系取代了原有的圖書館學情報學系。另一方面是學科定位和發展不穩定、不成熟。固守客觀知識的問題域(圖書館學的問題域),是符合這個學科的實際情況的,但是似乎不符合社會的潮流和拔高學科地位的需求,也不能將情報學真正與圖書館學相區別開;而脫離圖書館學的傳統,又離開了原來的問題域,變成了技術的應用,這樣,情報學學科同樣也不是獨立存在的,定位也因此變得模糊。
(二)教育困境
在圖情教育方面可以發現以下特點:一是所授予的學位越來越不集中,即提供的課程越來越多學科化或者交叉學科化。二是課程的變化:課程的范圍擴大了,更多地加進社會、經濟等方面的內容;去掉和圖書館相關的,如目錄、圖書館學、編目等方面的內容,而更多地代之以技術類的課程。在這樣一個變化過程中,情報學容易失去內核。圖情的核心課程一時不同于一時,一校不同于一校。
(三)職業困境
情報學缺乏職業認同感。舉例來講,美國情報科學協會ASIS更名為美國情報科學與技術協會,增加了技術色彩,提升和強調了在這一學科中的技術成分,這一協會包括管理者、計算機科學家、工程師、律師等等,但是就是沒有情報學家。英國與圖書館協會獨立存在的情報科學家協會,在20世紀末討論出兩種融合方案,一是與英國計算機協會融合,二是和圖書館協會合并。大多數成員選擇與圖書館協會合并,組建英國圖書館與情報科學協會。所以說,圖書、情報、檔案一體化組織已經成為全歐洲趨勢。
三、大數據時代的情報學
大數據的特點可以用4V來概括,即Volume,Velocity,Variety,Value。
(1)VoIume意思是數量巨大。現在的大數據中的數據其數據級以PB(1TB=1024TB)或EB來(1EB=100萬TB)或更高計算。人類生產的所有印刷材料的數據量是200PB,而歷史上全人類說過的所有的話的數據量大約是5EB。
(2)Velocity意思是處理速度快。對于大數據的處理速度,有一個著名的‘1秒定律或稱秒級定律,也就是說在秒級時間范圍內給出分析的結果,如果超出這個時間,數據就失去了價值。
大數據帶來的機遇主要分為以下四個方面:
(1)大數據為情報學研究提供了豐富的數據資源支持。情報學研究大多建立在大量數據的基礎上,人們時刻在以各種方式生產不同的數據,比如圖片、動畫、音頻、視頻等等。
(2)大數據使情報學學科技術日益完善。大數據的數據收集、存儲、處理、分析、挖掘技術是大數據時代的產物,例如云計算、物聯網、文本挖掘、數據可視化等等。
大數據給情報學的發展帶來的挑戰有:
(1)大數據的數量巨大、價值密度低的特點,使得獲取信息的難度加大。隨著互聯網技術的發展,現在的大數據中的數據其數據級以PB(1TB=1024TB)或EB來(1EB=100萬TB)或更高計算,但是真正有價值的數據只會是在很小的范圍內。這就導致在提取有用信息時要利用先進技術,例如數據挖掘、文本處理等來進行信息提取。
(2)大數據的數據巨大,數據類型多樣的特點,使得數據的管理成為一大問題。在大數據時代,已經不能用原有的傳統的數據管理方式來管理數據,需要利用計算機硬件和軟件技術,對數據進行有效的收集、存儲、處理和應用等有效的管理,并促進其廣泛共享,使之價值最大化。這對于情報學來講,不僅僅是技術挑戰,更是一種管理思維模式的轉變。
四、結語
綜上所述,情報學的發展面臨很大的困境,但是大數據時代的到來為情報學研究帶來了前所未有的機遇。大數據方面的豐富技術手段和方法研究,給情報學的技術和方法提供了指導。現在需要做的是在理論上對情報學的理論基礎進行進一步的研究,建立起真正的情報學理論體系來,增進學科技術發展,提供更好的方法,讓情報學逐步擺脫面臨的種種困境。