劉莉 王翠萍 劉雁

[摘要]針對情報學中數據、信息、情報三者的關系進行探討,綜述了目前已有的情報學轉化論的理論研究,在情報學的學科發展和數據密集的時代發展環境下,構建數據、信息、情報的三角轉化模式。在原有的數據轉化為信息、信息轉化為情報的基礎上,提出信息到數據的逆向轉化和數據到情報的直接轉化,并對轉化過程進行探討。
[關鍵詞]數據;信息;情報;轉化
[中圖分類號]C250.2
[文獻標識碼]A
[文章編號]1008-0821(2015)02-0028-04
大數據時代的到來,引起了新一輪的數據浪潮。數據作為情報轉化論的研究元素之一,對它的研究引起了各界學者的重視。無論是政府還是企事業單位都在努力獲取數據,分析數據并利用數據,從而帶動組織得發展。大數據的利用核心是通過對海量數據的搜集和整理,將其轉化為有價值的可以為行為主體提供決策服務的情報。這一過程正是數據到信息和情報的轉化。在大數據時代發展的推動下,情報領域應加強對轉化論的研究,從而更好的利用數據,推動醫療、交通、教育等事業的快速發展。
在中國知網中檢索情報學相關論文,可以發現情報應用和實證的研究越來越多,理論的研究與深化有被忽視的傾向。在對情報學三動論的研究中,序化論的研究較多,轉化論和融合論的研究相對較少。其中,轉化論的研究主要集中在信息的轉化上,信息與知識的轉化、信息與情報的轉化、知識與情報的轉化。無論是實踐的發展還是情報學自身發展,都需要對數據、信息、情報的轉化理論進行深入研究。
1 數據、信息、情報概述
研究數據、信息、情報之間的相互轉化,首先應明確三者的概念,及彼此之間具有怎樣的相互聯系。
1.1數據、信息、情報概念
在情報學中,數據、信息、情報作為情報學研究的主要元素,被學者們從不同的角度進行了研究和探討。對其概念的理解也是眾說紛紜,目前仍沒有明確統一的概念。從情報學的角度理解,筆者認為,數據是數字、符號或代碼等的表示形式,單個數據本身是沒有具體意義的,但在制定的環境下的多個數據是特定含義的。數據是一種資源,它可以作為結構單元被存儲和利用。信息是對客觀事物屬性的描述,雖然有些信息和數據的表現形式相似,也可以是數字、圖像、音視頻等,但信息本身是有意義的,這一點是與數據存在著明顯的區別。信息是傳播的具體內容,它有傳出方和接受方,具有一定的直觀性。數據是客觀事實,而信息則具有真偽之分,需要人們通過自己的主觀經驗來辨別。所以說信息是對事物或情況的描述,可以作為一種交流性的語言,具有明確的解釋和內涵。而由于情報的基本屬性,雖然不能將情報與信息完全分開,但情報應有其獨有的特點。情報是針對不同的主體而言,主要體現在價值上。信息無論其是否存在價值,它都客觀存在著。而情報是在有價值的前提下存在著,不管情報的概念最終落在信息上還是知識上,情報都是一個單獨的集合。
數據、信息、情報都是一種資源,是對客觀事物的不同的表示形式。他們雖然有很多共同點,但卻有自己獨有的特征。所以數據、信息、情報作為獨立的個體,可以進行相互轉化。
1.2數據、信息、情報三者關系
由于數據、信息、情報均從不同的角度有很多的理解,導致三者的關系也多種多樣。在學術界對于其概念的詮釋和三者關系的紛爭都從未間斷。1997年H.Garai將數據、信息、情報的關系表述為:Data+Relevance+Purpose=Information;Information+Understanding=Intelligence;Intelligence+Action=Effectiveness。從學者們的研究中可以發現,數據、信息、情報的關系可以主要概括為:并列關系、包含關系、轉化關系、交叉關系。并列關系體現在情報學基礎理論中,數據、信息、情報均為獨立的個體,有其自身的特點和內涵,是一種概念元素。作為元素,數據、信息、情報三者存在并列關系。包含關系是大多數學者的觀點,認為數據包含信息、信息包含情報,這是從范圍的角度對三者關系的界定。轉化關系可以說是在包含關系的基礎上建立的,數據的范圍比信息大,數據中非信息的部分可以通過加工轉化為信息,而信息中非情報的集合元素也可以經過加工轉化為情報。所以數據、信息和情報之間存在可轉化的關系。
數據、信息、情報之間的關系并沒有那么簡單,其中還存在復雜的交叉關系。數據、信息只是從不同角度對同一客觀事實的不同表述。而情報此時并不在其中,如果對這一對象,從外部加入情報,原有的數據或信息將會發生結構性改變。情報作為外加物質,促使數據、信息發生改變,從而實現知識的創新。情報的出現源于廣泛的數據和信息,它們之間是互相支撐、互相補充的。
綜上所述,數據、信息、情報從不同視角下有著不同的關系。在并列關系、包含關系、轉化關系和交叉關系中,轉化關系被提及的較多。情報學轉化論是對其轉化關系的進一步探討。無論數據、信息、情報的關系怎么界定,三者都是密不可分的。
2 數據、信息、情報轉化研究現狀
2.1數據、信息、情報的線性轉化
數據、信息、情報之間也可以用箭頭的形式進行線性鏈接,從而體現其中的相互關系。數據經過分析和整合轉化為信息,信息經過加工和提取轉化為情報。而有些學者也將知識納入其中,貫穿于三者之間的轉化。
線性轉化模式在學習生活中比較常見,如學術論文的數據庫,包含著很多相應的數據,經過檢索詞的選擇和縮小范圍就可以搜集到某個主題的數據集合,這些數據集是一種信息的體現,利用各種分析方法對這些信息進行分析,可以得出相應的研究報告,研究報告具有一定的結論性,可以為對以后的研究和熱點的分析有一定的理論指導意義,即轉化為了情報。這種轉化模式較為簡單直接,其主要分歧在于知識在其中的位置,早期的線性轉化是“數據——信息——知識——情報”,在不斷的研究探討后,有學者提出知識不應作為其中的一個節點,而是將知識貫穿于數據、信息、情報三者的轉化之中。數據到信息的加工過程離不開知識,信息到情報的加工過程也少不了知識的支撐。無論是那種觀點,線性轉化模式都是從最表面的現象對數據、信息、情報關系的一個表達。該模式屬于傳統的模式,但隨后出現的模式也將此作為主干,在其基礎上進行加工和擴散。所以數據、信息、情報的線性轉化模式在其關系的界定中有其一定的理論基礎和研究意義。endprint
關于數據到信息、信息到情報的轉化,化柏林教授都已經進行了深入的研究,他認為數據到信息可以通過情景化、有效化、歸一化、細分化和精煉化處理進行轉化。信息轉化為情報可以通過以下幾種方式和途徑:去偽存真型分析、對比分析型、見微知著型分析、由此及彼型分析、化零為整型分析,通過這些分析將信息轉化為情報。
2.2數據、信息、情報的金字塔轉化
傳統的金字塔模式展現的是一種遞進的關系,數據是信息和情報的前提,金字塔的形式也體現了數據的范圍是最大的。情報位于塔尖,不僅是范圍的精小,同時也說明了情報的價值性。而信息則作為兩者之間的紐帶,是一個過渡,也是一個樞紐。
用金字塔的形式來表示數據、信息、情報的層次體系,層與層之間都存在著固定的關系,每一層比它下面的一層都多賦予了一些特質。從獲取原始的數據開始,對數據進行分析,挖掘數據之間存在的關系,從而轉化為信息。數據是記錄下來可以被鑒別的符號。它是最原始素材,沒有被加工解釋,也沒有回答特定的問題。信息是已經被處理、具有邏輯關系的數據,是對數據的解釋,這種信息對其接收者是具有意義的。情報是加工了的信息,是通過對信息的合成和提取,總結出來的可以為決策提供支持的那一小部分知識。
金字塔轉化模式在情報學領域被廣泛熟知和傳播,對轉化理論的影響也較為深刻。但芬蘭學者Iikka.Tuomi在1999年的時候提出的倒金字塔轉化模式,也值得深思。他認為數據、信息(情報)、知識是倒金字塔結構:數據是從信息(情報)里產生的,信息(情報)是在我們擁有知識后涌現出來的。該結構將信息和情報放在一個層次里,而知識作為金字塔的底部,認為知識是情報的前提,先有知識后才可以出現情報,先有信息后才能有數據。無論是正金字塔還是倒金字塔,它們都體現著數據、信息、情報之間的關系和相互之間的轉化。而將兩種金字塔結合起來,將更為確切的表示了幾個事物的動態關系。
2.3數據、信息、情報包含關系轉化
包含于鏈狀轉化結構是借用了數學中的集合概念,并結合數據、信息、情報三者的包含關系建立的。有學者認為數據、信息、情報具有包含關系,他們每一個物質都組成一個集合。數據集合中的元素最多,集合范圍最大,信息的集合是數據的真子集,而情報作為最小的集合真包含于信息集中。如果數據集合記做全集U,信息集合記做集合A,情報集合記做集合B,那么數據中非信息的部分就可以記做CUA,信息中非情報的部分則記做CAB。由此,數據、信息、情報之間的轉化就可以這樣理解。在數據集中,非信息的數據可以向信息集中的數據進行轉化(CUA轉化為A),在信息集中,非情報的信息可以向情報集中的信息進行轉化(CAB向B轉化)。
包含于鏈狀模式在一定程度上擴大的數據、信息、和情報的概念范圍,使其變成一個大的元素集合。并認為信息是一種特殊的數據,情報是一種特殊的信息,也是一種特殊的數據。包含于模式與金字塔模式的主要區別在于內在的轉化。金子塔將三者分別獨立開來,層與層之間不存在交叉關系。
3 數據、信息、情報三角轉化模型構建
大數據時代,隨著社會對于數據的重視程度的加深,加工數據的先進技術在不斷出現,部分數據到情報的轉化可以直接進行,無需按步驟先轉化為信息,再進一步轉化為情報。而在三者之間的轉化關系中,信息的數據化應被列入其中,信息到情報的轉化過程也可以是先對信息進行數字化處理后再進一步轉化為可以提供決策的情報。數據、信息、情報之間的三角轉化模式主要是在線性模式的基礎上增加了數據到情報的直接轉化,以及信息到數據的反向轉化。從而構建出單雙線橋連接的三角形轉化模式。
如圖1所示,該模型在數據、信息、情報之間構建了4條轉化路線,分別是數據到信息、信息到情報、信息到數據、數據到情報。其中數據和信息是可逆的轉化過程。本文重點探究粗箭頭指示的兩個轉化。
3.1信息轉化為數據
信息到數據的轉化也就是信息數據化。信息轉化為數據與倒金字塔的觀點相吻合,芬蘭學者Iikka.Tuomi認為數據是從信息中產生的。而怎樣產生、如何產生就是信息轉化為數據的過程。計算機時代,信息的數字化已經被廣泛應用到實際生活中。
信息的數字化其實是計算機技術的典型應用。計算機將信息用二進制代碼的形式表示,本身就是一種數字化模式。在這個數據堆積的時代,高效的存儲和利用數據要求有較高的技術支撐。條形碼、二維碼說明了信息到數據的轉化。條形碼是將寬度不等的多個黑條和白條,按照一定的編碼規則排列,用以表達一組信息的圖形標識符。條形碼下面對應著一排數字,每一個數字都有其獨特的含義。條形碼具有惟一性,而且采集量大。一位條形碼可以采集幾十位字符的信息,二維條形碼更可以攜帶數千個字符的信息。條形碼可以標出物品的生產國、制造廠家、商品名稱、生產日期、圖書分類號、郵件起止地點、類別、日期等許多信息。二維碼輸入的是信息,呈現的是數據,生活中到處都是信息,也存在各種信息不安全的因素。在保護個人隱私不被泄露的前提下,我們可以將原本復雜的信息進行轉化,以一種簡單明了的形式呈現出來。目前二維條形碼被應用的越來越廣泛,商家利用微信二維碼宣傳產品,車票利用二維碼體現用戶購票信息,報紙也出現了二維碼,以便讀者對感興趣的信息進一步關注感興趣的信息。這是一個時代的特征,也是數據時代的產物。條形碼、二維碼技術足以說明信息轉化為數據的這項技術已經被社會所接受和認可。條形碼使信息的傳遞速度增加數倍,而且節省了存儲信息的空間,靈活可靠。這也正是信息轉化成數據的真正意義所在。
信息數字化既能無時間空間限制的利用信息,又能減少存儲空間。不僅可以應用在圖書館、博物館等重要的信息的保存和利用,還可以應用到各行各業的業務處理中。信息到數據的轉化是在一定的合理條件下,由先進的技術作為支持才可以做到的。但是這種轉化是存在的,也就是說數據和信息之間是互相轉化的,轉化反應可逆。在某種特殊的情況下,為了將信息轉化為情報,也可以先對信息進行數字化處理后,將數據轉化為情報來進行。這一過程可以是連續不間斷的。endprint
3.2數據轉化為情報
隨著數據時代的發展,對數據加工技術的不斷改進,數據到情報的轉化變得簡單易行。R.M.Hays等人就認為:“情報乃是數據經過加工處理而產生的數據”。R.M.Hays的觀點表達的是情報其實是一種特殊的數據,是在原始數據的基礎上進行加工得到的。加拿大McGill大學信息學教授David Batty,他在《情報工作與信息科學:一船兩夫》一文中指出,情報工作和信息科學的相同點在于輸入、處理和輸出原始數據。情報工作是原始數據變為情報,信息科學是原始數據變為信息。這足以說明數據可以轉化信息,數據也可以轉化為情報。而數據到情報的轉化是否必須經過信息是我們有待探討的。
對于一個企業來說,數據可以轉化為企業的洞察力,數據可以轉化為證據,數據也可以轉化為提供決策的依據,另外規范的數據還可以提高企業的創新力。無論是洞察力、證據還是創新力,他們對于企業來說都是一種可用作提高企業競爭力的情報。而企業真正需要的就是情報。大數據改變了企業的業務,也推動了社會發展。企業對數據的加工需要更為先進的技術來直接提取情報。數據到情報的轉化不是簡單的人工能實現的,更多的依靠技術來實現。數據可以通過相應的技術直接轉化為情報,但在這個過程中,因為數據具有原始性、復雜性、多量性的特點,對技術也有著很高的要求。大數據時代的興起,數據將不再是單純的數字或是符號,而是一筆巨大的財富。掌握數據就是掌握了發展方向,擁有數據就擁有了決定權。超市的銷售記錄顯示,啤酒和尿布共同購買的次數較多,于是超市將啤酒和尿布擺放在附近,讓彼此帶動銷售,得到了很好的效果。在這個過程中,超市的銷售記錄數據庫里儲存的是大量的購買記錄,經過對該數據庫中的數據進行分析,發現其中存在的銷售規律。從而為企業贏得更大的利潤的過程充分的將數據轉化為有價值的情報。
大數據時代出現了數據清洗、數據挖掘、數據融合等技術,對數據的深入加工。數據到情報的轉化,可以通過這些技術來直接進行,數據的原始性使得到的情報更具有真實性,技術的先進性使得轉化更具有高效性,但目前的技術有限,還需進一步開發。所以數據可以通過一定的技術方法直接將其轉化為情報,而無需提取信息,轉化過程更為直接。
4 結語
本文是在實踐發展的帶動下,重新審視情報學基礎理論的研究。筆者提出了數據、信息、情報之間存在的新的轉化模式:在原有的數據可以轉化為信息,信息可以轉化為情報的基礎上,還存在著信息到數據的逆向轉化,也就是說數據和信息在特定條件下是可以相互轉化的。此外,大數據時代,一些新的計算機技術的出現,也促使了數據到情報之間可以直接進行轉化。因此,將數據、信息、情報之間的轉化模式概括為單雙線橋結合的三角形的轉化模式,進一步完善了數據、信息、情報之間的轉化關系。本文的研究是在已有理論基礎上新的探索,如有偏頗之處,敬請批評指正。
(本文責任編輯:孫國雷)endprint