李玲
【摘 要】隨著移動互聯網、物聯網、云計算等技術的快速發展和廣泛應用,大數據成為了當今時代信息技術的必然產物。簡單分析了大數據環境下信息組織面臨的困難和挑戰,總結出信息組織發展的趨勢。
【關鍵詞】大數據;信息組織;發展趨勢
Abstract: With the rapid development and wide application of mobile Internet, Internet of things, cloud computing and other technologies, big data has become an inevitable product of information technology in today's era. This paper analyzes the difficulties and challenges that faced by information organizations in the big data environment and summarizes the development trend of the information organization.
Keywords: big data; information organization; development tendency
一、引言
信息組織是采用各種方法和手段使信息有序化的過程。它通過揭示信息間內在的邏輯關系,對信息進行加工、整理、提煉,使之系統化、濃縮化,從而達到便于信息傳遞和交流的目的。今天,國際互聯網的飛速發展和普及,使其成為當今最大的信息資源庫,如何對這分布式的、異構的、多格式的、海量的、高動態的信息,進行快速的整序,以最方便用戶、最人性化、最智能化的形式提供給信息的使用者,成了檢驗信息組織水平和效率,促進信息組織理論和技術深刻變革的強大動力。大數據環境給信息組織帶來了巨大的影響,正確地識別這些影響,對于凝練信息組織的研究方向、使其適應當前的發展環境、與國家的重大需求對接、為國家大數據戰略的實施提供智力支持,具有非常重大的意義[1]。
本文通過探析面臨的困難和挑戰,并針對這些困難和挑戰,總結出信息組織在大數據環境下的發展趨勢。
二、大數據環境信息組織面臨的困難及挑戰
海量、異構、動態變化的數據使得信息組織的任務變得更為復雜,具體體現在數據本身的復雜性、計算的復雜性和信息系統的復雜性等方面。這也是大數據處理任務面臨的普遍問題,有賴于大數據存儲、大數據計算、大數據挖掘與分析等基礎性技術的突破和迭代。大數據環境信息組織面臨的困難及挑戰表現在以下三方面:
(1)信息組織的作用極易被忽視。在大數據環境下的某些場景中,數據經過挖掘可以直接生成情報(解決方案),無需經過組織的便可直接服務于決策。另外,某些大數據在一定程度上強調實時性,很多數據還沒有被存儲和組織,就已經失去了效用。在這種情況下,信息組織的作用也很難顯性化,再加上大數據時代人們在思想上對數據挖掘和分析的重視與推崇,信息組織在從數據到解決方案這個過程中的作用往往被隱藏或忽略了。
(2)信息描述標準的建立存在困難。在文獻組織階段,MARC,FRBR,DTD是文獻信息資源描述的標準;在網絡信息組織階段,Dublin Core等元數據是網絡信息資源描述的標準;在知識組織階段,RDF,OWL等形式化語言使得數據可以被機器讀取并理解。而在大數據環境下,無論是數據類型還是數據載體,其表現形式正變得更加多樣化,越來越多的大數據來源于科學觀察中的實驗數據、生命科學中的基因組數據、物聯網中的傳感器數據、互聯網中的社交媒體數據等等。所以,建立跨領域和跨數據類型的統一描述標準、實現不同領域的大數據描述標準的關聯和互操作存在較大因難。
(3)信息組織的學科邊界逐漸模糊。近現代的信息組織最早起源于圖書情報領域,以應對文獻信息資源的急劇增長[2],分類法、標題法、編目、文摘索引等文獻組織的方法是早期的主要方法,《杜威十進制分類法》、《美國圖書館協會標題表》、《化學文摘》等是信息組織早期的重要成果。隨著時代的發展和技術的進步,計算機技術被廣泛應用于信息組織,自動分類、自動標引、聯機檢索、自然語言檢索技術得到快速發展,隨之而來的是計算機科學對傳統信息組織研究的巨大沖擊。大數據環境下的元數據標準制定等信息組織研究內容與信息技術標準化等領域有重合,大數據組織等研究內容與數據科學、數據管理等領域產生了聯系與交叉。可見,在計算機技術、網絡技術、語義技術、大數據技術的沖擊下,信息組織的學科邊界逐漸模糊。
三、大數據環境信息組織的發展趨勢
為了應對大數據環境提出的挑戰,信息組織未來應該朝著自動化、語義化、標準化、開放化的方面邁進。其發展趨勢和任務可以總結為以下幾個方面:
(1)借助存量語義資源,對大數據進行語義化組織。語義化是信息組織的重要發展方向,無論是語義網的提出,還是關聯數據、知識圖譜的蓬勃發展,都是在朝著語義化的方向邁進。對于大數據來說,可以通過信息組織的方法、工具對大數據進行一定程度的語義化,進而通過實體的關聯對各類大數據進行連接、整合。要利用存量語義資源,必須對可用的存量語義資源進行清查與摸底,掌握現有存量語義資源的數量、種類和分布.并對存量語義資源進行集成.關聯開放數據[3]和中文開放知識圖譜[4]在這方面已經取得了較大的進展。同時,由于大數據涉及的領域廣泛、數據類型多樣,難以直接為大數據標注指定相應的知識庫,所以,還要研究存量語義資源的發現與更新機制、算法和模型,研究大數據與存量語義資源中知識庫進行匹配的方法等等。
(2)依托大數據技術,提升信息組織的自動化水平和效率。具體體現在:
第一,大數據環境下,機器學習、人工智能、數據挖掘與分析等領域取得了長足的進步,將為大數據組織提供有力的技術支撐[5]。
第二,大數據處理需求催生的新型計算模式,有利于數據的整合,比如查詢分析計算模式可用于結構化數據的整合,圖計算模式可應用于社交媒體中的知識整合,等等。
第三,大數據可視化技術進一步豐富了信息組織的表達和展示方式。長期以來,可視化是信息組織成果展示的重要渠道和方式,大數據環境使人們對可視化的需求呈現爆發式增長,催生了一系列新的可視化工具、技術和方法,其中的一些工具、技術和方法也同樣適用于展示信息組織的成果。
信息組織研究需要充分引入大數據處理的新范式、新技術和新工具,提高信息組織的自動化水平和效率。
四、結語
信息組織作為圖書情報學的核心研究領域,是信息存儲、信息檢索、信息利用與服務的基礎和前提。現階段,雖然信息組織在大數據環境下面臨嚴峻的挑戰,但我們始終相信在相關學者的堅持不懈、艱苦深入的研究下,我們定能創新出新的信息組織工具,應對大數據環境帶來的影響與挑戰。
【參考文獻】
[1]趙一鳴,馬費成.大數據環境對信息組織的影響[J].博士論壇,2017(1):4-10.
[2]葉繼元.信息組織[M].北京:電子工業出版社,2010:5-6,18-26,170.
[3]The Linking Open Data Community. The linking open data cloud diagram[EB/OL]. [2016-03-20]. http://lod-cloud.net/
[4]CKAN聯盟.中文開放知識圖譜[EB/OL].[2016-09-01 ].http: //openkg.cn/
[5]馮芷艷,郭迅華,曾大軍,等.大數據背景下商務管理研究若干前沿課題[J].管理科學學報,2013,16(1):1-9.