
摘要:信息組織作為圖書情報學的核心研究領域,在大數據時代下迎來了機遇與挑戰。文章通過對大數據時代下信息組織面臨的挑戰、迎來的機遇的分析,探討在大數據環境下信息組織應發揮的作用,發現信息組織應在大數據資源的描述、標記、序化、分類、濃縮與加工、交換與共享等方面繼續發揮作用,期待信息組織能夠及時轉型,推動圖情人信息組織意識的轉變以及信息組織工具的發展,促進自動化在信息組織中的應用,推動新的描述規范的建立,以應對大數據時代帶來的影響與挑戰。
關鍵詞:大數據;信息組織;圖書情報
中圖分類號:G203 文獻標志碼:A
0 引言
大數據又稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產[1]。這個定義擁有兩層含義:一是數據規模巨大且類型繁多,二是當前的信息管理工具及方式已難以適應增長集成的大數據。大數據時代的到來給各個行業帶來沖擊,使得各行各業的人們對于數據的認知以及信息的處理方式發生了顛覆性的改變,同時也引起了數據獲取、數據存儲、數據分析以及數據挖掘等技術的變革與發展。
1 大數據時代下信息組織面臨的挑戰
1.1 傳統信息組織已無法滿足時代發展的需要
信息組織是對信息資源對象進行收集、加工、整合、存儲,使之有序化、系統化的過程。組織信息的目的是檢索信息和利用信息。信息組織最開始是對文獻進行組織,具體文獻組織的流程如圖1所示。
信息標引、信息描述、信息排序是關鍵的3個階段。信息標引是指在對信息內容進行分析的基礎上,根據一定規則給信息的內容屬性以標識,并作出描述的過程;信息描述是指根據信息組織和檢索的需要,對信息資源的主題內容、形勢特征、物質形態等進行分析、選擇、記錄的活動;信息排序是在信息標引后,按一定規則和方法把所有信息描述、記錄、組織、排列成一個有序的整體[2]。
隨著技術的發展以及信息分析方法的多領域運用,信息組織不再局限于傳統的文獻組織,轉而向信息分析方向發展,通過對搜集到的零散的原始數據和信息進行識別鑒定、篩選、濃縮等加工整理及系統深入的分析與研究,挖掘隱藏于信息、數據中的規律、情報和知識,提供針對性、預測性、科學性、綜合性和可用性結論或方案,為管理和決策服務[3]。
伴隨著信息源的拓展、實時信息量的爆炸式產生,傳統的信息組織與發展面臨著大數據時代帶來的挑戰。傳統的“標準先行”分析方法已經滿足不了現在的發展速度,希望利用大數據處理無序、類型多樣、不標準不規范的信息,進行全樣本分析,快速地處理信息,挖掘數據信息背后的客觀聯系,為決策做支撐,提供增值的數據情報產品,信息組織與分析亟待轉型。
1.2 信息組織在實現信息利用中的作用被大大削弱
曾經從數據中提煉信息、從信息中升華出知識、再從知識中找到解決方案轉化的過程中,信息組織發揮著極其重要的作用。但是在大數據的背景下,很多數據經過挖掘后就已經變成了情報,可以直接為決策提供服務,無須進行信息組織便可以成為解決方案。大數據時代下,信息的產生是實時且海量的,很多信息是低價值的且噪聲大,會有很多信息還沒有進行組織時就已經失去了其時效性以及效用。在這種情況下,信息組織在實現信息利用中的作用被大大削弱。
1.3 信息組織不再完全屬于圖情專業的專有技術
隨著計算機技術的發展,計算機技術被大量應用于圖情領域,比如自動標引、自動分類、聯機檢索等,計算機專業出身的人才做起信息組織時也是得心應手;隨著對本體研究的深入,語義網、知識發現等領域也與信息組織有了極大的交叉,在實際的信息組織過程中,圖情人會感到在應用技術時,與研究語義網以及知識發現的人才相比,明顯有些力不從心。
在計算機技術、語義網技術、知識發現技術以及大數據技術的沖擊下,信息組織這項工作不再完全屬于圖情專業的專有技術,傳統的信息組織技術并不能完全滿足大數據環境下信息組織的需要;與技術出身的人才相比,圖情人在技術的應用上沒有明顯優勢,因此,圖情人需要與時俱進更新技能知識,根據不同的大數據類型采取相應的策略,確定數據描述和分析的細節與深度,做好新形勢下的信息組織與分析工作。
1.4 缺少通用的、適用于大數據的信息標引標準
大數據背景下的數據是海量的,來自各行各業,并且隨著技術的發展,不停地有新的術語產生。現有的信息組織所使用的MARC、FRBR、都柏林元數據、RDF等難以滿足日益增長的術語需要,但是一個通用的、適用于大數據的信息標引標準又是數據流通與共享的基本前提。
因此,在大數據時代下應該制定一個通用的、適用于大數據的信息標引標準,但是如何制定、由誰牽頭、多久能夠制定出來、是否所有機器都可以兼容、是否可以國際通用都是大數據環境下信息組織所面臨的挑戰。
1.5 現有的信息組織方法與工具難以勝任大數據工作
大數據時代的來臨使得信息量劇增、信息傳播速度極快、信息源復雜程度增加(眾多非文本信息),給信息組織帶來了沖擊。而信息組織的自動化程度不夠高、非結構化信息難以規范、信息組織的方法存在過多的中間加工環節、動態性較弱等局限使得現有的信息組織方法與工具難以勝任大數據工作。同時,大數據的技術和開發工具不夠成熟,難以滿足海量復雜數據的分析,如何加快開發安全級別較高、運行速度快的大數據信息分析工具也是亟須解決的難題。
2 大數據時代下信息組織的機遇
盡管大數據時代下信息組織面臨著眾多挑戰,但是機遇與挑戰往往如影隨形。歷史上的每一次信息大爆炸都對信息組織提出了挑戰,每一次信息大爆炸都推動了信息組織的大發展。大數據時代其實本質上也是一場新的信息大爆炸,以前信息組織都能逆流而上,實現信息組織方法體系的革新,這次也不會例外。大數據時代給信息組織帶來以下機遇。
2.1 大數據會推動信息組織意識的轉變以及工具的發展
《中國大數據技術與產業發展白皮書》認為,大數據的發展帶來了3方面積極影響:一是提高了“數據意識”;二是解決現有數據管理與分析系統不能應對急劇增長、種類繁多的數據這一挑戰性問題;三是推動Hadoop,Spark等大數據處理架構更廣泛地應用,實現從傳統的數據處理向大數據處理的過渡[4]。這些方面為信息組織的發展提供了巨大的機遇。
2.2 大數據技術會促進自動化在信息組織的應用
信息組織涉及一系列需要自動處理的鏈接,例如知識索引、知識集成、知識排序和信息組織結果顯示。大數據處理需求產生的新計算模型有利于數據集成[5]。大數據技術推動了機器學習、人工智能等技術的發展,將這些新技術應用于數據挖掘與自動標引等需要自動化處理的環節中,將會促進自動化在信息組織的應用,提高信息組織的自動化水平和效率,極大地節省人力與時間。
2.3 推動新的描述規范的建立
現有的信息組織所使用的MARC、FRBR、都柏林元數據、RDF等難以滿足日益增長的術語的需要,但事實上這些標準在曾經的信息組織中的表現也不盡人意,每次的更新往往是在以前煩瑣的標準上進行修改與增補。大數據時代的到來正好是一個機遇,這是一個與以往不同的時代,甚至用戶成分的復雜化也在要求組織方式的透明化與易用化,不破不立,應該建立一種新的信息組織描述規范,使得每一個普通用戶都能簡單上手,進行信息的交互。
3 信息組織在大數據時代下可發揮的基礎作用
大數據具有“4V”的特征,即海量的數據規模(Volume)、快速的數據流轉和動態的數據體系(Velocity)、模態繁多的數據類型(Variety)和數據價值密度低(Value)[6]。信息組織是對信息資源對象進行收集、加工、整合、存儲,使之有序化、系統化的過程。組織信息的目的是檢索信息和利用信息。信息組織的功能是對信息進行分類、描述,使之便于交換與共享[7]。在大數據時代下,信息組織不可能解決大數據所有的問題,但是可以與時俱進地使用信息組織的功能,使其在數據的分類、描述、交換共享等方面發揮重要作用。
3.1 大數據資源的描述、標記、序化
信息組織分析原始信息源的內外部特征后,對信息內容的概要進行標記,可以對其進行建檔,記錄其內外部特征,為大數據挖掘、分析提供一定的參考。
3.2 大數據資源的分類
分類一直都是信息組織的核心功能以及基礎性方法。在大數據環境下,應該建立一個大數據多維度分類體系,在對大數據進行序化的基礎上,對數據的內容進行分析分類、對數據的價值進行評估,實現數據的劃分歸類,以便用戶更好更快地找到所需要的信息。
3.3 大數據資源的濃縮與加工
對數據進行描述、標記、序化以及分類其實是將一次信息加工成二次信息的過程,也是對信息進行濃縮的過程。通過對大數據資源的抽象與提取,信息組織可以發揮對大數據資源的濃縮與加工的作用。
3.4 大數據資源的交換與共享
通過對原始信息源的內外部特征分析以及信息內容的概要標記,若是在標記以后用信息組織時常用的各種詞表,比如敘詞表、人名地名表等,或一個通用的適用于大數據時代下的規范詞表進行規范,就可以實現大數據資源的交換與共享。
4 大數據時代信息組織與分析的發展建議
4.1 做好信息組織與分析的重新定位
在大數據時代背景下,信息組織與分析應該突破原有的傳統思維,具備大數據的思維,滿足大數據時代的行業需求以及迎接大數據的挑戰。一是信息組織與分析要有全數據理念。信息組織與分析的對象,不局限于文獻資源,更多的是網絡資源,包括文本、圖片、視頻、音頻等。二是在全數據的理念下,要重新構建新的數據資源框架和系統,有組織地、全面地、高效地、準確地處理信息數據。三是信息組織與分析要結合大數據的技術。用計算機程序和軟件自動獲取信息,而不是繼續耗費大量的人力,解放傳統的人力和精力,從事更智慧的活動。四是被動式服務向自動式和主動式服務轉變。數據產品的生產和輸出也要結合大數據的技術與思維,運用大數據技術讓客戶方便地獲取和響應反饋機制,及時地了解客戶的需求。
4.2 人才培養及思維方式的轉變
從事信息分析的工作人員應當轉變思維方式,在進行研究設計時,無須進行問卷調查或親自采訪收集數據,數據本身就存在,可以直接對數據進行預處理、清洗并開展研究。信息組織的目的是信息利用。圖情人獨特的學科能力就是致力于將各種信息變為系統的、統一的、整體的信息[8]。信息組織與分析的人才要注重自身能力的培養,不斷地更新自己的知識,掌握前沿分析處理和信息挖掘技術,學習計算機編程技能,了解服務領域的需求,由需求引導進步方向,不斷思考創新才能讓信息組織與分析在時代變革中繼續前進。
4.3 保留領域特色,拓展工作重點
信息組織作為圖書館和情報學的核心研究領域,是信息存儲、信息檢索、信息利用與服務的基礎和前提。在大數據的背景下,信息組織與分析將繼續發揮大數據資源的分類、記錄與描述、集中與縮減、定位與選擇、評價與管理、交流與共享等作用。需要注意保留圖情領域的特色,運用大數據技術和思維把原有的服務領域做好,同時拓展工作重點,主動跟蹤學科前沿領域、市場動態、國家重大科研計劃領域,發揮信息組織與分析的優勢,結合大數據相關技術深度挖掘情報信息,提供情報報告,對市場產品的研發、科學決策等提供數據支持,對科技前沿和相關領域做技術預見。
5 結語
大數據時代的到來給各個行業帶來沖擊,使得各行各業的人們對于數據的認知以及信息的處理方式發生了顛覆性的改變,原本特屬于圖情專業專有技術的信息組織同樣面臨著沖擊,但機遇與挑戰并存,只有轉變思維、培育人才、保留特色、開拓創新,勇于面對挑戰,積極尋求轉變才能讓信息組織與分析常用常新,在新形勢新時代也發揮出信息組織與分析的獨特學科魅力。
參考文獻
[1]危平,王冉.金融科技支持生物多樣性的價值分析與路徑探索[J].金融經濟,2022(5):40-50.
[2]鞠英杰.信息描述[M].合肥:合肥工業大學出版社,2010.
[3]王偉軍,蔡國沛.信息分析方法與應用[M].北京:清華大學出版社,2010.
[4]CCF大數據專家委員會.中國大數據技術與產業發展白皮書[R].中國計算機學會,2013.
[5]趙一鳴,馬費成.大數據環境對信息組織的影響[J].圖書情報知識,2017(1):4-10.
[6]施強.大數據、知識服務與當代圖書館學[M].杭州:浙江大學出版社,2020.
[7]謝映萍.數字化學習資源組織與目錄體系構建研究——基于建構主義和人本主義學習理論[D].長春:東北師范大學,2013.
[8]陳志新.圖情檔融合發展背景下信息組織的新趨向研究[J].圖書館,2021(7):31-38.
(編輯 何琳編輯)
Opportunities and challenges faced by information organization and analysis in the age of big data
Feng Jinyi
(Northwest University of Political Science and Law, Xi’an 710122, China)
Abstract:As the core research field of library and information science, information organization has met opportunities and challenges in the era of big data. Through the analysis of the challenges and opportunities faced by information organizations in the age of big data, this paper discusses the role that information organizations should play in the environment of big data, such as information organizations should continue to play a role in the description, marking, sequencing, classification, concentration and processing, exchange and sharing of big data resources, and look forward to the timely transformation of information organizations, promote the transformation of information organization awareness of map lovers and the development of information organization tools, promote the application of automation in information organizations, and promote the establishment of new description specifications to cope with the impact and challenges of the big data era.
Key words:big data; information organization; library and information