周曉英+劉莎+馮向梅

(1.中國人民大學信息資源管理學院 北京 100872)
摘 要:文章從信息-技術-人三個方面分析了大數據對情報學帶來的影響,以及數據提取知識的大數據應用目標與建立人與知識間關聯的情報學目標之間的關系。通過對美國國立衛生研究院的BD2K大數據項目的案例分析,從信息-技術-人的維度、數據生態系統建設以及數據素養提升三個方面,提出了情報學的大數據應對策略。
關鍵詞:BD2K;大數據;情報學;信息-技術-人;信息鏈;應對策略
中圖分類號:G250.2 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2017030
1 引言
大數據是近五年來我國情報學的研究熱點,在中國知網的“圖書情報與數字圖書館”子庫中以“大數據”作為主題搜索,能夠檢索到2183篇論文,其中2013年之前只有零星的論文,2013年之后每年以約300多篇的速度增加(見表1)。以“大數據+影響”為主題搜索,能夠檢索到317篇論文,以“大數據+策略”為主題搜索,能夠檢索到278篇論文(截至時間為2017年2月10日)。可見我國圖書情報領域對大數據及其影響和策略的研究成果在短短的五年內增長速度非常快。
盡管大數據對情報學的影響和對策研究論文數量增長很快,但其一,大數據和數據科學的發展本身尚處在起步階段;其二,相關論文增長的年代還不夠五年,歷時比較短;其三,大數據的影響和策略研究成果大多從圖書館的角度開展。因此,開展大數據對情報學的影響以及情報學的應對策略,對于情報學在大數據時代的準確定位以及健康發展非常有必要。
本文將從情報學的視角,結合醫療健康領域大數據的國家應對措施的案例分析,研究大數據對情報學的影響,探討情報學的大數據策略。
2 情報學視角的大數據影響分析
2.1 大數據影響的考察維度
2.1.1 大數據的數據、技術和應用三個維度
考察大數據的影響,我們首先要找到一個全面和客觀的考察維度。對于什么是大數據,業界已經存在很多定義以及圍繞著定義的質疑,很多學者認同大數據是有著“4V”(即容量(Volume),種類(Variety),速度(Velocity)和價值(Value)) 特征的數據,其數量大、類型多、實效強、價值高。大數據的發展歷史并不長,故人們常在不同立場上對其定義進行敘述,因而,不同背景下大數據就有不同的指向,只有站在同樣的認知角度上討論大數據的問題,才能得到解決大數據問題的正確辦法。
大數據最先是來自技術領域的術語,它被認為是現有的技術手段難以在短期內處理的數據,2009年美國政府發布了數據網站,率先開始了政府數據開放的歷程,到2012年美國政府發布“大數據研究和發展倡議”之后,從決策和應用的角度研究大數據才開始大量出現。大數據之所以受到廣泛的關注并不因為它是技術上的新挑戰,當前人類科學和技術上的挑戰很多,但大多數都只受到科學家或工程師們的關注,而大數據的不同是因為它的應用價值高、影響廣泛深刻。
朱揚勇和熊赟[1]論述了大數據的三個要素,即數據、技術和應用,是對大數據比較全面的認識。大數據中隱含了大價值,需要技術支持價值的發掘,需要結合社會應用來實現價值。
2.1.2 情報學的“記錄的知識、人、工具”三大內容結構
對于情報學的內容結構,業界同樣存在很多不同的認識。2000年,J.M.Griffiths[2]在《回歸未來:千禧年的信息科學》一文中將情報科學的基本構成歸納為“人、記錄的知識、工具”三個要素,并提出了圍繞三個要素的情報學研究內容,對人的研究內容包括:人與信息的關系、人的認知過程和知識結構、人的信息查詢行為、人所處的信息環境、人與環境的互動、人際互動;對記錄知識的研究內容包括:知識組織與傳播、信息管理和知識管理、信息檢索設計、信息計量學、網絡計量學;對工具的研究內容包括:人在獲取、存貯、識別、傳播記錄的知識中起作用的工具如分類法、標引、主題詞表、檢索算法、搜索引擎、人工智能等[2]。
而早在1999年,iSchool運動便開始興起,最早有十多所世界一流的LIS院系參與iSchool聯盟,秉承聯盟所倡導的在教學和研究中關注“人-信息-技術”以及它們之間的關系的理念。
2.1.3 “信息(數據)-技術-人”的考察維度
從大數據的“數據-技術-應用”視角、到情報學內容結構的“知識-工具-人”視角、以及iSchool的“信息-技術-人”的相互關系視角,雖然它們的思想來源不同,但卻是異曲同工。大數據視角中的“數據”,可以看作是信息的一種,或者說是信息的原料;大數據強調的“應用”就是強調大數據對人的作用,強調大數據的人文關懷;大數據視角和iSchool理念強調的“技術”比情報學內容結構中的“工具”范圍稍微廣泛一些,但是都是圍繞信息或者數據的獲取、存貯、識別和傳播所起作用的技術、工具或者方法。
所以,不管我們是從全面認識大數據本身的角度,還是從情報學內容結構以及iSchool理念的角度分析,從“信息-技術-人”的角度關注大數據帶來的影響都是一種可行的、客觀的考察模式。
2.2 大數據帶來的影響分析
2.2.1 從信息方面看
網絡可以留下人類行為的數字化記錄,科學儀器采集記錄大量的實驗和觀測數據,可穿戴設備記錄人體生理和活動數據,這些逐漸形成了來源多樣、數量巨大的大數據;數據的采集、存儲、傳播技術的發展使數據利用的成本降低、便利程度提高,逐漸造成了當今社會人人生成數據、人人需要數據、人人分析數據、人人理解數據的狀況;大數據可以在不經意間自然反映出一些過去無法用科學手段揭示的現象和結果,直接影響人們的決策,因此很快被應用普及。以公共健康為例,集中記錄匯總全國或全地區的患者病歷數據庫、匯總患者的臨床記錄,形成覆蓋全面的大數據,便可以幫助醫療機構快速檢測傳染病,進行疫情監測、疾病監測,還可以聯動公眾健康個性化咨詢和疾病防控的快速響應程序,從而形成智慧醫療的效果。