嚴 珊
(中南財經(jīng)政法大學(xué) 圖書館,湖北 武漢 430073)
大數(shù)據(jù)時代背景下,數(shù)據(jù)存儲和數(shù)據(jù)分析方式發(fā)生了巨大改變,網(wǎng)絡(luò)信息資源的開發(fā)與利用模式也隨之變化。圖書館作為文獻信息中心,其信息存儲和服務(wù)方式也受到巨大的沖擊和挑戰(zhàn)。大數(shù)據(jù)的到來,對圖書館的服務(wù)要求日益復(fù)雜和多樣化,圖書館的學(xué)科館員也逐漸轉(zhuǎn)向數(shù)據(jù)館員。1997年,美國學(xué)者J.Liscouski指出數(shù)據(jù)館員應(yīng)以用戶為中心,搜集信息資源,致力于解決數(shù)據(jù)管理問題同時保證信息資源的安全性、共享性以及可訪問性[1]。美國研究圖書館協(xié)會于2006年第一次提出圖書館服務(wù)工作中數(shù)據(jù)管理的作用與不可替代性[2]。2007年,A.Gold在數(shù)據(jù)生命周期研究中,得出數(shù)據(jù)的發(fā)現(xiàn)、選擇、獲取、許可、治理、存儲等都離不開數(shù)據(jù)館員的工作[3]。2008年,Swan和Brown提出“數(shù)據(jù)館員”這一崗位名稱,把“數(shù)據(jù)館員”定義為在圖書館中對各種數(shù)據(jù)進行采集、存儲、分析、利用和管理的工作人員[4]。L.David等指出數(shù)據(jù)館員在數(shù)字化研究中發(fā)揮了新的作用[5]。2011年,A.Elsa等調(diào)研了E-science招聘中關(guān)于數(shù)據(jù)館員的一些崗位需求和技能要求[6]。國內(nèi)圖書館關(guān)于數(shù)據(jù)館員的研究也有一些進展。蔣麗麗等通過對國外61所設(shè)置了數(shù)據(jù)館員崗位的服務(wù)模式進行調(diào)研,為國內(nèi)高校圖書館設(shè)置數(shù)據(jù)館員崗位、開展數(shù)據(jù)服務(wù)提供借鑒和指導(dǎo)[7]。郭桑、林薇調(diào)研了50所國外高校數(shù)據(jù)管理的崗位設(shè)置、職責和任職要求,研究數(shù)據(jù)館員在圖書館職能轉(zhuǎn)型中的作用[8]。高珊、盧志國通過IASSIST網(wǎng)站,對國外數(shù)據(jù)館員的崗位職責和招聘要求進行調(diào)查分析,以期為我國培養(yǎng)數(shù)據(jù)館員提供參考[9]。2015年,國務(wù)院《關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》,重點提出我國要加強數(shù)字圖書館、檔案館、博物館等公益設(shè)施建設(shè),構(gòu)建文化傳播大數(shù)據(jù)綜合服務(wù)平臺,并積極推進科學(xué)大數(shù)據(jù)的發(fā)展以及知識服務(wù)大數(shù)據(jù)的應(yīng)用[10]。資源建設(shè)的不斷加深,改變了圖書館的社會地位。從閱讀場所發(fā)展為以用戶為核心、提供知識服務(wù)的信息中心。圖書館的服務(wù)模式也隨之改變,從過去的文獻資源檢索服務(wù)、學(xué)科咨詢服務(wù)業(yè)務(wù)擴展到嵌入式科研服務(wù)、學(xué)科評價和數(shù)據(jù)服務(wù)等。因此數(shù)據(jù)館員這個崗位在數(shù)字圖書館的發(fā)展過程中將逐漸發(fā)揮更大的作用。本文擬從目前國內(nèi)外與數(shù)據(jù)館員相關(guān)的研究現(xiàn)狀、角色定位、素質(zhì)要求、未來發(fā)展等方面來探析數(shù)據(jù)館員在大數(shù)據(jù)環(huán)境下的實踐。
“數(shù)據(jù)館員”這一崗位至今并沒有統(tǒng)一名稱。筆者通過檢索IASSIST 網(wǎng)站,整理與數(shù)據(jù)管理崗位相關(guān)的招聘信息,得出高校圖書館對數(shù)據(jù)館員的崗位名稱和崗位職責要求,初步反映了目前數(shù)據(jù)館員的發(fā)展現(xiàn)狀。如表1所示:
從表1可以看出,“數(shù)據(jù)館員”的崗位名稱在圖書館中并沒有統(tǒng)一的命名。第一類是科研數(shù)據(jù)館員(Research Data Librarian),此類館員的工作側(cè)重于參與制定數(shù)據(jù)管理政策;支持研究人員管理、分析、共享和交流數(shù)據(jù);與教師和部門合作,提供嵌入式學(xué)科服務(wù),以科研數(shù)據(jù)為基礎(chǔ)進行數(shù)據(jù)挖掘和研究熱點預(yù)測。第二類是數(shù)據(jù)館員(Data Librarian),此類館員主要負責數(shù)據(jù)采集、管理、儲存及訪問等;定期訪談了解用戶需求;與研究服務(wù)部門合作,促進數(shù)據(jù)共享。第三種是數(shù)據(jù)服務(wù)館員(Data Services Librarian),此類館員側(cè)重于用可視化工具對原始數(shù)據(jù)進行分析,為用戶提供參考咨詢服務(wù)、科研數(shù)據(jù)分析和數(shù)據(jù)預(yù)測等服務(wù),也能為圖書館的決策提供支持。第四種是數(shù)據(jù)專家(Data Specialist),此類館員主要掌握數(shù)據(jù)的統(tǒng)計分析方法和工具,對數(shù)據(jù)進行多維度分析和挖掘。第五種是數(shù)據(jù)分析師(Data Analyst),主要工作是收集、處理、分析和報告數(shù)據(jù)。第六種是數(shù)據(jù)管理協(xié)調(diào)員(Data Management Coordinator),主要工作為協(xié)調(diào)和監(jiān)督研究人員以完成科研任務(wù);協(xié)調(diào)和提供有關(guān)評估、數(shù)據(jù)和報告工具的培訓(xùn)等。

表1 數(shù)據(jù)館員的崗位職責
2.2.1 崗位職責
在實際工作中,不同數(shù)據(jù)館員的工作內(nèi)容有很大的差異。對數(shù)據(jù)館員的素質(zhì)要求也很高,不僅深度融合了圖書情報專業(yè)技能、IT 技能與數(shù)據(jù)科學(xué)技能,數(shù)據(jù)館員的角色定位也要求其在圖情信息學(xué)科的基礎(chǔ)上,以多學(xué)科研究視角,采用整合的、關(guān)聯(lián)的研究方法與邏輯思維模式去明確、全面地認識和解決實際工作問題。大數(shù)據(jù)環(huán)境下,數(shù)據(jù)館員需能有效地利用數(shù)據(jù)和數(shù)字化分析方法和工具去驅(qū)動知識發(fā)現(xiàn)、知識復(fù)用和知識創(chuàng)新等,并在跨學(xué)科的基礎(chǔ)上完成服務(wù)模式和服務(wù)內(nèi)容的創(chuàng)造與創(chuàng)新。
從以下兩個方面對數(shù)據(jù)館員的工作內(nèi)容進行劃分:
一方面,從數(shù)據(jù)生命周期的角度進行劃分。
數(shù)據(jù)采集。數(shù)據(jù)館員的首要工作即為數(shù)據(jù)采集,也叫數(shù)據(jù)獲取,具體是指利用圖書館數(shù)據(jù)管理系統(tǒng)、網(wǎng)頁爬蟲或其他工具,從外部采集數(shù)據(jù)并輸入到系統(tǒng)內(nèi)部的一個過程。
數(shù)據(jù)存儲。數(shù)據(jù)存儲對象為數(shù)據(jù)流在加工過程中產(chǎn)生的臨時文件或加工過程中需要查找的信息。通過DSpace、FedoraCommons、Dataverse、Hadoop、NesstarOracle、DB2、MySQL等軟件優(yōu)化數(shù)據(jù)的存儲結(jié)構(gòu)。
數(shù)據(jù)分析。通過ETL、Informatica和開源的Kettle等工具來完成數(shù)據(jù)的提取、轉(zhuǎn)換和加載;通過R語言、BIEE、Python、Microstrategy、MapReduce、Hive、Matlab,Mathmatica和Maple等工具,進行數(shù)據(jù)可視化分析。通過Draw convnet、Tensorflow,NNSVG、PlotNeuralNet、TensorBoard、Caffe等工具,實現(xiàn)從線性數(shù)據(jù)到非線性數(shù)據(jù)的轉(zhuǎn)換,對數(shù)據(jù)進行神經(jīng)網(wǎng)絡(luò)設(shè)計分析與處理。
數(shù)據(jù)傳輸:內(nèi)部組織從一個實體流動到另一個實體。
數(shù)據(jù)銷毀:通過相關(guān)技術(shù)對數(shù)據(jù)和數(shù)據(jù)的存儲介質(zhì)進行處理,使其完全徹底丟失并且無法恢復(fù)。

圖1 數(shù)據(jù)生命周期
另一方面,從圖書館的服務(wù)內(nèi)容進行劃分。
數(shù)據(jù)標準制定。數(shù)據(jù)種類繁多,來源、存儲介質(zhì)和形式等也各不相同,數(shù)據(jù)館員需對眾多數(shù)據(jù)制定相應(yīng)標準,并進行分類加工和存儲,以便用戶查閱。
數(shù)據(jù)信息保障。包括數(shù)據(jù)政策解讀、數(shù)據(jù)倫理規(guī)范以及數(shù)據(jù)安全維護等。數(shù)據(jù)館員通過使用相關(guān)數(shù)據(jù)軟件和管理知識對數(shù)據(jù)進行處理,確保數(shù)據(jù)合規(guī)地、科學(xué)地、高效地能被用戶獲取與利用。
數(shù)據(jù)素養(yǎng)教育。數(shù)據(jù)館員對科研機構(gòu)、團體、個人等不同的用戶進行有針對性的數(shù)據(jù)素養(yǎng)培訓(xùn),如嵌入式教學(xué)或開放網(wǎng)絡(luò)課程,提高用戶的數(shù)據(jù)管理意識和數(shù)據(jù)處理能力。
科學(xué)研究支持。① 協(xié)助科研人員制定與科研有關(guān)的數(shù)據(jù)管理計劃;②為科研人員提供數(shù)據(jù)獲取、存儲等技術(shù)和服務(wù);③利用數(shù)據(jù)分析工具,協(xié)助科研人員處理數(shù)據(jù);④開發(fā)數(shù)據(jù)開放獲取平臺,方便科研人員檢索、搜集數(shù)據(jù)。
數(shù)據(jù)宣傳服務(wù)。對圖書館的相關(guān)館藏、數(shù)據(jù)資源與服務(wù)進行數(shù)據(jù)化分析,采用可視化圖表對外進行宣傳。

圖2 數(shù)據(jù)館員崗位職責
2.2.2 服務(wù)特點
服務(wù)智能化。圖書館在管理和對外開展基礎(chǔ)服務(wù)的過程中會產(chǎn)生巨大的不同種類的數(shù)據(jù),對這些數(shù)據(jù)進行整理、挖掘、分析和利用,并在此基礎(chǔ)上展開新的服務(wù)和制定新的決策。其結(jié)果是不僅提高了圖書館的服務(wù)水平,同時也改變了整個圖書館的服務(wù)模式?,F(xiàn)階段,國內(nèi)外圖書館開展的智能化服務(wù)主要包括圖片影像信息智能提取和推送、用戶行為分析與預(yù)測、嵌入式科研支持、圖書館決策智能制定、智能機器人問答等。這些服務(wù)的開展,預(yù)示著圖書館的基礎(chǔ)服務(wù)已經(jīng)成熟,并逐漸向智能化服務(wù)方向轉(zhuǎn)變。
服務(wù)動態(tài)化。數(shù)據(jù)館員在對外開展服務(wù)過程中,不僅要解決用戶的當前問題,還需跟蹤用戶的后續(xù)行為數(shù)據(jù),以此來分析用戶潛在的隱性需求,在此基礎(chǔ)上為客戶開展個性化服務(wù)。數(shù)據(jù)館員是一個職位名稱,但不是固定的崗位,需融入到圖書館不同的業(yè)務(wù)中,從事不同方面的數(shù)據(jù)服務(wù),對圖書館的數(shù)據(jù)資源以及用戶的行為數(shù)據(jù)進行動態(tài)跟蹤和動態(tài)分析。在開展跟蹤動態(tài)服務(wù)的過程中,圖書館以此來了解資源建設(shè)情況和服務(wù)水平,并能在掌握用戶需求下不斷提高圖書館的服務(wù)質(zhì)量以及完善圖書館對外服務(wù)模式。
數(shù)據(jù)館員作為復(fù)合型人才,要求其有跨學(xué)科背景,即要求專業(yè)基礎(chǔ)學(xué)科和其他學(xué)科的結(jié)合,將多學(xué)科融合作為人才選擇的基本標準。一般需要2個學(xué)科背景,如圖書情報與經(jīng)濟管理的結(jié)合,或者統(tǒng)計學(xué)與社會科學(xué)等的結(jié)合。
在日常服務(wù)工作中,圖書館會產(chǎn)生很多數(shù)據(jù),如:館藏借閱信息,數(shù)據(jù)庫購買、瀏覽、下載信息,學(xué)科咨詢信息等數(shù)據(jù)。數(shù)據(jù)館員在掌握這些數(shù)據(jù)的基礎(chǔ)上,要熟悉圖書館的業(yè)務(wù)并了解這些數(shù)據(jù)之間的內(nèi)在聯(lián)系和邏輯,并以此開展數(shù)據(jù)挖掘、用戶行為預(yù)測分析并進行個性化服務(wù)。并通過可視化方式呈現(xiàn)給用戶,實現(xiàn)多維的、深度的、動態(tài)的服務(wù)。如:不同的館藏資源利用率不僅反映了用戶對圖書的喜愛程度,也反映了學(xué)科發(fā)展優(yōu)勢以及科學(xué)研究熱點和進展。圖書館可借此數(shù)據(jù)完善自身的資源建設(shè)、對用戶進行圖書推薦,也能依此對用戶開展個性化科研支持服務(wù)。
數(shù)據(jù)館員在數(shù)據(jù)生命周期的基礎(chǔ)上,需掌握相關(guān)技術(shù)和軟件使用方法,如數(shù)據(jù)存儲軟件DSpace、FedoraCommons、Dataverse、Hadoop、NesstarOracle、DB2、MySQL;數(shù)據(jù)開發(fā)技術(shù)如Python、HTML、Java等開發(fā)語言;數(shù)據(jù)分析軟件SPSS、Matlab、DSpace、CiteSpace等,能快速有效地提取文獻中的主題、關(guān)鍵詞、作者、機構(gòu)、通訊地址等信息并進行可視化分析,以便用戶更好挖掘其內(nèi)在信息。
數(shù)據(jù)館員的工作可根據(jù)數(shù)據(jù)生命周期或圖書館的對外服務(wù)工作進行分工。但根據(jù)數(shù)據(jù)館員的工作內(nèi)容和職責來看,其不同崗位的工作是聯(lián)系極其緊密的,需不同的數(shù)據(jù)館員進行分工協(xié)作。因需對龐大的不同種類的數(shù)據(jù)進行采集、存儲、分析,因此數(shù)據(jù)館員的日常工作需要不同學(xué)科和技能的充分融合和團隊協(xié)作。以此充分發(fā)揮數(shù)據(jù)館員的技術(shù)和學(xué)科優(yōu)勢,提高圖書館的服務(wù)質(zhì)量。
根據(jù)大數(shù)據(jù)定律:“數(shù)據(jù)越龐大,分析的結(jié)果越準確”,采用圖書館聯(lián)盟,通過不同數(shù)據(jù)館員的分工協(xié)作與資源共享,一方面增加數(shù)據(jù)預(yù)測的準確率,另一方面發(fā)揮不同圖書館的學(xué)科優(yōu)勢和館藏資源優(yōu)勢,為用戶提供跨學(xué)科、跨地區(qū)的專業(yè)性數(shù)據(jù)服務(wù),提高圖書館整體的服務(wù)質(zhì)量。
大數(shù)據(jù)時代下,隨著科學(xué)技術(shù)的不斷發(fā)展,科研數(shù)據(jù)紛繁復(fù)雜,對數(shù)據(jù)管理的需求越來越強烈,數(shù)據(jù)管理者這一崗位的產(chǎn)生,順應(yīng)用戶需求,也是圖書館轉(zhuǎn)型發(fā)展的必經(jīng)之路。
體現(xiàn)在以下3個方面:①數(shù)據(jù)館員崗位名稱的多樣性。如數(shù)據(jù)管理者、數(shù)據(jù)服務(wù)館員、科研數(shù)據(jù)館員、社會科學(xué)數(shù)據(jù)館員、數(shù)據(jù)分析師、數(shù)據(jù)管理規(guī)劃顧問、地理信息系統(tǒng)館員以及數(shù)據(jù)管理協(xié)調(diào)員等。②數(shù)據(jù)館員崗位職責內(nèi)容的深度化發(fā)展。從數(shù)據(jù)查找、數(shù)據(jù)獲取、數(shù)據(jù)脫敏、數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)交換、數(shù)字共享到數(shù)據(jù)素養(yǎng)、數(shù)據(jù)安全、數(shù)據(jù)銷毀等,再到嵌入式教學(xué)與科研以及成為科研人員的合作伙伴等。③多方位的工作聯(lián)絡(luò)體系。數(shù)據(jù)館員發(fā)揮數(shù)據(jù)媒介作用,上與數(shù)據(jù)創(chuàng)造者、數(shù)據(jù)科學(xué)家,下與科研工作者、學(xué)科館員、數(shù)據(jù)存儲庫管理員、法律咨詢顧問等工作人員的合作,共同致力于推動機構(gòu)存儲庫、數(shù)據(jù)館藏資源建設(shè)、數(shù)據(jù)信息素養(yǎng)、數(shù)據(jù)管理等數(shù)據(jù)服務(wù)的實踐發(fā)展。
一方面,在學(xué)習(xí)中完善館員學(xué)科認知,提高數(shù)據(jù)館員的綜合素養(yǎng)。如:利用圖書館平臺,邀請圖情專家或舉辦數(shù)據(jù)館員實踐發(fā)展會議,為館員提供數(shù)據(jù)管理知識和相關(guān)軟件、技術(shù)等培訓(xùn);開放線上課程,鼓勵館員積極參與,充分挖掘館員個人的知識儲備。另一方面,理論聯(lián)系實際,在實際中鍛煉和強化館員的學(xué)科認知體系。鼓勵數(shù)據(jù)館員積極參與到科研項目中,將所掌握的數(shù)據(jù)管理的理念、方法和技能運用在嵌入式科研工作支持中。如:與科研人員合作,協(xié)助其開展項目的前期制定、項目中期的數(shù)據(jù)管理與數(shù)據(jù)分析、項目后期的深度挖掘和測評等。
數(shù)據(jù)文化是在數(shù)據(jù)理性的基礎(chǔ)上追求數(shù)據(jù)效益;在數(shù)據(jù)搜集使用過程中對數(shù)據(jù)危機具有覺醒意識,并能進行批判性反思與評價。主要包括:數(shù)據(jù)價值觀,即在數(shù)據(jù)研究過程中,認識到數(shù)據(jù)的作用與價值;數(shù)據(jù)態(tài)度觀,即在科研項目流程中能嚴謹?shù)貙Υa(chǎn)生的每一個數(shù)據(jù);數(shù)據(jù)行動觀,即尊重數(shù)據(jù),富有責任心的發(fā)布和利用數(shù)據(jù),保證數(shù)據(jù)獲取方式的公平、公正、公開。圖書館數(shù)據(jù)館員在采集、篩選、處理數(shù)據(jù)時,應(yīng)具有數(shù)據(jù)危機和數(shù)據(jù)價值判斷意識;在組織、交流、共享數(shù)據(jù)的過程中,具有低耗、高效的生態(tài)傳承意識;在數(shù)據(jù)宣傳和數(shù)據(jù)服務(wù)中,具有高質(zhì)便捷的生態(tài)服務(wù)意識。以此不斷提高數(shù)據(jù)館員的社會責任感和生態(tài)職業(yè)意識。