裴 昱
(廣東工業大學圖書館,廣東 廣州 510006)
近年來,大數據這個名詞變得越來越流行、越來越重要,成為了國家和政府層面的發展戰略[1]。在政府企業做出決策的過程中,經常要參考大量數據以及以此為依據得出的結論。然而,在當今社會中,影響決策的信息源基數與信息源所產生的有效數據日益增多。這些海量信息所蘊含的大量商業價值也逐漸映入了決策者的視野。
大數據通常被認為是一種數據量很大、數據形式多樣的非結構化數據[2]。針對這些海量信息,即大數據所進行的數據倉庫、數據安全、數據分析、數據挖掘,并從中獲得有價值信息的技術,就是大數據技術。
大數據技術的意義不在于對大數據信息的搜集,而在于對龐大數據的深度處理,從中分析和挖掘出有價值的信息。例如消費者在網站上的搜索記錄在亞馬遜的數據庫中,通過分析用戶的購買行為,向用戶推薦合適的產品,實現精準營銷。在互聯網行業,通過對接入設備、廣告、B2C業務的實時分析,從而達到不影響用戶體驗和快速準確營銷的目的,進而與各垂直行業發生深度融合,以帶動社會化媒體、電子商務的蓬勃發展。在金融服務領域,通過對銀行發卡量、用戶具體業務數據的分析,能夠對客戶信用額度進行有效的調整。同時,針對不同客戶采取不同的宣傳、營銷策略。在能源行業,能源勘探開發數據類型眾多,不同類型數據包含的信息各具特點,綜合各種數據所包含的信息才能得出地下真實的地質狀況。因此,它對大數據產品和解決方案的需求集中體現在:可擴展存儲、高帶寬、可處理不同格式數據的分析。在醫療行業,數據量主要來自于B超、病理分析等業務所產生的非結構化數據。通過對臨床操作的大量數據,包括醫療數據、監控影像、臨床決策、癥狀對比等的研究,可以預測或建立疾病模式。在此基礎上,公共衛生部門可對全國電子病歷數據庫進行全面的監測和快速的響應。
總之,大數據技術已經滲透到我們生活的方方面面,這些種類多、基數大的海量數據蘊涵著極大價值。作為可能產生海量數據并擁有眾多讀者的圖書館,具備大數據信息的來源與信息服務對象。因此,探討圖書館大數據信息的利用方式尤為必要。
首先,以不同的主體為研究對象,以不同的事件為線索,均能夠得到一系列數量龐大的流水記錄。例如,以讀者為分析對象,以讀者借閱圖書的標準流程為線索,其生成的信息依次為:讀者姓名、進入圖書館的時間、查詢圖書的關鍵詞、目標圖書的狀態、讀者借閱的狀態、借閱(或歸還)圖書的登記信息、離開圖書館的時間。同理,以圖書借閱登記人員為對象,同樣以圖書借閱的標準流程為線索,依次產生的信息為:被借閱圖書的狀態、讀者的狀態、圖書借閱的時間。
其次,除了具有這些實時生成的零散的數據流信息,圖書館還擁有館藏圖書信息、中外文論文庫信息、電子材料信息以及其他經過整理匯總得到的資源信息。
最后,在圖書館的整體運作過程中,有可能與學校部門、學生團體、社會團體、出版社產生一定的聯系。由此會產生活動開展、場地租借、廣告承載、新書出版等具有一定潛在商業價值的信息。雖然圖書館屬于非營利性公益事業單位,但如何使這些具有潛在商業價值的信息真正發揮作用,也是值得思考的。
從某種意義上來講,作為文化領域職能單位之一的圖書館,與文化領域其他單位的互動其實是最為便捷的。通過讀者的借閱信息,根據民眾所關心的時事熱點,向特定群體發送館藏信息及推薦資料。這種主動的推送通知,可以通過時下流行的各種方式,如微博更新、微信群發。另一方面,通過新穎方式與讀者進行有效互動所得到的反饋信息,將被用來進一步豐富館藏,逐漸形成針對讀者需求而發展的良性循環。這種良性的循環,不但改善了從前圖書館在讀者心目中刻板的形象,而且將讀者逐漸融入圖書館的運作。
圖書館是服務提供者的角色。面對知識鏈條的上游,圖書館應當也能夠承擔起科技創新發起者的角色,主動為專家學者提供有價值的參考信息,一定程度上引導專家學者的研究方向;而面對知識鏈條的下游,圖書館仍然能夠參與到科技轉化為實際生產力的隊伍當中。通過廣泛開展新型科技理論的展覽和推介,加強與社會上科技轉化團體的聯系,在為國家科技建設添磚加瓦的同時也挖掘出圖書館自身在商業、科技領域的綜合價值。對圖書館產出信息在科技領域的利用方式可以參考以下幾點:①學科服務,課題跟蹤。傳統的圖書館信息服務模式是參考咨詢,這種服務方式較為被動,旨在對圖書館資源及信息渠道自身的維護,通過軟硬件設施、人力資源來實現具體服務。學科服務是一種新型信息服務形式,它在當下的海量信息時代表現為專人專崗地向學校以及學校的科研力量提供行業前沿信息的個性化服務。這種包括信息的搜集、傳遞與分析的服務形式在國外已經具有一定的規模與成效。圖書館信息在科技領域的應用,可以視作由參考咨詢向學科服務的轉變,它要求館員從“走進來的服務”向“走出去的服務”轉變[3],從而帶動圖書館參與學校學科建設。②科技查新。目前國家教育部授權84所高校科技查新資質,這些科技查新中心為校內外的科研活動開展查新服務。為了提高服務水平和效率,很多學校已經研發和使用具有查詢和統計功能的查新管理系統,系統按照委托單位(校內和校外)、查新類型、查新范圍、時間、學科、地區等條件可對本年度的查新項目進行統計。通過以上各類的查詢和統計功能,查新站管理人員可以方便地掌握工作進展情況,提高業務管理的效率。各類統計數據也可供學校相關部門參考,及時把握學校科研動態和規劃。圖書館科技查新系統形成的數據庫能夠以查新課題為依托將科技信息服務貫穿于科研活動的各個環節,從科研立項、實施、鑒定、報獎到成果轉化和應用全過程[4]。該系統的歷史數據自身就是一個單位、科研梯隊、科研人員的很有價值的資料庫,利用信息技術、網絡技術對查新過程進行管理,可以有效地體現科研積淀[5],逐步形成全國科研信息特色數據庫,從而更深層次地提高服務水平。
圖書館的讀者本身來自于社會上的各個領域。很多讀者身處生產的第一線,其自身水平的提高將直接作用于生產力的提高。圖書館作為最新生產力的理論擁有者,如何向一線生產者灌輸最新的理論將是很有價值的研究方向。而經過生產者實踐的科技理論,反過來進一步影響研究人員的理論創新。對圖書館產出信息在生產領域的利用方式可以參考以下幾點:①依據生產實踐類圖書的借閱情況,聯系社會資源主動向讀者群進行培訓。培訓可定期或不定期,都可使圖書館成為讀者職業或興趣培養的紐帶。②聯系應用研究專家與實際應用群體,一方面為研究人員提供素材,一方面為實際應用人員提供指導。
嚴格來講,教育本身即屬于文化領域。大學圖書館所具有的能力和搜集到的信息,占據了圖書館整體信息量產出的絕大部分。大學圖書館能夠產出的信息可以用作以下幾方面:①為學校提供選修課開班的依據;②為學生選課、選導師、選畢業論文指導方向;③為數據庫培訓、舉辦講座提供參考;④為社會培訓機構、興趣聯盟的引入充當中介。
目前,多數學校圖書館采用的是門禁系統。師生進入圖書館要刷相應的證件方可通過門禁系統,由此產生的海量刷卡流水記錄就是一種大數據。通過對這些信息的統計,可以得到某一時間段內師生進出圖書館的時間與頻率,比如晚上的讀者比白天多,期末考試前一個月比平時的讀者多,去圖書館復習功課的學生比進行課外閱覽的學生多等。針對這些信息的分析,圖書館可以靈活調整開放時間與開放區域,便于資源更合理的使用。
通過對搜索關鍵詞的搜集與統計,以類似搜索排行榜的形式,主動引導讀者對相關內容的關注,從而帶動相關圖書的借閱。同時,通過這類信息,圖書館自身采購圖書時也可以對關注度較高的圖書種類予以一定的傾斜。
通過對具體圖書借閱的統計,學校可以利用這些信息舉辦校園書香節和讀者服務月活動,從中選出借閱量最多的前幾十位讀者。讀者專業與圖書類型的關聯統計,比如與其他專業讀者相比,外語學院的讀者借閱專業外語書籍就較多些。
電子數據庫的信息包括實體圖書文獻的電子版、音視頻教程、圖片畫作、試題庫等豐富的資源。這些資源是圖書館長期固有的,并且已經過了一定程度的數據集中,常規的利用方式是儲存、查閱和傳遞。通過對其特征的解構——例如內容、技法、適用范圍,匹配不同需求特征的人群,就能夠得到針對個人定制的數據庫。這種針對個人需求特性的數據庫既能夠增強用戶對圖書館的依賴,又能減少用戶進行搜索時所耗費的資源。
在圖書館更新或擴大館藏時,與出版社的聯系尤其緊密。在這種行為當中,圖書館將得到不同出版社正在或將要發行的圖書信息。對于讀者,這些信息一方面支撐了當下閱讀,同時也將引導未來閱讀的方向。因此,及時且有目的地向讀者提供此類信息,將加速圖書館從“知識中介者”向“知識引導者”的角色轉變過程。
圖書館具有對信息與知識的承載、組織、開發、創新、使用與傳承的功能[6]。作為圖書館長期以來的固有職能,信息承載的功能本身也應當發生積極的變化。以往,圖書館的信息承載體,如公告欄——僅僅刊登圖書借閱流程、文學作品介紹等內容。事實上,通過對讀者借閱圖書的數據分析,針對讀者的學習興趣,圖書館完全有能力引入社會上優秀的培訓組織或興趣聯盟,從而將學校與社會的力量有機結合起來,更好地為讀者服務。
大數據時代給社會各個領域帶來新的發展機遇,同時也為圖書館帶來創新轉型的可能性。基于固有以及可產生的各類信息資源,借鑒國外已有的創新經驗,結合社會相關單位的力量,圖書館將會發生相當程度的角色轉變,進而在個性化信息服務的大潮中取得較好的發展。
[1] 徐子灃.大數據:正在到來的數據革命,以及它如何改變政府、商業與我們的生活[M].桂林:廣西師范大學出版社,2012:40-57.
[2] 大數據時代的特點[EB/OL].[2012-05-20].http://www.5lian.cn/html/2012/xueshu_0417/32237.html.
[3]陽海燕,陳遠方.從參考咨詢走向學科服務——論高校圖書館參考咨詢的學科化服務[J].長沙大學學報,2011(6):158-160.
[4] 朱世清.科技查新系統的設計實現[D].揚州:揚州大學,2009.
[5] 袁潤,等.科技查新信息管理系統的設計與實現[J].現代情報,2007(7):152-155.
[6] 王雅坤.信息時代圖書館社會功能的定位思考[J].河北科技圖苑,2005(3):77-78.