沈華根
摘 要:文章主要以高校學術科研環境為條件,通過收集整理以高校師生的信息檢索關鍵詞等主要信息為基礎,以此對高校師生的信息搜索行為進行大數據分析,并構建用戶信息搜索行為模型。對相同條件下所獲得的師生在科研方面進行的搜索行為,以及所獲得的研究文獻進行分析和比較,總結出大學中各學科各專業的師生檢索行為形式和范圍的異同,并結合當下的高校學科信息服務,從而形成信息服務的創新理念的研究基礎和依據。
關鍵詞:檢索行為;大數據分析;高校;學科信息服務
大數據分析的含義是指對數量龐大的、類型復雜的、高并發的數據進行收集、挖掘、存儲,并進行數據計算和分析,產生可視化的數據報告,便于人工分析,用于輔助決策的一種技術。而面對當下數據量爆棚的時代,對于原始數據的采集和分析,對于系統的兼容性、系統的存儲效率、數據的訪問速度、用戶體驗中的人性化設計,則越來越多地得到了科研人員的重視。高校作為國家科研力量的重要組成部分,如何利用大數據分析提高數據檢索的效率,以智能化的檢索推送減少科研人員查找信息的時間,則成了學科信息服務所要重點研究的內容。
1 大數據分析中用戶信息行為數據的前期處理
1.1 用戶信息行為數據的規范化處理
由于數據本身具有類型繁多、信息量大、處理速度快、時效性高、結構復雜等特點,所以在對大數據進行分析的過程中,會造成一定的資源損耗,增加復雜程度和成本。所以為了更加有效、快捷地分析大數據,就必須在前期工作中對用戶信息行為數據進行規范化處理。具體處理的方式是在進行大數據分析之前對服務器所采集到的海量數據進行去除相同用戶下的相同數據等冗余數據,將數據進行格式規范化等處理,在這一過程中提升數據的可利用性和真實性,為后期數據分析中有效地降低成本和分析時間打下基礎。另外,為了避免數據處理過程中誤差的累積,需要對每一個過程中產生的誤差進行控制,以保證最終多次處理過程中累積誤差滿足預定的范圍[1]。
1.2 搭建具備科學性分析能力的大數據分析系統
前文所提到的在對數據進行規范化處理的過程中,如果僅靠有限的人力進行甄別處理,顯然是不現實的,所以搭建具備科學性分析能力的大數據分析系統是保證數據分析結果準確的必要前提和保障。由于該分析工作的研究對象是全校師生,所以所得到的信息行為的信息量相對比較大,且數據結構呈現復雜和多樣化的特點,因此需要大數據分析系統具有較高的數據辨別和分析能力。在搭建大數據分析系統的同時,其他準備工作和相關輔助設備也是不可或缺的。例如需要根據自身學校特點,制定數據收集的標準和流程,在對數據進行清洗和分析前,也必須保證有對應的規模較大的存儲陣列存儲行為數據。
1.3 大數據分析有利于提升用戶信息搜索行為分析的準確性
傳統的信息行為的研究方法主要是通過問卷法、訪談法等方式,對中小型的結構化數據進行分析。相對于傳統的信息行為的研究方法,大數據分析中所處理的是大規模半結構化、非結構化的數據,從總體數量與難度上都有了不小的提升。總體來看,利用大數據分析方法可以更全面、準確地收集到指定范圍內的用戶所產生的信息搜索行為數據。具體表現為收集到的數據樣本的規模更為龐大,幾乎可以完整地涵蓋整個用戶群體所產生的信息搜索行為數據。另外,通過此類方法收集的數據也更具有客觀性,搜集的途徑全部來自于用戶的搜索信息,不會因為用戶的主觀意識而造成數據失真的情況,保證數據的真實性。
2 構建用戶信息搜索行為模型
基于用戶行為和大數據分析的模型構建及個性化服務方案。
2.1 構建個性化服務模型
根據對大數據背景下高校學科信息化服務模型的需要,可以計劃構建一個基于用戶行為和大數據分析的學科個性化服務模型。該模型系統中可以主要分為用戶行為數據挖掘和用戶個性化服務兩個部分,在用戶行為數據挖掘中,該模型主要負責提供數據的集成和處理;在用戶個性化服務方面,主要提供通過對用戶檢索關鍵詞等檢索記錄的擴展性分析,對用戶可能所需要的學科知識進行挖掘和分析,進而為用戶推送相關學科知識聯想等多個方面的服務體系。
2.2 用戶個性化服務策略的構建
用戶行為數據挖掘技術在這一實施過程中是關鍵步驟,學科信息服務也將會產生新的特征。在個性化服務策略方面,一般注重個性化、交互性、實效性和人性化等幾種基本特性,通過這些服務策略,可以進一步提升學科服務的質量和多樣性。例如實時性和交互性源自于對用戶檢索行為數據的長期收集、存儲和分析,個性化的用戶行為數據則能夠緩解收集到的用戶數據出現信息過擬合現象[2],通過個性化的用戶信息推送和擬合聯想,也可以反映出用戶所需專業門類大方向的需求。借此可以加強學校學科信息服務的主動推薦服務和檢索服務,讓用戶在使用學科信息平臺的同時,對相關服務可以產生良性互動,再通過用戶與用戶之間、用戶與校方的反映,得到一個相對合適的個性化服務評判標準。
2.3 進一步滿足用戶對于信息檢索的需求
如何實現在用戶使用數據庫的過程中,對用戶可能想獲取的信息進行高效、準確的判斷和捕獲是幫助高校信息化建設進行大數據融合、云計算,以適應未來高校科研需求的關鍵組成。隨著時代的發展,越來越多的新興概念和專業出現在研究者的視線里,而高校所服務的師生用戶數量大、專業方向廣、類型復雜,且師生在搜索方面的習慣具有很強的隨機性和不確定性,所以針對用戶的需求而凸顯出大數據分析本身需要追求準確性和價值性,而不是一味地看數量是否龐大。同時,在向用戶展現大數據分析的結果時也需遵循一定的原則,例如需要堅持數據關系的精確表示、方便用戶查詢和理解的原則,既保證數據結果的直觀生動,又保證數據能夠與用戶的邏輯思維一致,減少因為表現模糊而降低數據結果的價值[3]。
3 大數據分析在面向用戶服務中的實施策略
3.1 數據挖掘和分析的物理環境支持
大數據分析平臺在實際應用中應當遵循高效、智能、可視化的構建原則,通過技術手段有效提高對數據的獲取率,降低工作人員工作量的同時,還要為高校師生用戶能夠提供精確、實時、可利用率和參考度高的可視化大數據分析示意圖。同時也可以為學校整體的專業建設和管理提供便捷的大數據決策參考。在大數據分析平臺與大數據存儲池進行數據讀取時,應當在保證數據傳輸安全、快速的前提下,保證平臺能夠動態地發現大數據庫數據的內容、結構和關系變化,通過有效下載、整合大數據而完成動態變化的可視化分析結果[4]。
由于大數據資源池中所存儲的資源具備數量龐大、類型結構復雜和處于動態發展變化的特點,所以大數據分析平臺應當支持可以將數據隨時傳輸到數據分析服務器上,由高性能的分析服務器即時完成對所上傳的用戶信息行為大數據的分析,并將分析結果傳輸到Web頁面或客戶端上進行集中顯示。另外,大數據分析平臺還應具備較強的智能性和人性化設置。理論上應當可以通過對服務器將數據上傳的結果按照客戶意愿以動態的圖形、表格等方式展示出來,保證通過智能反饋控制有效保證服務系統性能最優化。
3.2 用戶個性化數據服務的其他要求
在獲取知識資源的渠道逐漸多元化發展的當下,用戶對于個性化信息服務的要求也顯現出多樣化、復雜化的特點,這就要求應當準確、實時地掌握和發現用戶的需求走向趨勢,和未來信息服務的發展方向,以便為更科學地作出大數據服務決策和提供服務做好準備。同時在進行用戶信息行為數據的分析過程中,應當在保證數據準確可信的前提下,做好保護用戶的數據安全和隱私保密工作。合理利用網絡安全保護設備和平臺,確保用戶的信息數據不會泄露。
4 結語
用戶信息行為分析是在以大數據的條件和前提下所進行的技術分析,對高校未來的學術創新和發展具有現實的分析與指導意義。總的來說就是在搜集大量用戶的原始行為數據的情況下,以可視化、智能化的方式讓研究者能夠清晰地掌握用戶某一領域研究的信息行為和規律。進而把握總體用戶的信息行為趨勢,為用戶盡可能地挖掘海量數據中可能與搜索信息相關聯的內容并呈現給用戶,為用戶打造一個具有個性化、人性化的學科信息服務體系,以促進高校學科事業的長遠發展。
[參考文獻]
[1]袁紅,朱睿琪.用戶信息搜索行為大數據分析框架及其關鍵技術[J].圖書館學研究,2016(24):39-46.
[2]王大壯.基于用戶行為和大數據分析的圖書館個性化服務探究[J].圖書館學刊,2017(12):111-115.
[3]趙迎春.圖書館讀者行為的大數據分析系統的設計與實現[J].四川圖書館學報,2017(2):59-61.
[4]楊利軍,高軍.圖書館個性化服務中的大數據可視化分析與應用研究[J].現代情報,2015(7):68-72.