袁露
摘要:大數據分析技術有效規避了研究傳統用戶信息搜索行為的不足,為該課題的研究提供了新的理論視角與實踐工具。本文構建了大數據分析框架,用于對用戶信息搜索行為進行分析,然后介紹了大數據可視化等關鍵技術,以為大數據分析的應用提供理論依據。
關鍵詞:信息搜索行為;大數據分析;關鍵技術
引言
用戶在進行搜索和瀏覽時,會產生非常多的行為記錄,逐漸積累構成了大體量的數據?,F階段,針對用戶信息搜索行為進行研究的方法非常多,主要針對傳統網絡環境下的結構較為單一的數據,對大數據的應用能力非常弱,局限性也比較大。而應用大數據分析技術,可以快速處理海量數據,獲得足夠的用戶信息,并從中發掘出有規律的信息,將其展示出來。本文在此基礎上,針對用戶搜索行為構建了大數據分析框架,同時對其關鍵技術的應用進行介紹。
一、用戶信息搜索行為的大數據分析框架
(一)用戶信息搜索行為模型的構建
在已有文獻研究成果的基礎上,筆者對用戶搜索行為模型進行構建,將其分為前中后三個部分,分別與用戶層、人機交互層和評價利用層相對應[1]。用戶層分為信息用戶和用戶需求;人機交互層包含選擇信息源以及選擇檢索方式和瀏覽行為。而評價利用層包含用戶的物理行為以及心理行為。但是信息搜索是一個過程,并且該過程有可能是循環過程,用戶在信息評價時如果沒有得到令其滿意的結果,則會重新回到用戶層對其需求進行調整,然后在人機交互層對信息源和檢索方式等進行重新選擇,直到最終獲得滿意的結果。
(二)構建大數據分析體系
以往的學者在對這一問題進行研究時,所提出的構建大數據處理系統的流程,包括收集和預處理以及存儲分析、挖掘等。本文的研究在此基礎上,把大數據分析劃成數據收益與預處理以及數據存儲和分析、結果呈現等。大數據的收集可以來自于多種數據源,對于收集的大數據,要進行預處理后,才能進入下一環節,即進行存儲和處理。在此基礎上,對其進行分析更加容易發掘研究對象的內在規律,最后再將結果呈現出來,即從數據中提取有用的信息。
(三)構建用戶信息搜索行為的大數據分析框架
從橫向來看,該框架是以大數據處理流程為基礎,將其分為數據層和分析層以及結果呈現層與支撐層等。對于整個框架而言,數據層是基礎,分析層是核心,目標是結果呈現層,根本保證是支承層。數據層包括收集和預處理以及存儲數據等環節。收集的數據主要來源于互聯網和物聯網,預處理則包括數據的清洗和轉換以及數據加載等。數據存儲則是對大體量的數據采用分布式的方式進行存儲。分析層主要依據人工智能領域的多項技術,比如統計分析和數據挖掘等。結果呈現層就是將得到的結果呈現出來,支撐層是手機和預處理大體量數據的關鍵所在。
二、關鍵技術
(一)數據層的關鍵技術
首先是數據收集所應用的關鍵技術,主要包括數據收集、預處理以及數據存儲等。數據收集主要包括采集系統日志和網絡數據、物聯網技術以及智能移動終端。用戶的搜索行為所產生的數據均記錄在日志文件中,比如頁面訪問量和訪問時間以及搜索的關鍵詞與時間等[2]。日志文件能夠較好的記錄歷史數據,也不會受到防火墻的阻隔,而且日志文件所記錄的復雜信息在格式和內容方面都有一定的差異,需要采用專業的工具對其進行處理。在采集網絡數據時,可以采用API,這是目前應用比較廣泛的技術。物聯網技術主要包括RFID和紅外傳感以及全球定位等,關鍵在于傳感器技術,是物聯網技術獲取新的的關鍵。智能移動終端的普及率越來越高,比如智能手機和平板電腦等,這些設備隨時都在發送和接收信息。用戶在智能終端上進行信息搜索時,同樣會產生大量的數據。數據預處理的技術主要包括SSIS技術,不斷改進非結構化和半結構化的數據。數據存儲可以以云數據的模式進行,通過集群應用等,促使各類存儲設備協同工作,以更好的進行數據存儲與業務訪問等。
(二)分析層的關鍵技術
分析層的關鍵技術主要包括統計分析和機器學習以及自然語言處理與數據挖掘等。統計分析主要是利用統計學分析方法對數據進行一系列處理,分析人員可以采用定性和定量相結合的方法研究用戶信息搜索行為,運用到的分析工具包括SPSS和R語言以及SAS等。機器學習是要求計算機利用數據進行工作的方法,可以根據用戶的搜索數據等,識別用戶的搜索意圖,完成對用戶的策略學習[3]。自然語言處理主要應用的工具是OpenNLP和FundanNLP等,而數據挖掘常用的技術與統計分析基本一致。
(三)結果呈現層與支撐層的關鍵技術
結果呈現層所應用的技術主要是分析人員所應用的將數據進行可視化的技術,比如Tableau和Ember Charts等。而支撐層主要是為用戶信息搜索行為的研究提供數據處理平臺,核心在于分布式系統架構?,F階段該架構主要包括騰訊大數據平臺和阿里云的ODPS等。伴隨計算機技術的進步,該類技術也在不斷的更新,出現了很多新的技術,比如Spark、Storm等。
結語
當前時期,大數據技術的價值不斷凸顯,采用該技術對用戶信息搜索行為進行分析,可以更加有效的深度挖掘用戶的搜索需求,對于搜索引擎與信息組織方式的改進提供了方向,也給傳統信息服務模式帶來了較大的沖擊。在大數據背景下,構建分析用戶搜索信息行為的框架,需要注重各層關鍵技術的應用,確保分析框架的先進性和實用性。
參考文獻:
[1]易成岐,鮑媛媛,薛一波.社會網絡大數據分析框架及其關鍵技術[J].中興通訊技術,2014(1):5-10.
[2]袁紅,朱睿琪.用戶信息搜索行為大數據分析框架及其關鍵技術[J].圖書館學研究,2016(24):39-46.
[3]徐飛,徐緒堪,吳廣印.基于大數據的用戶閱讀行為分析[J].數字圖書館論壇,2014(12):56-62.