孫明
摘 要:隨著社會全面的進入大數據時代和云計算時代,大數據已經逐步的融入到我們的生活中,人們都能夠感受到大數據對我們生活的改變。同時,很多用戶的行為,會被計算機自動化機器所保留記錄下來,通過大數據和云計算的方式,對這些用戶的行為進行分析,可以更好的掌握經濟發展的規律。本文探討了大數據,分析了大數據和云計算下對用戶行為,研究了大數據對企業與用戶關系的影響,以及大數據背景下對用戶行為分析帶來的挑戰。
關鍵詞:大數據;云計算;用戶行為分析
中圖分類號:TN919.2 文獻標識碼:A 文章編號:1671-2064(2019)15-0027-02
0 引言
隨著人類社會的發展,目前已經全面的進入到了信息化、智能化的時代中,很多用戶的行為都被記錄下來,并且能夠對其做出分析和預測,對于掌握我國的經濟發展和社會的真實規律有很大的幫助,能夠為人們制定智能化、個性化的服務,對提升城市的管理、提高交通質量、提升人們的生活質量,有很大的幫助作用,同時,減少不必要的浪費。
1 大數據概述
1.1 大數據分析
大數據的記錄數據的方式,從本質上發生的改變,用戶在瀏覽網站中的數據信息,會通過設備記錄下來,通過用戶的行為來挖掘數據,由于數據規模比較龐大,因此,需要多個云平臺來擴展數據的節點體系,需要拓展性更強的大數據架構,云計算能夠為用戶提供多種數據支持。
1.2 云計算的發展趨勢
云計算能夠讓用戶集中到“云端”,是計算機網的一種運用模式[1]。在外國的一些國家,云計算逐漸成為國家核心競爭力的主要手段,如美國的云計算服務中,在農業、司法部門和軍事中得到的應用,并通過構建云計算的生態系統,能夠推動產業鏈的發展,在澳大利亞,政府在公共行業和服務行業中,將大數據分析融入其中,制定出了公共政策。我國的云技術已經有了很大的突破,主要應用在了北京電力和我國的教育云系統中,形成了H3C的云計算系統。
2 大數據和云計算下對用戶行為分析
2.1 對信息進行分類
信息資源整合分為兩大類型,一是同類數據的合并,二是不同類數據之間的關聯[2]。在同事數據的合并中,可以將用戶發的信息匯集起來,進行歸類研究,關注用戶群體的特點,在同一類性的數據中,存在數據格式的不同、數據規模的差異,所以需要對資源進行整合,使得數據資源具有統一的結構,形成具有代表性的數據規模;另外一類是不同數據之間的關聯,是利用科技的搜索形式,通過關鍵詞、摘要、文獻、用戶日志對信息進行整合[3]。大數據信息組織,目前具有很強的擴展性、容錯性。在信息組織過程中,具有較好的精確性和普遍通用性。目前的大數據建模中,還沒有完全參考數關系數據庫的模板,因此,存在著信息冗繁不一致的現象。可以通過用戶行為的分析,進行宏觀、微觀和中觀的多層次的觀察,建立一個具有一定彈性和層次的數據信息。
2.2 對信息資源的收集
目前,在網絡上可以通過大數據,收集信息,但是卻沒有分析數據對用戶行為帶來的影響,為用戶行為的分析帶來了難度。通過對原本的數據進行標注,可以獲取大量的信息內涵,可以為用戶的行為作出很好的指引,為用戶尋找數據提供便利的條件。目前,主要使用的映射方法有GAV和LAV兩種方法,雖然前者查詢的效率比較高,但是沒有很強映射擴展性。而LAV方法具有很強的擴展性,是采集發數據集的主要應用方法。
2.3 對信息的處理和挖掘
在對用戶的數據進行分析和挖掘的過程中,主要表現在的幾個方面:(1)將數據可以分成多個小規模的模塊,再對數據進行處理和挖掘,降低數據的傳輸和系統計算的費用。(2)針對不同的數據的結構的不同,安全性的不同以及相關法律限制的不同,可以將數據信息進行集中化的分析,對于不符合實際的數據信息,進行處理。通過云計算分布式的用戶日志框架進行分析,對日志進行處理、用戶模式進行深入的挖掘、分析和研究,這種方式非常方便、便捷,在云端就可以完成。(3)對于不同結構的數據的分布式的數據挖掘,可以從相互學習和元學習進行。元學習是從已經得到的知識中再進行學習,最終得到數據模型。而相互學習是從多個數據的挖掘節點,對通過一個學習任務進行互相分析學習成果的方式。對于異構的數據分布挖掘數據的形式,可以先使用正交化的基函數分成分量模式,最后行成全局的模式。(4)云計算能夠以租代買的形式,可以有效的提升計算系統的使用率,對于商業領域來說,可以在云數據平臺中以較低的成本進行使用信息。(5)云數據儲存的模式。GFS硬件系統,是一個規模比較大的中低端計算機集群,有一個主節點和許多的數據節點。在程序訪問數據的過程中,會首先訪問主節點,在獲取主節點的信息,通過數據的節點就會影響到整個系統數據的使用情況。(6)云分布式計算架構。這種與GFS相類似,是面向隊規模的計算機集團進行設計的,主節點控制和分配個子節點的計算機資源。任何一個子節點,就可以從集群中移除,不會影響執行當前的任務。在MAPPEDUCE的構架下,可以由系統自行完成,用戶不需要有此方面的轉化,也可以有效的進行分布式的計算。在谷歌提出的這兩種思想的基礎上,研發了一個Hadoop計算框架,能夠處理大量的分布式的處理軟件框架,在實踐中取得了很大的成效。(7)對知識呈現的方式進行研究。在知識的呈現上,需要通過數據的可視化形式來表達出來,再進行分析,如媒體軟件臉書上的情感數據分析可知,科學家將人類的情緒分為12種不同的類型,如高興、悲傷、生氣、暴怒等,其中的每種情緒,都會觸發人們的心理情緒的變化、面部表情的變化,對人們的外在行為產生刺激和影響。通過分析,將可視化的方式展現的大眾面前。如:美國波士頓的爆炸案會引起人們情緒的低落,通過可視化的技術手段,可以讓用戶直觀的看到大數據解釋的規律和未來的發展趨勢。
3 大數據對企業與用戶關系的影響
(1)在互聯網的環境中,用戶對企業的管理不斷的增強,大數據、云計算改變的傳統商業運作模式,通過大數據可以對用戶進行分析,這也是未來企業的主要研發和發展的方向之一。這使得用戶和企業之間的關系發生了很大的變化,互聯網的環境能夠給企業提供更多的創新基礎,這樣可以給用戶帶來更多的價值。(2)互聯網能夠讓企業和用戶之間無障礙的溝通,通過社區可以進行有效的溝通,這重創新的模式,可以增強企業研發能力,用戶也能隨時看到企業更新的動態。其次,大數據能夠有效的對用戶的信息進行分析,提升了用戶的議價能力,通過兩者有效的互動,可以推動企業創新與改良產品,更加滿足用戶的需求。
4 大數據背景下對用戶行為分析帶來的挑戰
4.1 信息范圍
大數據的數據來源主要是計算機生成的數據和社交網上的緩存數據,不論是哪種類型的數據,其中有原始數據和結構化的數據,但是數據的結構和內涵上,出現了真假不清的情況,因此會干擾對用戶的分析,影響了分析的結果。
4.2 數據的存儲
大數據的數據質量和數據的質量上都有一定的變化,與傳統數據存在很大的區別。對分析傳統的用戶行為主要以數據倉庫上的數據為主,但是大戶數據對用戶的分析,首先需要處理超大的數據庫進行分析,傳統的數據庫不能夠駕馭超大的數據庫,所以,必須要首先解決處理超大數據庫的處理和分析的能力。
4.3 信息安全的問題
大數據、云計算的發展中,很多用戶的隱私可能會被盜用或者暴露,如在進行個人的信息檢索的過程中,如果不注意就會暴露到自己的信息。因此,在大數據和云計算的時代發展中,需要對用戶的信息進行規范,要做好法律限定,避免個人信息的曝光,在大數據處理信息的過程中,一般都是在開放的環境下進行的,所以很難保證數據信息的安全,使得信息系統更加的不安全。這就給非法盜用信息的人員提供了可乘之機,對用戶的安全造成了不利的影響。
4.4 不斷的整理知識內容 形成體系
在大數據、云計算的時代發展中,分析用戶行為是一個長期而復雜的過程,需要不斷的摸索積累經驗,因為互聯網平臺的數據,需要進行充分的處理和挖掘,云服務平臺中,需要大數據的知識進行整合,提高大數據的擴展性,這樣才能更好的各個行業中得到應用和發展。
5 結語
綜上所述,在大數據、云計算的時代背景下,如果信息想要得到更好的使用,就需要對用戶的行為進行分析,是未來面臨的巨大的挑戰和發展的機遇。在對用戶的行為進行分析,可以將數據進行重新的構建、對數據進行分析,再生成有益的信息,通過大數據的分析,能夠形成廣闊的視野,加強對大數據信息資源整合的分析,同時加強對用戶的行為理論的分析,才能推進社會經濟的發展。
參考文獻
[1] 王兵.基于云計算技術的大數據用戶行為引擎設計[J].電腦知識與技術,2016(05):1-2.
[2] 陳碩,李曉戈.大數據、云計算與用戶行為經驗分析[J].信息記錄材料,2018(7):118-120.
[3] 張梅.云計算技術下的大數據用戶行為引擎設計研究[J].西安文理學院學報(自然科學版),2016(3):48-52.