999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)技術(shù)在商業(yè)分析中的實(shí)踐應(yīng)用研究

2021-11-05 15:35:58宋偉偉
數(shù)字通信世界 2021年10期
關(guān)鍵詞:可視化數(shù)據(jù)庫功能

宋偉偉

(四川財(cái)經(jīng)職業(yè)學(xué)院,四川 成都 610101)

1 大數(shù)據(jù)技術(shù)

大數(shù)據(jù)技術(shù)是當(dāng)前比較熱門的技術(shù)之一,萬物信息化、數(shù)字化就會(huì)產(chǎn)生大量的數(shù)據(jù),而產(chǎn)生的大量數(shù)據(jù)是錯(cuò)綜雜亂的,可以通過數(shù)據(jù)分析、可視化等技術(shù),將有規(guī)律有用的信息呈現(xiàn)出來[1]。數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)是一門比較新穎且跨學(xué)科比較多的技術(shù), 因此需要有數(shù)學(xué)、編程、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)等知識(shí)。

商業(yè)數(shù)據(jù)分析不僅是向管理者提供各種數(shù)據(jù), 還需要更加深入的方法來記錄、分析和提煉數(shù)據(jù), 并以易于理解的格式呈現(xiàn)結(jié)果。數(shù)據(jù)本身僅僅是事實(shí)和數(shù)字,可以通過大數(shù)據(jù)技術(shù)尋找數(shù)據(jù)規(guī)律,結(jié)合業(yè)務(wù)問題找出有用信息,提高生產(chǎn)力。

2 實(shí)驗(yàn)相關(guān)技術(shù)闡述

2.1 網(wǎng)絡(luò)爬蟲技術(shù)

網(wǎng)絡(luò)爬蟲[2]是一種基于B/S架構(gòu)的數(shù)據(jù)采集技術(shù),它能夠按照一定的規(guī)則自動(dòng)抓取萬維網(wǎng)信息的程序或者腳本。網(wǎng)絡(luò)爬蟲運(yùn)行流程如圖1所示,由調(diào)度器負(fù)責(zé)URL管理器、網(wǎng)頁下載器、網(wǎng)頁解析器之間的協(xié)調(diào)工作,價(jià)值數(shù)據(jù)是從網(wǎng)頁中提取出的數(shù)據(jù),其通常被保存在文件或者數(shù)據(jù)庫中。

圖1 網(wǎng)絡(luò)爬蟲運(yùn)行流程

2.2 數(shù)據(jù)庫存儲(chǔ)技術(shù)

通過網(wǎng)絡(luò)爬蟲對(duì)于爬取到的數(shù)據(jù)列表進(jìn)行存儲(chǔ),以備下一步數(shù)據(jù)分析使用。主要用到的數(shù)據(jù)存儲(chǔ)技術(shù)是mysql、sqlserver、csv文 件 存 儲(chǔ)、excel表 格 存 儲(chǔ)、mongoDB等,本文實(shí)驗(yàn)中是將爬取到的數(shù)據(jù)存儲(chǔ)到mysql數(shù)據(jù)庫中。

2.3 數(shù)據(jù)分析技術(shù)

商業(yè)數(shù)據(jù)分析工具主要包括Python、R、Stata、MATLAB、EViews、SAS、SPSS等,本文實(shí)驗(yàn)應(yīng)用的是Python數(shù)據(jù)分析工具。

Python是一種面向?qū)ο蟆⒔忉屝缘挠?jì)算機(jī)程序設(shè)計(jì)語言,Python語言簡(jiǎn)潔而清晰,具有豐富而強(qiáng)大的類庫,能夠把用其他語言制作的各種模塊很輕松地聯(lián)結(jié)在一起。在Python中,通過安裝Pandas、Numpy、

Scipy、Statsmodels、Matplotlib、Seaborn、Scikit-Learn、Theano、Tensorf low等一系列的程序包實(shí)現(xiàn)上述功能,還需要安裝IPython交互環(huán)境。

本文實(shí)驗(yàn)中,通過Numpy實(shí)現(xiàn)數(shù)值計(jì)算, Pandas實(shí)現(xiàn)數(shù)據(jù)分析、分組聚合等操作,Matplotlib 和Seaborn實(shí)現(xiàn)數(shù)據(jù)可視化。

2.4 數(shù)據(jù)可視化技術(shù)

Python提供了非常多樣的繪圖功能,可以通過Python提供的工具M(jìn)atplotlib繪制二維、三維圖形。Seaborn在Python中用于創(chuàng)建信息豐富和有吸引力的統(tǒng)計(jì)圖形庫,它基于Matplotlib,提供多種功能,實(shí)現(xiàn)單因素、雙因素、線性回歸、數(shù)據(jù)矩陣、統(tǒng)計(jì)時(shí)間序列等的可視化,以便進(jìn)一步實(shí)現(xiàn)更加復(fù)雜的可視化過程。

Matplotlib常用的制圖功能有直方圖、散點(diǎn)圖、曲線標(biāo)繪圖、連線標(biāo)繪圖、箱圖、餅圖、條形圖、點(diǎn)圖等。

3 在商業(yè)中的應(yīng)用

準(zhǔn)備好工具后,首先需要從網(wǎng)站上抓取信息并對(duì)數(shù)據(jù)進(jìn)行初步分析,了解數(shù)據(jù)的構(gòu)成并判斷數(shù)據(jù)的質(zhì)量。數(shù)據(jù)初步分析往往是統(tǒng)計(jì)性的、多角度的、嘗試性的。根據(jù)分析的結(jié)果進(jìn)行深入的挖掘, 得到更有價(jià)值的結(jié)果。

3.1 明確目標(biāo)

論文中的目標(biāo)相對(duì)比較明確,最終目標(biāo)是要根據(jù)實(shí)時(shí)獲取到的Top100排名圖書,可視化顯示前十名熱銷圖書和熱評(píng)圖書的數(shù)據(jù),以及根據(jù)關(guān)注的圖書進(jìn)行圖書推薦、圖書價(jià)格和評(píng)論預(yù)警等功能。

3.2 數(shù)據(jù)采集與處理

在進(jìn)行數(shù)據(jù)采集時(shí),需要根據(jù)實(shí)際的業(yè)務(wù)環(huán)境采用不同的方式,本文中使用爬蟲對(duì)數(shù)據(jù)進(jìn)行采集,使用爬蟲獲取京東計(jì)算機(jī)行業(yè)排行榜數(shù)據(jù)。獲取的數(shù)據(jù)有:獲取排名前100名的圖書名、出版社、圖書鏈接、圖書ID、價(jià)格。

本文采集數(shù)據(jù)中,創(chuàng)建了Crawl.py文件,創(chuàng)建了的Crawl類定義三個(gè)方法:def get_ranking( ):獲取排行前100名的圖書ID;def get_ pr ice( ):根據(jù)ID獲取前100名在圖書價(jià)格,并存儲(chǔ)圖書名、出版社、京東價(jià)格、定價(jià)、鏈接、ID列表;def get_evaluation():獲取評(píng)價(jià)評(píng)分內(nèi)容。

3.3 數(shù)據(jù)庫存儲(chǔ)操作

將獲取到的圖書信息存儲(chǔ)到MySQL數(shù)據(jù)庫表中。新建mysql.py文件,在文件中定義各個(gè)應(yīng)用方法:如連接數(shù)據(jù)庫、關(guān)閉數(shù)據(jù)庫、數(shù)據(jù)表的紀(jì)錄插入、查詢數(shù)據(jù)的方法。

3.4 UI可視化界面設(shè)計(jì)及UI轉(zhuǎn)Py編程文件

首先,單擊File菜單——Settings,打開的對(duì)話框中單擊Tools——External Tools打開的界面中添加擴(kuò)展工具,主要是QT Designer和PyUIC,它們的主要功能是通過Qt Designer進(jìn)行圖形可視化設(shè)計(jì)[3],采用pyUIC插件將可視化圖形界面轉(zhuǎn)換生成相應(yīng)的Python 文件,生產(chǎn)的Python文件需要移動(dòng)到項(xiàng)目的根目錄下, 可以在生成的Python文件中進(jìn)行代碼功能編寫。

采用NumPy、Pandas、Matplotlib模塊進(jìn)行計(jì)算、處理分析、可視化編程。

NumPy是Python處理數(shù)組和矢量運(yùn)算的庫, 是進(jìn)行高性能計(jì)算和數(shù)據(jù)分析的基礎(chǔ),NumPy提供了對(duì)數(shù)組進(jìn)行快速運(yùn)算的標(biāo)準(zhǔn)數(shù)學(xué)函數(shù)。Pandas是Python的一個(gè)開源庫,為Python提供了高性能、簡(jiǎn)單易用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。Pandas提供了方便的類似表格統(tǒng)計(jì)操作和SQL操作等操作,使得數(shù)據(jù)處理工作更加便捷。Matplotlib是利用Python進(jìn)行數(shù)據(jù)分析的一個(gè)重要的可視化工具,繪制多種高質(zhì)量的2D、3D圖形。

在生成的Python文件中,我們主要完成了10個(gè)可視化界面的設(shè)計(jì),以及13個(gè)Python文件的代碼編寫。完成本項(xiàng)目數(shù)據(jù)服務(wù)功能。

4 結(jié)束語

本文中的項(xiàng)目對(duì)網(wǎng)絡(luò)爬蟲技術(shù)、數(shù)據(jù)庫存儲(chǔ)技術(shù)、數(shù)據(jù)分析技術(shù)及可視化技術(shù)進(jìn)行了流程和實(shí)踐總結(jié),從數(shù)據(jù)分析出發(fā),依靠技術(shù)工具,以決策優(yōu)化和一定的數(shù)據(jù)服務(wù)為目的,洞察數(shù)據(jù)背后的規(guī)律,為商業(yè)創(chuàng)造更大的數(shù)據(jù)獲取、分析、可視化等一系列技術(shù)思路。

猜你喜歡
可視化數(shù)據(jù)庫功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評(píng)”:黨媒評(píng)論的可視化創(chuàng)新
關(guān)于非首都功能疏解的幾點(diǎn)思考
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
主站蜘蛛池模板: 午夜福利在线观看成人| 91网红精品在线观看| 亚洲成人动漫在线观看 | 69综合网| 亚洲天堂色色人体| 高清不卡毛片| 亚洲最新网址| 91久久偷偷做嫩草影院电| 亚洲精品中文字幕无乱码| 国产青榴视频| 国产精品香蕉在线观看不卡| 97se亚洲| 怡春院欧美一区二区三区免费| 国产在线观看91精品亚瑟| 国产在线八区| 日韩av高清无码一区二区三区| 无码AV动漫| 91亚洲精品第一| 久热这里只有精品6| 91国内在线观看| 在线观看国产网址你懂的| 久久频这里精品99香蕉久网址| 91在线无码精品秘九色APP | 人妻精品久久久无码区色视| 91成人在线免费视频| 在线观看亚洲人成网站| 久久男人视频| 嫩草在线视频| 欧美日韩专区| 在线观看视频一区二区| 免费国产一级 片内射老| 国产精品污视频| 色老头综合网| 免费无码又爽又黄又刺激网站| 亚洲久悠悠色悠在线播放| 欧美视频在线第一页| 乱系列中文字幕在线视频| 免费播放毛片| 国产自在线拍| 99视频精品全国免费品| 亚洲日本中文字幕乱码中文| 永久免费AⅤ无码网站在线观看| 亚洲视频欧美不卡| 一本久道热中字伊人| 亚洲91在线精品| 国产亚洲精| 亚洲综合激情另类专区| 免费国产高清精品一区在线| 91在线精品麻豆欧美在线| 欧美色综合网站| 欧美日韩精品一区二区在线线| 久久国产精品影院| 国产99在线| 全裸无码专区| 精品少妇三级亚洲| 欧美区国产区| 久青草国产高清在线视频| 国产高清国内精品福利| 午夜电影在线观看国产1区| 99在线小视频| 免费看a级毛片| 思思99热精品在线| 激情六月丁香婷婷| 国产国语一级毛片| 偷拍久久网| 区国产精品搜索视频| 中文无码影院| 日本少妇又色又爽又高潮| 中文字幕不卡免费高清视频| 成人午夜免费观看| 亚洲无线一二三四区男男| 99精品伊人久久久大香线蕉| 婷婷久久综合九色综合88| 国产综合精品日本亚洲777| 性欧美精品xxxx| 乱人伦视频中文字幕在线| 日韩性网站| 成年av福利永久免费观看| 国产精品成人第一区| 精品国产自| 欧美精品另类| 久久久久无码精品|