999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據技術在商業分析中的實踐應用研究

2021-11-05 15:35:58宋偉偉
數字通信世界 2021年10期
關鍵詞:可視化數據庫功能

宋偉偉

(四川財經職業學院,四川 成都 610101)

1 大數據技術

大數據技術是當前比較熱門的技術之一,萬物信息化、數字化就會產生大量的數據,而產生的大量數據是錯綜雜亂的,可以通過數據分析、可視化等技術,將有規律有用的信息呈現出來[1]。數據科學與大數據技術是一門比較新穎且跨學科比較多的技術, 因此需要有數學、編程、統計學、計算機等知識。

商業數據分析不僅是向管理者提供各種數據, 還需要更加深入的方法來記錄、分析和提煉數據, 并以易于理解的格式呈現結果。數據本身僅僅是事實和數字,可以通過大數據技術尋找數據規律,結合業務問題找出有用信息,提高生產力。

2 實驗相關技術闡述

2.1 網絡爬蟲技術

網絡爬蟲[2]是一種基于B/S架構的數據采集技術,它能夠按照一定的規則自動抓取萬維網信息的程序或者腳本。網絡爬蟲運行流程如圖1所示,由調度器負責URL管理器、網頁下載器、網頁解析器之間的協調工作,價值數據是從網頁中提取出的數據,其通常被保存在文件或者數據庫中。

圖1 網絡爬蟲運行流程

2.2 數據庫存儲技術

通過網絡爬蟲對于爬取到的數據列表進行存儲,以備下一步數據分析使用。主要用到的數據存儲技術是mysql、sqlserver、csv文 件 存 儲、excel表 格 存 儲、mongoDB等,本文實驗中是將爬取到的數據存儲到mysql數據庫中。

2.3 數據分析技術

商業數據分析工具主要包括Python、R、Stata、MATLAB、EViews、SAS、SPSS等,本文實驗應用的是Python數據分析工具。

Python是一種面向對象、解釋性的計算機程序設計語言,Python語言簡潔而清晰,具有豐富而強大的類庫,能夠把用其他語言制作的各種模塊很輕松地聯結在一起。在Python中,通過安裝Pandas、Numpy、

Scipy、Statsmodels、Matplotlib、Seaborn、Scikit-Learn、Theano、Tensorf low等一系列的程序包實現上述功能,還需要安裝IPython交互環境。

本文實驗中,通過Numpy實現數值計算, Pandas實現數據分析、分組聚合等操作,Matplotlib 和Seaborn實現數據可視化。

2.4 數據可視化技術

Python提供了非常多樣的繪圖功能,可以通過Python提供的工具Matplotlib繪制二維、三維圖形。Seaborn在Python中用于創建信息豐富和有吸引力的統計圖形庫,它基于Matplotlib,提供多種功能,實現單因素、雙因素、線性回歸、數據矩陣、統計時間序列等的可視化,以便進一步實現更加復雜的可視化過程。

Matplotlib常用的制圖功能有直方圖、散點圖、曲線標繪圖、連線標繪圖、箱圖、餅圖、條形圖、點圖等。

3 在商業中的應用

準備好工具后,首先需要從網站上抓取信息并對數據進行初步分析,了解數據的構成并判斷數據的質量。數據初步分析往往是統計性的、多角度的、嘗試性的。根據分析的結果進行深入的挖掘, 得到更有價值的結果。

3.1 明確目標

論文中的目標相對比較明確,最終目標是要根據實時獲取到的Top100排名圖書,可視化顯示前十名熱銷圖書和熱評圖書的數據,以及根據關注的圖書進行圖書推薦、圖書價格和評論預警等功能。

3.2 數據采集與處理

在進行數據采集時,需要根據實際的業務環境采用不同的方式,本文中使用爬蟲對數據進行采集,使用爬蟲獲取京東計算機行業排行榜數據。獲取的數據有:獲取排名前100名的圖書名、出版社、圖書鏈接、圖書ID、價格。

本文采集數據中,創建了Crawl.py文件,創建了的Crawl類定義三個方法:def get_ranking( ):獲取排行前100名的圖書ID;def get_ pr ice( ):根據ID獲取前100名在圖書價格,并存儲圖書名、出版社、京東價格、定價、鏈接、ID列表;def get_evaluation():獲取評價評分內容。

3.3 數據庫存儲操作

將獲取到的圖書信息存儲到MySQL數據庫表中。新建mysql.py文件,在文件中定義各個應用方法:如連接數據庫、關閉數據庫、數據表的紀錄插入、查詢數據的方法。

3.4 UI可視化界面設計及UI轉Py編程文件

首先,單擊File菜單——Settings,打開的對話框中單擊Tools——External Tools打開的界面中添加擴展工具,主要是QT Designer和PyUIC,它們的主要功能是通過Qt Designer進行圖形可視化設計[3],采用pyUIC插件將可視化圖形界面轉換生成相應的Python 文件,生產的Python文件需要移動到項目的根目錄下, 可以在生成的Python文件中進行代碼功能編寫。

采用NumPy、Pandas、Matplotlib模塊進行計算、處理分析、可視化編程。

NumPy是Python處理數組和矢量運算的庫, 是進行高性能計算和數據分析的基礎,NumPy提供了對數組進行快速運算的標準數學函數。Pandas是Python的一個開源庫,為Python提供了高性能、簡單易用的數據結構和數據分析工具。Pandas提供了方便的類似表格統計操作和SQL操作等操作,使得數據處理工作更加便捷。Matplotlib是利用Python進行數據分析的一個重要的可視化工具,繪制多種高質量的2D、3D圖形。

在生成的Python文件中,我們主要完成了10個可視化界面的設計,以及13個Python文件的代碼編寫。完成本項目數據服務功能。

4 結束語

本文中的項目對網絡爬蟲技術、數據庫存儲技術、數據分析技術及可視化技術進行了流程和實踐總結,從數據分析出發,依靠技術工具,以決策優化和一定的數據服務為目的,洞察數據背后的規律,為商業創造更大的數據獲取、分析、可視化等一系列技術思路。

猜你喜歡
可視化數據庫功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
關于非首都功能疏解的幾點思考
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 欧美午夜理伦三级在线观看| 亚洲成av人无码综合在线观看| 色妞永久免费视频| 色婷婷在线播放| 国产精品国产三级国产专业不| 99热最新在线| 国产精品无码影视久久久久久久| 在线看片中文字幕| 国产区在线看| 国产网友愉拍精品视频| 国产微拍一区二区三区四区| 日韩123欧美字幕| 一级毛片高清| 少妇精品网站| 欧美在线天堂| 亚洲精品午夜天堂网页| 91久久偷偷做嫩草影院| 成年女人18毛片毛片免费| 四虎在线高清无码| 国产精品一区二区在线播放| 久久a级片| 免费一级大毛片a一观看不卡| 久久香蕉国产线看精品| 欧美国产日韩在线观看| 本亚洲精品网站| 日韩精品专区免费无码aⅴ| 国产你懂得| 欧美激情伊人| 久综合日韩| 中文字幕av一区二区三区欲色| 午夜福利视频一区| 91精品久久久久久无码人妻| 久久精品国产亚洲麻豆| 国产成a人片在线播放| 欧美有码在线| 国产网友愉拍精品视频| 欧美日韩va| 国产精品欧美在线观看| 欧美亚洲第一页| 亚洲视频免| 亚洲高清在线播放| 女人天堂av免费| 人妻丝袜无码视频| 中文字幕丝袜一区二区| 最新日韩AV网址在线观看| AV在线天堂进入| 自慰网址在线观看| 中文字幕有乳无码| 四虎影视无码永久免费观看| 日韩成人高清无码| 尤物亚洲最大AV无码网站| 国产精品一区二区在线播放| 国产精品久久久久无码网站| 人人看人人鲁狠狠高清| 国产免费黄| 日韩精品高清自在线| 国产a在视频线精品视频下载| 国产91在线|日本| 97se亚洲| 成人欧美日韩| 91精品福利自产拍在线观看| 露脸真实国语乱在线观看| 久久久久亚洲精品成人网| 亚洲av无码人妻| 午夜性刺激在线观看免费| 国产免费高清无需播放器| 国产AV无码专区亚洲A∨毛片| 日韩av无码DVD| 一本无码在线观看| 国产第八页| 亚洲精品天堂自在久久77| 亚洲男人在线| 91福利国产成人精品导航| 亚洲资源站av无码网址| 国产精品开放后亚洲| 亚洲国产系列| 天天综合天天综合| 国产99免费视频| 欧美午夜久久| 亚洲综合18p| 伊人精品成人久久综合| 在线另类稀缺国产呦|