999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于python的拉勾網職位薪資及需求量數據分析與可視化

2020-04-09 10:55:16柳向陽戴崢杜茜亞吳榮信李玉香
締客世界 2020年8期
關鍵詞:可視化信息

柳向陽 戴崢 杜茜亞 吳榮信 李玉香*

(河北科技師范學院 河北 秦皇島 066004)

引言

Python具有易學易用、類庫豐富、功能強大的特點。Python在機器學習、人工智能、數據爬蟲、大數據處理等方面擁有非常豐富的插件,使得Python 可以非常方便地實現諸多使用其他語言難以實現的功能。其中Python的類庫非常強大,本文主要用到numpy、pandas、matplotlib對數據進行處理和統計分析。

1 數據爬取

1.1 查看robots協議

當使用爬蟲爬取網站的數據時,需要遵守網站所有者針對所有爬蟲所制定的協議,這就是robots協議。在地址欄輸入https://www.lagou.com/robots.txt,結果如下:

User-agent: Jobuispider

Disallow: /

User-agent: *

Disallow:/*?*

Disallow:/gongsi/v1/

通過查看robots協議,知道哪些數據可以爬取、哪些數據不可以爬取。

1.2 數據爬取編程思路

(1)導入requests庫

用import requests導入,為實現向網站發送GET類型的HTTP請求、并獲取返回的響應做準備。

(2)導入xlwt庫

用import xlwt導入,為實現將爬取的數據存入excel表格做準備。

(3)用開發者工具獲取HTTP頭部信息

右鍵單擊Chrome瀏覽器頁面,選擇“開發者工具”或按“F12”鍵,獲取Headers標簽的HTTP頭部信息,如requests URL、User-Agent等信息。

(4)輸入要爬取的職位和要爬取的頁數,進行數據爬取、解析

招聘信息很多,但我們感興趣的職位應該只有幾個,所以采用輸入的方式,如“python”。招聘信息很多,但只有最近的信息對我們才有意義,故查找有限頁數,如“30”。

用s=requests.session()和s.get(url,headers=headers,timeout=2)爬取數據;

用info=result.json()解析數據;

(5)將數據保存到excel表中

用w=xlwt.Workbook(encoding='utf-8')建立工作簿;

用ws=w.add_sheet(jos,cell_overwrite_ok=True)建立工作表;

用ws.write(0,0,'序號')、ws.write(0,1,'公司')、ws.write(0,2,'城市')……建立表的列標題;

用循環實現表格數據的寫入;

用w.save('拉勾網.xls') 保存數據到excel表中,如圖1所示。

2 數據分析與處理

2.1 導入庫函數

導入import numpy as np和import pandas as pd,為數據分析做準備。

步入21世紀的中國,面臨新的發展機遇和挑戰。這十年是極不平凡的十年:戰勝了2003年非典、2008年汶川地震等自然災害等,經受了2008年金融危機考驗,舉辦了第29屆奧運會、第41屆世博會。這十年也是中國成長的十年,一次次的經歷增強了中華民族的凝聚力,同時也提升了中國的國際影響力。這期間黨中央召開了十六大、十七大,更加堅定了改革開放的步伐。黨的十六大向世人昭示了新世紀的中國舉什么旗、走什么路、實現什么樣的目標等重大問題,并圍繞這些問題做了全方位的部署,大踏步向全面建成小康社會的目標邁進。黨的十七大總結了改革開放的歷史進程和經驗,對深入貫徹科學發展觀提出明確要求,將改革開放不斷深入推進。

2.2 導入excel表

Pandas擁有十分豐富的數據導入函數,可以從excel、 txt、SQL 數據庫等多種數據源中快速導入數據。本文使用pandas的read_excel()函數讀入數據表,代碼如下:

file = '拉勾網.xls' #賦值變量

df = pd.read_excel(file) #導入數據表

結果如圖2所示。

2.3 數據分析

通過groupby()函數分組得出需要統計的數據,代碼如下:

cs_ave_money= df.groupby(['城市'])['平均薪資(k)'].mean()

cs_min_money=df.groupby(['城市'])['最低薪資(k)'].min()

cs_max_money=df.groupby(['城市'])['最高薪資(k)'].max()

cs_count=df.groupby(by=['城市']).size() #以城市分組查看其次數

data = list(cs_count.values) #出現的次數

labels=list(cs_count.keys()) #其對應的城市

結果如圖3~圖6所示。

3 數據展示

3.1 導入庫函數

導入import matplotlib.pyplot as plt,為數據展示做準備。

3.2 數據展示

在完成對數據表的篩選處理后,就可以使用matplotlib提供的畫圖函數進行數據的展示,使其可視化,使其數據更加直觀,代碼如下:

plt.bar(np.arange(0,len(labels)*2,2),cs_min_money,alpha=0.5,width=0.5,color='yellow',edgecolor='red',label='最低薪資',lw=3)

plt.bar(np.arange(0,len(labels)*2,2)+0.5, cs_max_money, alpha=0.2, width=0.5, color='green', edgecolor='blue', label='最高薪資', lw=3)

plt.bar(np.arange(0,len(labels)*2,2)+1, cs_ave_money, alpha=0.2, width=0.5, color='red', edgecolor='blue', label='平均薪資', lw=3)

plt.title('各地區薪資對照表',color='r')plt.ylabel('薪資(K)')

plt.xlabel('城市')

plt.legend()

plt.xticks(np.arange(0,len(labels)*2,2)+0.5/2,labels)

plt.title('地區需求量分析',color='r')

plt.pie(data,labels=labels,autopct='%1.1f%%',shadow=False,startang le=150)

結果如圖7~圖8所示。

4 結論

使用第三方庫numpy、pandas、matplotlib可以快速簡單的使其想要分析的數據可視化,在本次處理中,并列柱狀圖的位置及數值處理頗為繁瑣,可在日后改善。

猜你喜歡
可視化信息
自然資源可視化決策系統
北京測繪(2022年6期)2022-08-01 09:19:06
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
信息
建筑創作(2001年3期)2001-08-22 18:48:14
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 玖玖精品视频在线观看| 久久99国产乱子伦精品免| 九九视频免费看| 韩国福利一区| 日本伊人色综合网| 人妻无码中文字幕一区二区三区| 国产乱人伦AV在线A| 香蕉视频在线观看www| 中文字幕人成人乱码亚洲电影| 99热这里只有免费国产精品 | 欧美a级完整在线观看| 97久久免费视频| 国产精品jizz在线观看软件| 天天视频在线91频| 一边摸一边做爽的视频17国产| 欧美精品啪啪| 亚洲第一成年人网站| 国产日本一区二区三区| 国产一区二区人大臿蕉香蕉| 欧美精品一区在线看| 成年人免费国产视频| 久久精品丝袜| 91年精品国产福利线观看久久| 欧美a在线| 日韩精品视频久久| 亚洲第一视频网| 欧美视频在线不卡| 亚洲人成网站日本片| 国产精品极品美女自在线看免费一区二区| 日本高清成本人视频一区| 国产乱人免费视频| 五月婷婷亚洲综合| 99热这里只有精品在线观看| 国产精品自在在线午夜区app| 四虎成人精品| 一区二区三区四区日韩| 老司机午夜精品网站在线观看 | 激情视频综合网| 亚洲综合极品香蕉久久网| 午夜天堂视频| 最新亚洲人成网站在线观看| AV不卡无码免费一区二区三区| 国产十八禁在线观看免费| 亚洲AV无码乱码在线观看裸奔| 亚洲一区二区三区在线视频| 欧美一区二区自偷自拍视频| 亚洲最大福利网站| 亚洲成人精品| 99这里精品| 欧美日韩成人在线观看| 精品视频在线观看你懂的一区| 国产精品.com| 制服丝袜亚洲| lhav亚洲精品| 国产成人免费手机在线观看视频| 国产美女免费| 久草美女视频| 国产一区免费在线观看| 美女无遮挡免费视频网站| 2020极品精品国产| 美女一级毛片无遮挡内谢| 欧美日韩免费在线视频| 成人av专区精品无码国产| 亚瑟天堂久久一区二区影院| 在线观看视频99| 成人国产一区二区三区| 欧美精品成人| 欧美a在线视频| 国产AV无码专区亚洲A∨毛片| 亚洲国产成人久久精品软件 | 日本欧美精品| 亚洲成AV人手机在线观看网站| 久久性视频| 色老二精品视频在线观看| 国产精品开放后亚洲| 97视频免费看| 婷五月综合| 亚洲欧美成aⅴ人在线观看| 91原创视频在线| 国产69精品久久久久孕妇大杂乱| 日韩欧美网址| 日韩在线视频网站|