999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

用Python快速分析Excel表

2020-12-02 07:52:23陳新龍
電腦報 2020年42期
關鍵詞:利用

陳新龍

我們可以在一些面向白領的編程培訓廣告中看到,僅用幾節課學會Python之后,五分鐘就可以把領導分派的幾百張Excel表格處理完畢,這就是利用了Python的數據分析功能……

一、 數據分析簡介

數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解并消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。

而Python能成為受歡迎的編程語言最主要的原因是它的簡單易學。與其他語言相比,Python的語法很簡單,幾天就可以掌握它的基礎知識。即使在學習其他語言(例如C++、Java)之后,開發者通常還是更喜歡使用Python。因為Python庫幾乎可以滿足所有開發需求。所以,庫和簡單的語法讓使用Python進行開發既簡單又高效,也讓其成為適合初學者的語言。

我們也要跟隨著知識潮流的腳步,電腦報也會逐步和大家分享一些數據分析的技巧,在基本掌握Python后將其應用到實際工作中解放自己的生產力。

在學好Python的基礎知識后,初學數據分析可以使用兩款開發工具Pycharm或Jupyter Notebook。大致上從數據類型開始學習,深入到數據處理分析,再到圖形輸出。每一部分都有很多知識點,希望能在未來的日子里和大家一起學習進步。

今天就通過實例體會一下數據分析的簡單過程吧。下面我們根據班級學生基本情況表來分析班級中的男女生比例,并畫出餅圖來。雖然例子只處理了一張簡單的表格,但是當我們使用Python作為數據分析工具時,就可以快速處理大量的表格和數據(圖1)。

二、 開發工具簡介

Pycharm和Jupyter Notebook是我們用來編寫數據分析程序的常用開發工具,兩者各有優勢。

Pycharm是一款功能強大的Python開發環境,有大量的庫為數據分析和處理提供了完整的工具集,但在使用過程中,需要手動安裝需要的庫。在用于數據分析時Pycharm更全能,采用了更具創新性的實現算法,還能和其他語言對接,例如與C語言對接彌補Python運行效率不高的問題。

Jupyter Notebook是基于網頁的用于交互計算的應用程序,它是一個性能強大的終端可以在網頁中直接編寫和運行代碼(可以寫一行代碼,執行一行,運行結果直接在代碼塊下顯示)。這個集文本、代碼、圖像、公式展現于一體的超級Python Web界面,可以幫助我們學習和調試代碼。而且已經集成了大量的庫,用起來非常方便。

三、 數據分析處理

1. 環境安裝

本例我們在Jupyter Notebook上實操。

Jupyter Notebook的安裝網上已有不少教程,不再贅述,附上安裝教程鏈接:

https://blog.csdn.net/yu1014745867/article/

details/84191485

2. 導入庫

在數據分析中,我們需要不同庫的幫助。選擇數據路徑,對數據預處理、清洗、分析,最后繪制圖表……本次Python實例中需要用到以下函數庫。

Numpy庫:用來實現科學計算,包括計算數組、一些隨機的函數……對文件中的數據進行處理。

Pandas庫:提供大量能使我們快速便捷地處理數據的函數與方法,比如導入文件、提取文件……

OS庫:提供了豐富的方法用來處理文件和目錄,包括一些修改文件的目錄……

由于我們已經安裝好了Jupyter Notebook,這些需要函數庫直接導入就可以使用了(如圖2)。在Jupyter Notebook分段輸入部分代碼就可以直接運行查看效果,特別適合我們學習。

3. 導入數據表

導入成功后便可以利用os函數定位到文件所指定的位置“F:\\數據分析表”,數據表格放在這個目錄下(如圖3)。

隨后我們用pandas將所需的數據從表格文件中調取出來,我們采用的數據是一張班級成員信息表(表格中個人隱私有打碼)(如圖4)。

由于數據量較大,我們只需要使用“data1[:5]”提取前面五行的內容便于觀察數據格式和內容。

4. 數據清洗

觀察數據后發現并沒有性別這一項內容,但是數據中存在著身份證號一項,可以利用數據清洗整理提取身份證倒數第二位數字的奇偶性來判斷性別。首先增加一個列表用來存放性別,其次定義male和female兩個變量分別代表男和女, 利用循環提取出所有的身份證號,然后再去尋找出倒數第二位的數字(注意Python是左開右閉的這個知識點)然后利用判斷語句判斷倒數第二個數和2的余數是否等于0,如果余數等于0代表女,否則代表男(如圖5)。

將男女的性別添加到列表中。之后再使用“data1[:5]”,我們可以看到已經多出了性別這一列(如圖6)。

數據清洗簡單說就是把數據中的污染“洗掉”,指發現并糾正數據文件中可識別的錯誤,包括檢查數據一致性、處理無效值和缺失值等。這是數據分析的難點,需要針對具體情況提出相應的解決方案。

5. 繪制圖表

根據已經處理過的數據就可以統計male和female的人數,根據這兩個數值就可以算出對應的比例。然后用餅圖的方式繪制出來(圖7)。

Python繪制圖形需要用到Python Matplotlib.pyplot庫。Matplotlib庫是一個面向對象的繪圖庫。繪圖界面由pyplot模塊提供。該模塊提供了許多繪圖函數,男女比例可以用餅圖來直觀顯示,餅圖利用plt.pie的方法,設置繪制所需要的參數,包括數據值、區間的內容、顯示字符的距離、區間顯示的顏色、百分比……都需要一一設置好。由于圖形的參數設置繁雜,這里就不一一詳述了,你可以根據參數表自行查看使用(圖8)。

掌握數據分析是一項非常實用的技能,要想學好還需要提前打好一定的數學和編程基礎,本實例只是拋磚引玉告訴你Python可以幫你快速處理數據,今后我們也會繼續介紹一些均值、方差的計算實例,希望能夠對您有所幫助。

猜你喜歡
利用
利用min{a,b}的積分表示解決一類絕對值不等式
中等數學(2022年2期)2022-06-05 07:10:50
利用倒推破難點
如何利用基本不等式比較大小
利用一半進行移多補少
利用口訣算除法
利用數的分解來思考
Roommate is necessary when far away from home
利用
回收木再利用——Piet Hein Eek
工業設計(2016年5期)2016-05-04 04:00:33
低丘緩坡未利用地的開發利用探討
河北遙感(2015年4期)2015-07-18 11:05:06
主站蜘蛛池模板: 在线欧美日韩| 成人在线视频一区| 亚洲精品不卡午夜精品| 亚洲欧洲日韩综合色天使| 国产精品99在线观看| 欧美一级专区免费大片| 99久久人妻精品免费二区| 欧美一区国产| 人妻免费无码不卡视频| 国产精品午夜电影| 亚洲无码高清免费视频亚洲 | 亚洲综合色婷婷中文字幕| 精品国产www| 亚洲精品无码AV电影在线播放| 人妻熟妇日韩AV在线播放| 99热这里都是国产精品| 手机永久AV在线播放| 91综合色区亚洲熟妇p| 欧美激情,国产精品| 欧美α片免费观看| 日本高清免费不卡视频| 国产综合精品一区二区| 国产亚洲精品自在久久不卡| 97视频在线精品国自产拍| 狠狠色狠狠综合久久| 国产一区二区三区精品久久呦| 欧美一道本| 成人福利在线观看| 黄色网页在线播放| 第九色区aⅴ天堂久久香| 国产成人一级| 国产人碰人摸人爱免费视频 | 亚洲精品视频在线观看视频| 美美女高清毛片视频免费观看| 人禽伦免费交视频网页播放| 欧洲一区二区三区无码| 天天操天天噜| 亚洲综合在线最大成人| 99偷拍视频精品一区二区| 99精品在线看| 香蕉久久国产超碰青草| 无码国内精品人妻少妇蜜桃视频| 国产后式a一视频| 九九久久99精品| 国产第一页亚洲| 在线欧美日韩| 亚洲一欧洲中文字幕在线| 亚洲高清中文字幕| 欧美成人精品高清在线下载| 国产精品第页| 精品欧美日韩国产日漫一区不卡| 免费黄色国产视频| 国产成人精品第一区二区| 国产剧情国内精品原创| 欧美三级日韩三级| 九九精品在线观看| 在线免费观看AV| 免费国产好深啊好涨好硬视频| 免费在线看黄网址| 一级毛片在线直接观看| 最近最新中文字幕免费的一页| 99精品久久精品| 4虎影视国产在线观看精品| 精品三级网站| 激情無極限的亚洲一区免费| 成年女人a毛片免费视频| 人人澡人人爽欧美一区| 国产精品久久精品| 一本大道在线一本久道| 不卡色老大久久综合网| 26uuu国产精品视频| 亚洲婷婷六月| www.youjizz.com久久| 色国产视频| 亚洲中文精品久久久久久不卡| 亚洲人妖在线| 手机看片1024久久精品你懂的| 欧美日韩中文国产va另类| 亚洲综合精品第一页| 欧美一区二区福利视频| 91福利国产成人精品导航| 日本亚洲欧美在线|