999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于python+pandas的數(shù)據(jù)分析處理應用

2018-12-24 15:06:05何春燕王超宇成都理工大學
數(shù)碼世界 2018年7期
關鍵詞:數(shù)據(jù)處理用戶

何春燕 王超宇 成都理工大學

1.引言

Python是一種面向對象的腳本語言,自20世紀90年代初誕生到現(xiàn)在,已經(jīng)被廣泛應人工智能,機器學習,大數(shù)據(jù)等方面。python語法簡單,容易理解和上手。無論安裝還是使用python都不需要付費。python是一種面向對象的語言,同時也支持面向過程。基于它的開源的本質,python可在許多平臺上使用,包括Windows,Linux等。python有強大的標準庫和豐富的第三方庫。.

Pandas被廣泛運用于金融、統(tǒng)計以及社會科學領域的數(shù)據(jù)處理。

2.Pandas處理數(shù)據(jù)

2.1 數(shù)據(jù)導入

程序段1:

從mangoDB讀取用戶表

import pandas as pd

from pymongo import MongoClient

host = ‘0.0.0.0’# 配置 MongoDB 連接信息

port = 27019

client = MongoClient(host=host, port=port)

collenction =‘user’

cursor = db[collection].find({})

User = pd.DataFrame(list(cursor))

部分數(shù)據(jù)展示:

user_id channel

first_visit_time

2018-01-04 10:43:33 33737760 anzhishichang

2018-01-04 13:54:50 33217154 anzhishichang

2018-01-08 17:46:22 33130645 anzhishichang

2.2 數(shù)據(jù)處理

2.2.1. 獲取新增用戶

新增用戶:首次使用應用程序的用戶,以first_visit_time為依據(jù),判斷用戶是否為新增用戶。

時間序列分析在金融數(shù)據(jù)分析中占據(jù)重要位置,可傳入字符串進行索引。

例如可傳入”20180109”來獲取1月9號首次訪問應用程序的用戶數(shù)據(jù),

User[‘20180109]

user_id channel

first_visit_time

2018-01-09 15:50:44 33217151 anzhishichang

可傳入時間段獲取數(shù)據(jù):

User[“201808”:”20180111”]

user_id channel

first_visit_time

2018-01-08 17:43:11 4897182 anzhishichang

2018-01-11 09:18:59 33217153 anzhishichang

時間索引的切片操作包含尾部的數(shù)據(jù)。

2.2.2.獲取最近7天新增用戶數(shù)

程序段2:

import pandas as pd

from datetime import datetime, date, timedelta

end_date = date.today()

new_user = pd.Series(name=`新增用戶數(shù)`)

#通過for循環(huán)獲取7天的新增用戶數(shù)

for i in range(7):

dt = date.today() - timedelta(days=i)

sum_new = User[dt[-4:]]

new_user[dt] = len(sum_new)

返回結果:

0522 65

0521 36

0520 8

0519 6

0518 3

0517 41

0516 58

可清晰的看到,每天的新增用戶數(shù)。

2.2.3.獲取最近7天不同渠道的新增用戶數(shù)

程序段3:

import pandas as pd

from datetime import datetime, timedelta, date

new7channel = pd.DataFrame()

#外層for循環(huán)獲取最近7天的新增用戶數(shù)據(jù)

for i in range(7):

Dt = date.today() - timedelta(days=i)

dt1 = datetime.strftime(dt, "%Y%m%d")

data = User[dt1]

Channel = data[`channel`].drop_duplicates()

new_channel=pd.Series(name=dt1[-4:])

#內(nèi)層for循環(huán),獲取各渠道新增用戶數(shù)

for cn in channel:

dt_cn = data[data[`channel`] == cn]

num_channel[cn] = len(dt_cn)

#concat函數(shù)將數(shù)據(jù)連接起來。通過fillna函數(shù)將值為NaN數(shù)據(jù)用0填充。

new7channel=pd.concat([new7channel,new_channel],axis=1).fillna(0)

部分結果:

0523 0522 0521 0520 0519 0518 0517

AppStore 8.0 20.0 13.0 13.0 12.0 11.0 20.0

c360 0.0 2.0 2.0 0.0 0.0 0.0 1.0

橫向數(shù)據(jù)表示不同渠道最近7天的新增用戶數(shù),縱向則表明不同渠道的新增用戶數(shù)。

3 結束語

在大數(shù)據(jù)時代,數(shù)據(jù)分析的影響及重要性在不斷拓寬和加深。本文介紹了基于Python,pandas簡單的數(shù)據(jù)分析過程。

猜你喜歡
數(shù)據(jù)處理用戶
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
MATLAB在化學工程與工藝實驗數(shù)據(jù)處理中的應用
Matlab在密立根油滴實驗數(shù)據(jù)處理中的應用
Camera360:拍出5億用戶
100萬用戶
如何獲取一億海外用戶
主站蜘蛛池模板: 伦精品一区二区三区视频| 欧美、日韩、国产综合一区| 91久草视频| 国产区人妖精品人妖精品视频| 漂亮人妻被中出中文字幕久久| 亚洲伦理一区二区| 在线国产你懂的| 99激情网| 国产 日韩 欧美 第二页| 日韩在线视频网| 在线国产欧美| 亚洲综合在线最大成人| 国产精品19p| 国产日产欧美精品| 国产91导航| 中文字幕2区| 精品欧美一区二区三区久久久| 国产导航在线| 国产精品嫩草影院av| 无码网站免费观看| 国产精品视频观看裸模| 亚洲人成网站在线播放2019| 69免费在线视频| 青青极品在线| 试看120秒男女啪啪免费| 欧美激情,国产精品| 亚洲无码91视频| 久久无码av三级| 国产三级精品三级在线观看| 999国产精品永久免费视频精品久久| 最新日本中文字幕| 女人18毛片一级毛片在线| 野花国产精品入口| 亚洲精品另类| 国产久操视频| 蜜芽一区二区国产精品| 91视频区| AV熟女乱| 成年人国产网站| 国产免费a级片| 国产日韩欧美黄色片免费观看| 国产自产视频一区二区三区| 67194亚洲无码| 国产第一福利影院| 久久男人视频| 国产97视频在线观看| 蜜臀AVWWW国产天堂| 久久香蕉国产线| 国产69精品久久| 国产一区成人| 国产69囗曝护士吞精在线视频| 国产传媒一区二区三区四区五区| 亚洲男人天堂久久| 亚洲国产精品一区二区高清无码久久| 国产成人精品一区二区| 久久久久人妻一区精品| 国产精品亚洲а∨天堂免下载| 亚洲精品在线观看91| 粉嫩国产白浆在线观看| 欧美在线精品怡红院| 国产精品毛片一区| 亚洲天天更新| 欧美成人精品高清在线下载| 国产又粗又猛又爽视频| 午夜免费视频网站| 久久黄色小视频| 国产91全国探花系列在线播放| 2022国产无码在线| 亚洲精品国产自在现线最新| 人妖无码第一页| 伊人久久大香线蕉综合影视| 久久91精品牛牛| 人妻免费无码不卡视频| 国产主播喷水| 91福利国产成人精品导航| 国产精品第一区在线观看| 久久免费视频6| 精品夜恋影院亚洲欧洲| 国产精品私拍在线爆乳| 欧美一级在线看| 国产18页| 日韩激情成人|