999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于python+pandas的數(shù)據(jù)分析處理應用

2018-12-24 15:06:05何春燕王超宇成都理工大學
數(shù)碼世界 2018年7期
關鍵詞:數(shù)據(jù)處理用戶

何春燕 王超宇 成都理工大學

1.引言

Python是一種面向對象的腳本語言,自20世紀90年代初誕生到現(xiàn)在,已經(jīng)被廣泛應人工智能,機器學習,大數(shù)據(jù)等方面。python語法簡單,容易理解和上手。無論安裝還是使用python都不需要付費。python是一種面向對象的語言,同時也支持面向過程。基于它的開源的本質,python可在許多平臺上使用,包括Windows,Linux等。python有強大的標準庫和豐富的第三方庫。.

Pandas被廣泛運用于金融、統(tǒng)計以及社會科學領域的數(shù)據(jù)處理。

2.Pandas處理數(shù)據(jù)

2.1 數(shù)據(jù)導入

程序段1:

從mangoDB讀取用戶表

import pandas as pd

from pymongo import MongoClient

host = ‘0.0.0.0’# 配置 MongoDB 連接信息

port = 27019

client = MongoClient(host=host, port=port)

collenction =‘user’

cursor = db[collection].find({})

User = pd.DataFrame(list(cursor))

部分數(shù)據(jù)展示:

user_id channel

first_visit_time

2018-01-04 10:43:33 33737760 anzhishichang

2018-01-04 13:54:50 33217154 anzhishichang

2018-01-08 17:46:22 33130645 anzhishichang

2.2 數(shù)據(jù)處理

2.2.1. 獲取新增用戶

新增用戶:首次使用應用程序的用戶,以first_visit_time為依據(jù),判斷用戶是否為新增用戶。

時間序列分析在金融數(shù)據(jù)分析中占據(jù)重要位置,可傳入字符串進行索引。

例如可傳入”20180109”來獲取1月9號首次訪問應用程序的用戶數(shù)據(jù),

User[‘20180109]

user_id channel

first_visit_time

2018-01-09 15:50:44 33217151 anzhishichang

可傳入時間段獲取數(shù)據(jù):

User[“201808”:”20180111”]

user_id channel

first_visit_time

2018-01-08 17:43:11 4897182 anzhishichang

2018-01-11 09:18:59 33217153 anzhishichang

時間索引的切片操作包含尾部的數(shù)據(jù)。

2.2.2.獲取最近7天新增用戶數(shù)

程序段2:

import pandas as pd

from datetime import datetime, date, timedelta

end_date = date.today()

new_user = pd.Series(name=`新增用戶數(shù)`)

#通過for循環(huán)獲取7天的新增用戶數(shù)

for i in range(7):

dt = date.today() - timedelta(days=i)

sum_new = User[dt[-4:]]

new_user[dt] = len(sum_new)

返回結果:

0522 65

0521 36

0520 8

0519 6

0518 3

0517 41

0516 58

可清晰的看到,每天的新增用戶數(shù)。

2.2.3.獲取最近7天不同渠道的新增用戶數(shù)

程序段3:

import pandas as pd

from datetime import datetime, timedelta, date

new7channel = pd.DataFrame()

#外層for循環(huán)獲取最近7天的新增用戶數(shù)據(jù)

for i in range(7):

Dt = date.today() - timedelta(days=i)

dt1 = datetime.strftime(dt, "%Y%m%d")

data = User[dt1]

Channel = data[`channel`].drop_duplicates()

new_channel=pd.Series(name=dt1[-4:])

#內(nèi)層for循環(huán),獲取各渠道新增用戶數(shù)

for cn in channel:

dt_cn = data[data[`channel`] == cn]

num_channel[cn] = len(dt_cn)

#concat函數(shù)將數(shù)據(jù)連接起來。通過fillna函數(shù)將值為NaN數(shù)據(jù)用0填充。

new7channel=pd.concat([new7channel,new_channel],axis=1).fillna(0)

部分結果:

0523 0522 0521 0520 0519 0518 0517

AppStore 8.0 20.0 13.0 13.0 12.0 11.0 20.0

c360 0.0 2.0 2.0 0.0 0.0 0.0 1.0

橫向數(shù)據(jù)表示不同渠道最近7天的新增用戶數(shù),縱向則表明不同渠道的新增用戶數(shù)。

3 結束語

在大數(shù)據(jù)時代,數(shù)據(jù)分析的影響及重要性在不斷拓寬和加深。本文介紹了基于Python,pandas簡單的數(shù)據(jù)分析過程。

猜你喜歡
數(shù)據(jù)處理用戶
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
MATLAB在化學工程與工藝實驗數(shù)據(jù)處理中的應用
Matlab在密立根油滴實驗數(shù)據(jù)處理中的應用
Camera360:拍出5億用戶
100萬用戶
如何獲取一億海外用戶
主站蜘蛛池模板: 亚洲成人在线网| 亚洲欧美一区二区三区蜜芽| 亚洲欧州色色免费AV| 天堂亚洲网| 91久久国产综合精品女同我| 欧美中文字幕一区| 东京热av无码电影一区二区| 欧美性久久久久| 亚洲精品福利视频| 亚洲国内精品自在自线官| 日本免费高清一区| 91精品久久久无码中文字幕vr| 亚洲精品大秀视频| 99视频国产精品| 无码一区中文字幕| 国产成人精品无码一区二| 五月婷婷精品| 久久久久国产一级毛片高清板| 91亚瑟视频| 欧美成人看片一区二区三区| 欧美色丁香| 九九热在线视频| 最新国产网站| 视频一区视频二区中文精品| 激情综合网激情综合| 欧美午夜网| 天天婬欲婬香婬色婬视频播放| 国产在线观看精品| 国产精品亚洲一区二区三区z| 久久这里只有精品8| 亚洲无线国产观看| 美女无遮挡拍拍拍免费视频| 国产成人综合日韩精品无码首页| 精品国产污污免费网站| 久久久久久久久18禁秘| 视频一本大道香蕉久在线播放| 国产精品美乳| 国产精选小视频在线观看| 色综合久久88色综合天天提莫| 毛片在线看网站| 无码人妻热线精品视频| 91欧美亚洲国产五月天| 精品一区二区久久久久网站| 自偷自拍三级全三级视频| 亚洲成人黄色在线| 欧美精品亚洲精品日韩专区va| 亚洲欧洲日韩综合色天使| 高清不卡一区二区三区香蕉| 国产人妖视频一区在线观看| 欧美笫一页| 在线国产毛片手机小视频| 色综合久久综合网| 97综合久久| 国产综合网站| 国产精品视频3p| 欧美日韩午夜| 国产va欧美va在线观看| 久久久久久久蜜桃| 久久综合一个色综合网| 国产精品视频导航| 国产成人AV综合久久| 成人免费网站久久久| 国产网站一区二区三区| 无码精品国产dvd在线观看9久| 成人在线亚洲| 波多野结衣亚洲一区| 这里只有精品在线播放| 国产精品无码在线看| 波多野结衣视频网站| 亚洲第一精品福利| 日韩久草视频| 熟妇无码人妻| 久久精品丝袜| 欧美亚洲一区二区三区在线| 日韩午夜福利在线观看| 在线国产综合一区二区三区 | av午夜福利一片免费看| 一本大道无码高清| 国产精品永久在线| 精品午夜国产福利观看| 国产在线一二三区| 亚洲va欧美ⅴa国产va影院|