999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于python+pandas的數(shù)據(jù)分析處理應用

2018-12-24 15:06:05何春燕王超宇成都理工大學
數(shù)碼世界 2018年7期
關鍵詞:數(shù)據(jù)處理用戶

何春燕 王超宇 成都理工大學

1.引言

Python是一種面向對象的腳本語言,自20世紀90年代初誕生到現(xiàn)在,已經(jīng)被廣泛應人工智能,機器學習,大數(shù)據(jù)等方面。python語法簡單,容易理解和上手。無論安裝還是使用python都不需要付費。python是一種面向對象的語言,同時也支持面向過程。基于它的開源的本質,python可在許多平臺上使用,包括Windows,Linux等。python有強大的標準庫和豐富的第三方庫。.

Pandas被廣泛運用于金融、統(tǒng)計以及社會科學領域的數(shù)據(jù)處理。

2.Pandas處理數(shù)據(jù)

2.1 數(shù)據(jù)導入

程序段1:

從mangoDB讀取用戶表

import pandas as pd

from pymongo import MongoClient

host = ‘0.0.0.0’# 配置 MongoDB 連接信息

port = 27019

client = MongoClient(host=host, port=port)

collenction =‘user’

cursor = db[collection].find({})

User = pd.DataFrame(list(cursor))

部分數(shù)據(jù)展示:

user_id channel

first_visit_time

2018-01-04 10:43:33 33737760 anzhishichang

2018-01-04 13:54:50 33217154 anzhishichang

2018-01-08 17:46:22 33130645 anzhishichang

2.2 數(shù)據(jù)處理

2.2.1. 獲取新增用戶

新增用戶:首次使用應用程序的用戶,以first_visit_time為依據(jù),判斷用戶是否為新增用戶。

時間序列分析在金融數(shù)據(jù)分析中占據(jù)重要位置,可傳入字符串進行索引。

例如可傳入”20180109”來獲取1月9號首次訪問應用程序的用戶數(shù)據(jù),

User[‘20180109]

user_id channel

first_visit_time

2018-01-09 15:50:44 33217151 anzhishichang

可傳入時間段獲取數(shù)據(jù):

User[“201808”:”20180111”]

user_id channel

first_visit_time

2018-01-08 17:43:11 4897182 anzhishichang

2018-01-11 09:18:59 33217153 anzhishichang

時間索引的切片操作包含尾部的數(shù)據(jù)。

2.2.2.獲取最近7天新增用戶數(shù)

程序段2:

import pandas as pd

from datetime import datetime, date, timedelta

end_date = date.today()

new_user = pd.Series(name=`新增用戶數(shù)`)

#通過for循環(huán)獲取7天的新增用戶數(shù)

for i in range(7):

dt = date.today() - timedelta(days=i)

sum_new = User[dt[-4:]]

new_user[dt] = len(sum_new)

返回結果:

0522 65

0521 36

0520 8

0519 6

0518 3

0517 41

0516 58

可清晰的看到,每天的新增用戶數(shù)。

2.2.3.獲取最近7天不同渠道的新增用戶數(shù)

程序段3:

import pandas as pd

from datetime import datetime, timedelta, date

new7channel = pd.DataFrame()

#外層for循環(huán)獲取最近7天的新增用戶數(shù)據(jù)

for i in range(7):

Dt = date.today() - timedelta(days=i)

dt1 = datetime.strftime(dt, "%Y%m%d")

data = User[dt1]

Channel = data[`channel`].drop_duplicates()

new_channel=pd.Series(name=dt1[-4:])

#內(nèi)層for循環(huán),獲取各渠道新增用戶數(shù)

for cn in channel:

dt_cn = data[data[`channel`] == cn]

num_channel[cn] = len(dt_cn)

#concat函數(shù)將數(shù)據(jù)連接起來。通過fillna函數(shù)將值為NaN數(shù)據(jù)用0填充。

new7channel=pd.concat([new7channel,new_channel],axis=1).fillna(0)

部分結果:

0523 0522 0521 0520 0519 0518 0517

AppStore 8.0 20.0 13.0 13.0 12.0 11.0 20.0

c360 0.0 2.0 2.0 0.0 0.0 0.0 1.0

橫向數(shù)據(jù)表示不同渠道最近7天的新增用戶數(shù),縱向則表明不同渠道的新增用戶數(shù)。

3 結束語

在大數(shù)據(jù)時代,數(shù)據(jù)分析的影響及重要性在不斷拓寬和加深。本文介紹了基于Python,pandas簡單的數(shù)據(jù)分析過程。

猜你喜歡
數(shù)據(jù)處理用戶
認知診斷缺失數(shù)據(jù)處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數(shù)據(jù)處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
MATLAB在化學工程與工藝實驗數(shù)據(jù)處理中的應用
Matlab在密立根油滴實驗數(shù)據(jù)處理中的應用
Camera360:拍出5億用戶
100萬用戶
如何獲取一億海外用戶
主站蜘蛛池模板: 日本人妻一区二区三区不卡影院| 国产精品青青| 992tv国产人成在线观看| 黄色网址手机国内免费在线观看| 国产日韩精品欧美一区喷| 女人av社区男人的天堂| 国产精品女在线观看| 国产欧美成人不卡视频| 国产大片喷水在线在线视频| 伊人91视频| 欧美福利在线| 在线观看国产精美视频| 欧美在线视频a| 欧美国产日韩在线播放| 制服丝袜一区| av一区二区人妻无码| 秋霞国产在线| 97国产在线播放| 99久久精品视香蕉蕉| 亚洲成在人线av品善网好看| 亚洲欧洲日产国码无码av喷潮| 欧美日韩一区二区三| 日本免费福利视频| 国产va欧美va在线观看| 谁有在线观看日韩亚洲最新视频| 18禁黄无遮挡网站| 免费看美女毛片| 成人福利在线免费观看| 99视频精品在线观看| 国产女人水多毛片18| 亚洲天堂.com| 夜夜操天天摸| 免费AV在线播放观看18禁强制| 久久精品91麻豆| 亚洲码一区二区三区| 久久人人97超碰人人澡爱香蕉| 成人精品亚洲| 国产在线精品网址你懂的 | 日韩AV无码免费一二三区| 成人一区在线| a级毛片在线免费| 日韩精品高清自在线| 国产精品永久在线| 日韩高清成人| 亚洲国产成人精品青青草原| 伊人91视频| 午夜毛片福利| 亚洲国产中文在线二区三区免| 久久午夜影院| 国产凹凸视频在线观看| 国产在线自乱拍播放| 亚洲欧美日韩另类在线一| 999精品免费视频| 国产高清在线观看| 在线免费观看AV| JIZZ亚洲国产| 国产性爱网站| 久久久国产精品无码专区| 91福利片| 国产成人精品亚洲日本对白优播| 中字无码精油按摩中出视频| 伊大人香蕉久久网欧美| 999国内精品久久免费视频| 在线免费a视频| 日本国产在线| 日本三级黄在线观看| 国产特一级毛片| 人妻丰满熟妇αv无码| 丁香六月综合网| 国产成人永久免费视频| 久一在线视频| 国产在线欧美| 国产午夜一级毛片| 欧美三级视频网站| 国产三级毛片| 日韩午夜伦| 亚洲高清国产拍精品26u| 毛片网站观看| 91成人在线观看视频| 亚洲一区二区三区香蕉| 波多野结衣一二三| 免费一级毛片|