# -*- coding: utf-8 -*-
#概念:时间转换,是指将字符型的时间格式数据,转换为时间型数据的过程
#时间转换函数:datetime = pandas.to_datetime(dateString,format)
# %Y:代表年份
# %m:代表月份
# %d:代表日期
# %H:代表小时
# %M:代表分钟
# %S:代表秒
#时间格式化:是指将时间型的数据,按照指定的格式,转为字符型数据
#时间格式化函数:dateTimeFormat = datetime.dt.strftime(format)
#时间属性抽取:是指从日期格式里面,抽取出需要的部分属性
#抽取语法:datetime.dt.property
#second:1-60秒,从1开始,到60
#minute:1-60分钟,从1开始,到60
#hour:1-24小时,从1开始,到24
#day:1-31,一个月中的第几天,从1开始,到31
#month:1-12月,从1开始,到12
#year:年份
#weekday:1-7,一周中的第几天,从1开始,最大为7
import pandas
data = pandas.read_csv("D:/python/workspace/pythonStudy/21.csv",encoding="utf8")
data['时间'] = pandas.to_datetime(
data.注册时间,
format='%Y/%m/%d' #format怎么定义要根据时间字符串来定,因为时间字符串里面是斜线隔开的,所以这里也要用斜线
)
#如何用横杠来代替斜杠呢?使用时间格式化函数
data["格式化时间"] = data.时间.dt.strftime('%Y-%m-%d')
#时间属性如何抽取?
data['时间.年'] = data['时间'].dt.year
data['时间.周'] = data['时间'].dt.weekday
#使用时间属性抽取之后,我们就可以做相应的分组统计了,比如统计某一年注册的用户数量是多少
|
|