截断python datetime对象的经典方法是什么?
在这种特殊情况下,直到今天。因此,基本上将小时,分钟,秒和微秒设置为0。
我希望输出也是日期时间对象,而不是字符串。
截断python datetime对象的经典方法是什么?
在这种特殊情况下,直到今天。因此,基本上将小时,分钟,秒和微秒设置为0。
我希望输出也是日期时间对象,而不是字符串。
Answers:
我认为这就是您要寻找的...
>>> import datetime
>>> dt = datetime.datetime.now()
>>> dt = dt.replace(hour=0, minute=0, second=0, microsecond=0) # Returns a copy
>>> dt
datetime.datetime(2011, 3, 29, 0, 0)
但是,如果您真的不在乎事物的时间方面,那么您实际上应该只在传递date
对象……
>>> d_truncated = datetime.date(dt.year, dt.month, dt.day)
>>> d_truncated
datetime.date(2011, 3, 29)
datetime
,而不是date
对象(您可以使用dt.date()
调用(无需使用显式构造函数))。.replace()
如果datetime
添加纳秒级支持,该方法可能会失败。你可以使用datetime.combine()
代替。
datetime.datetime.now().replace(hour=0, minute=0, second=0, microsecond=0)
?
如果您不在乎时间,请使用date
not datetime
。
>>> now = datetime.now()
>>> now.date()
datetime.date(2011, 3, 29)
您可以像这样更新日期时间:
>>> now.replace(minute=0, hour=0, second=0, microsecond=0)
datetime.datetime(2011, 3, 29, 0, 0)
您不能截断日期时间对象,因为它是不可变的。
但是,这是一种使用0小时,分钟,秒和微秒字段构造新日期时间而不丢弃原始日期或tzinfo的方法:
newdatetime = now.replace(hour=0, minute=0, second=0, microsecond=0)
replace
期权放在第一位,因为这可能就是他们想要的。
tzinfo=now.tzinfo
。在tzinfo
半夜可能会有所不同例如,UTC偏移量2012-04-01 00:09:00
在澳大利亚/墨尔本时区(上午9:00)是AEST+10:00
,但它是AEDT+11:00
在2012-04-01 00:00:00
(午夜) -有在这一天结束DST过渡。您可以使用pytz
模块来修复它,请参阅我的答案。
要获得对应于给定日期时间对象的午夜,可以使用datetime.combine()
method:
>>> from datetime import datetime, time
>>> dt = datetime.utcnow()
>>> dt.date()
datetime.date(2015, 2, 3)
>>> datetime.combine(dt, time.min)
datetime.datetime(2015, 2, 3, 0, 0)
与该.replace()
方法相比,优点是datetime.combine()
即使datetime
模块引入了纳秒级支持,基于解决方案的解决方案仍将继续有效。
tzinfo
可以在必要时保留它,但是utc偏移量可能在午夜有所不同,例如由于DST转换,因此幼稚的解决方案(设置tzinfo
时间属性)可能会失败。请参阅如何获取给定时区的UTC时间“午夜”?
您可以为此使用熊猫(尽管对于该任务可能是开销)。您可以像通常的数字一样使用round,floor和ceil,也可以使用offset-aliases的任何熊猫频率:
import pandas as pd
import datetime as dt
now = dt.datetime.now()
pd_now = pd.Timestamp(now)
freq = '1d'
pd_round = pd_now.round(freq)
dt_round = pd_round.to_pydatetime()
print(now)
print(dt_round)
"""
2018-06-15 09:33:44.102292
2018-06-15 00:00:00
"""
您可以使用datetime.strftime提取日期,月份,年份...
范例:
from datetime import datetime
d = datetime.today()
# Retrieves the day and the year
print d.strftime("%d-%Y")
输出(今天):
29-2011
如果只想获取日期,则可以使用day属性,例如:
from datetime import datetime
d = datetime.today()
# Retrieves the day
print d.day
Ouput(今天):
29
d.day
等等
有一个很棒的用于操作日期的库:Delorean
import datetime
from delorean import Delorean
now = datetime.datetime.now()
d = Delorean(now, timezone='US/Pacific')
>>> now
datetime.datetime(2015, 3, 26, 19, 46, 40, 525703)
>>> d.truncate('second')
Delorean(datetime=2015-03-26 19:46:40-07:00, timezone='US/Pacific')
>>> d.truncate('minute')
Delorean(datetime=2015-03-26 19:46:00-07:00, timezone='US/Pacific')
>>> d.truncate('hour')
Delorean(datetime=2015-03-26 19:00:00-07:00, timezone='US/Pacific')
>>> d.truncate('day')
Delorean(datetime=2015-03-26 00:00:00-07:00, timezone='US/Pacific')
>>> d.truncate('month')
Delorean(datetime=2015-03-01 00:00:00-07:00, timezone='US/Pacific')
>>> d.truncate('year')
Delorean(datetime=2015-01-01 00:00:00-07:00, timezone='US/Pacific')
并且如果您想获取日期时间值:
>>> d.truncate('year').datetime
datetime.datetime(2015, 1, 1, 0, 0, tzinfo=<DstTzInfo 'US/Pacific' PDT-1 day, 17:00:00 DST>)
参见https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.dt.floor.html
现在是2019年,我认为最有效的方法是:
df['truncate_date'] = df['timestamp'].dt.floor('d')
6年后...我发现了这篇文章,并且我更喜欢numpy的方式:
import numpy as np
dates_array = np.array(['2013-01-01', '2013-01-15', '2013-01-30']).astype('datetime64[ns]')
truncated_dates = dates_array.astype('datetime64[D]')
干杯
截断是什么意思?
通过使用strftime()方法并使用适当的格式字符串,您可以完全控制格式。
http://docs.python.org/library/datetime.html#strftime-strptime-behavior
如果要处理DateTime类型的Series,则有一种更有效的方法来截断它们,尤其是在Series对象包含很多行时。
您可以使用发言权功能
例如,如果要将其截断为几个小时:
产生日期范围
times = pd.Series(pd.date_range(start='1/1/2018 04:00:00', end='1/1/2018 22:00:00', freq='s'))
我们可以通过比较替换功能和发言权功能之间的运行时间来检查它。
%timeit times.apply(lambda x : x.replace(minute=0, second=0, microsecond=0))
>>> 341 ms ± 18.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%timeit times.dt.floor('h')
>>>>2.26 ms ± 451 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)