如何从一个简单的字符串构造一个timedelta对象


96

我正在编写一个需要将timedelta输入作为字符串传递的函数。用户必须输入诸如“ 32m”或“ 2h32m”,甚至是“ 4:13”或“ 5hr34m56s”之类的东西...是否存在已经实现了这种东西的图书馆或东西?


对于只希望使用一行(在导入之后)构建一个d天,h小时,m分钟和s秒的timedelta对象的人datetimedatetime.timedelta(days = d, hours = h, minutes=m, seconds=s)
zthomas.nc

Answers:


72

对于第一种格式(5hr34m56s),应使用正则表达式进行解析

这是重新设计的解决方案:

import re
from datetime import timedelta


regex = re.compile(r'((?P<hours>\d+?)hr)?((?P<minutes>\d+?)m)?((?P<seconds>\d+?)s)?')


def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    time_params = {}
    for (name, param) in parts.iteritems():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)


>>> from parse_time import parse_time
>>> parse_time('12hr')
datetime.timedelta(0, 43200)
>>> parse_time('12hr5m10s')
datetime.timedelta(0, 43510)
>>> parse_time('12hr10s')
datetime.timedelta(0, 43210)
>>> parse_time('10s')
datetime.timedelta(0, 10)
>>> 

4
我在考虑某种函数,可以将所有内容扔给它,但仍然能够处理转换为timedelta。
priestc 2011年

2
我添加了基于解决方案的示例:)
virhilo 2011年

4
我看不到dateutil.parser.parse如何解析持续时间,似乎总是返回datetime。我想念什么?
Nickolay 2014年

7
dateutil.parser.parse不会解析timedelta对象。它返回一个datetime,并且会触发类似的字符串的异常'28:32:11.10'
Spak

95

对我来说,最优雅的解决方案是使用datetime强大的字符串解析方法,而不必诉诸dateutil等外部库或手动解析输入。strptime

from datetime import datetime, timedelta
# we specify the input and the format...
t = datetime.strptime("05:20:25","%H:%M:%S")
# ...and use datetime's hour, min and sec properties to build a timedelta
delta = timedelta(hours=t.hour, minutes=t.minute, seconds=t.second)

之后,您可以照常使用timedelta对象,将其转换为秒以确保我们做正确的事情,等等。

print(delta)
assert(5*60*60+20*60+25 == delta.total_seconds())

33
请注意,这种方法仅在时间跨度小于24小时(datetime.strptime("32:20:25","%H:%M:%S")不起作用)时有效,并且您必须知道确切的输入格式。
verdesmarald

这也只能部分回答OP的问题。如果函数需要处理多种格式-您仍然需要进行其他格式检查(1个冒号还是2个?)。
丹尼·史泰普

3
@verdesmarald那么,从python 3.5开始,是否有一个优雅的解决方案,而无需使用外部库并且不假设时间跨度小于24小时?
最大

1
我发现有必要为该参数手动指定命名参数,这timedelta很烦人,但为避免这种情况delta = t - datetime.combine(t.date(), time.min),我能想到的最好方法是:,这太可怕了。
凯尔·斯特兰德

2
这种方法的一个严重问题是,如果包括天数,然后将%d发送到strptime中,将使您无法输入第0天,因为只有> = 1的天才对日期有效。
user1581390

75

昨天我花了点时间,所以我将@virhilo答案开发到Python模块中,添加了更多时间表达格式,包括@priestc要求的所有格式。

源代码位于github(MIT许可证)上,供任何需要的人使用。它也在PyPI上:

pip install pytimeparse

以秒为单位返回时间:

>>> from pytimeparse.timeparse import timeparse
>>> timeparse('32m')
1920
>>> timeparse('2h32m')
9120
>>> timeparse('4:13')
253
>>> timeparse('5hr34m56s')
20096
>>> timeparse('1.2 minutes')
72

有Java / Scala等效项吗?
luca.giovagnoli

太棒了!非常感谢
Bouncner

@ luca.giovagnoli在Scala中,您可以使用Duration类。持续时间可以从像'15秒字符串来构造,“4分钟的等
康拉德马立克

14

我只想输入一个时间,然后将其添加到各个日期,所以这对我有用:

from datetime import datetime as dtt

time_only = dtt.strptime('15:30', "%H:%M") - dtt.strptime("00:00", "%H:%M")

dtt.strptime(myduration, "%H:%M:%S") - dtt(1900, 1, 1)也可以使用...
576i

8

我通过一些升级修改了virhilo的不错答案

  • 添加断言该字符串是有效的时间字符串
  • 用“ h”代替“ hr”小时指示器
  • 允许使用“ d”-天指示器
  • 允许非整数时间(例如3m0.25s3分钟0.25秒)

import re
from datetime import timedelta


regex = re.compile(r'^((?P<days>[\.\d]+?)d)?((?P<hours>[\.\d]+?)h)?((?P<minutes>[\.\d]+?)m)?((?P<seconds>[\.\d]+?)s)?$')


def parse_time(time_str):
    """
    Parse a time string e.g. (2h13m) into a timedelta object.

    Modified from virhilo's answer at https://stackoverflow.com/a/4628148/851699

    :param time_str: A string identifying a duration.  (eg. 2h13m)
    :return datetime.timedelta: A datetime.timedelta object
    """
    parts = regex.match(time_str)
    assert parts is not None, "Could not parse any time information from '{}'.  Examples of valid strings: '8h', '2d8h5m20s', '2m4s'".format(time_str)
    time_params = {name: float(param) for name, param in parts.groupdict().items() if param}
    return timedelta(**time_params)

1
大!我在元素之间添加了“ *”,也允许“ 1d 3h 5m”
Marcel Waldvogel '19

@MarcelWaldvogel很好,如果您复制新正则表达式的文本,我将在
Peter

@virhilo和Peter:我对您的代码进行的细微改动在这里:github.com/zeitgitter/zeitgitterd/blob/master/zeitgitter/…。我认为可以使用您的代码。您对许可证有任何偏好吗?麻省理工学院,Apache,GPL……?
Marcel Waldvogel

1
马塞尔,您能寄给我您的地址以便我起诉吗?JK继续进行任何许可都可以。
彼得·

这是新的正则表达式;区别在于“ *”:regex = re.compile(r'^((?P <days> [\。\ d] +?)d)?*'r'((?P <hours> [\ 。\ d] +?)h)?*'r'((?P <minutes> [\。\ d] +?)m)?*'r'((?P <seconds> [\。\ d] +?)s)?$')
Marcel Waldvogel

3

如果您使用Python 3,那么以下是Hari Shankar解决方案的更新版本,我使用了它:

from datetime import timedelta
import re

regex = re.compile(r'(?P<hours>\d+?)/'
                   r'(?P<minutes>\d+?)/'
                   r'(?P<seconds>\d+?)$')

def parse_time(time_str):
    parts = regex.match(time_str)
    if not parts:
        return
    parts = parts.groupdict()
    print(parts)
    time_params = {}
    for name, param in parts.items():
        if param:
            time_params[name] = int(param)
    return timedelta(**time_params)

3

Django带有实用程序功能parse_duration()。从文档中

解析字符串并返回datetime.timedelta

期望数据"DD HH:MM:SS.uuuuuu"采用ISO 8601 格式或指定的格式(例如P4DT1H15M20S,等同于4 1:15:20)或PostgreSQL的白天间隔格式(例如3 days 04:05:06)指定的格式。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.