在熊猫数据框中将Unix时间转换为可读日期


110

我有一个带有unix时间和价格的数据框。我想转换索引列,以便以人类可读的日期显示它。

因此,例如,我在index列中有dateas 1349633705,但我希望它显示为10/07/2012(或至少10/07/2012 18:15)。

在某些情况下,这是我正在使用的代码以及我已经尝试过的代码:

import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)   
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates 
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date   

如您所见,我在df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))这里使用的 是无效的,因为我使用的是整数而不是字符串。我认为我需要使用,datetime.date.fromtimestamp但我不确定如何将其应用于整个df.date

谢谢。

Answers:


221

距纪元似乎只有几秒钟。

In [20]: df = DataFrame(data['values'])

In [21]: df.columns = ["date","price"]

In [22]: df
Out[22]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date     358  non-null values
price    358  non-null values
dtypes: float64(1), int64(1)

In [23]: df.head()
Out[23]: 
         date  price
0  1349720105  12.08
1  1349806505  12.35
2  1349892905  12.15
3  1349979305  12.19
4  1350065705  12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')

In [26]: df.head()
Out[26]: 
                 date  price
0 2012-10-08 18:15:05  12.08
1 2012-10-09 18:15:05  12.35
2 2012-10-10 18:15:05  12.15
3 2012-10-11 18:15:05  12.19
4 2012-10-12 18:15:05  12.15

In [27]: df.dtypes
Out[27]: 
date     datetime64[ns]
price           float64
dtype: object

1
在0.13中,当read_json时,您将可以使用date_unit:D
Andy Hayden

大!您的解决方案非常合理。熊猫:现在我也了解了to_datetime,转换为Timestamps非常好。
卡内基

只是另一点。在0.11中,这对我不起作用,但在0.12+中对我来说很好
WA Carnegie

1
这个解决方案给了我OverflowError: Python int too large to convert to C long
如果__name__为None

2
没关系,有毫秒的时间戳,只是必须为lambda x: x/1000.0unit='ms'
如果__name__为None

48

如果您尝试使用:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))

并收到一个错误:

“ pandas.tslib.OutOfBoundsDatetime:无法转换单位为's'的输入”

这表示DATE_FIELD未指定秒。

就我而言,是毫秒- EPOCH time

转换工作如下:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms')) 

15

假设我们导入了pandas as pd并且df是我们的数据框

pd.to_datetime(df['date'], unit='s')

为我工作。


0

或者,通过更改上面的代码行:

# df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.date = df.date.apply(lambda d: datetime.datetime.fromtimestamp(int(d)).strftime('%Y-%m-%d'))

它也应该起作用。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.