用于将字符向量转换为POSIXct / POSIXlt的as.POSIXct / as.POSIXlt和strptime之间的区别

93

我在这里关注了许多问题，询问如何将字符向量转换为日期时间类。我经常看到2种方法，即strptime和as.POSIXct / as.POSIXlt方法。我看了两个功能，但不清楚有什么区别。

strptime

function (x, format, tz = "") 
{
    y <- .Internal(strptime(as.character(x), format, tz))
    names(y$year) <- names(x)
    y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>

as.POSIXct

function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>

as.POSIXlt

function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>

进行微基准测试，看看是否存在性能差异：

library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
                                    expr      min       lq   median       uq      max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2            strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422

strptime似乎更快。那有什么呢？为什么会有2个相似的功能，或者我错过了它们之间的差异？

r date time benchmarking

— RJ-
source

4

如果要查看在调用as.POSIXct和调用as.POSIXlt字符向量时正在调用的代码，请分别查看as.POSIXct.default和as.POSIXlt.character。

— 约书亚·乌尔里希

153

好的，这些功能可以做不同的事情。

首先，有两种日期/时间的内部实现：POSIXct，存储自UNIX纪元以来的秒数（+一些其他数据）；和POSIXlt，存储日，月，年，时，分，秒等的列表。

strptime是将字符向量（多种格式）直接转换为POSIXlt格式的功能。

as.POSIXlt将各种数据类型转换为POSIXlt。它试图变得聪明并做明智的事情-在角色方面，它充当的包装strptime。

as.POSIXct将各种数据类型转换为POSIXct。它还尝试变得聪明并做明智的事情-如果是角色，它将strptime首先运行，然后执行从POSIXlt到的转换POSIXct。

这样做是有道理的strptime，因为strptime它只处理字符输入，而其他方法则尝试根据输入类型来确定要使用哪种方法。这也应该更安全一些，因为处理意外数据只会产生错误，而不是尝试做您可能不想要的聪明事情。

— 费努佐格
source

好答案。关于为建模或数据可视化目的而编译数据的最佳实践，是否存在共识？

— dre

22

有两种POSIXt类型，POSIXct和POSIXlt。“ ct”可以代表日历时间，它存储自起点以来的秒数。“ lt”或本地时间将日期保留为时间属性列表（例如“ hour”和“ mon”）。尝试以下示例：

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year

— ku
source