我需要将包含信息的列拆分为几列。
我会使用,tstrsplit
但相同的信息在行之间的顺序并不相同,我需要在变量中提取新列的名称。重要信息:可能有很多信息(字段变成新变量),我不知道所有这些信息,因此,我不需要“逐字段”解决方案。
以下是我所拥有的示例:
library(data.table)
myDT <- structure(list(chr = c("chr1", "chr2", "chr4"), pos = c(123L,
435L, 120L), info = c("type=3;end=4", "end=6", "end=5;pos=TRUE;type=2"
)), class = c("data.table", "data.frame"), row.names = c(NA,-3L))
# chr pos info
#1: chr1 123 type=3;end=4
#2: chr2 435 end=6
#3: chr4 120 end=5;pos=TRUE;type=2
我想得到:
# chr pos end pos type
#1: chr1 123 4 <NA> 3
#2: chr2 435 6 <NA> <NA>
#3: chr4 120 5 TRUE 2
最简单的方法将不胜感激!(注意:我不愿意采用dplyr / tidyr的方式)