向ggplot2线图添加图例


143

我对ggplot2中的图例有疑问。我设法在同一张图中绘制三条线,并希望使用所用的三种颜色添加图例。这是使用的代码

library(ggplot2)    
require(RCurl)

link<-getURL("https://dl.dropbox.com/s/ds5zp9jonznpuwb/dat.txt")
datos<- read.csv(textConnection(link),header=TRUE,sep=";")
datos$fecha <- as.POSIXct(datos[,1], format="%d/%m/%Y")    

temp = ggplot(data=datos,aes(x=fecha, y=TempMax,colour="1")) + 
           geom_line(colour="red") + opts(title="TITULO") +
           ylab("Temperatura (C)") + xlab(" ") + 
           scale_y_continuous(limits = c(-10,40)) + 
           geom_line(aes(x=fecha, y=TempMedia,colour="2"),colour="green") + 
           geom_line(aes(x=fecha, y=TempMin,colour="2"),colour="blue") +
           scale_colour_manual(values=c("red","green","blue"))

temp

和输出

ggplot三行

我想添加一个图例,其中使用了三种颜色和变量名称(TempMax,TempMedia和TempMin)。我努力了

scale_colour_manual

但找不到确切的方法。

不幸的是,原始数据已从链接站点中删除,无法恢复。但是它们来自具有这种格式的气象数据文件

"date","Tmax","Tmin","Tmed","Precip.diaria","Wmax","Wmed"
2000-07-31 00:00:00,-1.7,-1.7,-1.7,-99.9,20.4,20.4
2000-08-01 00:00:00,22.9,19,21.11,-99.9,6.3,2.83
2000-08-03 00:00:00,24.8,12.3,19.23,-99.9,6.8,3.87
2000-08-04 00:00:00,20.3,9.4,14.4,-99.9,8.3,5.29
2000-08-08 00:00:00,25.7,14.4,19.5,-99.9,7.9,3.22
2000-08-09 00:00:00,29.8,16.2,22.14,-99.9,8.5,3.27
2000-08-10 00:00:00,30,17.8,23.5,-99.9,7.7,3.61
2000-08-11 00:00:00,27.5,17,22.68,-99.9,8.8,3.85
2000-08-12 00:00:00,24,13.3,17.32,-99.9,8.4,3.49

我仍然很好奇,传说是否可以与情节的其他元素(例如不同的geom_line)联系在一起。
EtienneLow-Décarie2012年

如果您只有3行,我建议您看一下dirrectlabels软件包。(LINK)
泰勒·林克

@TylerRinker我以前曾将它用于其他目的,但现在csgillespie的答案对我
而言

@EtienneLow-Décarie可以,但是通常只有他们使用不同的美学原理才可以。例如,将一组线映射到颜色,将另一组线映射到线型。通常,在这种情况下,您也会将单独的数据传递给每个地理区域。
joran 2012年

Answers:


82

我倾向于发现,如果要在多个geom中指定单个颜色,那我做错了。这是我如何绘制您的数据的方法:

##Subset the necessary columns
dd_sub = datos[,c(20, 2,3,5)]
##Then rearrange your data frame
library(reshape2)
dd = melt(dd_sub, id=c("fecha"))

剩下的就是一个简单的ggplot命令:

ggplot(dd) + geom_line(aes(x=fecha, y=value, colour=variable)) +
  scale_colour_manual(values=c("red","green","blue"))

样例图

在此处输入图片说明


87
我仍然对如何添加与单独添加元素(例如geom_line)相关联的图例感到好奇,尽管这是问题的初衷。
EtienneLow-Décarie2012年

201

由于@Etienne询问如何在不融合数据的情况下做到这一点(通常是首选方法,但我知道在某些情况下这是不可能的),因此,我提出了以下替代方法。

从原始数据的子集开始:

datos <-
structure(list(fecha = structure(c(1317452400, 1317538800, 1317625200, 
1317711600, 1317798000, 1317884400, 1317970800, 1318057200, 1318143600, 
1318230000, 1318316400, 1318402800, 1318489200, 1318575600, 1318662000, 
1318748400, 1318834800, 1318921200, 1319007600, 1319094000), class = c("POSIXct", 
"POSIXt"), tzone = ""), TempMax = c(26.58, 27.78, 27.9, 27.44, 
30.9, 30.44, 27.57, 25.71, 25.98, 26.84, 33.58, 30.7, 31.3, 27.18, 
26.58, 26.18, 25.19, 24.19, 27.65, 23.92), TempMedia = c(22.88, 
22.87, 22.41, 21.63, 22.43, 22.29, 21.89, 20.52, 19.71, 20.73, 
23.51, 23.13, 22.95, 21.95, 21.91, 20.72, 20.45, 19.42, 19.97, 
19.61), TempMin = c(19.34, 19.14, 18.34, 17.49, 16.75, 16.75, 
16.88, 16.82, 14.82, 16.01, 16.88, 17.55, 16.75, 17.22, 19.01, 
16.95, 17.55, 15.21, 14.22, 16.42)), .Names = c("fecha", "TempMax", 
"TempMedia", "TempMin"), row.names = c(NA, 20L), class = "data.frame")

您可以通过以下方式获得所需的效果(这也会清理原始的绘图代码):

ggplot(data = datos, aes(x = fecha)) +
  geom_line(aes(y = TempMax, colour = "TempMax")) +
  geom_line(aes(y = TempMedia, colour = "TempMedia")) +
  geom_line(aes(y = TempMin, colour = "TempMin")) +
  scale_colour_manual("", 
                      breaks = c("TempMax", "TempMedia", "TempMin"),
                      values = c("red", "green", "blue")) +
  xlab(" ") +
  scale_y_continuous("Temperatura (C)", limits = c(-10,40)) + 
  labs(title="TITULO")

这个想法是通过将colour美学映射到恒定的字符串来为每行赋予颜色。选择要在图例中显示的字符串是最简单的。在这种情况下,它与y要绘制的变量的名称相同的事实并不重要;它可以是任何一组字符串。这是非常重要的,它应该在aes调用中。您正在创建到该“变量”的映射。

scale_colour_manual现在可以将这些字符串映射到适当的颜色。结果是 在此处输入图片说明

在某些情况下,需要通过在手动比例尺中命名值来明确级别和颜色之间的映射(感谢@DaveRGP指出这一点):

ggplot(data = datos, aes(x = fecha)) +
  geom_line(aes(y = TempMax, colour = "TempMax")) +
  geom_line(aes(y = TempMedia, colour = "TempMedia")) +
  geom_line(aes(y = TempMin, colour = "TempMin")) +
  scale_colour_manual("", 
                      values = c("TempMedia"="green", "TempMax"="red", 
                                 "TempMin"="blue")) +
  xlab(" ") +
  scale_y_continuous("Temperatura (C)", limits = c(-10,40)) + 
  labs(title="TITULO")

(与之前的数字相同)。使用命名的值,可以使用分隔符来设置图例中的顺序,并且可以在值中使用任何顺序。

ggplot(data = datos, aes(x = fecha)) +
  geom_line(aes(y = TempMax, colour = "TempMax")) +
  geom_line(aes(y = TempMedia, colour = "TempMedia")) +
  geom_line(aes(y = TempMin, colour = "TempMin")) +
  scale_colour_manual("", 
                      breaks = c("TempMedia", "TempMax", "TempMin"),
                      values = c("TempMedia"="green", "TempMax"="red", 
                                 "TempMin"="blue")) +
  xlab(" ") +
  scale_y_continuous("Temperatura (C)", limits = c(-10,40)) + 
  labs(title="TITULO")


2
我喜欢这种解决方案,但我认为可能会有限制。在“中断”和“值”变量的映射之间是否存在字母排序问题?TempM {a] x,TempM {e} dia和TempM {i} n整齐地排序,尽管当我将其调整为变量名时,颜色似乎按照字母顺序与“中断”匹配,而不是按顺序输入。是否可以澄清/完善上述内容以反映/解决此问题?
DaveRGP 2015年

3
我设法找到了我先前购买的有关re:颜色订购的问题的修复程序。使用scale_colour_manual("", values = c("TempMax" = "red", "TempMedia" = "green", "TempMin" = "blue"))上面的答案中将TempMax,TempMedia和TempMin指定为color参数的形式。
DaveRGP

@DaveRGP可以认为它是ggplot的错误吗?
亚历山德罗·贾科普森

1
@StellaBiderman谢谢。很高兴知道这个答案在5年后(!)仍然有用。
布赖恩·迪格斯

1
@BrianDiggs您不会碰巧知道如何使该显示在刻度上而不是直线上吗?
Stella Biderman

2

我真的很喜欢@Brian Diggs提出的解决方案。但是,在我的情况下,我以循环方式创建线图,而不是明确给定它们,因为我不知道先验有多少图。当我尝试适应@Brian的代码时,我在正确处理颜色时遇到了一些问题。原来,我需要修改美学功能。如果有人遇到同样的问题,这是对我有用的代码。

我使用了与@Brian相同的数据框:

data <- structure(list(month = structure(c(1317452400, 1317538800, 1317625200, 1317711600, 
                                       1317798000, 1317884400, 1317970800, 1318057200, 
                                       1318143600, 1318230000, 1318316400, 1318402800, 
                                       1318489200, 1318575600, 1318662000, 1318748400, 
                                       1318834800, 1318921200, 1319007600, 1319094000), 
                                     class = c("POSIXct", "POSIXt"), tzone = ""),
                   TempMax = c(26.58, 27.78, 27.9, 27.44, 30.9, 30.44, 27.57, 25.71, 
                               25.98, 26.84, 33.58, 30.7, 31.3, 27.18, 26.58, 26.18, 
                               25.19, 24.19, 27.65, 23.92), 
                   TempMed = c(22.88, 22.87, 22.41, 21.63, 22.43, 22.29, 21.89, 20.52,
                                 19.71, 20.73, 23.51, 23.13, 22.95, 21.95, 21.91, 20.72, 
                                 20.45, 19.42, 19.97, 19.61), 
                   TempMin = c(19.34, 19.14, 18.34, 17.49, 16.75, 16.75, 16.88, 16.82, 
                               14.82, 16.01, 16.88, 17.55, 16.75, 17.22, 19.01, 16.95, 
                               17.55, 15.21, 14.22, 16.42)), 
              .Names = c("month", "TempMax", "TempMed", "TempMin"), 
              row.names = c(NA, 20L), class = "data.frame")  

就我而言,我生成my.colsmy.names动态,但我不想让事情变得不必要地复杂化,所以我给他们明确地在这里。这三行使图例的排序和颜色分配更加容易。

my.cols <- heat.colors(3, alpha=1)
my.names <- c("TempMin", "TempMed", "TempMax")
names(my.cols) <- my.names

这是情节:

p <-  ggplot(data, aes(x = month))

for (i in 1:3){
  p <- p + geom_line(aes_(y = as.name(names(data[i+1])), colour = 
colnames(data[i+1])))#as.character(my.names[i])))
}
p + scale_colour_manual("", 
                        breaks = as.character(my.names),
                        values = my.cols)
p

在此处输入图片说明


2
在这种复杂性下,将数据重塑为ggplot期望的长格式确实变得容易得多。
阿克斯曼

1
与@Brian发布的原始答案相比,我认为这真的不会增加复杂性。此外,有些人可能希望在不重塑数据的情况下这样做。
Justyna

...并且此方法通过变量允许使用不同的几何图形(图类型)
mac
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.