Answers:
解决此问题的一种方法是使用Alpha混合,它使每个点都稍微透明。因此,区域显得更暗,上面绘制了更多点。
这很容易做到ggplot2
:
df <- data.frame(x = rnorm(5000),y=rnorm(5000))
ggplot(df,aes(x=x,y=y)) + geom_point(alpha = 0.3)
解决此问题的另一种简便方法是(可能更适合于您拥有的点数)是六角形装仓:
ggplot(df,aes(x=x,y=y)) + stat_binhex()
此外,还有常规的旧矩形装箱(省略了图像),更像是传统的热图:
ggplot(df,aes(x=x,y=y)) + geom_bin2d()
scale_fill_gradient()
并指定您自己的低色和高色,或者使用scale_fill_brewer()
并从顺序调色板之一中进行选择。
geom_point()
并绘制每个点。
您也可以查看ggsubplot
包装。该软件包实现了Hadley Wickham早在2011年(http://blog.revolutionanalytics.com/2011/10/ggplot2-for-big-data.html)提出的功能。
(下面,出于说明目的,我包括“点”层。)
library(ggplot2)
library(ggsubplot)
# Make up some data
set.seed(955)
dat <- data.frame(cond = rep(c("A", "B"), each=5000),
xvar = c(rep(1:20,250) + rnorm(5000,sd=5),rep(16:35,250) + rnorm(5000,sd=5)),
yvar = c(rep(1:20,250) + rnorm(5000,sd=5),rep(16:35,250) + rnorm(5000,sd=5)))
# Scatterplot with subplots (simple)
ggplot(dat, aes(x=xvar, y=yvar)) +
geom_point(shape=1) +
geom_subplot2d(aes(xvar, yvar,
subplot = geom_bar(aes(rep("dummy", length(xvar)), ..count..))), bins = c(15,15), ref = NULL, width = rel(0.8), ply.aes = FALSE)
但是,如果您要控制第三个变量,则此功能会很困难。
# Scatterplot with subplots (including a third variable)
ggplot(dat, aes(x=xvar, y=yvar)) +
geom_point(shape=1, aes(color = factor(cond))) +
geom_subplot2d(aes(xvar, yvar,
subplot = geom_bar(aes(cond, ..count.., fill = cond))),
bins = c(15,15), ref = NULL, width = rel(0.8), ply.aes = FALSE)
或者另一种方法是使用smoothScatter()
:
smoothScatter(dat[2:3])
概述以下几个不错的选择ggplot2
:
library(ggplot2)
x <- rnorm(n = 10000)
y <- rnorm(n = 10000, sd=2) + x
df <- data.frame(x, y)
o1 <- ggplot(df, aes(x, y)) +
geom_point(alpha = 0.05)
o2 <- ggplot(df, aes(x, y)) +
geom_point(alpha = 0.05) +
geom_density_2d()
o3 <- ggplot(df, aes(x, y)) +
stat_density_2d(aes(fill = stat(level)), geom = 'polygon') +
scale_fill_viridis_c(name = "density") +
geom_point(shape = '.')
o4 <- ggplot(df, aes(x, y)) +
stat_density_2d(aes(fill = stat(density)), geom = 'raster', contour = FALSE) +
scale_fill_viridis_c() +
coord_cartesian(expand = FALSE) +
geom_point(shape = '.', col = 'white')
o5 <- ggplot(df, aes(x, y)) +
geom_hex() +
scale_fill_viridis_c() +
geom_point(shape = '.', col = 'white')
o6 <- ggplot(df, aes(x, y)) +
geom_point(alpha = 0.1) +
geom_rug(alpha = 0.01)
合并成一个图:
cowplot::plot_grid(
o1, o2, o3, o4, o5, o6,
ncol = 2, labels = 'AUTO', align = 'v', axis = 'lr'
)
基本图形也很容易进行Alpha混合。
df <- data.frame(x = rnorm(5000),y=rnorm(5000))
with(df, plot(x, y, col="#00000033"))
后面的前六个数字#
是RGB十六进制的颜色,后两个数字是不透明度,再次是十六进制,所以33〜3 / 16th不透明。
您可能会发现该hexbin
软件包很有用。从的帮助页面hexbinplot
:
library(hexbin)
mixdata <- data.frame(x = c(rnorm(5000),rnorm(5000,4,1.5)),
y = c(rnorm(5000),rnorm(5000,2,3)),
a = gl(2, 5000))
hexbinplot(y ~ x | a, mixdata)
geom_pointdenisty
从ggpointdensity
包可以让你在同一时间显现的密度和单个数据点(最近被卢卡斯克雷默和西蒙·安德斯(2019)开发的):
library(ggplot2)
# install.packages("ggpointdensity")
library(ggpointdensity)
df <- data.frame(x = rnorm(5000), y = rnorm(5000))
ggplot(df, aes(x=x, y=y)) + geom_pointdensity() + scale_color_viridis_c()
我最喜欢绘制这种类型数据的方法是此问题中描述的一种方法- 散布密度图。这个想法是做一个散点图,但要通过点的密度(大致来说,该区域的重叠量)来给点着色。
同时:
这是链接问题的最高答案的结果: