一种替代方法是Kooperberg及其同事的方法,该方法基于使用样条曲线估算密度的方法,以近似数据的对数密度。我将展示一个使用@whuber答案中数据的示例,该示例将允许对方法进行比较。
set.seed(17)
x <- rexp(1000)
您需要为此安装logspline软件包。如果不是,请安装:
install.packages("logspline")
使用以下logspline()
功能加载包装并估算密度:
require("logspline")
m <- logspline(x)
在下面,我假设d
工作区中存在来自@whuber答案的对象。
plot(d, type="n", main="Default, truncated, and logspline densities",
xlim=c(-1, 5), ylim = c(0, 1))
polygon(density(x, kernel="gaussian", bw=h), col="#6060ff80", border=NA)
polygon(d, col="#ff606080", border=NA)
plot(m, add = TRUE, col = "red", lwd = 3, xlim = c(-0.001, max(x)))
curve(exp(-x), from=0, to=max(x), lty=2, add=TRUE)
rug(x, side = 3)
结果图如下所示,对数线密度由红线显示
另外,可以通过参数lbound
和来指定对密度的支持ubound
。如果我们希望假设密度在0的左侧为0,并且在0处存在不连续性,则可以lbound = 0
在调用中使用logspline()
,例如
m2 <- logspline(x, lbound = 0)
得出以下密度估计值(此处显示为原始对数m
线拟合,因为前一个图已经很忙)。
plot.new()
plot.window(xlim = c(-1, max(x)), ylim = c(0, 1.2))
title(main = "Logspline densities with & without a lower bound",
ylab = "Density", xlab = "x")
plot(m, col = "red", xlim = c(0, max(x)), lwd = 3, add = TRUE)
plot(m2, col = "blue", xlim = c(0, max(x)), lwd = 2, add = TRUE)
curve(exp(-x), from=0, to=max(x), lty=2, add=TRUE)
rug(x, side = 3)
axis(1)
axis(2)
box()
结果图如下所示
x
x = 0x