Questions tagged «prediction-interval»

预测间隔(也称为预测间隔)是一个以某个预先确定的概率覆盖随机变量的未来(或其他未知但可观察到的)值的间隔。


8
生成与现有变量具有定义的相关性的随机变量
对于模拟研究,我必须生成随机变量,这些变量显示与现有变量的预定义(填充)相关性。ÿYY 我研究了这些R软件包copula,CDVine它们可以生成具有给定依赖关系结构的随机多变量分布。但是,不可能将结果变量之一固定为现有变量。 任何想法和现有功能的链接表示赞赏! 结论: 提出了两个有效的答案,有不同的解决方案: 一个R 脚本由卡拉卡尔,其计算与一个随机变量精确(样品)的相关性,以一个预定义的变量 我发现了一个R 函数,该函数计算与预定义变量具有定义的总体相关性的随机变量 [@ttnphns的补充:我可以自由地将问题标题从单个固定变量的情况扩展到任意数量的固定变量;即如何生成具有预定义正确性和一些固定的现有变量的变量]

2
线性回归中预测值的置信区间形状
我注意到,线性回归中预测值的置信区间在预测器的平均值附近趋于狭窄,在预测器的最小值和最大值附近趋于胖。这可以从以下4个线性回归的图中看出: 我最初认为这是因为大多数预测变量的值都集中在预测变量的均值附近。但是,我然后注意到,即使许多的值集中在预测变量的极值附近,也会出现置信区间的狭窄中间,如左下方线性回归所示,预测变量的哪些值集中在预测值的最小值附近。预测变量。 有谁能解释为什么线性回归预测值的置信区间在中间趋于狭窄而在极端处趋于肥胖?


2
R中lmer()混合效应模型的预测间隔
我想从lmer()模型获得围绕预测的预测间隔。我发现了一些有关此的讨论: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq 但他们似乎并未考虑随机效应的不确定性。 这是一个具体的例子。我在比赛金鱼。我有过去100场比赛的数据。考虑到我的RE估算和FE估算的不确定性,我想预测第101位。我包括鱼的随机拦截(有10种不同的鱼)和重量的固定效应(较轻的鱼更快)。 library("lme4") fish <- as.factor(rep(letters[1:10], each=100)) race <- as.factor(rep(900:999, 10)) oz <- round(1 + rnorm(1000)/10, 3) sec <- 9 + rep(1:10, rep(100,10))/10 + oz + rnorm(1000)/10 fishDat <- data.frame(fishID = fish, raceID = race, fishWt = oz, time = sec) head(fishDat) plot(fishDat$fishID, fishDat$time) lme1 <- lmer(time …

1
自举预测间隔
是否有任何引导技术可用于计算点预测的预测间隔,例如通过线性回归或其他回归方法(k近邻,回归树等)获得的点预测? 我以某种方式感到,有时建议的仅引导点预测的方法(例如,参见kNN回归的预测间隔)不是提供预测间隔,而是提供置信区间。 R中的一个例子 # STEP 1: GENERATE DATA set.seed(34345) n <- 100 x <- runif(n) y <- 1 + 0.2*x + rnorm(n) data <- data.frame(x, y) # STEP 2: COMPUTE CLASSIC 95%-PREDICTION INTERVAL fit <- lm(y ~ x) plot(fit) # not shown but looks fine with respect to all relevant …

1
线性回归预测区间
如果我的数据点的最佳线性近似(使用最小二乘)是线,如何计算近似误差?如果我计算观察值和预测值之间的差异的标准偏差,我以后可以说真实(但未观察到)的值属于区间假设正态分布()的概率约为68%?e i = r e a l (x i)− (m x i + b )y r = r e a l (x 0)[ y p - σ ,y p + σy=mx+by=mx+by=mx+bei=real(xi)−(mxi+b)ei=real(xi)−(mxi+b)e_i=real(x_i)-(mx_i+b)yr=real(x0)yr=real(x0)y_r=real(x_0)y p = m x 0 + b[yp−σ,yp+σ][yp−σ,yp+σ][y_p-\sigma, y_p+\sigma]yp=mx0+byp=mx0+by_p=mx_0+b 澄清: 我对函数进行了观察,评估结果为点。我将这些观察值拟合为。对于我没有观察到的,我想知道 有多大。使用上述方法,中的是正确的。〜68%?X 我升(X )= 米X + b X 0 ˚F …


2
有哪些非贝叶斯方法可用于预测推理?
在贝叶斯推断中,通过整合未知参数可以得出未来数据的预测分布。对这些参数的后验分布进行积分可得出后验预测分布,即以已观察到的条件为前提的未来数据的分布。有哪些非贝叶斯预测推理方法考虑了参数估计中的不确定性(即,不仅将最大似然估计或其他任何东西都插入了密度函数中)? 每个人都知道如何在线性回归后计算预测间隔,但是计算背后的原理是什么以及如何将它们应用在其他情况下(例如,从数据中估算出速率参数后为新的指数变量计算确切的预测间隔)?

9
如何确定神经网络预测的置信度?
为了说明我的问题,例如,假设我有一个训练集,其中输入具有一定程度的噪声,但输出却没有噪声。 # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] 如果无噪声(不是实际的梯度),那么这里的输出就是输入数组的梯度。 训练网络后,对于给定的输入,输出应类似于以下内容。 # Expected Output [1.01, 1.96, 2.00, 3.06] : 95% confidence interval of [0.97, 1.03] [2.03, 4.11, 3.89, 3.51] : 95% …

1
计算预测间隔以进行逻辑回归
我想了解如何为逻辑回归估计生成预测间隔。 建议我遵循Collett的Modeling Binary Data,第二版,第98-99页中的步骤。在实现了此过程并将其与R进行比较之后predict.glm,我实际上认为这本书展示的是计算置信区间而非预测区间的过程。 与相比predict.glm,Collett实施了该程序,如下所示。 我想知道:如何从这里开始产生预测间隔而不是置信区间? #Derived from Collett 'Modelling Binary Data' 2nd Edition p.98-99 #Need reproducible "random" numbers. seed <- 67 num.students <- 1000 which.student <- 1 #Generate data frame with made-up data from students: set.seed(seed) #reset seed v1 <- rbinom(num.students,1,0.7) v2 <- rnorm(length(v1),0.7,0.3) v3 <- rpois(length(v1),1) #Create df …

1
基于交叉验证(CV)的预测间隔
在课本和youtube讲座中,我学到了很多关于诸如boosting之类的迭代模型的知识,但是我从未见过关于推导预测间隔的任何知识。 交叉验证用于以下目的: 型号选择:尝试不同的型号,然后选择最合适的型号。如果是升压,请使用CV选择调整参数。 模型评估:估算所选模型的性能 几个参数对于模型评估很重要,其中之一是预期的预测误差。交叉验证可以很好地估计预测误差,正如《统计学习的要素》一书中所述。 但是,我们如何使用预期的预测误差来建立预测间隔? 例如,如果您预测房屋价格,则500.000欧元房屋的预测间隔将比200.000欧元房屋的预测间隔高。我们如何使用交叉验证来估计这些预测间隔?

3
获得线性模型中预测极限的公式(即预测间隔)
让我们来看下面的例子: set.seed(342) x1 <- runif(100) x2 <- runif(100) y <- x1+x2 + 2*x1*x2 + rnorm(100) fit <- lm(y~x1*x2) 这将使用OLS回归基于x1和x2创建y模型。如果我们希望针对给定的x_vec预测y,则可以简单地使用从中获得的公式summary(fit)。 但是,如果我们要预测y的上下预测怎么办?(对于给定的置信度)。 那我们将如何建立公式?

1
如何计算黄土的预测间隔?
我有一些数据是使用R中的LOESS模型拟合的,给了我这个: 数据具有一个预测变量和一个响应,并且是异方差的。 我还添加了置信区间。问题在于间隔是该行的置信区间,而我对预测间隔感兴趣。例如,底部面板比顶部面板更具可变性,但是不会在间隔中捕获。 这个问题有点相关: 从多项式回归中了解置信带,尤其是@AndyW的答案,但是在他的示例中,他使用了interval="predict"中存在的相对简单的论点predict.lm,但从中没有predict.loess。 所以我有两个非常相关的问题: 如何获得LOESS的逐点预测间隔? 我如何预测将捕获该间隔的值,即生成一堆最终看起来看起来像原始数据的随机数? 我可能不需要黄土,应该使用其他东西,但是我不熟悉我的选择。基本上,它应该使用局部回归或多元线性回归来拟合线,从而为线提供误差估计,此外,还为不同的解释变量提供了不同的方差,因此我可以在某些x值处预测响应变量(y)的分布。

1
如何计算非线性回归的预测范围?
Prism 的帮助页面对如何计算非线性回归的预测范围进行了以下说明。请原谅长引号,但我没有遵循第二段(它解释了的定义方式以及d Y / d P的计算方式)。任何帮助将不胜感激。G|xG|xG|xdY/dPdY/dPdY/dP 置信度和预测范围的计算是相当标准的。继续阅读有关Prism如何计算非线性回归的预测带和置信带的详细信息。 首先,让我们定义G | x,它是在特定X值下并使用所有参数的最佳拟合值的参数梯度。结果是一个向量,每个参数一个元素。对于每个参数,它定义为dY / dP,其中Y是给定特定X值和所有最佳拟合参数值的曲线的Y值,P是其中一个参数。) G'| x是转置的梯度矢量,因此它是一列而不是一行值。 Cov是协方差矩阵(上次迭代的逆Hessian)。它是一个正方形矩阵,行和列的数量等于参数的数量。矩阵中的每一项都是两个参数之间的协方差。 现在计算c = G'| x * Cov * G | x。结果是任何X值的单个数字。 置信带和预测带以最佳拟合曲线为中心,并在曲线的上方和下方延伸相等的量。 置信带在曲线的上方和下方延伸:= sqrt(c)* sqrt(SS / DF)* CriticalT(Confidence%,DF) 预测带在曲线的上方和下方进一步延伸,等于:= sqrt(c + 1)* sqrt(SS / DF)* CriticalT(Confidence%,DF)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.