Questions tagged «estimation»

这个标签太笼统了。请提供更具体的标签。对于有关特定估计量属性的问题,请改用[estimators]标签。

3
我可以根据样本大小以及最小值和最大值重建正态分布吗?我可以使用中点来代表均值
从统计上讲,我知道这可能有些困难,但这是我的问题。 我有很多范围数据,即变量的最小,最大和样本大小。对于其中一些数据,我也有一个平均值,但并不多。我想将这些范围相互比较,以量化每个范围的变异性,并比较均值。我有充分的理由假设分布在均值周围是对称的,并且数据将具有高斯分布。因此,我想我可以证明在没有均值时使用分布的中点作为均值的代理。 我想做的是为每个范围重建一个分布,然后使用该分布为该分布提供标准偏差或标准误差。我仅有的信息是从样本中观察到的最大值和最小值,以及将中点作为平均值的代表。 这样,我希望能够基于我拥有的范围数据和我的假设(对称分布和正态分布)来计算每组的加权均值,并计算出每组的变异系数。 我打算使用R来做到这一点,因此任何代码帮助也将不胜感激。

1
总体R平方的无偏估计是多少?
我有兴趣在多元线性回归中获得的无偏估计。R2R2R^2 通过反思,我可以想到的无偏估计可能试图匹配的两个不同值。R2R2R^2 出样品的:R2R2R^2如果从样品获得的回归方程时得到的R平方(即)施加于外部的样本数据的无限量,但是从同一数据生成处理。β^β^\hat{\beta} 人口R2R2R^2:如果获得了一个无限样品并且装配到无穷大样品(即,模型时得到的R平方),或者只是R平方由已知数据生成处理暗示。ββ\beta 我知道调整后的R2R2R^2旨在补偿样品观察到的过拟合。尽管如此,现在还不清楚是否调整ř 2实际上是的无偏估计- [R 2,并且如果它是一个无偏估计,其中上述两个定义的R2R2R^2R2R2R^2R2R2R^2它的目标是估计。R2R2R^2 因此,我的问题是: 我对以上所说的样本的无偏估计是多少 ?R2R2R^2 我所说的高于人口的无偏估计是多少 ?R2R2R^2 有没有提供模拟或其他证明无偏见的参考文献?


3
炸弹在哪里:给定行和列的总数,如何估计概率?
这个问题的灵感来自《口袋妖怪魂银》的迷你游戏: 想象一下,在这个5x6区域隐藏了15枚炸弹(编辑:最多1枚炸弹/细胞): 现在,考虑到行/列的总数,您如何估计在特定区域找到炸弹的概率? 如果查看第5列(炸弹总数= 5),那么您可能会认为:在此列中,在第2行中找到炸弹的机会是在第1行中找到一个炸弹的机会的两倍。 直接比例性的这种(错误)假设基本上可以描述为将标准独立性测试操作(例如在Chi-Square中)引入错误的上下文中,将导致以下估计: 如您所见,直接成比例导致概率估计超过100%,甚至在此之前是错误的。 因此,我对所有可能的排列进行了计算仿真,得出了放置15枚炸弹的276种独特可能性。(给出行和列的总数) 以下是276个解决方案的平均值: 这是正确的解决方案,但是由于需要进行指数计算,因此我想找到一种估算方法。 我的问题现在是:是否有一种确定的统计方法来对此进行估算?我想知道这是否是一个已知问题,如何称呼它,以及是否有您可以推荐的论文/网站!

1
Oracle Inequality:基本而言
我正在阅读一篇使用oracle不等式证明某事的论文,但我什至无法理解它甚至试图做些什么。当我在线搜索有关“ Oracle不等式”时,一些消息源将我引向了文章“ Candes,Emmanuel J.'通过Oracle不等式的现代统计估计”。可以在这里找到https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf。但是这本书对我来说似乎太重了,我认为我缺少一些先决条件。 我的问题是:您如何解释非数学专业(包括工程师)的Oracle不平等?其次,在尝试学习上述书籍之类的东西之前,您将如何推荐他们去研究先决条件/主题。 我强烈建议在高维统计方面有具体把握和丰富经验的人来回答这个问题。

6
MLE vs MAP估计,什么时候使用?
MLE =最大似然估计 MAP =最大后验 MLE是直观/天真的,因为它仅从给定参数(即似然函数)的观察概率开始,并尝试找到与观察最相符的参数。但是它没有考虑先验知识。 MAP似乎更合理,因为它确实考虑了贝叶斯规则中的先验知识。 这是一个相关的问题,但答案并不彻底。 /signals/13174/differences-using-maximum-likelihood-or-maximum-a-posteriori-for-deconvolution-d 因此,我认为MAP更好。那正确吗?那我什么时候该使用呢?

3
多元模式的计算有效估计
简短版:估算从连续分布中采样的多维数据集模式的最有效的计算方法是什么? 长版:我有一个数据集,需要估计其模式。该模式与均值或中位数不一致。下面显示了一个示例,这是一个2D示例,但ND解决方案会更好: 目前,我的方法是 在等于模式所需分辨率的网格上计算内核密度估计 寻找最大的计算点 显然,这会在很多不合理的点上计算KDE,如果有很多高维度的数据点或者我希望模式具有良好的分辨率,则这尤其糟糕。 一种替代方法是使用模拟退火,遗传算法等在KDE中找到全局峰。 问题是是否有一种更聪明的方法来执行此计算?

2
参数可估计性问题
令和为四个随机变量,使得,其中是未知参数。还假设,那哪个是真的?Y1,Y2,Y3Y1,Y2,Y3Y_1,Y_2,Y_3Y4Y4Y_4E(Y1)=θ1−θ3; E(Y2)=θ1+θ2−θ3; E(Y3)=θ1−θ3; E(Y4)=θ1−θ2−θ3E(Y1)=θ1−θ3; E(Y2)=θ1+θ2−θ3; E(Y3)=θ1−θ3; E(Y4)=θ1−θ2−θ3E(Y_1)=\theta_1-\theta_3;\space\space E(Y_2)=\theta_1+\theta_2-\theta_3;\space\space E(Y_3)=\theta_1-\theta_3;\space\space E(Y_4)=\theta_1-\theta_2-\theta_3θ1,θ2,θ3θ1,θ2,θ3\theta_1,\theta_2,\theta_3Var(Yi)=σ2Var(Yi)=σ2Var(Y_i)=\sigma^2i=1,2,3,4.i=1,2,3,4.i=1,2,3,4. :是可估计的。θ1,θ2,θ3θ1,θ2,θ3\theta_1,\theta_2,\theta_3 B.是可估计的。θ1+θ3θ1+θ3\theta_1+\theta_3 C.是可估计的,是的最佳线性无偏估计。θ1−θ3θ1−θ3\theta_1-\theta_312(Y1+Y3)12(Y1+Y3)\dfrac{1}{2}(Y_1+Y_3)θ1−θ3θ1−θ3\theta_1-\theta_3 D.是可估计的。θ2θ2\theta_2 给出的答案是C,它对我来说看起来很奇怪(因为我得到了D)。 为什么我得到D?由于。E(Y2−Y4)=2θ2E(Y2−Y4)=2θ2E(Y_2-Y_4)=2\theta_2 为什么我不明白C可以作为答案?好的,我可以看到是的无偏估计量,并且其方差小于。 θ1-θ3ÿ1+ÿ3Y1+Y2+Y3+Y44Y1+Y2+Y3+Y44\dfrac{Y_1+Y_2+Y_3+Y_4}{4}θ1−θ3θ1−θ3\theta_1-\theta_3Y1+Y32Y1+Y32\dfrac{Y_1+Y_3}{2} 请告诉我我在哪里做错了。 也发布在这里:https : //math.stackexchange.com/questions/2568894/a-problem-on-estimability-of-parameters

1
为什么算术平均值小于对数正态分布中的分布平均值?
所以,我有一个随机过程生成数正态分布随机变量XXX。这是相应的概率密度函数: 我想估计分配是原始分配的几个时刻,让我们说第一次的时刻:算术平均值。为此,我绘制了100个随机变量10000次,以便可以计算10000次算术平均值估计。 有两种不同的方法可以估算均值(至少,这是我的理解:我可能是错的): 通过清楚地计算的算术平均值以通常的方式: X¯= ∑我= 1ñX一世ñ。X¯=∑i=1NXiN.\bar{X} = \sum_{i=1}^N \frac{X_i}{N}. 或先根据基本正态分布估算和μ:μ = N ∑ i = 1 log (X i)σσ\sigmaμμ\mu然后平均值作为 ˉ X =EXP(μ+1μ = ∑我= 1ñ日志(X一世)ñσ2= ∑我= 1ñ(日志(X一世)- μ )2ñμ=∑i=1Nlog⁡(Xi)Nσ2=∑i=1N(log⁡(Xi)−μ)2N\mu = \sum_{i=1}^N \frac{\log (X_i)}{N} \quad \sigma^2 = \sum_{i=1}^N \frac{\left(\log (X_i) - \mu\right)^2}{N}X¯= 经验(μ + 12σ2)。X¯=exp⁡(μ+12σ2).\bar{X} = \exp(\mu + \frac{1}{2}\sigma^2). 问题在于,与每个这些估计相对应的分布在系统上是不同的: …

4
人口的任何数量特性是“参数”吗?
我对术语统计和参数之间的区别比较熟悉。我认为统计量是通过将函数应用于样本数据而获得的值。但是,参数的大多数示例都与定义参数分布有关。一个常见的例子是均值和标准差,以参数化正态分布;系数和误差方差,以参数化线性回归。 但是,还有许多其他的人口分布值不是典型值(例如,最小回归,最大值,多元回归中的r平方,0.25分位数,中位数,系数非零的预测变量数量,偏度,数量大于0.3的相关性矩阵中的相关性等)。 因此,我的问题是: 人口的任何数量特性是否应标记为“参数”? 如果是,那为什么呢? 如果否,哪些特征不应标记为参数?它们应贴上什么标签?又为什么呢? 阐述混乱 维基百科有关估算器的文章指出: “估计器”或“点估计”是用于推断统计模型中未知参数值的统计信息(即数据的函数)。 但是我可以将未知值定义为.25分位数,并且可以为该未知数开发一个估算器。即,并非所有种群的定量特性都是以均值和sd为正态分布参数的相同方式作为参数,但是试图估算任何定量种群特性是合理的。

2
轮廓似然的Hessian用于标准误差估计
这个问题是由这个问题引起的。我查找了两个来源,这就是我发现的内容。 A. van der Vaart,渐进统计: 几乎不可能显式计算轮廓似然,但其数值评估通常是可行的。然后,轮廓似然可用于减小似然函数的维数。轮廓似然函数通常以与参数模型的(普通)似然函数相同的方式使用。除了上述的最大的他们的点作为估计,在二阶导数用作的估计减去e的渐近协方差矩阵的逆矩阵。最近的研究似乎证实了这种做法。 θθ^θ^\hat\thetaθ^θ^\hat\theta J. Wooldridge,《截面和面板数据的计量经济学分析》(两个版本均相同): 作为研究渐近性质的设备,由于通常取决于所有,因此集中目标函数的值是有限的,在这种情况下,目标函数不能写为独立的,均匀分布的求和的和。当我们从某些非线性面板数据模型集中特定于个体的效果时,就会出现一种方程式(12.89)是iid函数之和的设置。此外,集中目标函数对于建立看似不同的估算方法的等效性可能很有用。WG(W,β)g(W,β)g(W,\beta)w ^WW Wooldridge在更广泛的M估计量上下文中讨论了这个问题,因此它也适用于最大似然估计量。 因此,对于同一个问题,我们得到两个不同的答案。我认为魔鬼在于细节。对于某些模型,对于某些模型,我们可以安全地使用轮廓似然的hessian。是否有任何一般结果为我们何时(或不能这样做)提供条件?

4
均方误差用于评估一个估算器相对于另一个估算器的相对优势吗?
假设我们有两个参数估计量和。为了确定哪个估算器“更好”,我们看一下MSE(均方误差)吗?换句话说,我们看,其中是估计量的偏差,而是估计量的方差?哪个拥有更高的MSE才是更差的估算器?α 2 X 中号小号ë = β 2 + σ 2 β σ 2α1个α1\alpha_1α2α2\alpha_2Xxx中号小号Ë= β2+ σ2MSE=β2+σ2MSE = \beta^2+ \sigma^2ββ\betaσ2σ2\sigma^2
13 estimation  mse 

1
拟合“简单”测量误差模型的方法
我正在寻找可用于估计“ OLS”测量误差模型的方法。 X 我 = X 我 + ë X ,我 ÿ 我 = α + β X 我ÿ一世= Y一世+ eÿ,我yi=Yi+ey,iy_{i}=Y_{i}+e_{y,i} X一世= X一世+ eX ,我xi=Xi+ex,ix_{i}=X_{i}+e_{x,i} ÿ一世= α + βX一世Yi=α+βXiY_{i}=\alpha + \beta X_{i} 其中的误差是独立的正常与未知方差和σ 2 X。在这种情况下,“标准” OLS无效。σ2ÿσy2\sigma_{y}^{2}σ2Xσx2\sigma_{x}^{2} 维基百科有一定的吸引力的解决方案-这两个给力您认为无论是“变化率” 或“可靠性比”λ=σ 2 Xδ= σ2ÿσ2Xδ=σy2σx2\delta=\frac{\sigma_{y}^{2}}{\sigma_{x}^{2}}是已知的,其中σ 2 X是真回归的方差X我。我对此不满意,因为不知道方差的人怎么知道其比率?λ = σ2Xσ2X+ σ2Xλ=σX2σx2+σX2\lambda=\frac{\sigma_{X}^{2}}{\sigma_{x}^{2}+\sigma_{X}^{2}}σ2XσX2\sigma_{X}^2X一世XiX_i 无论如何,除了这两个以外,还有其他解决方案不需要我“了解”参数的任何信息吗? 仅截距和斜率的解决方案就可以了。

1
套索的LARS与坐标下降
使用LARS [1]与使用坐标下降来拟合L1正则化线性回归有什么优缺点? 我主要对性能方面感兴趣(我的问题往往有N成千上万且p小于20。)但是,任何其他见解也将受到赞赏。 编辑:自从我发布问题以来,chl亲切地指出了Friedman等人的论文[2],其中坐标下降比其他方法快得多。如果是这样,作为执业医生,我是否应该忘掉LARS来支持协调下降? [1]埃弗隆·布拉德利;海蒂·特雷弗;约翰·斯通,伊恩和蒂布希拉尼·罗伯特(2004)。“最小角度回归”。统计年鉴32(2):第407-499页。 [2] Jerome H. Friedman,Trevor Hastie,Rob Tibshirani,“通过坐标下降的广义线性模型的正则化路径”,《统计软件》,第1卷。33,第1期,2010年2月。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.