Questions tagged «point-estimation»

点估计是将估计器应用于数据,以便了解某个总体参数。


2
如何推导二项式分布的似然函数以进行参数估计?
根据Miller和Freund的《工程师概率与统计》,第8版(第217-218页),对于二项分布(伯努利试验),最大化的似然函数为 L(p)=∏ni=1pxi(1−p)1−xiL(p)=∏i=1npxi(1−p)1−xiL(p) = \prod_{i=1}^np^{x_i}(1-p)^{1-x_i} 如何得出这个方程式?对于其他分布,泊松和高斯,对我来说似乎很清楚。 L(θ)=∏ni=1PDF or PMF of dist.L(θ)=∏i=1nPDF or PMF of dist.L(\theta) = \prod_{i=1}^n \text{PDF or PMF of dist.} 但是二项式的只是一点点不同。坦率地说,如何 nCx px(1−p)n−xnCx px(1−p)n−XnC_x~p^x(1-p)^{n-x} 成为 px一世(1 − p)1个−x一世pxi(1个-p)1个-X一世p^{x_i}(1-p)^{1-x_i} 在上述似然函数中?

2
收缩 vs无偏:估计量
关于皮尔逊相关系数总体值的两种估计量,我的头脑有些困惑。 A. Fisher(1915)表明,对于二元正态总体,经验是的负偏差估计量,尽管该偏差实际上仅对于小样本量()才是相当可观的。样本在某种意义上低估了,因为它比更接近于。(除非后者为或,否则是无偏的。)已经提出了几种几乎无偏的估计量,最好的估计可能是Olkin和Pratt(1958)r[RrÑ &lt; 30 [R ρ 0 ρ 0 ± 1 - [Rρρ\rhon&lt;30ñ&lt;30n<30r[Rrρρ\rho000ρρ\rho000±1±1个\pm 1r[Rrρρ\rho更正的:r[Rr runbiased=r[1+1−r22(n−3)][R无偏见的=[R[1个+1个-[R22(ñ-3)]r_\text{unbiased} = r \left [1+\frac{1-r^2}{2(n-3)} \right ] B.据说在回归中观察到高估了相应的总体R平方。或者,通过简单的回归,就是高估了。基于这一事实,我见过很多文章说,是正相关偏向于,这意味着绝对值:是从更远的比(?是说法正确)。文本说这与通过样本值高估标准偏差参数是同样的问题。有许多公式可以“调整”观察到的使其更接近人口参数Wherry's(1931)- [R 2 ρ 2 - [RR2[R2R^2r2[R2r^2ρ2ρ2\rho^2r[Rr[R 0 ρ - [R 2ρρ\rhor[Rr000ρρ\rhoR2[R2R^2 R2adj[R调整2R_\text{adj}^2是最著名的(但不是最好的)。调整后的的根称为收缩:r2adj[R调整2r_\text{adj}^2 r[Rr rshrunk=±1−(1−r2)n−1n−2−−−−−−−−−−−−−−√[R压缩=±1个-(1个-[R2)ñ-1个ñ-2r_\text{shrunk} = \pm\sqrt{1-(1-r^2)\frac{n-1}{n-2}} 当前是两个不同的估计量。非常不同的:第一个膨胀,第二放气。如何调和他们?在哪里使用/报告,在另一个地方?ρρ\rhor[Rrr[Rr 特别是,“收缩”的估计量也(几乎)是无偏的,就像“无偏”的估计一样,但仅在不同的上下文中-在回归的非对称上下文中,这是真的吗?因为,在OLS回归中,我们认为一侧(预测变量)的值是固定的,因此每个样本之间都没有随机误差吗?(要补充一点,回归不需要双变量正态性。)

2
研究生学校是否过分强调了最小方差理论的无偏估计?
最近,当我给出一个关于均匀分布参数的最小方差无偏估计的结论时,我感到非常尴尬。幸运的是,红衣主教和亨利立即纠正了我,亨利为OP提供了正确的答案。 这让我思考。大约37年前,我在斯坦福大学的数学研究生课程中学习了最佳无偏估计量的理论。我有Rao-Blackwell定理,Cramer-Rao下界和Lehmann-Scheffe定理的回忆。但是,作为一名应用统计学家,我对日常生活中的UMVUE的考虑并不多,而最大似然估计的出现却很多。 这是为什么?我们在研究生院是否过分强调UMVUE理论?我认同。首先,无偏不重要。许多完美的MLE都有偏差。斯坦因收缩估计量是有偏差的,但在均方误差损失方面占主导地位。这是一个非常漂亮的理论(UMVUE估计),但是非常不完整,我认为不是很有用。别人怎么看?


4
怀疑(但不反对数学)读者的推理
我刚刚观看了有关统计推断(“比较比例和均值”)的讲座,这是统计在线课程简介的一部分。对于我来说,这种材料一如既往地毫无意义(到现在为止,我必须已经看过数十遍这种材料,并且在过去的三十年中一直散布着)。 我正在寻找一本有关“基本Stats-101”的书(分数估算,估算评估,统计推断,假设检验,研究设计),该书认真对待了说服怀疑论者的问题。 下面,我给出了一些我正在寻找的作者会认真对待并知道如何令人信服地解决的问题类型的示例。 但是首先让我花点时间强调一下,在这篇文章中我没有问这些问题。 请不要回答他们! 我以“石蕊试纸法”(针对搜索作者的类型)为例进行举例说明。 如果“比例”只是布尔变量的均值(即仅取值0和1的布尔变量),那么为什么要教不同的过程来对“比例”和“均值”进行统计推断呢? 如果正态分布非常健壮,即使在数据不是非常正态分布的情况下,假设正态性也会产生良好的结果,并且如果t分布看起来很正态,那么为什么所有关于使用t分布而不是正常? “自由度” 到底是什么?为什么我们担心它们? 考虑到我们只是使用恰好看起来与数据相似的分布,说一个参数的“真实”值意味着什么? 为什么“探索性数据分析”是一件好事,而“数据监听”却是一件坏事? 正如我已经说过的,我对忽略此类问题所隐含的态度感到不满意。我不想在教给我一些东西的人中看到“认识论立场”。我正在寻找尊重读者的怀疑和理性,并且知道如何解决这些问题的作者(不必深入探讨形式主义和技术性的页面)。 我意识到这是一个艰巨的任务,尤其是在统计方面。因此,我不希望有很多作者能够成功。但是现在我只满足于找到一个。 让我补充一点,我不是数学上的厌恶者。相反,我喜欢数学。(我对分析(又称“高级演算”),线性代数,概率论,甚至基本测度论感到满意。) 也就是说,我目前的兴趣是“应用”,“实用”,“日常”,“现实”统计(与理论上的细微差别相反)。(但我也不想要食谱!) FWIW,我已经阅读了Gelman和Hill的使用回归和多层次/层次模型进行数据分析的前几章,并且我喜欢作者的语气。他们的重点是实际的,但在需要时可以进行理论探讨。他们还经常退后一步,对标准做法进行严格评估,并提出坦率的见解,以引起怀疑的读者的常识。不幸的是,这些作者还没有写一本书专门讨论我在这篇文章中要问的话题(如上所述,“ Stats 101”一词)。我还知道,其中一位作者(Gelman)与人共同撰写了备受赞誉的贝叶斯数据分析,但是,这又不是我目前正在寻找的东西。 编辑: Dikran Marsupial提出以下反对意见: 我认为忽略问题并不一定有什么不对,有一个观点认为,解决每个问题有损于通常更重要的基本概念的阐述(尤其是在统计101本书中!)。 我同意这一点。如果我说我正在寻找“第二眼基本统计数据”,那对我来说会更准确。实际上,以此为动力,我看了研究生课程中有关推理(说)的教科书,发现它们太像我列出的问题而被忽略了。如果有的话,他们似乎甚至不太愿意去研究这样的问题(这样他们就可以专注于诸如某些融合条件或其他……)的问题。 问题在于,更高级的书籍针对的是完全不同的读者群体,其中“局外人”的怀疑已被彻底耗尽。IOW,那些正在做研究生水平统计的人已经超出了困扰我的问题的地步。他们不再对这些东西持怀疑态度。(他们是如何克服怀疑态度的?然后统计一下。其他人可能有老师填写了他们的课本不足的地方。一些人可能很聪明,可以自己找出这些问题的答案。

1
足够或不足
考虑一个随机样本 {X1,X2,X3}{X1,X2,X3}\{X_1,X_2,X_3\} 哪里 XiXiX_i 是我 Bernoulli(p)Bernoulli(p)Bernoulli(p) 随机变量 p∈(0,1)p∈(0,1)p\in(0,1)。检查是否 T(X)=X1+2X2+X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3 是足够的统计 ppp。 首先,我们如何找到 (X1+2X2+X3)(X1+2X2+X3)(X_1+2X_2+X_3)?还是应该分解为X1+X2+X2+X3X1+X2+X2+X3X_1+X_2+X_2+X_3 然后这将跟随 乙我Ñ (4 ,p )Bin(4,p)Bin(4,p)?我认为不是因为要注意所有变量在这里不是独立的。 或者,如果我只考虑因式的联合pmf而采用因式分解条件 (X1个,X2,X3)(X1,X2,X3)(X_1,X_2,X_3) 然后 F(X1个,X2,X3)=pX1个+X2+X3(1 − p)3 - (X1个+X2+X3)= [pt (x )(1 − p)3 − t (x )]p-X2(1 − p)X2f(X1,X2,X3)=px1+x2+x3(1−p)3−(x1+x2+x3)=[pt(x)(1−p)3−t(x)]p−x2(1−p)x2f(X_1,X_2,X_3)=p^{x_1+x_2+x_3}(1-p)^{3-(x_1+x_2+x_3)}=[p^{t(x)}(1-p)^{3-t(x)}]p^{-x_2}(1-p)^{x_2} 哪里 t (x )=X1个+ 2X2+X3t(x)=x1+2x2+x3t(x)=x_1+2x_2+x_3。 这表明 ŤTT 还不够。 但是,如果我想遵循定义并想应用该怎么办 F(X| p)G(T(X)| p )f(X|p)g(T(X)|p)\dfrac{f(X|p)}{g(T(X)|p)} …

3
贝叶斯估计器是否要求true参数是先验的可能变量?
这可能是一个有点哲学问题的,但在这里我们去:在决策理论,贝叶斯估计的风险为相对于定义为先验分布上。θ&Element;ΘπΘθ^(x)θ^(x)\hat\theta(x)θ∈Θθ∈Θ\theta\in\Thetaππ\piΘΘ\Theta 现在,一方面,为了使真实的生成数据(即“存在”),必须是下的可能变量,例如具有非零概率,非零密度等。另一方面,是未知的,因此先验的选择,因此我们不能保证真实的是我们选择的下的可能变量。θ π θ θ πθθ\thetaθθ\thetaππ\piθθ\thetaθθ\thetaππ\pi 现在,对我来说,似乎我们不得不以某种方式选择,以使成为可能的变量。否则,某些定理将不成立。例如,最小极大值的估计将不是最不利先验的贝叶斯估计,因为我们可以通过从其域中排除周围并包括的大区域来使该先验任意地变坏。但是,很难保证确实在域中。θ θππ\piθθ\thetaθθ\thetaθθ\theta 所以我的问题是: 通常是否假定实际是的可能变量?πθθ\thetaππ\pi 可以保证吗? 是否可以至少以某种方式检测到违反此情况的案例,所以在条件不成立时,不依赖最小定理等定理吗? 如果不需要,为什么决策理论中的标准结果成立呢?

1
从基于GPS的报告中确定未知数量的现实世界位置
我正在开发一些软件,该软件应从多个基于GPS的报告中确定现实世界的位置(高速摄像头)。当报告位置时,用户将在驾驶,因此报告非常不准确。为了解决该问题,我必须对同一位置的报告进行聚类并计算平均值。 我的问题是关于如何将这些报告归类。我阅读了有关期望最大化算法和k均值聚类的信息,但据我了解,我需要提前确定实际位置的数量。 是否有其他算法不需要真正位置的确切数目,而是使用一些边缘条件(最小距离)? 报告包含经度,纬度和精度(以米为单位)。没有名称或其他可用于识别重复项的名称。 另一个障碍可能是这很常见,一个真实位置的报告只有一个。这使得很难将异常数据与正常数据区分开。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.