估计量和估计量之间有什么关系?


21

估计量和估计量之间有什么关系?


5
“在统计中,估算器是用于根据观察到的数据计算给定数量的估算值的规则:因此可以区分该规则及其结果(估算值)。” (Wikipedia文章en.wikipedia.org/wiki/Estimator的第一行)。
whuber

+1我赞成这个问题(尽管在一个明显的Wikipedia页面上有一个精心设计的答案),因为在这里回答这个问题的最初尝试已经指出了一些微妙之处。
ub

@whuber,我可以说模型参数估计是估计器吗?
牛油果

2
@loganecolss估计量是一个数学函数。这与针对任何数据集可能获得的值(估计值)有所区别。欣赏差的一种方式是要注意,某些数据组将产生相同的估计的,也就是说,在斜率使用不同的线性回归估计(如最大似然或迭代重加权最小二乘,例如)。如果不将估算值与用于产生这些估算值的估算值区分开,我们将无法理解该陈述甚至说了什么。
whuber

@whuber,即使有了一个特定的数据集,不同的估计量也可能给出不同的估计,不是吗?d
鳄梨2013年

Answers:


13

EL Lehmann在其经典的“点估计理论”中,在第1-2页回答了这个问题。

现在假定观测值是由随机变量取的值,这些变量假定遵循属于某些已知类的联合概率分布P

...现在让我们专注于点估计......假设是[在规定的分布类上]定义的实值函数,并且我们想知道g的值[无论在什么实际分布中效应,θ ]。不幸的是,θ,因此g θ 是未知的。但是,该数据可用于获得g θ 的估计值,该值是人们希望接近g θ )的值GGθθGθGθGθ

换句话说:估计器是一个确定的数学过程,为特定问题可能产生的任何可能的数据集提供一个数字(估计)。该数字旨在表示数据生成过程的某些确定的数值属性()。我们可以称其为“估计”。Gθ

估算器本身不是随机变量:它只是一个数学函数。但是,它产生的估计是基于将其自身建模为随机变量的数据。这使得估计值(根据数据而定)成为一个随机变量,针对特定数据集的特定估计值成为该随机变量的实现。

在一个(常规)普通最小二乘公式中,数据由有序对。的X 已被实验者(它们可以是给药的药物的量,例如)来确定。每个ÿ (对药物的响应,例如)被假设为来自概率分布是正常的,但具有未知均值μ 共同方差σ 2。此外,假设该装置相关的X 经由公式μ = β 0X一世ÿ一世X一世ÿ一世μ一世σ2X一世。这三个parameters-- σ β 0 β 1 --determine的潜在分布 ÿ 为任何值 X 。因此任何其分布的特性可以被认为是作为的函数的σ β 0β 1。这样的性质的实例是截距 β 0,斜率 β 1,的值 COS σ + βμi=β0+β1xiσβ0β1个ÿ一世X一世σβ0β1个β0β1个,或甚至在值的平均值X=2,其中(根据该配方,)必须为β0+2β1cosσ+β02-β1个X=2β0+2β1个

在此OLS上下文中,如果x设置为2 ,则估计器的一个非示例将是猜测的过程。这不是估计器,因为y的此值是随机的(以与数据的随机性):它不是分布的(确定数值)属性,即使它与该分布有关。(正如我们刚锯,虽然,期望ŶX = 2,等于β 0 + 2 β 1,可以进行估计。)ÿXÿÿX=2β0+2β1个

在雷曼的公式中,几乎任何公式都可以是几乎任何性质的估计。 估计量和估计量之间没有内在的数学联系。 但是,我们可以提前评估估计器合理接近预期要估计的数量的可能性。估计方法的主题是如何做到这一点以及如何利用它们。


1
(+1)非常准确,详细的回复。
chl

2
随机变量本身的函数不是随机变量吗?
jsk 2015年

@jsk我认为可以通过考虑函数的组成来澄清我在此处要做出的区分第一个函数是随机变量X;第二个(称之为)称作估计器在此处,将组成两个X Ω →交通- [R是一个“估算”或“估计过程”,这是-选择正确说-一个随机变量。
Ω[Rñ[R
XŤ
ŤXΩ[R
ub

1
@whuber在您的帖子中,您说“估计量本身不是随机变量”。我试图对您的帖子进行编辑,以澄清您和我似乎同意的观点,但似乎有人拒绝了我的编辑。也许他们会喜欢您的编辑!
jsk 2015年


7

简而言之:估计量是一个函数,估计量是对观察到的样本进行汇总的值。

一个估计器是将一个随机样本的参数估计的函数:

。注意,估计器Ñ随机变量X1X2XÑ是一个随机变量 Θ。例如,估计器是样本均值: ‾ X =1

Θ^=ŤX1个X2Xñ
X1个X2XñΘ^估计 θ是应用所述估计函数为小写的结果观测样本X1X2xn
X¯=1个ññ=1个ñX一世
θ^X1个X2Xñ

。例如,所观察到的样品的估计X1X2XÑ是样本均值 μ = ¯ X =1

θ^=ŤX1个X2Xñ
X1个X2Xñ
μ^=X¯=1个ññ=1个ñX一世

估计量是RV,而估计量是常数吗?
Parthiban Rajendran

您的结论是否与@whuber的结论冲突?在这里,您说估算器是RV,但胡布尔说不。
Parthiban Rajendran

是的,我不同意@whuber的说法“估计量本身不是随机变量:它只是一个数学函数”。随机变量的函数也是随机变量。onlinecourses.science.psu.edu/stat414/node/128
Freeman,

3

在线性回归模型的背景下说明胡布尔的答案可能会有所帮助。假设您有一些双变量数据,并且使用普通最小二乘提出以下模型:

Y = 6X + 1

此时,您可以取X的任何值,将其插入模型并预测结果Y。从这个意义上讲,您可以将模型的通用形式(mX + B)的各个组成部分视为估计量。样本数据(您可能插入到通用模型来计算特定值上文)提供在其上可以想出的基础估计分别。

与下面的线程中的@whuber点一致,在线性回归的情况下,一组特定的估计量为您生成的Y的任何值都被视为预测值。

(编辑-几次-以反映以下评论)


1
您已经很好地定义了预测变量。 它与估计量有微妙(但重要的是)不同。在这种情况下,估算器是用于从数据计算参数1和6的最小二乘公式。
ub

嗯,@ whuber不是我的意思,但是我认为您的评论说明了我以前没有注意到的我的语言中的一个重要歧义。这里的要点是,您可以将方程Y = mX + B的通用形式(如上所用)视为一个估计量,而由该公式的特定示例生成的特定预测值(例如1 + 6X)为估计。让我尝试编辑上面的段落以体现这种区别...
ashaw

顺便说一句,我试图解释这一点而不引入我在大多数有关该概念的教科书讨论中遇到的“帽子”符号。毕竟那也许是更好的路线?
ashaw 2011年

2
我认为您在原始答案中已经达到了准确性和技术性之间的良好平衡:请继续努力!您不需要戴帽子,但是如果您可以设法说明估算器与其他相似外观的事物之间的区别,那将是最有帮助的。但是请注意,在预测值Y和估计参数mb之间存在区别。Y可以解释为随机变量;m和b不是(贝叶斯设置中除外)。
ub

实际上,就参数与此处的值而言,这是一个很好的观点。再次编辑...
ashaw

0

假设您收到了一些数据,并且有一些观察到的变量称为theta。现在您的数据可以来自数据分布,对于此分布,您可以推断出相应的theta值,它是一个随机变量。每当数据的分布发生变化时,都可以使用MAP或均值来计算此随机变量的估算值。因此,随机变量theta称为估计值,即特定类型数据的未观察变量的单个值。

虽然估算器是您的数据,但它也是一个随机变量。对于不同类型的分布,您具有不同类型的数据,因此具有不同的估计,因此,此相应的随机变量称为估计器

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.