这个问题涉及什么是统计数据以及如何进行良好的统计分析。它提出了许多问题,一些术语和理论上的其他问题。为了澄清它们,让我们从注意问题的隐含上下文开始,然后从那里开始定义关键术语“参数”,“属性”和“估计器”。问题的几个部分在讨论中都会得到解答。最后的结论部分总结了关键思想。
状态空间
一个常见的统计使用“分布”,如在“与PDF正态分布成正比 ”实际上是一(严重)滥用英语,因为显然这不是一个分布:它是由和符号参数化的整个分布族。一个标准的表示法是“状态空间”,一个集合μσΩΩexp(−12(x−μ)/σ)2)dxμσΩ的分布。(为了便于说明,我在这里进行了一些简化,并且将继续简化,同时保持尽可能严格。)它的作用是勾勒出统计程序的可能目标:当我们估算某物时,我们挑选一个(或更多)元素。Ω
有时状态空间被显式参数化,例如。在此描述中,上半平面中的元组与我们将用来对数据建模的分布集之间存在一一对应的关系。这种参数化的一个价值是,我们现在可以通过有序对实数来具体引用的分布。{ (μ ,σ )} ΩΩ={N(μ,σ2)|μ∈R,σ>0}{(μ,σ)}Ω
在其他情况下,状态空间未明确参数化。一个例子是所有单峰连续分布的集合。下面,我们将解决在这种情况下是否可以找到足够的参数化的问题。
参数化
通常,参数化的是一个对应的(数学函数从的子集)(与有限)至。也就是说,它使用元组的有序集来标记分布。但这不只是任何对应关系:它必须“表现良好”。要理解这一点,请考虑其PDF具有有限期望的所有连续分布的集合。从任何“自然”尝试对此集合进行参数化的尝试将涉及可数的实数序列(使用任何正交基础进行扩展)的意义上来说,这将被广泛视为“非参数”。不过,因为该集合具有基数- [R d d Ω d ℵ 1 - [RΩRddΩdℵ1是实数的基数,这些分布与之间必须存在一些一对一的对应关系。矛盾的是,这似乎使它成为具有单个实参的参数化状态空间!R
通过指出单个实数不能与分布具有“很好的”关系来解决这一悖论:当我们更改该数的值时,它对应的分布在某些情况下必须以根本方式改变。通过要求与它们的参数的接近值相对应的分布本身必须彼此“接近”,我们排除了这种“病理”参数化。 讨论合适的“接近”定义会使我们走得太远,但是我希望这种描述足以证明参数本身不仅仅是命名一个特定的分布。
分布的性质
通过重复应用,我们习惯于将分布的“属性”视为一些经常在我们的工作中出现的可理解的数量,例如期望值,方差等。作为“财产” 的可能定义的问题在于它过于模糊且不够笼统。(这是数学在18世纪中叶的地方,“功能”被认为是应用于对象的有限过程。)相反,关于“财产”始终有效的唯一明智的定义是将属性视为是每个分配唯一分配的数字Ω Ω Ω 吨1 ΩΩ。这包括均值,方差,任何时刻,时刻的任何代数组合,任何分位数以及许多其他内容,甚至包括无法计算的内容。然而,它并没有包含的事情,就没有意义了一些元素。例如,如果由所有Student t分布组成,则均值不是的有效属性(因为没有均值)。这再次使我们印象深刻,我们的想法在多大程度上取决于真正组成。ΩΩΩt1Ω
属性并不总是参数
属性可能是一个复杂的函数,因此它不能用作参数。考虑“正态分布”的情况。我们可能想知道真实分布的均值在四舍五入为最接近的整数时是否为偶数。那是财产。但是它不会用作参数。
参数不一定是属性
当参数和分布一一对应时,显然,根据我们的定义,任何参数以及该参数的任何函数都是属性。但是,参数与分布之间不必一一对应:有时必须用两个或两个以上截然不同的参数值来描述一些分布。例如,球体上点的位置参数自然会使用经度和纬度。很好-除了在两个极点处,这两个极点对应于给定的纬度和任何有效的经度。该位置(球上的点)确实是一个属性,但其经度不一定是一个属性。尽管存在各种闪避(例如,仅将极点的经度声明为零),但此问题突出显示了属性(与分布唯一相关)和参数(这是标记方式)之间的重要概念差异分布,并且可能不是唯一的)。
统计程序
估计的目标称为估计。它仅仅是一个财产。统计人员不能随意选择估计值:这是她的客户所在的省份。当有人向您提供总体样本时,要求您估算总体的第99个百分位数时,您可能会因为提供均值估算器而被忽略了!作为统计学家,您的工作是确定一个良好的程序来估计您的估计值。(有时您的工作是说服您的客户他为自己的科学目标选择了错误的估计,但这是一个不同的问题...)
根据定义,过程是从数据中获取数字的一种方法。过程通常是作为要应用于数据的公式给出的,例如“将它们加起来并除以计数”。从字面上看,任何过程都可以说成是给定估计值的“估计器”。例如,我可以声明样本均值(应用于数据的公式)估计总体方差(假设我们的客户将可能的总体限制为仅包括那些实际存在方差的人群),则为总体属性。。Ω
估算器
估计量与估计量没有明显的联系。例如,您是否看到样本均值和总体方差之间有任何联系?我也没有。但是,尽管如此,样本均值实际上还是某些Ω(例如所有Poisson分布的集合)的总体方差的合理估计。这是理解估算器的一个关键:它们的质量取决于可能状态的集合。但这只是其中的一部分。Ω
称职的统计学家将想知道他们所推荐的程序实际执行得如何。让我们将过程称为“ ”,并将估计值设为。她不知道哪一种分配实际上是正确的分配,她将考虑每个O可能的分配。鉴于这样的,并给出任何可能的结果(即一组数据),她会比较(她有什么程序估计)至(该estimand的价值)。 她的委托人有责任告诉她这两个人有多近或多远。θ ˚F ∈ Ω ˚F 小号吨(小号)θ (˚F )˚F 吨(小号)θ (˚F )˚F Ωtθ F∈ΩFst(s)θ(F)F (这通常通过“损失”函数完成。)然后,她可以考虑对与之间的距离的期望。这是她手术的风险。因为它取决于,所以风险是上定义的函数。t(s)θ(F)FΩ
(好的)统计学家建议根据比较风险的程序。例如,假设对于每个,过程的风险小于或等于的风险。这样就没有理由使用:它是“不允许的”。否则,它是“可接受的”。吨1吨吨F∈Ωt1tt
(“贝叶斯”统计学家将始终通过对可能状态的“先前”分布(通常由客户提供)求平均值来比较风险。比较贝叶斯避开其他方式的风险。)
结论
我们不得不说,任何一项权利也就是接纳为是一个估计的。θ θ tθθ 我们必须,出于实用的目的(因为受理程序,可很难找到),弯曲这说任何具有可接受的小风险(进行比较时)实用程序中是一个估计。 “可接受的”和“可行的”由客户确定,当然:“可接受的”是指其风险,而“可行的”则反映了实施该程序的成本(最终由他们支付)。吨θ θtθθ
简明定义的基础是刚刚讨论的所有想法:要理解它,我们必须牢记特定的(这是问题,过程或所研究人群的模型),确定的估计值(由客户提供),具体的损失函数(定量地将与估计值联系起来,也由客户给出),风险的概念(由统计学家计算),比较风险函数的一些程序(统计学家与客户协商后的责任) ,以及对实际上可以执行哪些程序的理解(“实用性”问题),即使在定义中未明确提及这些程序。ŤΩt