我是统计学的新手,发现了这一点。
在统计中,θ(小写希腊字母“ theta”)是某些一般概率分布的(一个或多个)参数的(向量)的常用名称。一个常见的问题是找到theta的值。注意,以这种方式命名参数没有任何意义。我们不妨称之为其他任何事情。实际上,许多发行版的参数通常使用其他名称。例如,通常分别命名正态分布的均值和偏差μ(读为“ mu”)和偏差σ(“σ”)。
但是我仍然不知道用简单的英语意味着什么?
我是统计学的新手,发现了这一点。
在统计中,θ(小写希腊字母“ theta”)是某些一般概率分布的(一个或多个)参数的(向量)的常用名称。一个常见的问题是找到theta的值。注意,以这种方式命名参数没有任何意义。我们不妨称之为其他任何事情。实际上,许多发行版的参数通常使用其他名称。例如,通常分别命名正态分布的均值和偏差μ(读为“ mu”)和偏差σ(“σ”)。
但是我仍然不知道用简单的英语意味着什么?
Answers:
这不是惯例,但是经常代表分布的参数集。
就是说简单的英语,让我们显示示例。
示例1.您想研究一个老式的图钉的投掷(底部有一个大的圆形图钉)。您假设其下降的概率是一个未知值,称为。您可以调用随机变量X并说图钉朝下指向时X = 1,朝下指向时X = 0。你会写模型
并且您可能会对估算感兴趣(此处,图钉掉落的可能性朝下)。
例2.您想研究放射性原子的分解。根据文献,您知道放射性的数量呈指数下降,因此您决定用指数分布对分解时间建模。如果是解体时间,则模型为
这里的是概率密度,这意味着原子在时间间隔(t ,t + d t )中解体的概率为f (t )d t。同样,您将对估计θ(此处为崩解率)感兴趣。
示例3.您想研究称重仪器的精度。根据文献,您知道测量是高斯的,因此您决定将标准的1千克物体的重量建模为
这里是标度给出的量度,f (x )是概率的密度,参数是μ和σ,所以θ = (μ ,σ )。参数μ是目标重量(如果μ ≠ 1,则称量表会有偏差),而σ是每次称量物体时度量的标准偏差。同样,您将有兴趣估算θ(这里是比例尺的偏差和不精确度)。
什么取决于您使用的模型。例如,在普通的最小二乘回归中,您将因变量(通常称为Y)建模为一个或多个自变量(通常称为X)的线性组合,得到如下结果:
其中p是自变量的数量。这里要估计的参数是和θ是所有的名称β 小号。但是更笼统的θ可以应用于我们想要估计的任何参数。
简而言之:
统计分布是一个数学函数,告诉你什么是你的不同值的概率随机变量X具有分布˚F,即˚F (X )输出的概率X。此类函数有不同,但是现在让我们将f视为某种“通用”函数。
然而,对于是普遍,即,一个能够适用于不同的数据(即具有相似的特性),它需要参数即改变其形状,使得它适合不同的数据。此类参数的一个简单示例是正态分布中的μ,该μ表示该分布的中心(均值)在哪里,因此它可以描述具有不同平均值的随机变量。正态分布具有另一个参数σ,其他分布也具有至少一个这样的参数。这些参数通常称为θ,对于正态分布,θ是μ和σ的简写(即是两个值的向量)。
为什么重要?统计分布用于近似数据的经验分布。假设您拥有一组人的年龄数据集,并且平均年龄为50岁,并且您想使用正态分布来近似估计他们的年龄分布。如果正态分布不允许使用不同的μ值(例如,该参数具有固定值,例如μ = 0),则对于此数据将毫无用处。但是,由于μ不是固定的,因此正态分布可以使用μ的不同值,其中μ = 50是其中之一。这是一个简单的示例,但是在更复杂的情况下,参数不清楚,因此您必须使用统计工具来估计(找到最合适的) θ值。
因此,您可以说统计是关于在给定数据的情况下找到最佳值(贝叶斯主义者会说:给定数据和先验条件)。