我的统计专家基本上说过,如果给出以下三个之一,则可以找到其他两个:
- 累积分布函数
- 瞬间产生功能
- 概率密度函数
但是我的计量经济学教授说,CDF比PDF更基础,因为在某些示例中您可以拥有CDF,但未定义PDF。
CDF是否比PDF更基础?我如何知道可以从CDF导出PDF还是MGF?
我的统计专家基本上说过,如果给出以下三个之一,则可以找到其他两个:
但是我的计量经济学教授说,CDF比PDF更基础,因为在某些示例中您可以拥有CDF,但未定义PDF。
CDF是否比PDF更基础?我如何知道可以从CDF导出PDF还是MGF?
Answers:
(的子集)上的每个概率分布都具有累积分布函数,并且它唯一地定义了分布。因此,从这个意义上讲,CDF确实与发行版本身一样重要。
甲概率密度函数,但是,对于只存在(绝对)连续概率分布。缺少PDF的分布的最简单示例是任何离散概率分布,例如仅采用整数值的随机变量的分布。
当然,这种离散的概率分布可以用概率质量函数来代替,但也有一些既不具有PDF也不具有PMF的分布,例如连续分布和离散分布的任意混合:
甚至存在奇异的概率分布,例如Cantor分布,即使通过PDF和PMF 的组合也无法描述。但是,此类分布仍然具有定义明确的CDF。例如,这是Cantor发行版的CDF,有时也称为“魔鬼的阶梯”:
(图片来自Theon和Amirki用户的Wikimedia Commons,在CC-By-SA 3.0许可下使用。)
CDF(称为Cantor函数)是连续的,但不是绝对连续的。实际上,除Cantor集零Lebesgue测度外,它在任何地方都是恒定的,但仍然包含无数个点。因此,康托尔分布的整个概率质量都集中在实数线这一消失的小子集上,但是集合中的每个点仍然单独具有零概率。
还有一些概率分布不具有矩生成函数。可能最著名的例子是柯西分布,这是一种不规则的1阶或更高阶矩的胖尾分布(因此,尤其是没有明确的均值或方差!)。
但是,上的所有概率分布都具有(可能是复数值的)特征函数,其定义与MGF的定义仅在于与虚数单位相乘。因此,特征函数可以被视为与CDF基本相同。
我相信您的计量经济学教授正在按照以下思路进行思考。
考虑功能与domiain由下式定义[ 0 ,1 ]
F(x)=1
这是一个不连续的函数,但是对于上的某些概率分布而言,它是完全有效的CDF 。请注意,使用此分布
即使有CDF,也没有功能可以用作此发行版的PDF。
如果您之前已经看过这种事情,那么在这个简单的示例中很容易就可以确定它是否成立。假设有一个pdf,我们将证明它必须具有不可能的性质,因此不存在。
根据PDF的定义,我们必须
对于所有。集成到线性函数的函数必须是常数(技术上几乎在任何地方都是常数),因此我们得出结论:
以同样的方式,但从1开始积分,向零移动,到,我们得出相同的结论
因此,我们有决心无处不在,除了。但是,到底是什么并不重要,它不能具有所需的集成属性。以来
我们会需要
对于每个包含间隔。但是实际上,任何积分的值都不会因在任何一点上更改函数的值而受影响,因此
所以没有出路,像这样的函数就不存在。
Ilmari从理论角度给出了很好的答案。但是,也可能会问密度(pdf)和分布函数(pdf)用于实际计算的目的是什么。这可以阐明一种情况比另一种情况更直接有用。
对于上的概率分布,分布函数直接给出所有区间的概率从这些概率中,可以通过基本算术计算区间的有限并集的概率。可以认为,这些都是你希望可以计算唯一的概率可能是理论上方便表达这些。或更一般的集合概率为积分,但对于实际的计算,我们需要有效的分布函数。( - ∞ ,X ] - -
但是,密度对于统计至关重要,因为可能性是根据密度定义的。因此,如果我们要计算最大似然估计,则直接需要密度。
如果我们将经验分布和理论分布进行比较,两者都可能有用,但是通常首选基于分布函数的方法,例如pp-和qq-图。
有关概率分布为的分布函数起着以下显着的作用。原因之一是无法轻松地计算出许多兴趣集(球,椭球,圆锥等)的概率。 d≥2