Wolfram Mathworld是否会错误地描述具有概率密度函数的离散概率分布?


14

通常,使用概率质量函数(PMF)描述离散变量的概率分布:

当使用连续随机变量时,我们使用概率密度函数(PDF)而不是概率质量函数来描述概率分布。

- 深度学习的古德费洛,Bengio和库维尔

但是,Wolfram Mathworld使用PDF来描述离散变量的概率分布:

在此处输入图片说明

这是一个错误吗?还是没关系?


5
我认为这很草率,但不是很重要。如果他们从量度理论的角度看待概率,那甚至是有根据的,尽管对于介绍掷硬币来说似乎有点多。(奇怪的是,他们似乎没有关于PMF的文章。)
Dave

9
pmf是相对于计数手段的密度
西安,

3
当您在由3个元素指定的度量空间级别上讨论概率论时,pdf和pmf没有什么不同,因此pmf被删除。可以通过pdf指定所有分布。wolfram是一个数学网站,因此他们使用高级数学谈论概率不足为奇。这里是不错的免费阅读。stat.washington.edu/~pdhoff/courses/581/LectureNotes/...
user158565

Answers:


30

这不是一个错误:在对概率的形式化处理中,通过量度理论,概率密度函数是感兴趣的概率量度的衍生形式,是针对“主导量度”(也称为“参考量度”)采取的。对于整数的离散分布,概率质量函数是关于计数度量的密度函数。由于概率质量函数是概率密度函数的一种特殊类型,因此有时您会发现像这样的引用将其称为密度函数,以这种方式引用它们并不是错误的。

在关于概率和统计的普通论述中,通常会避免使用该术语,而是在“质量函数”(对于离散随机变量)和“密度函数”(对于连续随机变量)之间进行区分,以区分离散分布和连续分布。在其他情况下,当人们陈述概率的整体方面时,通常最好忽略这种区别,并将两者都称为“密度函数”。


感谢您的回答。请问treatment“在概率的正规治疗”平均符号,角度,公约或其他什么东西?
czlsws

当我在这里谈论“形式处理”时,我指的是概率论的现代基础,它是测量理论的子集。那是被视为概率形式形式基础的数学理论。
恢复莫妮卡

“概率密度函数是感兴趣的概率度量的导数”在我看来,从某种意义上讲,它比起导数更像是“反积分”。有不连续的PDF,例如均匀分布,离散分布可以视为Dirac delta函数之和。在这种情况下,必须将泛化的概念推广到远远超出一般理解的范围。
16:37处累计

@累积-均匀分布如何不连续?与测量理论相比,测量和理论对积分和微分的更一般的处理。
jbowman

@Accumulation:是的,这是一个公平的表征,实际上,这就是完成的工作。从技术上讲,密度是Radon-Nikodym衍生物,的确是您所描述类型的“反积分”类型。
恢复莫妮卡

5

除了从量度理论方面获得更多理论答案外,在统计编程中不区分pmfs和pdf也很方便。例如,R具有丰富的内置分布。对于每个发行版,它具有4个功能。例如,对于正态分布(来自帮助文件):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

R用户迅速使用d,p,q,r前缀。如果您必须执行诸如丢弃dm用于二项式分布的操作,那将很烦人。相反,一切都与R用户期望的一样:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.

3
scipy.stats区别在于,某些对象具有pdf方法,而另一些具有pmf方法。这真的让我很烦!
马修·德鲁里
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.