Questions tagged «distributions»

分布是概率或频率的数学描述。

11
Beta发行背后的直觉是什么?
免责声明:我不是统计学家,而是软件工程师。我在统计学方面的大部分知识都来自自我教育,因此我在理解概念上仍然有很多空白,这些概念对于这里的其他人而言似乎微不足道。因此,如果答案包含较少的具体术语和更多的解释,我将非常感激。想象一下,你在跟奶奶说话:) 我试图把握性质的beta分布 -它应该用于和如何解释它在各种情况下。如果我们说的是正态分布,则可以将其描述为火车的到站时间:最经常到达的时间是准时到达的,更不常见的是早到1分钟或晚到1分钟的时间,很少有差异到达的距离平均值20分钟 均匀分配尤其描述了彩票中每张彩票的机会。二项分布可以用硬币翻转等来描述。但是,对beta分布有这样直观的解释吗? 假设和。Beta分布在这种情况下看起来像这样(在R中生成):α = 0.99α=.99\alpha=.99β= .5β=.5\beta=.5B (α ,β)B(α,β)B(\alpha, \beta) 但这实际上是什么意思?Y轴显然是概率密度,但是X轴上是什么? 我非常感谢您对本示例或任何其他示例所做的任何解释。

2
什么时候(为什么)应该记录(数字)分布的对数?
假设我有一些历史数据,例如过去的股价,机票价格波动,公司的过去财务数据... 现在有人(或某些公式)出现并说“让我们使用/使用分布的对数”,这就是我为什么要去的地方? 问题: 为什么一个人应该首先获取分发日志? 分配的日志会“给出/简化”原始分配无法/不会的记录吗? 日志转换是否“无损”?即,当转换为对数空间并分析数据时,对于原始分布是否有相同的结论?怎么会? 最后何时获取分发日志?在什么条件下决定这样做? 我真的很想了解基于日志的分布(例如,对数正态),但我从未理解何时/为什么方面-即分布的对数是正态分布,那又如何呢?这甚至告诉我什么,为什么要打扰?因此,这个问题! 更新:根据@whuber的评论,我查看了这些帖子,由于某种原因,我确实了解了对数变换及其在线性回归中的应用,因为您可以在自变量和因变量的对数之间建立关系。但是,从分析分布本身的角度来看,我的问题是通用的-我无法得出结论来帮助理解采用日志来分析分布的原因本身没有关系。我希望我有道理:-/ 在回归分析中,您确实对数据的类型/拟合/分布有限制,您可以对其进行转换并定义自变量和(未经转换的)因变量之间的关系。但是,何时/为什么要对孤立的分布这样做,其中类型/适合/分布的约束不一定适用于框架(如回归)。我希望澄清后的事情比混淆起来更清楚:) 对于“为什么和什么时候”,这个问题应有明确的答案


6
概率分布值超过1可以吗?
在有关朴素贝叶斯分类器的Wikipedia页面上,存在以下行: p(height|male)=1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789(1的概率分布是可以的。钟形曲线下的面积等于1。) 值如何确定?我认为所有概率值都表示在范围内。此外,假设有可能具有这样的值,那么在页面上显示的示例中如何获得该值?>1>1>10≤p≤10≤p≤10 \leq p \leq 1

2
如何确定哪种分布最适合我的数据?
我有一个数据集,想找出哪种分布最适合我的数据。 我用了 fitdistr()函数来估计必要的参数,以描述假设的分布(即,威布尔,柯西,正态)。使用这些参数,我可以进行Kolmogorov-Smirnov检验来估计我的样本数据是否来自与假设分布相同的分布。 如果p值> 0.05,我可以假设样本数据是从相同的分布中得出的。但是p值没有提供有关拟合度的任何信息,不是吗? 因此,如果我的样本数据的p值对于正态分布以及Weibull分布> 0.05,那么我如何知道哪个分布更适合我的数据呢? 这基本上就是我所做的: > mydata [1] 37.50 46.79 48.30 46.04 43.40 39.25 38.49 49.51 40.38 36.98 40.00 [12] 38.49 37.74 47.92 44.53 44.91 44.91 40.00 41.51 47.92 36.98 43.40 [23] 42.26 41.89 38.87 43.02 39.25 40.38 42.64 36.98 44.15 44.91 43.40 [34] 49.81 38.87 40.00 …

3
帮助我了解贝叶斯先验和后验分布
在一组学生中,有18个学生中有2个是惯用左手的。假设先验信息不足,则找到惯用左手的学生在人群中的后验分布。总结结果。根据文献,5-20%的人是左撇子。事先考虑这些信息并计算新的后验。 我知道应该在这里使用beta发行版。首先,αα\alpha和ββ\beta值为1?我在后验材料中找到的等式是 π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)\pi(r \vert Y ) \propto r^{(Y +−1)} \times (1 − r)^{(N−Y +−1)} \\ Y=2Y=2Y=2,N=18N=18N=18 为什么方程式中的?(rrrrrr表示惯用左手的人的比例)。这是未知的,那么怎么在等式中呢?对我来说,似乎是可笑的计算rrr给出并使用方程给出的。好吧,对于样本 2/18,结果为0,0019。该˚F我应该从演绎?YYYrrrrrrr=2/18r=2/18r=2/180,00190,00190,0019fff 在已知和,给出的期望值的方程更好地工作,给了我,这听起来很正确。方程为其中值分配给和。考虑到先验信息,我应该给和提供什么值?RRRYYYNNN0,150,150,15E(r|X,N,α,β)=(α+X)/(α+β+N)E(r|X,N,α,β)=(α+X)/(α+β+N)E(r | X, N, α, β) = (α + X)/(α + β + N)111αααβββαααβββ 一些提示将不胜感激。关于先验和后验分布的一般性演讲也不会受到伤害(我含糊其词,但含糊其词)也要记住,我不是一个非常高级的统计学家(实际上,我是主要行业的政治学家),所以高等数学可能会飞过我的脑海。



10
直观地理解“差异”
解释某人方差概念的最干净,最简单的方法是什么?直觉上是什么意思?如果要向他们的孩子解释这一点,那该怎么办? 这是我很难阐明的概念,尤其是在将差异与风险相关时。我在数学上理解它,也可以用这种方式解释它。但是,在解释现实世界现象时,可以这么说,您如何理解方差及其在“现实世界”中的适用性。 假设我们正在使用随机数来模拟对股票的投资(滚动骰子或使用Excel表格都没关系)。通过将随机变量的每个实例与回报中的“某些变化”相关联,我们可以获得“投资回报”。例如。: 滚动1意味着0.8%的变化$ 1的投入,5 1.1%的变化$ 1等。 现在,如果此模拟运行大约50次(或20或100),我们将获得一些价值和最终投资价值。那么,“方差”实际上告诉我们是否要根据上述数据集进行计算?一个“看到”的是什么-如果方差变成1.7654或0.88765或5.2342,这甚至意味着什么?我对这项投资有何看法?我可以得出一些结论-用外行的话来说。 请也随意增加标准偏差的问题!尽管我觉得理解起来“更容易”,但是将有助于使它也“直观地”变得清晰起来,这一点将不胜感激!

4
泊松与指数分布之间的关系
泊松分布的等待时间是带有参数lambda的指数分布。但是我不明白。例如,泊松(Poisson)对每单位时间的到达次数进行建模。这与指数分布有何关系?假设以时间为单位的k到达概率为P(k)(由泊松建模),k + 1的概率为P(k + 1),那么指数分布如何建模它们之间的等待时间?

8
生成与现有变量具有定义的相关性的随机变量
对于模拟研究,我必须生成随机变量,这些变量显示与现有变量的预定义(填充)相关性。ÿYY 我研究了这些R软件包copula,CDVine它们可以生成具有给定依赖关系结构的随机多变量分布。但是,不可能将结果变量之一固定为现有变量。 任何想法和现有功能的链接表示赞赏! 结论: 提出了两个有效的答案,有不同的解决方案: 一个R 脚本由卡拉卡尔,其计算与一个随机变量精确(样品)的相关性,以一个预定义的变量 我发现了一个R 函数,该函数计算与预定义变量具有定义的总体相关性的随机变量 [@ttnphns的补充:我可以自由地将问题标题从单个固定变量的情况扩展到任意数量的固定变量;即如何生成具有预定义正确性和一些固定的现有变量的变量]


4
概率分布的“矩”又是什么“矩”?
我知道什么是矩,如何计算矩,以及如何使用矩生成函数获取高阶矩。是的,我知道数学。 现在,我需要润滑工作中的统计知识,我想我也应该问这个问题-困扰我大约几年了,回到大学后,没有教授知道答案,或者只是拒绝回答这个问题(诚实地) 。 那么“矩”一词在这种情况下是什么意思?为什么选择这个词?对我来说,这听起来不直观(或者我从没在大学时就这么听过:)想到它,我同样对它在“惯性矩”中的用法感到好奇;)但让我们暂时不关注它。 因此,分布的“时刻”是什么意思,它试图做什么,以及为什么要这样说!:)为什么有人在乎时刻?在这一刻,我对那一刻感到不舒服;) PS:是的,我可能也曾问过类似的方差问题,但我确实很重视直观的理解,而不是“在书中查找以找出问题” :)


4
如何识别双峰分布?
我了解,一旦将值绘制为图表,便可以通过观察双峰来识别双峰分布,但是如何以编程方式找到它呢?(我正在寻找一种算法。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.