Questions tagged «distributions»

分布是概率或频率的数学描述。

1
没有长尾的重尾分布示例
通过阅读有关重尾和长尾分布的信息,我了解到所有长尾分布都是重尾分布,但并非所有重尾分布都是长尾分布。 有人可以提供以下示例: 连续的,对称的,平均零密度的长尾函数 一个连续的,对称的,平均密度为零的函数,该函数重尾但不长尾 这样我可以更好地理解它们定义的含义? 如果两者都可以具有单位方差,那就更好了。

2
推导二元泊松分布
我最近遇到了双变量Poisson分布,但是对于如何导出它有点困惑。 分布由下式给出: P(X=x,Y=y)=e−(θ1+θ2+θ0)θx1x!θy2y!∑i=0min(x,y)(xi)(yi)i!(θ0θ1θ2)iP(X=X,ÿ=ÿ)=Ë-(θ1个+θ2+θ0)θ1个XX!θ2ÿÿ!∑一世=0米一世ñ(X,ÿ)(X一世)(ÿ一世)一世!(θ0θ1个θ2)一世P(X = x, Y = y) = e^{-(\theta_{1}+\theta_{2}+\theta_{0})} \displaystyle\frac{\theta_{1}^{x}}{x!}\frac{\theta_{2}^{y}}{y!} \sum_{i=0}^{min(x,y)}\binom{x}{i}\binom{y}{i}i!\left(\frac{\theta_{0}}{\theta_{1}\theta_{2}}\right)^{i} 据我所知,在θ0θ0\theta_{0}项之间的相关性的测量XXX和YÿY ; 因此,当XXX和YÿY是独立的,θ0=0θ0=0\theta_{0} = 0和分配简单地变成两个单变量泊松分布的产物。 考虑到这一点,我的困惑是基于求和项-我假设该项解释了XXX和之间的相关性YÿY。 在我看来,该加数构成某种其中“成功”的概率由下式给出二项式累积分布函数的产品(θ0θ1θ2)(θ0θ1个θ2)\left(\frac{\theta_{0}}{\theta_{1}\theta_{2}}\right)和“失败”的概率由下式给出i!1min(x,y)−i一世!1个米一世ñ(X,ÿ)-一世i!^{\frac{1}{min(x,y)-i}},因为(i!1min(x,y)−i!)(min(x,y)−i)=i!(一世!1个米一世ñ(X,ÿ)-一世!)(米一世ñ(X,ÿ)-一世)=一世!\left(i!^{\frac{1}{min(x,y)-i!}}\right)^{(min(x,y)-i)} = i!,但我可能与此相去甚远。 有人可以提供一些有关如何导出这种分布的帮助吗?同样,如果可以将其包含在任何答案中,那么如何将模型扩展到多变量场景(例如三个或更多随机变量),那就太好了! (最后,我已经注意到,之前有一个类似的问题(了解二元泊松分布),但实际上并未对此推导进行探讨。)

1
熵如何取决于位置和尺度?
密度函数为f的连续分布的熵定义为log (f )期望值的负值,因此等于Fff日志(f),log⁡(f),\log(f), HF= - ∫∞- ∞日志(f(x ))f(x )d x 。Hf=−∫−∞∞log⁡(f(x))f(x)dx.H_f = -\int_{-\infty}^{\infty} \log(f(x)) f(x)\mathrm{d}x. 我们还说,任何分布具有密度f的随机变量XXX都有熵H f。 (即使f为零,该积分也是明确定义的,因为在这样的值下log (f (x ())f (x )可以等于零。)FffHF。Hf.H_f.Fff日志(f(x ))f(x )log⁡(f(x))f(x)\log(f(x))f(x) 当XXX和ÿYY是ÿ= X+ μY=X+μY = X+\mu(μμ\mu为常数)的随机变量时,ÿYY被称为是XXX 移位μ 。μ.\mu. 类似地,当ÿ= XσY=XσY = X\sigma(σσ\sigma是正的常数),ÿYY被说成是一个版本XXX 缩放由σ。σ.\sigma.组合秤与换档给出Y=Xσ+μ.Y=Xσ+μ.Y=X\sigma + \mu. 这些关系经常发生。例如,更改XXX的度量单位将对其进行缩放和缩放。 如何的熵Y=Xσ+μY=Xσ+μY = X\sigma + \mu涉及于的X?X?X?



5
分布范围是0到1,并且它们之间有峰值?
是否有一个发行版,或者我可以与其他发行版一起创建一个下图所示的发行版(对不好的图纸表示歉意)? 在这里我给出一个数字(在示例中为0.2、0.5和0.9),以表示峰值应位于的位置以及使函数变宽或变窄的标准偏差(sigma)。 PS:当给定数字为0.5时,分布为正态分布。




2
离散均匀随机变量(?),在封闭区间内取所有有理值
我刚刚发生了(智力)恐慌发作。 一个连续的随机变量,它在一个封闭的间隔中遵循统一:这是一种非常熟悉的统计概念。 ü(a ,b )U(a,b)U(a,b) 在扩展的实数(一半或整个)上具有支持的连续均匀rv:不是rv固有的,而是基本贝叶斯概念,用于不适当的先验,有用和适用。 一个离散的统一值,其值是有限的:让我们扔一个测地线圆顶,没什么大不了的。 但是,一个函数具有一个以整数为界的封闭区间中包含的所有有理数(如果需要,以开头)的函数呢?我们想在概率框架中使用它,要求每个可能值与所有其他值都具有相等的概率吗?[ 0 ,1 ][0,1][0,1] 可能值的数量是无穷大的(表征许多离散分布),但是如果我们希望概率相等,那么如何表达单个值的概率呢? 我们能否说出证明这种实体是(不是)随机变量? 如果不是,这是否是“不当先验”的又一个化身(也许已经众所周知)? 这个实体在某种意义上是否可能定义为连续统一rv的“等效”(无论多么特别)?还是我只是犯了一个基本罪? 似乎该域是一个封闭的间隔这一事实并不能让我放手。有界的东西通常是可管理的。 为了指示内部漩涡,问题很多。我不是要得到每个问题的答案。 在任何时候,如果我想出任何见解,我都会进行更新。 更新:目前的问题在这里刚刚获得了一个建构主义的续集。

1
Cauchy分布中的位置参数的MLE
居中后,可以将两个测量值x和-x假定为具有概率密度函数的柯西分布的独立观测值: 1F(x :θ )=f(x:θ)=f(x :\theta) = ,-∞&lt;x&lt;∞1个π(1 + (X - θ )2)1π(1+(x−θ)2)1\over\pi (1+(x-\theta)^2) ,- ∞ &lt; X &lt; ∞,−∞&lt;x&lt;∞, -∞ < x < ∞ 表明,如果的MLE θ是0,但如果X 2 &gt; 1有两个MLE的θ,等于± √X2≤ 1x2≤1x^2≤ 1θθ\thetaX2&gt; 1x2&gt;1x^2>1θθ\thetaX2− 1-----√x2−1\sqrt {x^2-1} 我认为要找到MLE,必须区分对数可能性: =Σ2(X我-θ)d升dθdldθdl\over d\theta = ∑=∑=\sum =2(-X-θ)2 (x一世- θ )1 + (x一世- θ )22(xi−θ)1+(xi−θ)22(x_i-\theta)\over 1+(x_i-\theta)^2 === …

3
为了得出“天花板效应”正在发生,必须满足什么条件?
根据SAGE社会科学研究方法百科全书 ... [a]上限效应发生在一项措施具有潜在响应的明显上限并且参与者集中度达到或接近该上限时。尺度衰减是一个方法学问题,每当以这种方式限制方差时都会发生。…例如,某种程度的态度可能会产生天花板效应,其中高分表示一种有利态度,而最高的反应却无法捕捉到最积极的评价。…解决天花板效应的最佳解决方案是试点测试,这可以尽早发现问题。如果发现上限效应,并且[结果]度量标准是任务绩效,则可以使任务更加难以增加潜在响应的范围。1个 [重点添加] 似乎有很多的建议和问题,(在这里)处理分析这表明类似于上述报价的天花板埋入影响的数据。 我的问题可能很简单,也可能很幼稚,但是如何真正检测出数据中存在上限效应呢?更具体地说,例如,创建了一个心理测验,并怀疑其导致了上限效应(仅视觉检查),然后对该测验进行了修改,以产生更大范围的值。如何显示修订后的测试已从其生成的数据中消除了上限效应?是否有一项测试表明数据集a中存在上限效应,但数据集b中没有上限效应? 我幼稚的方法是仅检查分布偏斜,如果不偏斜,则得出结论没有上限效应。这太简单了吗? 编辑 再举一个更具体的例子,我说开发了一种可以测量某些潜在特征x的工具,该特征x随着年龄的增长而增加,但最终趋于平稳,并随着年龄的增长而开始下降。我制作了第一个版本,范围为1-14,进行了一些试验,发现似乎有一个上限效应(很多响应在14或接近14时,最大值。)查看数据,但是为什么呢?是否有严格的方法来支持该主张? 然后,我将度量值修改为1-20,并收集更多数据。我看到趋势更加符合我的期望,但是我怎么知道测量范围足够大。我需要再次修改吗?从外观上看,这似乎还可以,但是有没有一种方法可以验证我的怀疑? 我想知道如何才能在数据中检测到这种上限效应,而不仅仅是查看它。这些图代表实际数据,而非理论数据。扩大仪器的范围可以产生更好的数据分布,但这足够吗?我该如何测试? 1 Hessling,R.,Traxel,N.,&Schmidt,T.(2004)。天花板效果。SAGE社会科学研究方法百科全书,由 Michael S. Lewis-Beck,A。Bryman和Tim Futing Liao(编)撰写。(第107页)。加利福尼亚州千橡市:Sage Publications,Inc. doi:10.4135 / 9781412950589.n102

4
为什么所有已知分布都是单峰的?
我不知道任何多峰分布。 为什么所有已知分布都是单峰的?是否有不止一种模式的“著名”发行版? 当然,分布的混合通常是多峰的,但是我想知道是否存在任何不止一种具有多个模式的分布。



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.