Questions tagged «distributions»

分布是概率或频率的数学描述。

4
平均值=中位数是否意味着单峰分布是对称的?
对于单峰分布,如果均值=中值,那么说分布是对称的就足够了吗? 维基百科在平均值和中位数之间的关系中说: “如果分布是对称的,则均值等于中值,并且分布将具有零偏度。此外,如果分布是单峰的,则均值=中值=模式。这就是抛硬币或系列1,2,3,4,...,但是,请注意,相反的情况通常并不正确,即零偏度并不意味着均值等于中位数。” 但是,(对我而言)收集我需要的信息不是很简单。请帮忙。

2
构造一个离散的rv,以支持所有原理
这是这个问题的建构主义后遗症。 如果我们不能有一个离散的统一随机变量来支持区间中的所有有理数,那么下一个最好的事情就是: [0,1][0,1][0,1] 构造一个具有此支持的随机变量,,并遵循一定的分布。我的工匠要求此随机变量是根据现有分布构建的,而不是通过抽象定义我们想要获得的内容来创建的。Q ∈ Q ∩ [ 0 ,1 ]QQQQ∈Q∩[0,1]Q∈Q∩[0,1]Q\in \mathbb{Q}\cap[0,1] 因此,我提出了以下建议: 令为遵循参数的Geometric Distribution-Variant II的离散随机变量,即0 &lt; p &lt; 1XXX0&lt;p&lt;10&lt;p&lt;10<p<1 X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1X∈{0,1,2,...},P(X=k)=(1−p)kp,FX(X)=1−(1−p)k+1 X \in \{0,1,2,...\},\;\;\;\; P(X=k) = (1-p)^kp,\;\;\; F_X(X) = 1-(1-p)^{k+1} 还令为遵循相同参数的几何分布-变量I的离散随机变量,即pYYYppp Y∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)kY∈{1,2,...},P(Y=k)=(1−p)k−1p,FY(Y)=1−(1−p)k Y \in \{1,2,...\},\;\;\;\; P(Y=k) = (1-p)^{k-1}p,\;\;\; F_Y(Y) = 1-(1-p)^k XXX和是独立的。现在定义随机变量YYY Q=XYQ=XYQ = \frac {X}{Y} 并考虑条件分布 P(Q≤q∣{X≤Y})P(Q≤q∣{X≤Y})P(Q\leq q \mid …

3
如何从
我想根据密度f (a )∝ c a d a − 1进行采样 F(一)α Ç一种da − 1Γ (a )1个(1 ,∞ )(一)F(一种)∝C一种d一种-1个Γ(一种)1个(1个,∞)(一种) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) 其中CCc和ddd严格为正。(动机:当Gamma密度的形状参数具有一致的先验值时,这对于Gibbs采样很有用。) 有谁知道如何轻松地从这种密度采样?也许这是标准的,只是我不知道的事情? 我能想到一个笨排斥sampliing算法,将更多或更少的工作(找到模式的一种∗一种∗a^*的FFf,样品(a,u)(一种,ü)(a,u)从均匀在一个大的盒[0,10a∗]×[0,f(a∗)][0,10a∗]×[0,f(a∗)][0,10a^*]\times [0,f(a^*)]和拒绝如果u&gt;f(a)u&gt;f(a)u>f(a)),但(i)其是不是在所有有效的和(ii)f(a∗)f(a∗)f(a^*)对于中等大小的和d来说,对于计算机来说它太大了,难以处理。(请注意,大c和d的模式大约为a = c d。)cccdddcccddda=cda=cda=cd 在此先感谢您的帮助!


2
对称分布的定义是什么?
对称分布的定义是什么?有人告诉我,当且仅当和具有相同的分布时,随机变量才来自对称分布。但是我认为这个定义部分正确。因为我可以一个反例和。显然,它具有对称分布,但是和具有不同的分布!我对吗?你们有没有想过这个问题?对称分布的确切定义是什么?XXXXXX−X−X-XX∼N(μ,σ2)X∼N(μ,σ2)X\sim N(\mu,\sigma^{2})μ≠0μ≠0\mu\neq0XXX−X−X-X

2
两重分布之差的分布是什么
...为什么? 假设,是独立的随机变量,分别具有均值和方差。我的基本统计书告诉我的分布具有以下属性:X1个X1个X_1μ 1,μ 2 σ 2 1,σ 2 2 X 1 - X 2X2X2X_2μ1个,μ2μ1个,μ2\mu_1,\mu_2σ21个,σ22σ1个2,σ22\sigma^2_1,\sigma^2_2X1个- X2X1个-X2X_1-X_2 Ë(X1个- X2)= μ1个- μ2Ë(X1个-X2)=μ1个-μ2E(X_1-X_2)=\mu_1-\mu_2 Var(X1−X2)=σ21+σ22Var(X1−X2)=σ12+σ22Var(X_1-X_2)=\sigma^2_1 +\sigma^2_2 现在,假设, 是自由度为, t分布。的分布是什么?X 2 n 1 − 1 n 2 − 2 X 1 − X 2X1个X1个X_1X2X2X_2ñ1个− 1ñ1个-1个n_1-1ñ2− 2ñ2-2n_2-2X1个- X2X1个-X2X_1-X_2 这个问题已经过编辑:最初的问题是“两个t分布的差异的自由度是多少?” 。mpiktas已经指出,这是没有道理的,因为不是t分布的,无论近似值(即高df)如何。X1个- X2X1个-X2X_1-X_2X1个,X2X1个,X2X_1,X_2

1
社区对第四象限的看法是什么?
黑天鹅名人(或臭名昭著)的纳西姆·塔莱布(Nassim Taleb )详细阐述了这一概念,并开发了他所谓的“统计极限图”。他的基本论点是,存在一种决策问题,任何统计模型的使用都是有害的。这些都是决策问题,决策错误的后果可能过高,而且基本的PDF很难理解。 一个例子是做空股票期权。这种操作可能导致无限(至少在理论上)损失;而且这种损失的可能性尚不清楚。实际上,很多人都为概率建模,但塔勒布(Taleb)认为,金融市场还不够成熟,不足以让人们对任何模型都充满信心。仅仅因为您见过的每只天鹅都是白色,并不意味着黑天鹅是不可能甚至不可能的。 这就是问题所在:统计界是否就塔莱布的论点达成共识? 也许这应该是社区Wiki。我不知道。

2
使用样本均值和标准差估计伽玛分布参数
我正在尝试估计最适合我的数据样本的伽玛分布的参数。我只想使用mean,std(因此使用方差数据样本中),而不是实际值-因为这些值在我的应用程序中并不总是可用。 根据该文档,以下公式可用于估计形状和比例: 我为数据尝试了此操作,但是与使用python编程库在实际数据上拟合伽玛分布相比,结果却大不相同。 我附上我的数据/代码以显示手头的问题: import matplotlib.pyplot as plt import numpy as np from scipy.stats import gamma data = [91.81, 10.02, 27.61, 50.48, 3.34, 26.35, 21.0, 79.27, 31.04, 8.85, 109.2, 15.52, 11.03, 41.09, 10.75, 96.43, 109.52, 33.28, 7.66, 65.44, 52.43, 19.25, 10.97, 586.52, 56.91, 157.18, 434.74, 16.07, 334.43, 6.63, 108.41, 4.45, …

2
假设
证明以下陈述正确的最简单方法是什么? 假设Y1,…,Yn∼iidExp(1)Y1,…,Yn∼iidExp(1)Y_1, \dots, Y_n \overset{\text{iid}}{\sim} \text{Exp}(1)。显示∑ni=1(Yi−Y(1))∼Gamma(n−1,1)∑i=1n(Yi−Y(1))∼Gamma(n−1,1)\sum_{i=1}^{n}(Y_i - Y_{(1)}) \sim \text{Gamma}(n-1, 1)。 注意,Y(1)=min1≤i≤nYiY(1)=min1≤i≤nYiY_{(1)} = \min\limits_{1 \leq i \leq n}Y_i。 通过X∼Exp(β)X∼Exp(β)X \sim \text{Exp}(\beta),这意味着,fX(x)=1βe−x/β⋅1{x&gt;0}fX(x)=1βe−x/β⋅1{x&gt;0}f_{X}(x) = \dfrac{1}{\beta}e^{-x/\beta} \cdot \mathbf{1}_{\{x > 0\}}。 很容易看到Y(1)∼Exponential(1/n)Y(1)∼Exponential(1/n)Y_{(1)} \sim \text{Exponential}(1/n)。此外,我们也有∑ni=1Yi∼Gamma(α=n,β=1)∑i=1nYi∼Gamma(α=n,β=1)\sum_{i=1}^{n}Y_i \sim \text{Gamma}(\alpha = n, \beta = 1)的参数化下 fY(y)=1Γ(α)βαxα−1e−x/β1{x&gt;0}, α,β&gt;0.fY(y)=1Γ(α)βαxα−1e−x/β1{x&gt;0}, α,β&gt;0.f_{Y}(y) =\dfrac{1}{\Gamma(\alpha)\beta^{\alpha}}x^{\alpha-1}e^{-x/\beta}\mathbf{1}_{\{x > 0\}}\text{, }\qquad \alpha, \beta> 0\text{.} 西安人给出的解决方案答案:在原始问题中使用符号: 由此,我们得到了Σ Ñ …

3
为什么β分布密度函数为-1?
Beta分布出现在两个参数设置下(或在此处) f(x)∝xα(1−x)βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} 或似乎更常用的一种 f(x)∝xα−1(1−x)β−1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} 但是,为什么第二个公式中确切有“ ”呢?−1−1-1 第一个公式在直观上似乎更直接对应于二项式分布 g (k )∝ p k(1 - p )n - kg(k)∝pk(1−p)n−k(3) g(k) \propto p^k (1-p)^{n-k} \tag{3} 但是从的角度来看“可见”ppp。这在beta二项式模型中尤其明显,其中可理解为先前的成功次数,是先前的失败次数。αα\alphaββ\beta 那么,为什么第二种形式确切地受到欢迎,其背后的原理是什么?使用任何一种参数化(例如,用于与二项分布的连接)有什么后果? 如果有人可以另外指出这种选择的起源和最初的论点,那就太好了,但这对我来说不是必需的。

5
统计学家为什么要定义随机矩阵?
我十年前学习数学,所以我有数学和统计学背景,但是这个问题使我丧命。 这个问题对我来说仍然有点哲学。为什么统计学家开发各种技术以处理随机矩阵?我的意思是,随机向量不能解决问题吗?如果不是,那么随机矩阵的不同列的平均值是多少?Anderson(2003,Wiley)认为随机向量是只有一列的随机矩阵的特例。 我看不到具有随机矩阵的意义(而且我敢肯定那是因为我很无知)。但是,忍受我。想象一下,我有一个包含20个随机变量的模型。如果要计算联合概率函数,为什么要将它们描绘成矩阵而不是向量? 我想念什么? ps:很抱歉,您对这个问题的标签打的不好,但是没有随机矩阵的标签,我还不能创建一个! 编辑:将矩阵更改为标题中的矩阵

1
第二矩法,布朗运动?
令BtBtB_t为标准的布朗运动。令Ej,nEj,nE_{j, n}表示事件{Bt=0 for some j−12n≤t≤j2n},{Bt=0 for some j−12n≤t≤j2n},\left\{B_t = 0 \text{ for some }{{j-1}\over{2^n}} \le t \le {j\over{2^n}}\right\},令其中表示指标函数。是否存在使得对于所有是否存在?我怀疑答案是肯定的。我尝试过弄乱第二时刻的方法,但没有太大用处。可以使用第二时刻方法显示吗?还是我应该尝试其他东西?Kn=∑j=2n+122n1Ej,n,Kn=∑j=2n+122n1Ej,n,K_n = \sum_{j = 2^n + 1}^{2^{2n}} 1_{E_{j,n}},111ρ&gt;0ρ&gt;0\rho > 0P{Kn≥ρ2n}≥ρP{Kn≥ρ2n}≥ρ\mathbb{P}\{K_n \ge \rho2^{n}\} \ge \rhonñn

1
哈尔蒂冈人的浸水测试的解释
我想找到一种方法来量化我凭经验获得的某些分布的双峰强度。据我了解,关于量化双峰态的方法仍有一些争议。我选择使用Hartigans的Dip测试,这似乎是R上唯一可用的测试(原始论文:http : //www.stat.washington.edu/wxs/Stat593-s03/Literature/hartigan85a.pdf)。Hartigans的倾角测试定义为:“倾角测试通过经验分布函数和最小化最大差异的单峰分布函数之间的所有样本点上的最大差来度量样本中的多峰”。 我想完全理解在使用统计信息之前应该如何解释。我期望如果分布是多峰的(将其定义为“与单峰分布的最大差异”),则浸入试验会增加。但是:您可以在Wikipedia页面上阅读有关多峰分布的信息:“小于0.05的值表示显着的双峰,而大于0.05但小于0.10的值表明双峰具有边际意义。” 。这种说法来自本文(图2)。根据本文,当分布为双峰时,浸入测试指数接近于0。这让我感到困惑。 为了正确解释Hartigans的Dip测试,我构造了一些分布(原始代码从这里开始),然后增加了exp(mu2)的值(从现在开始称为“双模强度” -编辑:我应该将其称为“强度”双峰的”),以获得双峰。在第一个图中,您可以看到一些分布示例。然后,我估计了与那些不同的模拟分布相关的浸入测试指数(第二张图)和p值(第三幅图)(包装浸入测试)。使用的R代码在我的文章结尾。 我在这里展示的是,当分配为双峰时,倾角测试指数较高,而Pvalue较低。这与您可以在互联网上阅读的内容相反。 我不是统计学专家,所以我几乎不了解Hartigans的论文。我想就正确解释Hartigans浸测的正确方式发表一些意见。我在哪里错了? 谢谢你们。问候, TA 模拟分布示例: 哈蒂根氏浸测指数相关: Hartigan的Dip测试p.value相关联: library(diptest) library(ggplot2) # CONSTANT PARAMETERS sig1 &lt;- log(3) sig2 &lt;- log(3) cpct &lt;- 0.5 N=1000 #CREATING BIMOD DISTRIBUTION bimodalDistFunc &lt;- function (n,cpct, mu1, mu2, sig1, sig2) { y0 &lt;- rlnorm(n,mean=mu1, sd = sig1) y1 &lt;- rlnorm(n,mean=mu2, …
18 r  distributions 


3
指数随机变量的总和遵循Gamma,并与参数混淆
我了解了遵循Gamma分布的指数随机变量的总和。 但是我读到的所有参数化都是不同的。例如,Wiki描述了这种关系,但是不说它们的参数实际上是什么意思?形状,比例,比率,1 /比率? 指数分布: xxx〜exp(λ)exp(λ)exp(\lambda) f(x|λ)=λe−λxf(x|λ)=λe−λxf(x|\lambda )=\lambda {{e}^{-\lambda x}} E[x]=1/λE[x]=1/λE[x]=1/ \lambda var(x)=1/λ2var(x)=1/λ2var(x)=1/{{\lambda}^2} 伽玛分布:Γ(shape=α,scale=β)Γ(shape=α,scale=β)\Gamma(\text{shape}=\alpha, \text{scale}=\beta) ë[X]=αβv一个[R[X]=αβ2f(x|α,β)=1βα1Γ(α)xα−1e−xβf(x|α,β)=1βα1Γ(α)xα−1e−xβf(x|\alpha ,\beta )=\frac{1}{{{\beta }^{\alpha }}}\frac{1}{\Gamma (\alpha )}{{x}^{\alpha -1}}{{e}^{-\frac{x}{\beta }}} E[x]=αβE[x]=αβE[x]=\alpha\beta var[x]=αβ2var[x]=αβ2var[x]=\alpha{\beta}^{2} 在此设置中,什么?正确的参数化是什么?如何将此扩展到卡方?∑i=1nxi∑i=1nxi\sum\limits_{i=1}^{n}{{{x}_{i}}}

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.