Questions tagged «distributions»

分布是概率或频率的数学描述。

5
在Casella&Berger之后要学什么?
我是一名纯数学研究生,几乎没有应用数学背景。从去年秋天开始,我开始在Casella&Berger的书上上课,并且在书中完成了数百(230+)页的运动问题。现在我在第10章。 但是,由于我没有统计学专业或计划成为统计学家,所以我认为我将无法定期投入时间继续学习数据分析。到目前为止,我的经验告诉我,作为一名统计学家,需要承担很多繁琐的计算工作,涉及各种分布(Weibull,Cauchy,,F ...)。我发现虽然基本思想很简单,但由于技术原因,实现(例如假设检验中的LRT)仍然很困难。ŤŤtFFF 我的理解正确吗?有没有一种方法可以学习概率和统计信息,不仅可以涵盖更高级的材料,还可以在我需要现实生活中的数据分析时提供帮助吗?我是否需要像以前那样每周花费个小时?≥≥\ge 尽管我认为学习数学没有走上任何皇家之路,但我常常不禁要问-大多数时候,我们不知道真实数据的分布是什么,所以我们专注于各种分布族的目的是什么? ?如果样本量较小,并且中心极限定理不适用,那么在分布未知的情况下,除了样本平均值和方差之外,我们还应如何正确分析数据? 我的学期将在一个月内结束,在我开始专注于博士学位研究后,我不希望自己的知识消失。所以我决定问。我正在学习R,并且我有一定的编程背景,但是我的水平与代码猴子差不多。


1
重尾和肥尾分布之间的差异
我以为粗尾=粗尾,但是我读过的一些文章使我感觉不是。 其中之一说:重尾意味着对于某个整数j,分布具有无限的第j矩。另外,帕累托df吸引的锅域中的所有df都是重尾的。如果密度具有较高的中心峰和较长的尾巴,则峰度通常较大。峰度大于3的df是肥尾或瘦小体。我仍然没有这两者之间的具体区别(重型尾巴与胖尾巴)。任何有关相关文章的想法或指示,将不胜感激。

9
如何确定ping响应时间上该数据代表哪种分布?
我已经采样了一个真实的过程,即网络ping时间。“往返时间”以毫秒为单位。结果绘制在直方图中: Ping时间具有最小值,但尾巴较长。 我想知道这是什么统计分布,以及如何估算其参数。 即使该分布不是正态分布,我仍然可以显示我要实现的目标。 正态分布使用以下功能: 有两个参数 μ(平均值) σ 2 (方差) 参数估计 估算两个参数的公式为: 将这些公式应用于Excel中的数据,我得到: μ= 10.9558(平均值) σ 2 = 67.4578(方差) 使用这些参数,我可以在采样数据上方绘制“ 正态 ”分布: 显然,这不是正态分布。正态分布具有无限的顶部和底部尾部,并且是对称的。这种分布是不对称的。 我将采用什么原则?我将采用哪种流程图来确定这是哪种分布? 假设分布没有负尾巴,而有长正尾巴:什么分布与之匹配? 是否有与您所观察到的分布相匹配的参考? 紧追其后,此分布的公式是什么,以及估算其参数的公式是什么? 我想要获得分布,以便获得“平均”值以及“价差”: 我实际上是在软件中绘制直方图,我想覆盖理论分布: 注意:从math.stackexchange.com交叉发布 更新:160,000个样本 一个月又一个月,以及不计其数的抽样会议,都给出了相同的分布。有必须是一个数学表达式。 哈维建议将数据放在对数刻度上。这是对数刻度上的概率密度: 标签:抽样,统计,参数估计,正态分布 这不是答案,而是问题的附录。这是分配桶。我认为,喜欢冒险的人可能希望将其粘贴到Excel(或您知道的任何程序)中,并可以发现其分布。 值已标准化 Time Value 53.5 1.86885613545469E-5 54.5 0.00396197500716395 55.5 0.0299702228922418 56.5 0.0506460012708222 57.5 0.0625879919763777 58.5 0.069683415770654 …

1
为什么方差的采样分布是卡方分布?
该声明 样本方差的样本分布是自由度等于的卡方分布,其中是样本大小(假设感兴趣的随机变量是正态分布的)。nn−1n−1n-1nnn 资源 我的直觉 这对我来说有点直觉,1)因为卡方检验看起来像是平方和; 2)卡方分布只是正态分布的平方和。但是,我对此仍然不太了解。 题 这句话是真的吗?为什么?

3
不合适的先验如何导致正确的后验分布?
我们知道,在适当分配优先权的情况下, P(θ | X)= P(X| θ )P(θ )P(X)P(θ∣X)=P(X∣θ)P(θ)P(X)P(\theta \mid X) = \dfrac{P(X \mid \theta)P(\theta)}{P(X)} α P(X| θ )P(θ )∝P(X∣θ)P(θ) \propto P(X \mid \theta)P(\theta)。 该步骤的通常的理由是,边缘分布XXX,P(X)P(X)P(X),是相对于恒定θθ\theta和导出后验分布时可因此被忽略。 但是,如果先验不正确,您如何知道后验分布实际上存在?这个看似循环的论点似乎有些缺失。换句话说,如果我假设后验存在,那么我就会理解如何推导后验的机制,但是我似乎缺少关于为何甚至存在的理论依据。 PS我也认识到,在某些情况下,先验错误会导致后验错误。

5
评估分布差异的重要性
我有两组数据。每个变量都有不同的分布。我试图确定这两组的分布是否在统计上有意义。我既有原始格式的数据,又有binbined的数据,可以更轻松地处理每个频率计数的离散类别。 我应该使用什么测试/过程/方法来确定这两组是否存在显着差异,以及如何在SAS或R(或Orange)中进行测试?



3
破碎的棍子最大碎片的分布(间距)
随机将长度为均匀地分成片段。最长片段的长度分布是什么?k+1k+1k+1 更正式地说,让为IID,让为关联的订单统计信息,即我们简单地订购以这样的方式来处理样本。令。(U1,…Uk)(U1,…Uk)(U_1, \ldots U_k)U(0,1)U(0,1)U(0,1)(U(1),…,U(k))(U(1),…,U(k))(U_{(1)}, \ldots, U_{(k)})U(1)≤U(2)≤,…,≤U(k)U(1)≤U(2)≤,…,≤U(k)U_{(1)} \leq U_{(2)} \leq, \ldots , \leq U_{(k)}žķ= 最大(U(1 ),U(2 )− U(1 ),… ,U(k)−U(k−1),1−U(k))Zk=max(U(1),U(2)−U(1),…,U(k)−U(k−1),1−U(k))Z_k = \max \left(U_{(1)}, U_{(2)}-U_{(1)}, \ldots, U_{(k)} - U_{(k-1)}, 1-U_{(k)}\right) 我对Z_k的分布感兴趣ZkZkZ_k。矩,渐近结果或k \ uparrow \ infty的近似值k↑∞k↑∞k \uparrow \infty也很有趣。

2
这个离散分布有名称吗?
这个离散分布有名称吗?对于i∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} 我从以下内容中发现了此分布:我有按实用程序功能排列的项目的列表。我想随机选择其中一项,偏向列表的开头。因此,我首先均匀地选择介于1和N之间的索引j。然后,我在索引1和j之间选择一个项目。我相信这个过程会导致上述分布。NNNjjjNñNjjj


2
非中心卡方随机变量之和
我需要找到随机变量的分布 Y=∑i=1n(Xi)2Y=∑i=1n(Xi)2Y=\sum_{i=1}^{n}(X_i)^2 ,其中Xi∼N(μi,σ2i)Xi∼N(μi,σi2)X_i\sim{\cal{N}}(\mu_i,\sigma^2_i)和所有XiXiX_i s为独立的。我知道有可能首先找到XiXiX_i s 的所有矩生成函数的乘积,然后变换回以获得YYY的分布。但是,我想知道Y是否有通用形式YYY 类似于高斯案例:我们知道独立高斯的和仍然是高斯,因此我们只需要知道求和的平均值和求和的方差即可。 如何对所有?这种情况是否可以解决?σ2i=σ2σi2=σ2\sigma^2_i=\sigma^2


1
逆Wishart分布矩阵的对角线的边际分布
假设。我对对角元素的边际分布感兴趣。关于的子矩阵的分布有一些简单的结果(至少有一些列在Wikipedia上)。由此我可以看出,对角线上任何单个元素的边际分布都是反伽玛。但是我一直无法推断出联合分布。DIAG (X )= (X 11,... ,X p p)XX∼InvWishart(ν,Σ0)X∼InvWishart⁡(ν,Σ0)X\sim \operatorname{InvWishart}(\nu, \Sigma_0)诊断(X)= (x11,… ,xp p)诊断⁡(X)=(X11,…,Xpp)\operatorname{diag}(X) = (x_{11}, \dots, x_{pp})XXX 我认为也许可以通过合成来得出,例如: p (X11| X我我,i > 1 )p (x22| X我我,i > 2 )… p (x(p − 1 )(p − 1 )| Xp p)p (xp p),p(X11|X一世一世,一世>1个)p(X22|X一世一世,一世>2)…p(X(p-1个)(p-1个)|Xpp)p(Xpp),p(x_{11} | x_{ii}, i\gt 1)p(x_{22}|x_{ii}, i>2)\dots p(x_{(p-1)(p-1)}|x_{pp})p(x_{pp}), 但是我从没有得到任何帮助,并且进一步怀疑我缺少简单的东西;似乎已经知道这个“应该”,但是我一直无法找到/显示它。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.