Questions tagged «distribution-identification»

2
如何确定哪种分布最适合我的数据?
我有一个数据集,想找出哪种分布最适合我的数据。 我用了 fitdistr()函数来估计必要的参数,以描述假设的分布(即,威布尔,柯西,正态)。使用这些参数,我可以进行Kolmogorov-Smirnov检验来估计我的样本数据是否来自与假设分布相同的分布。 如果p值> 0.05,我可以假设样本数据是从相同的分布中得出的。但是p值没有提供有关拟合度的任何信息,不是吗? 因此,如果我的样本数据的p值对于正态分布以及Weibull分布> 0.05,那么我如何知道哪个分布更适合我的数据呢? 这基本上就是我所做的: > mydata [1] 37.50 46.79 48.30 46.04 43.40 39.25 38.49 49.51 40.38 36.98 40.00 [12] 38.49 37.74 47.92 44.53 44.91 44.91 40.00 41.51 47.92 36.98 43.40 [23] 42.26 41.89 38.87 43.02 39.25 40.38 42.64 36.98 44.15 44.91 43.40 [34] 49.81 38.87 40.00 …

3
我的数据遵循什么分布?
让我们说我有1000个组件,并且我一直在收集有关这些组件记录故障的次数以及每次它们记录故障的数据,我还跟踪团队修复该问题花费了多长时间。简而言之,我一直在记录这1000个组件中每个组件的修复时间(以秒为单位)。在该问题的末尾提供了数据。 我把所有的这些值,并使用在画了R A Cullen和Frey图descdist从fitdistrplus包。我的希望是了解维修时间是否遵循特定的分配时间。这是boot=500获取引导值的图: 我看到该图告诉我观察结果属于beta分布(或者可能不是,在这种情况下,它揭示了什么?)现在,考虑到我是系统架构师而不是统计学家,那么该图揭示了什么? ?(我正在寻找这些结果背后的实际现实直觉)。 编辑: QQplot使用qqPlot包中的功能car。我首先使用该fitdistr函数估算了形状和比例参数。 > fitdistr(Data$Duration, "weibull") shape scale 3.783365e-01 5.273310e+03 (6.657644e-03) (3.396456e+02) 然后,我这样做: qqPlot(LB$Duration, distribution="weibull", shape=3.783365e-01, scale=5.273310e+03) 编辑2: 使用对数正态QQplot更新。 这是我的数据: c(1528L, 285L, 87138L, 302L, 115L, 416L, 8940L, 19438L, 165820L, 540L, 1653L, 1527L, 974L, 12999L, 226L, 190L, 306L, 189L, 138542L, 3049L, 129067L, 21806L, 456L, 22745L, 198L, …

3
此发行版有名称吗?
今天我想到,分布 可以看作是高斯和拉普拉斯之间的折衷分布,对于和这样的分布有名称吗?它是否有一个标准化常数的表达式?结石树桩我,因为我不知道如何甚至开始求解在积分 1 = c ^ ·&∫ ∞ - ∞ EXP ( - | X - μ | pX∈[R ,p∈[1,2]β>0Çf(x)∝exp( - |x−μ|pβ)f(x)∝exp⁡(-|X-μ|pβ) f(x)\propto\exp\left(-\frac{|x-\mu|^p}{\beta}\right) x∈R,p∈[1,2]x∈R,p∈[1,2]x\in\mathbb{R}, p\in[1,2]β>0.β>0.\beta>0.CCC1=C⋅∫∞−∞exp(−|x−μ|pβ)dx1=C⋅∫−∞∞exp⁡(−|x−μ|pβ)dX 1=C\cdot \int_{-\infty}^\infty \exp\left(-\frac{|x-\mu|^p}{\beta}\right) dx

9
如何确定ping响应时间上该数据代表哪种分布?
我已经采样了一个真实的过程,即网络ping时间。“往返时间”以毫秒为单位。结果绘制在直方图中: Ping时间具有最小值,但尾巴较长。 我想知道这是什么统计分布,以及如何估算其参数。 即使该分布不是正态分布,我仍然可以显示我要实现的目标。 正态分布使用以下功能: 有两个参数 μ(平均值) σ 2 (方差) 参数估计 估算两个参数的公式为: 将这些公式应用于Excel中的数据,我得到: μ= 10.9558(平均值) σ 2 = 67.4578(方差) 使用这些参数,我可以在采样数据上方绘制“ 正态 ”分布: 显然,这不是正态分布。正态分布具有无限的顶部和底部尾部,并且是对称的。这种分布是不对称的。 我将采用什么原则?我将采用哪种流程图来确定这是哪种分布? 假设分布没有负尾巴,而有长正尾巴:什么分布与之匹配? 是否有与您所观察到的分布相匹配的参考? 紧追其后,此分布的公式是什么,以及估算其参数的公式是什么? 我想要获得分布,以便获得“平均”值以及“价差”: 我实际上是在软件中绘制直方图,我想覆盖理论分布: 注意:从math.stackexchange.com交叉发布 更新:160,000个样本 一个月又一个月,以及不计其数的抽样会议,都给出了相同的分布。有必须是一个数学表达式。 哈维建议将数据放在对数刻度上。这是对数刻度上的概率密度: 标签:抽样,统计,参数估计,正态分布 这不是答案,而是问题的附录。这是分配桶。我认为,喜欢冒险的人可能希望将其粘贴到Excel(或您知道的任何程序)中,并可以发现其分布。 值已标准化 Time Value 53.5 1.86885613545469E-5 54.5 0.00396197500716395 55.5 0.0299702228922418 56.5 0.0506460012708222 57.5 0.0625879919763777 58.5 0.069683415770654 …

1
指数和伽马之间的分布的名称?
密度F(š )α 小号s + αË− 秒,s > 0f(s)∝ss+αe−s,s>0f(s)\propto \frac{s}{s+\alpha}e^{-s},\quad s > 0,其中α ≥ 0α≥0\alpha \ge 0是一个参数,生命指数(之间α = 0α=0\alpha=0)和Γ (2 ,1 )Γ(2,1)\Gamma(2,1)(α → ∞α→∞\alpha \to \infty)分布。只是好奇这是否恰好是更广泛的发行系列的一个例子?我不这样认为。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.