Questions tagged «distributions»

分布是概率或频率的数学描述。


3
分配家庭的定义?
分布族对统计的定义是否不同于其他学科? 通常,曲线族是一组曲线,每条曲线由一个函数或参数化给定,其中一个或多个参数发生变化。这样的族例如用于表征电子部件。 为了进行统计,根据形状来源的一个族是改变形状参数的结果。那么,我们如何才能理解伽玛分布具有形状和比例参数,并且只有广义伽玛分布才具有位置参数?这是否会使家庭成为改变位置参数的结果?根据@whuber一个家庭的意义是隐式A中的家庭的“参数化”是从ℝ的一个子集的连续映射Ñ,以其平常的拓扑结构,为分布的空间,其图像是家庭。n^n 用简单的语言来说,统计分布族是什么? 关于同一个家庭的分布的统计属性之间的关系的一个问题已经为另一个问题引起了很大的争议,因此似乎值得探讨其含义。 不一定是一个简单的问题,是因为它在指数族这一短语中的使用而产生的,它与曲线族无关,但与通过重新参数化(不仅是参数)改变分布的PDF的形式有关。 ,还可以替换独立随机变量的功能。

1
Jeffreys先验多个参数
在某些情况下,前一个完整的多维模型的杰弗里被generaly视为不足,这是例如的情况下: (其中, ε 〜Ñ (0 ,σ 2),具有 μ和 σ未知),其中事先下面是首选(与全杰弗瑞斯现有 π (μ ,σ )α σ - 2): p (μ ,σ )= π (μ )·&π (σ )α σ - 1yi=μ+εi,yi=μ+εi, y_i=\mu + \varepsilon_i \, , ε∼N(0,σ2)ε∼N(0,σ2)\varepsilon \sim N(0,\sigma^2)μμ\muσσ\sigmaπ(μ,σ)∝σ−2π(μ,σ)∝σ−2\pi(\mu,\sigma)\propto \sigma^{-2} 其中 π (μ )是保持 σ固定时(以及类似的 p (σ ))获得的Jeffreys先验值。当在单独的组中处理 σ和 μ时,该先验与参考先验重合。p(μ,σ)=π(μ)⋅π(σ)∝σ−1,p(μ,σ)=π(μ)⋅π(σ)∝σ−1, p(\mu,\sigma) = \pi(\mu) …

2
从von Mises-Fisher发行版的Python中采样吗?
我正在寻找一种简单的方法来从Python中的多元von Mises-Fisher分布中采样。我在scipy和numpy模块中查看了stats模块,但只发现了单变量von Mises分布。有没有可用的代码?我还没找到。 显然,Wood(1994)根据该链接设计了一种从vMF分布进行采样的算法,但我找不到该论文。 -对于精度,我对在文献中很难找到的算法很感兴趣(大多数论文都集中在)。据我所知,开创性的文章(Wood,1994年)无法免费找到。小号2小号2S^2

2
正方变量和卡方变量平方的卷积分布?
最近在分析数据时出现了以下问题。如果随机变量X遵循正态分布且Y遵循χ2nχn2\chi^2_n分布(其中n自由度),如何是Z=X2+Y2Z=X2+Y2Z = X^2 + Y^2分布?到现在为止我想出的PDF Y2Y2Y^2: ψ2n(x)====∂F(x−−√)∂x(∫x√0tn/2−1⋅e−t/22n/2Γ(n/2)dt)′x12n/2Γ(n/2)⋅(x−−√)n/2−1⋅e−x√/2⋅(x−−√)′x12n/2−1Γ(n/2)⋅xn/4−1⋅e−x√/2ψn2(x)=∂F(x)∂x=(∫0xtn/2−1⋅e−t/22n/2Γ(n/2)dt)x′=12n/2Γ(n/2)⋅(x)n/2−1⋅e−x/2⋅(x)x′=12n/2−1Γ(n/2)⋅xn/4−1⋅e−x/2\begin{eqnarray} \psi^2_n(x) &=& \frac{\partial F(\sqrt{x})}{\partial x} \\ &=& \left( \int_0^{\sqrt{x}} \frac{t^{n/2-1}\cdot e^{-t/2}}{2^{n/2}\Gamma(n/2)} \mathrm{d}t \right)^\prime_x \\ &=& \frac{1}{2^{n/2}\Gamma(n/2)} \cdot \left( \sqrt{x} \right)^{n/2-1} \cdot e^{-\sqrt{x}/2} \cdot \left( \sqrt{x} \right)^\prime_x \\ &=& \frac{1}{2^{n/2-1}\Gamma(n/2)} \cdot x^{n/4-1} \cdot e^{-\sqrt{x}/2} \end{eqnarray} 以及一些简化的卷积积分(具有PDF χ 2 米,其中m自由度):X2X2X^2χ2mχm2\chi^2_m Kmn(t):===(χ2m∗ψ2n)(t)∫t0χ2m(x)⋅ψ2n(t−x)dx(2(n+m)2+1Γ(m2)Γ(n2))−1⋅∫t0(t−x)n4−1⋅xm2−1⋅exp(−(t−x−−−−√+x)/2)dxKmn(t):=(χm2∗ψn2)(t)=∫0tχm2(x)⋅ψn2(t−x)dx=(2(n+m)2+1Γ(m2)Γ(n2))−1⋅∫0t(t−x)n4−1⋅xm2−1⋅exp⁡(−(t−x+x)/2)dx\begin{eqnarray} K_{mn}(t) &:=& ( \chi^2_m …

5
如何使Weibull分布适合包含零的输入数据?
我正在尝试重现由退休研究员传承的现有预测算法。第一步是将一些观察到的数据拟合为威布尔分布,以获得将用于预测未来值的形状和比例。我正在用R做到这一点。这是我的代码示例: x<-c(23,19,37,38,40,36,172,48,113,90,54,104,90,54,157,51,77,78,144,34,29,45,16,15,37,218,170,44,121) f<-fitdistr(x, 'weibull') 除非输入数组中有任何零,否则它将完全失败,这可以正常工作。SAS中也会发生同样的事情。据我了解,这是因为计算Weibull分布的步骤之一是采用自然对数,该自然对数未定义为0。是否有合理的方法来解决此问题? 到目前为止,我发现最好的方法是在所有输入值中加1,拟合曲线,然后从预测值中减去1(“上移”曲线,然后下移1)。这非常适合先前预测的数据,但是这样做似乎是错误的方法。 编辑:输入数组中的值是多年来观察到的真实数据(某物的出现次数)。因此,在某些年份中发生的次数为零。不管这是不是最好的方法(我同意可能不是),原始算法作者声称已经使用了Weibull分布,并且我不得不尝试复制他们的过程。

3
截短的分布是什么意思?
在一篇有关动力系统常微分方程模型敏感性分析的研究文章中,作者提供了模型参数的分布,即正态分布(mean = 1e-4,std = 3e-5)截断了[0.5e -4 1.5e-4]。然后,他使用截断后的分布中的样本进行模型仿真。截短的分布并从该截短的分布中采样是什么意思? 我可以想出两种方法: 从正态分布采样,但是在仿真之前忽略所有落在指定范围之外的随机值。 以某种方式获得特殊的“截断正态”分布并从中获取样本。 这些有效和等效的方法吗? 我认为,在第一种情况下,如果要绘制样本的实验cdf / pdf,则它看起来不会像正态分布,因为曲线不会延伸到。±∞±∞\pm\infty

3
如何按比例绘制小提琴图以进行比较?
我正在尝试绘制小提琴图,并想知道是否存在公认的最佳实践,可以在各个组之间进行缩放。这是我使用R mtcars数据集尝试过的三个选项(1973年的Motor Trend Cars,在此处找到)。 等宽 似乎是原始纸张 *和R的vioplot作用(示例)。适合比较形状。 均等面积 由于每个图都是概率图,因此感觉不错,因此在某个坐标空间中每个图的面积应等于1.0。适用于比较每个组中的密度,但如果将图重叠,则似乎更合适。 加权面积 面积相等,但按观察次数加权。6缸变得相对稀薄,因为这些汽车较少。适用于比较各组的密度。 *小提琴图:箱形图-密度踪迹协同效应(DOI:10.2307 / 2685478)


2
根据任意分布计算p值
我希望这不是一个愚蠢的问题。假设我有一些任意的连续分布。我也有一个统计信息,我想使用此任意分布来获取此统计信息的p值。 我意识到,只要您的发行版适合内置发行版之一,就可以很容易地在R中执行此操作,就像正常情况一样。但是,是否有一种简单的方法可以对任何给定的分布执行此操作,而无需进行这种假设?

2
如果连接数不能为负,那么连接数如何为高斯呢?
我正在分析社交网络(不是虚拟网络),并且观察到人与人之间的联系。如果一个人会选择另一个人随机连接,则一组人中的连接数将以正态分布-至少根据我当前正在阅读的书。 我们怎么知道分布是高斯分布(正态分布)?有其它分布例如泊松,大米,瑞利等在理论高斯分布的问题是,该值从去−∞−∞-\infty到+∞+∞+\infty(虽然概率朝向零去)和连接的数量不能为负。 没有人知道在每个人独立(随机)地搭接另一个人的情况下可以预期的分布吗?

2
标准差的三角运算
正常随机变量的加法,减法,乘法和除法得到了很好的定义,但是三角运算又如何呢? 例如,让我们假设我正在尝试找到两个楔形的角度(建模为直角三角形),两个导管的尺寸分别为d1d1d_1和d2d2d_2,均被描述为正态分布。 直觉和模拟都告诉我,结果分布是正态的,平均。但是,有一种方法可以计算出角度的分布吗?我在哪里找到答案的参考?arctan(mean(d1)mean(d2))arctan⁡(mean(d1)mean(d2))\arctan\left(\frac{\text{mean}(d_1)}{\text{mean}(d_2)}\right) (在某种程度上,我正在研究机械零件的统计公差。我的第一个冲动是简单地模拟整个过程,检查最终结果是否合理正常,然后计算标准偏差。但是我想知道如果可以使用更整洁的分析方法。)

4
关于KL分歧有疑问吗?
我正在用KL散度比较两个分布,这给我返回了一个非标准化数字,根据我对这一度量的了解,该数字是将一种假设转换为另一种假设所需的信息量。我有两个问题: a)有没有一种方法可以量化KL散度,使其具有更有意义的解释,例如像效应大小或R ^ 2?任何形式的标准化? b)在R中,使用KLdiv(flexmix软件包)时,可以设置“ esp”值(标准esp = 1e-4),该值将所有小于esp的点设置为某个标准,以提供数值稳定性。我一直在使用不同的esp值,并且对于我的数据集,我选择的数字越小,KL散度就越来越大。到底是怎么回事?我希望esp越小,结果应该越可靠,因为它们会让更多的“真实值”成为统计数据的一部分。没有?我必须更改esp,因为否则它不会计算统计信息,而只会在结果表中显示为NA ...

1
插入符glmnet与cv.glmnet
在glmnet内部caret使用搜索最佳lambda和cv.glmnet执行相同任务的比较中似乎有很多困惑。 提出了许多问题,例如: 分类模型train.glmnet与cv.glmnet? 在插入符号中使用glmnet的正确方法是什么? 使用`caret`交叉验证`glmnet` 但是没有给出答案,这可能是由于问题的可重复性。在第一个问题之后,我给出了一个非常相似的示例,但确实存在相同的问题:为什么估计的lambda如此不同? library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = 0.001),standardize=FALSE) …

1
Kolmogorov–Smirnov检验与t检验
我在理解2个样本KS检验的解释以及与2组之间的常规t检验有何不同方面遇到一些困难。 可以说我有男性和女性在做一些任务,而我从这项任务中收集了一些分数。我的最终目标是确定男性和女性在这项任务上的表现是否不同 因此,我可以做的一件事就是在两组之间进行测试。我可以做的另一件事是计算男性和女性的ECDF,绘制它们,然后进行2个样本KS测试。我会得到这样的东西: KS测试 KS检验的原假设是2组连续得分分布来自同一人群 进行KS测试时,我得到:D = 0.18888,p值= 0.04742 首先,我想检查一下我对结果的解释是否正确。在这里,我将拒绝原假设,并说男性和女性得分分布来自不同的人群。换句话说,男性和女性得分的分布彼此不同。 更具体地说,男性在此任务上获得较低分数的可能性更高,这就是我从情节中得出的两种性别之间的差异 T检验 现在在测试中,将在得分变量上测试男性和女性均值之间的差异。 让我们想象一下在此任务中男性表现比女性差的情况。在这种情况下,男性得分的分布将以低均值为中心,而女性得分的分布将以高均值为中心。这种情况与上面的情节是一致的,因为男性获得较低分数的可能性更高。 如果t检验显着,我可以得出结论,女性平均得分明显高于男性。或从人口角度而言,女性分数是从平均数高于男性人口的人口中得出的,这听起来与堪萨斯州得出的结论是来自不同人口的结论非常相似。 有什么不同? 因此,我在KS和t测试用例中得出的结论是相同的。男性相对于女性表现较差。那么,使用一种测试优于另一种测试有什么好处?使用KS测试是否可以获得任何新知识? 我认为,男性的分布以低均值为中心,女性的分布以高均值为中心是导致显着t检验的原因。但是,基于同样的事实,男性得分较低值的可能性更高,这将使该图看起来像上面,并进行有效的KS检验。因此,两种检验的结果都具有相同的根本原因,但也许有人可能会说,KS检验不仅考虑了分布的均值,而且还考虑了分布的形状,但是有可能解析出原因仅从测试结果中得出哪些重要的KS测试? 那么在测试中运行KS测试有什么价值呢?并假设我可以满足这个问题的t检验的假设

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.