Questions tagged «lognormal»

对数正态分布是对数具有正态分布的随机变量的分布。

3
具有对数转换响应的线性模型与带对数链接的广义线性模型
在这篇题为“适用于医学数据的广义线性模型之间的选择”的论文中,作者写道: 在广义线性模型中,均值是通过链接函数转换的,而不是转换响应本身的。两种转换方法可能导致完全不同的结果。例如, 对数转换后的响应的平均值与均值响应的对数不同。通常,前者不能轻易转化为平均反应。因此,转换均值通常可以更容易地解释结果,特别是在均值参数与测量响应保持相同范围的情况下。 他们似乎建议使用带有对数链接的广义线性模型(GLM)代替具有对数转换响应的线性模型(LM)。我不了解这种方法的优势,对我来说似乎很不寻常。 我的响应变量看起来呈对数正态分布。无论采用哪种方法,在系数及其标准误差方面,我都得到类似的结果。 不过我在想:如果一个变量具有对数正态分布,不是平均的对数变换变量最好在日志的平均未转换的变量,作为均值是正态分布的自然总结和日志-transformed变量是正态分布的,而变量本身不是吗?


2
伽玛与对数正态分布
我有一个实验观察到的分布,看起来与gamma或对数正态分布非常相似。我已经读到对数正态分布是随机变量的最大熵概率分布,其ln (X )的均值和方差是固定的。伽马分布是否具有任何类似的性质?XXXln(X)ln⁡(X)\ln(X)

2
对数正态分布的矩估计量的偏差
我正在做一些数值实验,包括对对数正态分布进行采样,并尝试通过两种方法估算矩:ë [ X Ñ ]X∼LN(μ,σ)X∼LN(μ,σ)X\sim\mathcal{LN}(\mu, \sigma)E[Xn]E[Xn]\mathbb{E}[X^n] 看的样本均值XnXnX^n 通过使用的样本均值估算和,然后使用对数正态分布的事实,我们有。σ 2日志(X ),登录2(X )é [ X Ñ ] = EXP (Ñ μ + (Ñ σ )2 / 2 )μμ\muσ2σ2\sigma^2log(X),log2(X)log⁡(X),log2⁡(X)\log(X), \log^2(X)E[Xn]=exp(nμ+(nσ)2/2)E[Xn]=exp⁡(nμ+(nσ)2/2)\mathbb{E}[X^n]=\exp(n \mu + (n \sigma)^2/2) 问题是: 从实验上我发现,当我固定样本数量并将增加某个因子T 时,第二种方法的性能要比第一种更好。对此有一些简单的解释吗?μ,σ2μ,σ2\mu, \sigma^2 我附上一个图,其中x轴为T,而y轴为的值,比较的真实值(橙色线),到估算值。方法1-蓝点,方法2-绿点。y轴为对数刻度E[X2]E[X2]\mathbb{E}[X^2]E[X2]=exp(2μ+2σ2)E[X2]=exp⁡(2μ+2σ2)\mathbb{E}[X^2] = \exp(2 \mu + 2 \sigma^2) 编辑: 下面是一个最小的Mathematica代码,可以产生一个T的结果,并输出: ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample] (* Define variables *) n=2; …

2
两个iid对数正态随机变量的差
令和为2个iidrv,其中。我想知道的分布。X 2日志(X 1),日志(X 2)〜Ñ (μ ,σ )X 1 - X 2X1X1X_1X2X2X_2log(X1),log(X2)∼N(μ,σ)log⁡(X1),log⁡(X2)∼N(μ,σ)\log(X_1),\log(X_2) \sim N(\mu,\sigma)X1−X2X1−X2X_1 - X_2 我所能做的最好是将二者的泰勒级数取整,得出的差值是两个法线rv和两个卡方rv的差之和,以及其余各项之间的差。是否有更直接的方法来获取2个iid对数正态rv之间的差异的分布?

4
解释对数正态分布和幂律分布(网络度分布)之间的差异
首先,我不是统计学家。但是,我一直在为博士做统计网络分析。 作为网络分析的一部分,我绘制了网络度的互补累积分布函数(CCDF)。我发现,与常规网络分布(例如WWW)不同,该分布最适合对数正态分布。我确实尝试根据幂定律进行拟合,并使用Clauset等人的Matlab脚本,发现曲线的尾部遵循带有截止值的幂定律。 虚线表示幂律拟合。紫色线表示对数正态拟合。绿线代表指数拟合。 我努力理解的是什么意思?我已经读过纽曼(Newman)撰写的这篇论文,该论文略微涉及了这个话题:http : //arxiv.org/abs/cond-mat/0412004 以下是我的疯狂猜测: 如果度数分布遵循幂律分布,则我理解这意味着链路和网络度的分布中存在线性优先依附关系(富变得更富效应或Yules过程)。 我说的对数正态分布是否正确,是在曲线的开始处存在次线性的优先连接,而在尾部可以由幂定律拟合的地方,其线性变得更好? 同样,由于对数正态分布是在随机变量(例如X)的对数呈正态分布时发生的,这是否意味着在对数正态分布中,X的较小值较大,而X的较大值较小。遵循幂律分布的随机变量将具有什么? 更重要的是,关于网络度分布,对数正态优先附件是否仍暗示无规模网络?我的直觉告诉我,由于曲线的尾部可以通过幂定律进行拟合,因此仍然可以得出该网络具有无标度特征的结论。


4
到底是什么时刻?它们是如何衍生的?
通常,我们通过“使总体矩等于其样本对等体”来介绍矩估计器的方法,直到我们估算出总体的所有参数为止。这样,在正态分布的情况下,我们只需要第一刻和第二刻,因为它们可以完全描述这种分布。 Ë(X)= μ⟹∑ñ我= 1X一世/ n= X¯Ë(X)=μ⟹∑一世=1个ñX一世/ñ=X¯E(X) = \mu \implies \sum_{i=1}^n X_i/n = \bar{X} Ë(X2)= μ2+ σ2⟹∑ñ我= 1X2一世/ nË(X2)=μ2+σ2⟹∑一世=1个ñX一世2/ñE(X^2) = \mu^2 + \sigma^2 \implies \sum_{i=1}^n X_i^2/n 从理论上讲,我们最多可以将额外时刻计算为:ññn Ë(X[R)⟹∑ñ我= 1X[R一世/ nË(X[R)⟹∑一世=1个ñX一世[R/ñE(X^r) \implies \sum_{i=1}^nX_i^r /n 我该如何为真正的时刻建立直觉?我知道它们作为一个概念存在于物理学和数学中,但是我发现它们都不直接适用,特别是因为我不知道如何将抽象概念从质量概念扩展到数据点。该术语似乎在统计学中以特定方式使用,这与其他学科中的用法不同。 我的数据的什么特征决定了总共有多少()个力矩?[R[Rr


3
如何计算对数正态数据集平均值的置信区间?
我在很多地方都听说过/可以通过获取每个样本的对数来将数据集转换为正态分布的东西,计算转换后的数据的置信区间,并使用逆运算将其转换回(例如,将分别提高10到下限和上限的幂)。log10log10\log_{10} 但是,我对此方法有点怀疑,仅仅是因为它不适用于平均值:10mean(log10(X))≠mean(X)10mean⁡(log10⁡(X))≠mean⁡(X)10^{\operatorname{mean}(\log_{10}(X))} \ne \operatorname{mean}(X) 正确的方法是什么?如果它对均值本身不起作用,那么如何在均值的置信区间内起作用?

2
日志转换是否是对非正常数据进行t测试的有效技术?
在审查一篇论文时,作者指出:“在进行t检验以满足正态性的前提假设之前,使用自然对数对表现出偏态分布的连续结果变量进行了转换。” 这是分析非正态数据的可接受方法,尤其是在基础分布不一定是对数正态的情况下吗? 这可能是一个非常愚蠢的问题,但我之前从未见过。

5
如何在R中的glm族参数中指定对数正态分布?
一个简单的问题:如何在R中的GLM系列参数中指定对数正态分布?我找不到如何实现的目标。为什么对数正态(或指数)不是family参数中的选项? 我读到R存档中的某个地方,只需指定GLM中设置为高斯的族的对数链接,即可指定对数正态。但是,这是无稽之谈,因为这将适合非线性回归并且R开始要求起始值。 有人知道如何为GLM设置对数正态(或指数)分布吗?

1
相同时刻的分布是否相同
以下内容与此处和此处的以前的帖子类似,但有所不同 给定两个允许所有阶次矩的分布,如果两个分布的所有矩都相同,那么它们是否是相同的分布ae? 给定两个分配矩生成函数的分布,如果它们具有相同的矩,它们的矩生成函数是否相同?

1
对数正态随机变量的相关性
给定和具有相关系数正常随机变量,我如何找到以下对数正态随机变量和之间的相关性?X 2 ρ ý 1 ÿ 2X1X1X_1X2X2X_2ρρ\rhoY1Y1Y_1Y2Y2Y_2 Y1=a1exp(μ1T+T−−√X1)Y1=a1exp⁡(μ1T+TX1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}X_1) Y2=a2exp(μ2T+T−−√X2)Y2=a2exp⁡(μ2T+TX2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}X_2) 现在,如果X1=σ1Z1X1=σ1Z1X_1 = \sigma_1 Z_1和X2=σ1Z2X2=σ1Z2X_2 = \sigma_1 Z_2,其中Z1Z1Z_1和Z2Z2Z_2是标准法线,则从线性变换属性中,我们得到: Y1=a1exp(μ1T+T−−√σ1Z1)Y1=a1exp⁡(μ1T+Tσ1Z1)Y_1 = a_1 \exp(\mu_1 T + \sqrt{T}\sigma_1 Z_1) Y2=a2exp(μ2T+T−−√σ2(ρZ1+1−ρ2−−−−−√Z2)Y2=a2exp⁡(μ2T+Tσ2(ρZ1+1−ρ2Z2)Y_2 = a_2 \exp(\mu_2 T + \sqrt{T}\sigma_2 (\rho Z_1 + \sqrt{1-\rho^2}Z_2) 现在,如何从此处计算Y1Y1Y_1和Y_2之间的相关性Y2Y2Y_2?

1
中位数无偏估计量是否会使平均绝对偏差最小化?
这是一个后续的也是不同的问题,我以前的一个。 我在Wikipedia上读到,“ 拉普拉斯(Laplace)观察到,中值无偏估计器使绝对偏差损失函数的风险最小化。” 但是,我的蒙特卡洛模拟结果不支持该论点。 我假定从对数正常人群中,样品,其中,μ和σ是对数平均和对数标准差,β = EXP (μ )= 50X1,X2,...,XN∼LN(μ,σ2)X1,X2,...,XN∼LN(μ,σ2)X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2)μμ\muσσ\sigmaβ=exp(μ)=50β=exp⁡(μ)=50\beta = \exp(\mu)=50 几何平均估计量是总体中值的中值无偏估计量,exp(μ)exp⁡(μ)\exp(\mu) ,其中,μ和σ是对数平均和对数标准差,μ和 σ是极大似然估计μ和σ。β^GM=exp(μ^)=exp(∑log(Xi)N)∼LN(μ,σ2/N)β^GM=exp⁡(μ^)=exp⁡(∑log⁡(Xi)N)∼LN(μ,σ2/N)\hat{\beta}_{\mbox{GM}}= \exp(\hat{\mu})= \exp{(\sum\frac{\log(X_i)}{N})} \sim \mbox{LN}(\mu,\sigma^2/N)μμ\muσσ\sigmaμ^μ^\hat\muσ^σ^\hat\sigmaμμ\muσσ\sigma 校正后的几何平均估计量是总体中位数的均值无偏估计量。 β^CG=exp(μ^−σ^2/2N)β^CG=exp⁡(μ^−σ^2/2N)\hat{\beta}_{\mbox{CG}}= \exp(\hat{\mu}-\hat\sigma^2/2N) 我从LN (log (50 ),√)重复生成大小为5的样本。复制号是10,000。对于几何均值估计器,我得到的平均绝对偏差为25.14,对于校正后的几何均值,则为22.92。为什么?(log(50),log(1+22)−−−−−−−−−√)(log⁡(50),log⁡(1+22))(\log(50),\sqrt{\log(1+2^2)}) 顺便说一句,几何平均值的估计中值绝对偏差为18.18,校正几何平均值估计器为18.58。 我使用的R脚本在这里: #```{r stackexchange} #' Calculate the geomean to estimate the lognormal median. #' #' This function Calculate the geomean to estimate …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.