Questions tagged «normal-distribution»

正态分布或高斯分布的密度函数为对称的钟形曲线。它是统计中最重要的分布之一。使用[normality]标签询问有关正常性测试的信息。

2
估计具有独立变量的标准偏差缩放的速率
我有在我以正态分布变量的测量实验,YYY Y∼N(μ,σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) 但是,先前的实验提供了一些证据,表明标准偏差是自变量的仿射函数,即Xσσ\sigmaXXX σ=a|X|+bσ=a|X|+b\sigma = a|X| + b Y∼N(μ,a|X|+b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) 我想估计参数和通过取样在的多个值。此外,由于实验的限制,我只能采集有限数量(大约30-40)的样本,并且出于与实验无关的原因,我更愿意以X的多个值进行采样。给定这些约束,可以使用哪些方法来估计a和b?b Y XaaabbbYYYXXXYYYXXXaaabbb 实验说明 如果您对我为什么要问上述问题感兴趣,这是额外的信息。我的实验测量听觉和视觉空间知觉。我有一个实验设置,其中我可以显示来自不同位置X的听觉或视觉目标XXX,并且被摄对象指示目标Y的感知位置YYY。随着偏心率的增加(即| X |增大|X||X||X|),视觉*和听觉都变得不太精确,我在上面将其建模为σσ\sigma。最终,我想估计aaa和bbb对于视觉和听觉来说,所以我知道在空间中一系列位置上每种感觉的精度。这些估计值将用于预测同时显示的视觉和听觉目标的相对权重(类似于此处提出的多感官融合理论:http://www.ncbi.nlm.nih.gov/pubmed/12868643)。 *我知道,当比较中央凹与中央凹空间时,该模型的视觉不准确,但是我的测量仅限于中央凹空间,这是一个不错的近似值。


1
卡方因变量的比例分布
假设,其中是独立的。X 我〜Ñ (0 ,σ 2)X=X1+X2+⋯+XnX=X1+X2+⋯+Xn X = X_1 + X_2+\cdots+ X_n Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim N(0,\sigma^2) 我的问题是,什么分布 Z=X2X21+X22+⋯+X2nZ=X2X12+X22+⋯+Xn2 Z = \frac{X^2}{X_1^2 + X_2^2 + \cdots + X_n^2} 跟随?从这里我知道两个表示为卡方随机变量的比率遵循Beta分布。我认为这假设和之间具有独立性。但是在我的情况下,的分母包含平方的成分。 WYZXWW+YWW+Y\frac{W}{W + Y}WWWYYYZZZXXX 我认为也必须遵循Beta分布的变化,但是我不确定。如果这个假设是正确的,我不知道如何证明它。ZZZ

1
采样分布的半径为2D正态分布
均值和协方差矩阵的二元正态分布可以用半径和角度极坐标重写。我的问题是:给定样本协方差矩阵,的采样分布是什么,即从点到估计中心的距离是多少?Σ [R θ - [R X ˉ X小号μμ\muΣΣ\Sigmarrrθθ\thetar^r^\hat{r}xxxx¯x¯\bar{x}SSS 背景:从点到均值的真实距离遵循Hoyt分布。与特征值的,和,它的形状参数是,其缩放参数为。已知累积分布函数是两个Marcum Q函数之间的对称差。rrrμ λ 1,λ 2Σ λ 1 > λ 2 q = 1xxxμμ\muλ1,λ2λ1,λ2\lambda_{1}, \lambda_{2}ΣΣ\Sigmaλ1>λ2λ1>λ2\lambda_{1} > \lambda_{2} ω=λ1+λ2q=1(λ1+λ2)/λ2)−1√q=1(λ1+λ2)/λ2)−1q=\frac{1}{\sqrt{(\lambda_{1}+\lambda_{2})/\lambda_{2})-1}}ω=λ1+λ2ω=λ1+λ2\omega = \lambda_{1} + \lambda_{2} 仿真表明,估计堵和的和到真正的CDF适用于大样本,但不适用于小样本。下图显示了200次的结果小号μΣx¯x¯\bar{x}SSSμμ\muΣΣ\Sigma 为给定(轴),(行)和分位数(列)的每种组合模拟20个2D法线向量X ωqqqxxxωω\omega 对于每个样本,计算观察到的半径至的给定分位数 ˉ Xr^r^\hat{r}x¯x¯\bar{x} 对于每个样本,在插入样本估计和之后,根据理论Hoyt(二维法线)cdf和理论Rayleigh cdf计算分位数。小号x¯x¯\bar{x}SSS 当接近1(分布变为圆形)时,估计的Hoyt分位数接近不受影响的估计的Rayleigh分位数。随着增长,经验分位数与估计分位数之间的差异会增加,特别是在分布的尾部。q ωqqqqqqωω\omega

2
估计中心删失正态样本的方差
我已经正态分布从中我得到小样本(进程ñ通常为10-30),我想用估计方差。但是,这些样本之间的距离常常如此之近,以至于我们无法测量中心附近的各个点。 我有一个模糊的理解,我们应该能够使用有序样本构建一个有效的估算器:例如,如果我知道样本包含20个点,并且10个点过于靠近中心而无法单独进行测量,但是我有离散的测量值尾巴上是否有5个,是否有一种标准/公式化的方法来估算最佳利用此类样本的过程差异? (请注意,我认为我不能加权中心平均值。例如,可能有7个样本紧密聚类,而另外3个样本不对称地偏向一侧,但足够接近,如果没有更繁琐的单次抽样,我们就无法断定) 如果答案很复杂,那么我应该研究的任何技巧都将不胜感激。例如,这是一个订单统计问题吗?可能会有一个公式化的答案,或者这是一个计算问题? 更新的详细信息:该应用程序是对射击目标的分析。单个基础样本是单个镜头对目标的影响点(x,y)。基本过程具有对称的双变量正态分布,但轴之间没有相关性,因此我们能够将{ x }和{ y }样本视为来自相同正态分布的独立绘制。(我们也可以说底层过程是瑞利分布的,但是我们无法测量样本瑞利变量,因为我们无法确定过程的“真实”中心的坐标,对于小n来说,这可以是显着的远离样品中心(,))。X¯x¯\bar{x}ÿ¯y¯\bar{y} 给我们一个目标和射入其中的镜头数量。问题在于,对于n >> 3支精确的枪,通常会发射出一个“参差不齐的孔”,周围是不同的射击。我们可以观察到孔的x-和y-宽度,但是我们不知道未区分的镜头在孔中的哪个位置受到了影响。 以下是一些有问题的目标的示例: (当然,在理想情况下,我们会在每次拍摄后更改/切换目标,然后汇总样本进行分析。尽管有可能,但有很多原因通常是不切实际的。) 注释中经过WHuber澄清后的其他说明:子弹产生的目标孔直径均匀且已知。当射击不在任何“参差不齐的群”之外时,我们知道了射弹半径,因此我们可以测量精确的中心。在每个“参差不齐的组”中,我们可以识别出一定数量的外围“球”,并根据已知的射弹半径再次标记这些外部射击的精确中心。这是剩下的 “中心审查”的镜头,我们只知道影响地方的“破烂组”的内部(通常是-如果有必要,让我们假设-一个目标一个)。X一世xix_i 为了简化求解,我相信将其最简单地从法线简化为一组一维样本,其中心间隔为w > d,其中d为弹丸直径,包含c < n个 “被检举”样本。

1
高斯过程和Wishart分布的协方差矩阵
我正在阅读有关广义Wishart流程(GWP)的本文。本文使用平方指数协方差函数计算不同随机变量之间的协方差(遵循高斯过程),即。然后说该协方差矩阵遵循GWP。K(x,x′)=exp(−|(x−x′)|22l2)K(x,x′)=exp⁡(−|(x−x′)|22l2)K(x,x') = \exp\left(-\frac{|(x-x')|^2}{2l^2}\right) 我曾经认为从线性协方差函数()K(x,x′)=xTx′K(x,x′)=xTx′K(x,x') = x^Tx'计算出的协方差矩阵遵循具有适当参数的Wishart分布。 我的问题是,我们如何仍可以假设协方差服从具有平方指数协方差函数的Wishart分布?另外,一般来说,协方差函数产生Wishart分布协方差矩阵的必要条件是什么?

5
我可以对偏态正常数据进行假设检验吗?
我有一个数据收集,本来以为是正态分布的。然后我实际上查看了一下,意识到不是,主要是因为数据是歪斜的,并且我还进行了shapiro-wilks测试。 我仍然想使用统计方法对其进行分析,因此我想对偏态正态性进行假设检验。 所以我想知道是否有一种方法可以测试偏斜正态性,如果可能的话,还有一个库可以为我做测试。

3
如何从正态分布中找到样本标准偏差的标准偏差?
如果我错过了一些显而易见的事情,请原谅我。 我是一位物理学家,本质上是(直方图)分布,其中心是一个近似于正态分布的平均值。对我来说,重要的值是该高斯随机变量的标准偏差。我将如何尝试查找样本标准偏差上的误差?我感觉到它与原始直方图中每个bin上的错误有关。

3
抛硬币时应该使用二项式CDF还是普通CDF?
硬币需要进行公平性测试。翻转50次后,出现30个头。假设硬币是公平的,那么在50次翻转中至少获得30个正面的概率是多少? 我的老师说,解决这个问题的正确方法是 normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786 但是,我采用了这样的二项式累积分布函数 1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013 我相信满足二项式分布的标准:单个事件是独立的,只有两种可能的结果(正面对反面),问题的概率恒定(0.5),并且试验次数固定为50然而,显然,这两种方法给出的答案不同,并且模拟支持我的答案(至少运行了几次;很明显,我不能保证您会得到相同的结果)。 我的老师是否认为正态分布曲线也是解决此问题的有效方法是错误的(决不是说正态分布是正态分布,而是n * p和n *(1-p)都大于10),还是我误解了二项式分布?

1
理发师的难题
我的美发师史黛西(Stacey)总是笑着说,但经常因管理时间而受到压力。今天,斯泰西因我的任命而逾期未交,并且非常抱歉。在理发时,我想知道:她的标准约会应该持续多久?(如果可以暂时忽略客户对干净整数的偏爱)。 需要考虑的是某种“涟漪效应”,一个非常晚的客户可能导致一连串的延迟约会。实际上,理发师由于担心这些压力大的日子而直观地学会间隔越来越久。但是,必须要有一些统计天才才能实现最佳,优雅的解决方案。(如果我们稍微降低现实水平) 假设 a)剪发时间是正态分布的, b)只有一个理发师。 预约时间太长,显然会浪费美发师等待下一次约会的时间。让我们将此浪费的时间花费为每分钟$ 1。 但是,如果约会的时间不够长,下一位客户就会一直等待,这对喜欢客户的史黛西来说是每分钟3美元的沉重成本。 Stacey每天最多工作8个小时,并且有足够的需求来满足自己所能容纳的尽可能多的约会 平均剪发需要30分钟,而且要进行性病。10分钟的开发时间。(我们也假设男人的削减和女人的削减是相同的!) 编辑-有些人正确地指出,Stacey可以在他们指定的时间之前参加早期客户。这增加了另一层复杂性,但是如果我们将其视为一个非常现实的问题,则需要将其包括在内。让我们忘记我的90/10假设,并尝试一个可能接近现实的假设。 有些客户迟到,有些则早。客户的平均延迟时间为2分钟,标准差为2分钟(听起来与实际情况差不多吗?) 她的约会应该多长时间? @alexplanation对不起,我已经把您的目标发布了!我相信R读者会感谢您的回答。

2
在与威尔克斯定理的有限混合中找到高斯数?
假设我有一组独立的,均匀分布的单变量观测值以及关于x是如何产生的两个假设:xxxxxx : x是从均值和方差未知的单个高斯分布中得出的。H0H0H_0xxx : x是由两个均值,方差和混合系数未知的高斯混合而成的。HAHAH_Axxx 如果我理解正确,则这些是嵌套模型,因为如果将两个高斯的参数约束为相同或将两个高斯之一的混合系数约束为零,则可以用H A来描述表示的模型。。 H0H0H_0HAHAH_A 因此,看来您应该能够使用EM算法来估计的参数,然后使用Wilks定理来确定H A下数据的可能性是否明显大于H 0下。假设EM算法将在此处收敛到最大可能性,这是一个小小的信念飞跃,但这是我愿意做的。HAHAH_AHAHAH_AH0H0H_0 我在蒙特卡洛模拟中对此进行了尝试,假设比H 0(第二个高斯和混合参数的均值和方差)多3个自由度。当我从H 0模拟数据时,我得到的P值分布基本上是不均匀的,并且丰富了较小的P值。(如果EM不能收敛到真正的最大似然,则可以预期正好相反。)我对产生这种偏差的Wilks定理的应用有什么问题?HAHAH_AH0H0H_0H0H0H_0


4
如何生成具有给定标准偏差的近似正态分布的非对角项的随机相关矩阵?
我想生成一个随机相关矩阵,以使其非对角元素的分布看起来近似正态。我该怎么做? 动机是这样的。对于一组时间序列数据,相关分布通常看起来非常接近正态分布。我想生成许多“常规”相关矩阵来表示一般情况,并使用它们来计算风险数。ñnn 我知道一种方法,但由此产生的标准偏差(非对角元素的分布)太小了,无法达到我的目的:生成矩阵均匀或正常随机行,标准化行(减去均值,除以标准偏差),则样本相关矩阵具有非对角线正态分布[ 注释后更新:标准偏差为 ]。X 1ñnnXX\mathbf X〜ñ-1/21个n − 1X X⊤1n−1XX⊤\frac{1}{n-1}\mathbf X \mathbf X^\top〜ñ- 1 / 2∼n−1/2\sim n^{-1/2} 谁能建议一种更好的方法来控制标准偏差?


1
Iid随机变量之和的平方根的中心极限定理
出于对math.stackexchange的一个问题的兴趣,并进行了实证研究,我想知道以下有关iid随机变量之和的平方根的陈述。 假设是具有有限非零均值和方差 iid随机变量,并且。中心极限定理说随着增加。X1个,X2,… ,XñX1,X2,…,XnX_1, X_2, \ldots, X_nμμ\muσ2σ2\sigma^2ÿ= ∑我= 1ñX一世Y=∑i=1nXi\displaystyle Y=\sum_{i=1}^n X_iÑÿ- Ñ μñ σ2---√ →d ñ(0 ,1 )Y−nμnσ2 →d N(0,1)\displaystyle \dfrac{Y - n\mu}{\sqrt{n\sigma^2}} \ \xrightarrow{d}\ N(0,1)ñnn 如果,我也可以说类似随着增加?ž - √ž= | ÿ|---√Z=|Y|Z=\sqrt{|Y|}Ñž− n | μ | - σ24 | μ |--------√σ24 | μ |---√ →d ñ(0 ,1 )Z−n|μ|−σ24|μ|σ24|μ| →d N(0,1)\displaystyle \dfrac{Z …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.