Questions tagged «normal-distribution»

正态分布或高斯分布的密度函数为对称的钟形曲线。它是统计中最重要的分布之一。使用[normality]标签询问有关正常性测试的信息。

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
偏正态分布的参数估计
偏态正态的公式参数估计是什么?如果可以的话,通过MLE或Mom进行派生也将是很棒的。谢谢 编辑。 我有一组数据,可以通过绘图直观地看出这些数据的左侧偏斜。我想估算均值和方差,然后进行拟合优度检验(这就是为什么我需要参数估算值的原因)。我是否以为我只需要猜测偏斜(alpha)(也许做几次偏斜并测试哪种才是最好的?)就对了吗? 我想根据自己的理解来推导MLE,因为我对MLE较熟悉,所以更喜欢MLE。 我不确定是否有多个通用偏斜法线-我只是说一个负偏斜法线!如果可能的话,偏指数幂参数估计也将有所帮助!

2
两个独立正态随机变量的最大值(最小值)的分布是什么?
具体来说,假设和是正态随机变量(独立但不一定相同分布)。给定任何特定的,是否有一个很好的或类似概念的公式?我们是否知道\ max(X,Y)是正态分布的,也许是关于X和Y的均值和标准差的公式?我检查了平常的地方(维基百科,谷歌),但没有找到任何东西。XXXYYYaaaP(max(X,Y)≤x)P(max(X,Y)≤x)P(\max(X,Y)\leq x)max(X,Y)max(X,Y)\max(X,Y)XXXYYY


2
正态高斯向量的线性变换
我在证明以下陈述方面面临困难。它在Google上的研究论文中给出。我需要帮助证明这一说法! 令X=ASX=ASX= AS,其中AAA是正交矩阵,而SSS是高斯。在任何正交基础上具有相同分布的高斯的同位素行为SSS。 在S上应用A后,XXX高斯如何?AAASSS

2
给定的概率是多少?
假设XXX和YYY是均值μ=(μ1,μ2)μ=(μ1,μ2)\mu=(\mu_1,\mu_2)且协方差 Σ=[σ11σ12σ12σ22]Σ=[σ11σ12σ12σ22]\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}。\ Pr \ left(X &lt;Y | \ min \ left(X,Y \ right)\ right)的概率是Pr(X&lt;Y|min(X,Y))Pr(X&lt;Y|min(X,Y))\Pr\left(X<Y|\min\left(X,Y\right)\right)多少?

1
上UMVUE的存在和选择的估计的在人口
让是从绘制的随机样本人口其中。(X1,X2,⋯,Xn)(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)N(θ,θ2)N(θ,θ2)\mathcal N(\theta,\theta^2)θ∈Rθ∈R\theta\in\mathbb R 我正在寻找的UMVUE 。θθ\theta 联合密度为(X1,X2,⋯,Xn)(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n) fθ(x1,x2,⋯,xn)=∏i=1n1θ2π−−√exp[−12θ2(xi−θ)2]=1(θ2π−−√)nexp[−12θ2∑i=1n(xi−θ)2]=1(θ2π−−√)nexp[1θ∑i=1nxi−12θ2∑i=1nx2i−n2]=g(θ,T(x))h(x)∀(x1,⋯,xn)∈Rn,∀θ∈Rfθ(x1,x2,⋯,xn)=∏i=1n1θ2πexp⁡[−12θ2(xi−θ)2]=1(θ2π)nexp⁡[−12θ2∑i=1n(xi−θ)2]=1(θ2π)nexp⁡[1θ∑i=1nxi−12θ2∑i=1nxi2−n2]=g(θ,T(x))h(x)∀(x1,⋯,xn)∈Rn,∀θ∈R\begin{align} f_{\theta}(x_1,x_2,\cdots,x_n)&=\prod_{i=1}^n\frac{1}{\theta\sqrt{2\pi}}\exp\left[-\frac{1}{2\theta^2}(x_i-\theta)^2\right] \\&=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[-\frac{1}{2\theta^2}\sum_{i=1}^n(x_i-\theta)^2\right] \\&=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[\frac{1}{\theta}\sum_{i=1}^n x_i-\frac{1}{2\theta^2}\sum_{i=1}^nx_i^2-\frac{n}{2}\right] \\&=g(\theta,T(\mathbf x))h(\mathbf x)\qquad\forall\,(x_1,\cdots,x_n)\in\mathbb R^n\,,\forall\,\theta\in\mathbb R \end{align} ,其中和h(\ mathbf x)= 1。h(x)=1g(θ,T(x))=1(θ2π√)nexp[1θ∑ni=1xi−12θ2∑ni=1x2i−n2]g(θ,T(x))=1(θ2π)nexp⁡[1θ∑i=1nxi−12θ2∑i=1nxi2−n2]g(\theta, T(\mathbf x))=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[\frac{1}{\theta}\sum_{i=1}^n x_i-\frac{1}{2\theta^2}\sum_{i=1}^nx_i^2-\frac{n}{2}\right]h(x)=1h(x)=1h(\mathbf x)=1 在这里,ggg取决于θθ\theta和x1,⋯,xnx1,⋯,xnx_1,\cdots,x_n到T(x)=(∑ni=1xi,∑ni=1x2i)T(x)=(∑i=1nxi,∑i=1nxi2)T(\mathbf x)=\left(\sum_{i=1}^nx_i,\sum_{i=1}^nx_i^2\right)并且hhh独立于θθ\theta。因此,通过Fisher-Neyman分解定理,二维统计量T(X)=(∑ni=1Xi,∑ni=1X2i)T(X)=(∑i=1nXi,∑i=1nXi2)T(\mathbf X)=\left(\sum_{i=1}^nX_i,\sum_{i=1}^nX_i^2\right)足以满足θθ\theta。 但是,TTT不是一个完整的统计信息。这是因为Ëθ⎡⎣2 (∑我= 1ñX一世)2− (n + 1 )∑我= 1ñX2一世⎤⎦= 2 n (1 + n )θ2- (Ñ + 1 )2 Ñ θ2= 0∀θEθ[2(∑i=1nXi)2−(n+1)∑i=1nXi2]=2n(1+n)θ2−(n+1)2nθ2=0∀θE_{\theta}\left[2\left(\sum_{i=1}^n X_i\right)^2-(n+1)\sum_{i=1}^nX_i^2\right]=2n(1+n)\theta^2-(n+1)2n\theta^2=0\qquad\forall\,\theta …

2
期望
令,,,为独立的。的期望是什么?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} 容易找到。但是我不知道如何找到。您能提供一些提示吗?E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} 到目前为止我得到了什么 我想通过对称找到。但这与因为可能不等于。因此,我需要其他一些想法来找到期望。E(X41(X21+⋯+X2d)2)E(X14(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E(X21X21+⋯+X2d)E(X12X12+⋯+Xd2)\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right)E(X4i(X21+⋯+X2d)2)E(Xi4(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E(X2iX2j(X21+⋯+X2d)2)E(Xi2Xj2(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^2X_j^2}{(X_1^2 + \cdots + X_d^2)^2}\right) 这个问题来自哪里 数学堆栈交换中的一个问题要求S ^ {d-1}上的单位均匀随机向量x的方差。我的推导表明,答案非常取决于\ mathbb {E} \ left(\ frac {X_i ^ 4} {(X_1 …

3
Dirac的delta函数是否应被视为高斯分布的子类?
在Wikidata中,可以将本体中的概率分布(像其他所有事物一样)联系起来,例如,t分布是非中心t分布的子类,请参见,例如, https://angryloki.github.io/wikidata-graph-builder/?property=P279&amp;item=Q209675&amp;iterations=3&amp;limit=3 存在多种限制情况,例如,当t分布中的自由度变为无穷大时,或者当正态分布(高斯分布)的方差接近零时。在后一种情况下,分布将​​趋向于Dirac的delta函数。 我注意到,在英语Wikipedia上,方差参数当前被表示为大于零,因此严格解释下,人们不会说Dirac的delta函数是正态分布的子类。但是,对我来说似乎还可以,因为我要说指数分布是狄拉克三角函数的超类。 说明Dirac的delta函数是高斯分布的子类是否有问题?

2
多项式分布系数之和
\newcommand{\P}{\mathbb{P}}我要死了。每当我得到1、2或3时,我都写下一个“ 1”。每当我得到4时,我就写下“ 2”;每当我得到5或6时,我都会写下“ 3”。 令为我写下的所有数字乘积所需的总抛出次数。我想计算(或近似),并且可以根据正态分布给出近似值。NNN≥100000≥100000\geq 100000P(N≥25)P(N≥25)\P(N\geq 25) 首先,我知道因为。现在,让,和分别是我写下1、2和3的次数。然后:P(N≥11)=1P(N≥11)=1\P(N\geq 11) = 1log3100.000≈10.48log3⁡100.000≈10.48\log_3 100.000 \approx 10.48aaabbbccc P(a,b,c∣n)=⎧⎩⎨⎪⎪(na,b,c)(12)a(16)b(13)c0 if a+b+c=n otherwiseP(a,b,c∣n)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise\P(a,b,c\mid n) = \begin{cases}\displaystyle\binom {n}{a, b, c} \left(\frac 1 2\right) ^ a \left(\frac 1 6\right)^b\left(\frac 1 3\right)^c &\text{ if } a + b + c = n \\ 0 &\text{ …

1
误差函数和标准正态分布函数如何相关?
如果标准普通PDF为f(x)=12π−−√e−x2/2f(x)=12πe−x2/2f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2} CDF为 F(x )= 12个π--√∫X- ∞Ë− x2/ 2d X,F(X)=1个2π∫-∞XË-X2/2dX,F(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-x^2/2}\mathrm{d}x\,, 这如何变成的误差函数?žžz

4
它是否正确 ?(生成截断范数多元高斯)
如果 ,即 X∈Rn, X∼N(0–,σ2I)X∈Rn, X∼N(0_,σ2I)X\in\mathbb{R}^n,~X\sim \mathcal{N}(\underline{0},\sigma^2\mathbf{I})fX(x)=1(2πσ2)n/2exp(−||x||22σ2)fX(x)=1(2πσ2)n/2exp⁡(−||x||22σ2) f_X(x) = \frac{1}{{(2\pi\sigma^2)}^{n/2}} \exp\left(-\frac{||x||^2}{2\sigma^2}\right) 我想要多元情况下的截断正态分布的类似版本。 更确切地说,我想生成一个范数约束(值)的多元高斯 st ,其中ÿ ˚F ý(Ý )= { Ç 。f X(y ), 如果 | | y | | ≥ 一个0 , 否则 。c = 1≥a≥a\geq aYYYfY(y)={c.fX(y), if ||y||≥a0, otherwise .fY(y)={c.fX(y), if ||y||≥a0, otherwise . f_Y(y) = \begin{cases} c.f_X(y), \text{ if …

2
两个*相关*正态变量的总和不正常的示例
我知道一些相关的随机变量对的很好的例子,它们在边际上是正常的,但在联合上不是正常的。见这个答案由迪利普Sarwate,和这一个由红衣主教。 我也知道两个总和不正常的普通随机变量的例子。见这个答案的宏。但是在这个例子中,两个随机变量是不相关的。 是否存在两个具有非零协方差且总和不正常的普通随机变量的示例?还是有可能证明任何两个相关正态随机变量的和(即使它们不是二元正态)也必须是正态的? [上下文:我有一个作业问题,要求的分布,其中和是具有相关标准法线。我认为该问题旨在说明它们是双变量正态的。但是我想知道,如果没有非零的额外假设,是否可以X ÿ ρ ρaX+bYaX+bYaX+bYXXXYYYρρ\rhoρρ\rho 谢谢!



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.