Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。


1
澄清信息几何
此问题与Amari撰写的《弯曲指数家庭的微分几何-曲率和信息损失》有关。 全文如下。 令是具有坐标系统的维概率分布流形,其中假设 ...Sn={pθ}Sn={pθ}S^n=\{p_{\theta}\}nnnθ=(θ1,…,θn)θ=(θ1,…,θn)\theta=(\theta_1,\dots,\theta_n)pθ(x)>0pθ(x)>0p_{\theta}(x)>0 我们可以把每一个点的作为承载功能的 ...θθ\thetaSnSnS^nlogpθ(x)log⁡pθ(x)\log p_{\theta}(x)xxx 让是切空间在,这一点,粗略地说,有一小附近的线性化版本标识在。令是与协调系统关联的的自然基础...TθTθT_{\theta}SnSnS^nθθ\thetaθθ\thetaSnSnS^nei(θ),i=1,…,nei(θ),i=1,…,ne_i(\theta), i=1,\dots,nTθTθT_{\theta} 由于每个点的携带功能的,很自然地认为在作为表示函数θθ\thetaSnSnS^nlogpθ(x)log⁡pθ(x)\log p_{\theta}(x)xxxei(θ)ei(θ)e_i(\theta)θθ\thetaei(θ)=∂∂θilogpθ(x).ei(θ)=∂∂θilog⁡pθ(x).e_i(\theta)=\frac{\partial}{\partial\theta_i}\log p_{\theta}(x). 我不明白最后的陈述。这出现在上述论文的第2节中。上式如何给出切线空间的基础?如果该社区中熟悉此类材料的某人可以帮助我理解这一点,将会很有帮助。谢谢。 更新1: 尽管我同意(来自@aginensky),如果是线性独立的,则由于它们也是线性独立的,所以这些切线空间的成员首先是如何的还不是很清楚。因此如何将视为切线空间的基础。任何帮助表示赞赏。∂∂θipθ∂∂θipθ\frac{\partial}{\partial\theta_i}p_{\theta}∂∂θilogpθ∂∂θilog⁡pθ\frac{\partial}{\partial\theta_i}\log p_{\theta}∂∂θilogpθ∂∂θilog⁡pθ\frac{\partial}{\partial\theta_i}\log p_{\theta} 更新2: @aginensky:Amari在他的书中说: 让我们考虑以下情况:,上所有(严格)正概率度量的集合,其中我们将视为。实际上,是仿射空间一个开放子集。Sn=P(X)Sn=P(X)S^n=\mathcal{P}(\mathcal{X})X={x0,…,xn}X={x0,…,xn}\mathcal{X}=\{x_0,\dots,x_n\}P(X)P(X)\mathcal{P}(\mathcal{X})RX={X∣∣X:X→R}RX={X|X:X→R}\mathbb{R}^{\mathcal{X}}=\{X\big|X:\mathcal{X}\to \mathbb{R}\}P(X)P(X)\mathcal{P}(\mathcal{X}){X∣∣∑xX(x)=1}{X|∑xX(x)=1}\{X\big |\sum_x X(x)=1\} 然后切空间的每一点可以自然地与所确定的线性子空间。对于coordiante系统的自然基础,我们有。Tp(Sn)Tp(Sn)T_p(S^n)SnSnS^nA0={X∣∣∑xX(x)=0}A0={X|∑xX(x)=0}\mathcal{A}_0=\{X\big |\sum_x X(x)=0\}∂∂θi∂∂θi\frac{\partial}{\partial\theta_i}θ=(θ1,…,θn)θ=(θ1,…,θn)\theta=(\theta_1,\dots,\theta_n)(∂∂θi)θ=∂∂θipθ(∂∂θi)θ=∂∂θipθ(\frac{\partial}{\partial\theta_i})_{\theta}=\frac{\partial}{\partial\theta_i}p_{\theta} 接下来,就让我们再嵌入,并确定与该亚群的。的切线矢量然后通过操作的结果表示到,我们通过表示。特别是,我们有。显然和 p↦logpp↦log⁡pp\mapsto \log pSnSnS^nlogSn:={logp∣∣p∈Sn}log⁡Sn:={log⁡p|p∈Sn}\log S^n:=\{\log p\big |p\in S^n\}RXRX\mathbb{R}^{\mathcal{X}}X∈Tp(Sn)X∈Tp(Sn)X\in T_p(S^n)XXXp↦logpp↦log⁡pp\mapsto \log pX(e)X(e)X^{(e)}(∂∂θi)(e)θ=∂∂θilogpθ(∂∂θi)θ(e)=∂∂θilog⁡pθ(\frac{\partial}{\partial\theta_i})_{\theta}^{(e)}=\frac{\partial}{\partial\theta_i}\log p_{\theta}X(e)=X(x)/p(x)X(e)=X(x)/p(x)X^{(e)}=X(x)/p(x)T(e)p(Sn)={X(e)∣∣X∈Tp(Sn)}={A∈RX∣∣∑xA(x)p(x)=0}.Tp(e)(Sn)={X(e)|X∈Tp(Sn)}={A∈RX|∑xA(x)p(x)=0}.T_p^{(e)}(S^n)=\{X^{(e)}\big |X\in T_p(S^n)\}=\{A\in \mathbb{R}^{\mathcal{X}}\big |\sum_x A(x)p(x)=0\}. 我的问题:如果和都是切线空间的基础,那么这不会与事实和是不同的和?∂∂θi∂∂θi\frac{\partial}{\partial\theta_i}(∂∂θi)(e)(∂∂θi)(e)(\frac{\partial}{\partial\theta_i})^{(e)}TpTpT_pT(e)pTp(e)T_p^{(e)}∂∂θi(e)∈T(e)p∂∂θi(e)∈Tp(e)\frac{\partial}{\partial\theta_i}^{(e)}\in T_p^{(e)} 我猜想()和之间似乎存在关联。如果您可以澄清这一点,将有很大帮助。您可以给出答案。Sn,TpSn,TpS^n,T_p(logSn,T(e)p)(log⁡Sn,Tp(e))(\log S^n,T_p^{(e)})

2
在一个样本t检验,在方差如果发生了什么估计样本均值被替换为
假定一个单样本t检验,其中,所述零假设为。统计是然后吨= ‾ X - μ 0μ = μ0μ=μ0\mu=\mu_0使用样本标准差s。在估计小号,一个观测比较样本均值¯X:t = x¯¯¯- μ0s / n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssX¯¯¯x¯\overline{x} 。s = 1n − 1∑ñ我= 1(x一世− x¯¯¯)2---------------√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} 然而,如果我们假设在给定是真实的,人们也可以估算标准偏差小号*使用μ 0,而不是样本均值¯ X:μ0μ0\mu_0s∗s∗s^*μ0μ0\mu_0X¯¯¯x¯\overline{x} 。s∗= 1n − 1∑ñ我= 1(x一世- μ0)2----------------√s∗=1n−1∑i=1n(xi−μ0)2s^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\mu_0)^2} 对我来说,这种方法看起来更自然,因为我们因此也将原假设用于估计SD。有谁知道测试中是否使用了所得统计量,或者为什么不知道?

2
用逻辑函数转换的高斯随机变量的期望值
逻辑函数和标准差通常都表示为。我将使用和作为标准偏差。σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss 我有一个逻辑输入随机输入的逻辑神经元,其均值和标准差我所知。我希望可以通过一些高斯噪声很好地估计出与平均值的差。因此,略微使用符号,假定它产生。的期望值是多少?与或相比,标准偏差可能大或小。理想值的良好闭合形式近似值几乎与闭合形式解决方案一样好。μμ\musssσ(μ+N(0,s2))=σ(N(μ,s2))σ(μ+N(0,s2))=σ(N(μ,s2))\sigma(\mu + N(0,s^2))=\sigma(N(\mu,s^2))σ(N(μ,s2))σ(N(μ,s2))\sigma(N(\mu,s^2))sssμμ\mu111 我认为不存在封闭形式的解决方案。这可以看作是卷积,并且逻辑密度的特征函数是已知的(),但是我不确定有什么帮助。该逆符号计算器无法识别密度物流配送的密度的卷积和标准正态分布,这说明,但并不能证明没有简单的基本积分。更多的间接证据:在一些将高斯输入噪声添加到具有逻辑神经元的神经网络的论文中,这些论文也未给出封闭形式的表达式。πt csch πtπt csch πt\pi t ~\text{csch} ~\pi t000 这个问题产生于试图了解玻尔兹曼机中平均场近似的误差。

1
具有学生t错误的回归没有用吗?
请参阅编辑。 当您的数据尾巴很重时,进行带有Student-t错误的回归似乎是一件直观的事情。在探索这种可能性时,我遇到了这篇论文: TS的Breusch,JC的Robertson和AH的威尔士(1997年11月1日)。皇帝的新装:对多元t回归模型的评论。Statistica Neerlandica,51,3.)(link,pdf) 该论据认为,在某种意义上,比例参数和自由度参数是无法相互识别的,因此,进行带有t误差的回归不会做超出标准线性回归的任何事情。 Zellner(1976)提出了一种回归模型,其中数据向量(或误差向量)表示为来自多元Student t分布的实现。该模型引起了相当大的关注,因为它似乎扩大了通常的高斯假设,以允许更严重的误差分布。文献中的许多结果表明,在较宽的分布假设下,高斯模型的标准推理程序仍然适用,从而导致了标准方法的鲁棒性。我们证明,尽管从数学上讲这两个模型是不同的,但出于统计推断的目的,它们是无法区分的。多元t模型的经验含义与高斯模型的经验含义完全相同。因此,建议采用更广泛的数据分布表示形式是虚假的,而健壮性的主张则具有误导性。这些结论是从频繁主义者和贝叶斯主义者的角度得出的。 这让我感到惊讶。 我没有数学上的技巧来很好地评估他们的论点,所以我有两个问题:确实,用t误差进行回归通常没有用吗?如果它们有时有用,是我误解了本文还是引起误解?如果它们没有用,这是众所周知的事实吗?还有其他方法可以处理大量拖尾的数据吗? 编辑:仔细阅读第3段和第4节,似乎下面的文章并没有在谈论我作为学生t回归的想法(错误是独立的单变量t分布)。错误是从单一分布中得出的,并且不是独立的。如果我理解正确,那么这种缺乏独立性正是解释为什么您无法独立估计自由度和自由度的原因。 我猜这篇文章提供了一份避免阅读的论文清单。

2
假设检验和总变异距离与Kullback-Leibler散度的关系
在我的研究中,我遇到了以下一般性问题:在同一个域中有两个分布和,以及来自这些分布的大量(但有限)样本。样本是从这两个分布之一独立且相同地分布的(尽管分布可能是相关的:例如,可能是和其他分布的混合。)零假设是样本来自,替代假设是样本来自。Q Q P P QPPPQQQQQQPPPPPPQQQ 我试图表征I型和测试样品,了解发行第二类错误和。特别是,除了对和的了解之外,我还对限制一个错误和另一个错误感兴趣。Q P QPPPQQQPPPQQQ 我问了一个关于math.SE 的问题,关于和之间的总变异距离与假设检验的关系,并收到了我接受的答案。这个答案是有道理的,但是我仍然无法将总变化距离和假设检验之间更深层的含义笼罩在脑海中,因为这与我的问题有关。因此,我决定转向这个论坛。QPPPQQQ 我的第一个问题是:总变化是否与 I类错误和II类错误的概率之和无关,而与所采用的假设检验方法无关?本质上,只要存在可能由任一分布生成样本的非零概率,至少一个错误的概率就必须为非零。基本上,无论您进行多少信号处理,您都无法避免假设检验器会出错的可能性。而总变化限制了确切的可能性。我的理解正确吗? I型和II型错误与潜在的概率分布和之间还有另一关系:KL散度。因此,我的第二个问题是:KL散度约束是否仅适用于一种特定的假设检验方法(似乎很多涉及对数似然比方法),还是可以将其普遍适用于所有假设检验方法?如果它适用于所有假设检验方法,那么为什么它似乎与总变异范围有很大不同?它的行为是否有所不同?QPPPQQQ 我的基本问题是:在规定的条件下我应该使用约束还是纯粹为了方便起见?什么时候应该使用一个绑定推导结果并使用另一个绑定? 如果这些问题无关紧要,我深表歉意。我是计算机科学家(所以对我来说,这似乎是一个奇特的模式匹配问题:)。)我对信息论非常了解,并且也具有概率论的毕业背景。但是,我才刚刚开始学习所有这些假设检验的知识。如果需要,我将尽力澄清我的问题。


3
是独立的变量时分布
作为常规练习,我试图找到的分布,其中 和是独立的随机变量。X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2}XXXYYYU(0,1)U(0,1) U(0,1) 的联合密度为 (X,Y)(X,Y)(X,Y)fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right)cosθcos⁡θ\cos\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]zsinθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right)sinθsin⁡θ\sin\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right] 因此,对于1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2,我们有cos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right)。 变换的雅可比的绝对值为|J|=z|J|=z|J|=z 因此(Z,Θ)(Z,Θ)(Z,\Theta)的联合密度由下式给出 fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} 积分θθ\theta,我们得到ZZZ的pdf 为 fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1(1z))11&lt;z&lt;2√fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1⁡(1z))11&lt;z&lt;2f_Z(z)=\frac{\pi z}{2}\mathbf 1_{0\sqrt 2 \end{cases} 看起来像正确的表达。对于情况微分会带来一个表达式,该表达式不易简化为我已经获得的pdf。FZFZF_Z1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2 最后,我认为我具有CDF的正确图片: 对于:0&lt;z&lt;10&lt;z&lt;10<z<1 对于:1&lt;z&lt;2–√1&lt;z&lt;21<z<\sqrt 2 阴影部分应该指示区域{(x,y):0&lt;x,y&lt;1,x2+y2≤z2}{(x,y):0&lt;x,y&lt;1,x2+y2≤z2}\left\{(x,y):0<x,y< 1\,,\,x^2+y^2\le z^2\right\} 图片立即产生 FZ(z)=Pr(−z2−X2−−−−−−−√≤Y≤z2−X2−−−−−−−√)=⎧⎩⎨⎪⎪⎪⎪πz24z2−1−−−−−√+∫1z2−1√z2−x2−−−−−−√dx, if 0&lt;z&lt;1, if 1&lt;z&lt;2–√FZ(z)=Pr(−z2−X2≤Y≤z2−X2)={πz24, if 0&lt;z&lt;1z2−1+∫z2−11z2−x2dx, if 1&lt;z&lt;2\begin{align} F_Z(z)&=\Pr\left(-\sqrt{z^2-X^2}\le Y\le\sqrt{z^2-X^2}\right) \\&=\begin{cases}\frac{\pi z^2}{4} &,\text{ if } 0<z<1\\\\ \sqrt{z^2-1}+\int_{\sqrt{z^2-1}}^1 \sqrt{z^2-x^2}\,\mathrm{d}x …


1
如何在一幅图中绘制拟合的伽玛分布图和实际图?
加载所需的包。 library(ggplot2) library(MASS) 生成10,000个适合伽玛分布的数字。 x &lt;- round(rgamma(100000,shape = 2,rate = 0.2),1) x &lt;- x[which(x&gt;0)] 假设我们不知道x符合哪个分布,则绘制概率密度函数。 t1 &lt;- as.data.frame(table(x)) names(t1) &lt;- c("x","y") t1 &lt;- transform(t1,x=as.numeric(as.character(x))) t1$y &lt;- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y = y)) + theme_classic() 从图中可以看出,x的分布与伽马分布非常相似,因此fitdistr()在包中使用它MASS可以获取形状和伽马分布速率的参数。 fitdistr(x,"gamma") ## output ## shape rate ## 2.0108224880 0.2011198260 ## (0.0083543575) …

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
关于样本自协方差函数的问题
我正在阅读时间序列分析书,样本自协方差的公式在书中定义为: γˆ(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)γ^(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x}) 与对于。是平均值。γˆ(−h)=γˆ(h)γ^(−h)=γ^(h)\widehat{\gamma}(-h) = \widehat{\gamma}(h)\;h=0,1,...,n−1h=0,1,...,n−1\;h = 0,1, ..., n-1x¯x¯\bar{x} 有人可以直观地解释为什么我们将总和除以而不是吗?这本书解释说,这是因为上面的公式是一个非负的确定函数,因此最好除以,但这对我来说还不清楚。有人可以证明这一点,还是可以举例说明?nnnn−hn−hn-hnnn 对我而言,起初直观的事情就是除以。这是对自协方差的无偏估计吗?n−hn−hn-h

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
证明序列减少(通过绘制大量点来支持)
上个月我在SE上发布的许多问题都是为了帮助我解决这一特定问题。问题均已回答,但我仍然无法提出解决方案。因此,我认为我应该直接问我要解决的问题。 让 Xn∼FnXn∼FnX_n \sim F_n,在哪里 Fn= (1 − (1 −Fn − 1)C)CFn=(1−(1−Fn−1)c)cF_n = (1-(1-F_{n-1})^c)^c, F0= xF0=xF_0 = x, Ç ≥ 2c≥2c\geq 2 (整数),以及每个 FñFnF_n 超过CDF (0 ,1 )(0,1)(0,1)。 我想证明 EXnEXn\mathbb{E}X_n 减少 nnn 对所有人 ccc (甚至对于任何特定 ccc)!我可以证明FnFnF_n 以独特的解收敛到狄拉克质量 xc=(1−(1−x)c)c)xc=(1−(1−x)c)c)x_c = (1-(1-x)^c)^c) 对于 c=2c=2c=2, x2=(3−5–√)/2≈.38x2=(3−5)/2≈.38x_2 = (3-\sqrt{5})/2 \approx .38。当看CDFS增加时nnn都是一样的 ccc,所有cdf交叉在 xnxnx_n。的价值F(x)F(x)F(x) 减少值 …

1
相关随机变量之差的界线
给定两个高度相关的随机变量和,我想限制差的概率超出一定数量: XXXYYY|X−Y||X−Y| |X - Y| P(|X−Y|&gt;K)&lt;δP(|X−Y|&gt;K)&lt;δ P( |X - Y| > K) < \delta 为简单起见,假设: 已知相关系数为“高”,例如: ρX,Y=covar(X,Y)/σXσY≥1−ϵρX,Y=covar(X,Y)/σXσY≥1−ϵ \rho_{X,Y}= {covar(X,Y)} / {\sigma_X \sigma_Y} \geq 1 - \epsilon X,YX,YX,Y 为零均值:μx=μy=0μx=μy=0 \mu_x = \mu_y = 0 −1≤xi,yi≤1−1≤xi,yi≤1-1 \leq x_i, y_i \leq 1(或者 如果这样更容易的话)0≤xi,yi≤10≤xi,yi≤1 0 \leq x_i, y_i \leq 1 (如果它使事情变得容易,那么说具有相同的方差:)X,YX,YX,Y σ2X=σ2YσX2=σY2\sigma_X^2 = \sigma_Y^2 …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.