Questions tagged «proof»

统计的数学理论,涉及形式定义和一般结果。

5
在没有模拟的情况下,统计学家究竟如何同意使用(n-1)作为总体方差的无偏估计量?
分母的计算公式的分母为:(n − 1 )(n−1)(n-1) s2= ∑ñ我= 1(x一世− x¯)2n − 1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} 我一直想知道为什么。但是,阅读和观看一些有关“为什么”的优质视频似乎是人口方差的良好无偏估计。而n低估了(n - 2 )高估了总体方差。(n − 1 )(n−1)(n-1)ñnn(n − 2 )(n−2)(n-2) 我想知道的是,在没有计算机的时代,这种选择是如何做出的?是否有实际的数学证明来证明这一点?或者,这纯粹是经验和统计学家亲自进行了大量的计算,以得出当时的“最佳解释”? 在19世纪初期,统计学家是如何借助计算机提出这个公式的?手册还是比看得见的更多?

1
两个多元高斯之间的KL散度
假设两个多元正态分布,我在推导KL散度公式时遇到麻烦。我已经很轻松地完成了单变量案例。但是,自从我获得数学统计数据以来已经有一段时间了,因此在将其扩展到多元案例时遇到了一些麻烦。我确定我只是缺少一些简单的东西。 这就是我所拥有的... 假设二者和q是正态分布的与装置的PDF文件μ 1和μ 2和方差Σ 1和Σ 2分别。从q到p的Kullback-Leibler距离为:pppqqqμ1个μ1\mu_1μ2μ2\mu_2Σ1个Σ1\Sigma_1Σ2Σ2\Sigma_2qqqppp ,对于两个多元法线为:∫[ 日志(p (x ))- 对数(q((x ))] p (x )d X∫[log⁡(p(x))−log⁡(q(x))] p(x) dx\int \left[\log( p(x)) - \log( q(x)) \right]\ p(x)\ dx 12[log|Σ2||Σ1|−d+Tr(Σ−12Σ1)+(μ2−μ1)TΣ−12(μ2−μ1)]12[log⁡|Σ2||Σ1|−d+Tr(Σ2−1Σ1)+(μ2−μ1)TΣ2−1(μ2−μ1)]\frac{1}{2}\left[\log\frac{|\Sigma_2|}{|\Sigma_1|} - d + Tr(\Sigma_2^{-1}\Sigma_1) + (\mu_2 - \mu_1)^T \Sigma_2^{-1}(\mu_2 - \mu_1)\right] 遵循与此证明相同的逻辑,在陷入困境之前,请先到达此处: =∫[d2log|Σ2||Σ1|+12((x−μ2)TΣ−12(x−μ2)−(x−μ1)TΣ−12(x−μ1))]×p(x)dx=∫[d2log⁡|Σ2||Σ1|+12((x−μ2)TΣ2−1(x−μ2)−(x−μ1)TΣ2−1(x−μ1))]×p(x)dx=\int \left[ \frac{d}{2} \log\frac{|\Sigma_2|}{|\Sigma_1|} + \frac{1}{2} \left((x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2) - (x-\mu_1)^T\Sigma_2^{-1}(x-\mu_1) \right) …


3
R:尽管数据集中没有NaN,随机森林仍在“外部函数调用”错误中抛出NaN / Inf [关闭]
我正在使用插入符号在数据集上运行交叉验证的随机森林。Y变量是一个因素。我的数据集中没有NaN,Inf或NA。但是,当运行随机森林时,我得到 Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs introduced by coercion 3: In data.matrix(x) : NAs introduced by …

4
有条件期望证明作为最佳预测因子的问题
我的证明有问题 E(Y|X)∈argming(X)E[(Y−g(X))2]E(Y|X)∈arg⁡ming(X)E[(Y−g(X))2]E(Y|X) \in \arg \min_{g(X)} E\Big[\big(Y - g(X)\big)^2\Big] 这很可能表明人们对期望和有条件的期望有更深的误解。 我知道的证明如下(此证明的另一个版本可以在这里找到) ===argming(X)E[(Y−g(x))2]argming(X)E[(Y−E(Y|X)+E(Y|X)−g(X))2]argming(x)E[(Y−E(Y|X))2+2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]argming(x)E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]arg⁡ming(X)E[(Y−g(x))2]=arg⁡ming(X)E[(Y−E(Y|X)+E(Y|X)−g(X))2]=arg⁡ming(x)E[(Y−E(Y|X))2+2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]=arg⁡ming(x)E[2(Y−E(Y|X))(E(Y|X)−g(X))+(E(Y|X)−g(X))2]\begin{align*} &\arg \min_{g(X)} E\Big[\big(Y - g(x)\big)^2\Big]\\ = &\arg \min_{g(X)} E \Big[ \big(Y - E(Y|X) + E(Y|X) - g(X)\big)^2\Big]\\ =&\arg \min_{g(x)} E \Big[ \big(Y - E(Y|X)\big)^2 + 2 \big(Y - E(Y|X)\big) \big(E(Y|X) - g(X)\big) + \big(E(Y|X) - g(X)\big)^2\Big]\\ =&\arg \min_{g(x)} E …

3
证明矩生成函数唯一确定概率分布
Wackerly等人的文字指出该定理“让和分别表示随机变量X和Y的矩产生函数。如果两个矩产生函数都存在并且对于所有t值,则X和Y具有相同的概率分布。” 没有证据表明其超出了本文的范围。Scheaffer Young 在没有证明的情况下也具有相同的定理。我没有Casella,但是Google图书搜索似乎没有在其中找到定理。mx(t)mx(t)m_x(t)my(t)my(t)m_y(t)mx(t)=my(t)mx(t)=my(t)m_x(t) = m_y(t) Gut的文本似乎具有证明的轮廓,但是没有提及“众所周知的结果”,还需要知道另一个未提供证明的结果。 有谁知道谁最初证明了这一点,并且该证明是否可以在任何地方在线获得?否则,将如何填写这一证明的细节? 如果我不被问到这不是一个家庭作业问题,但我可以想象这可能是某人的家庭作业。我根据Wackerly的文字选了一个课程序列,一段时间以来,我一直在想知道这个证明。所以我认为是时候问了。

2
统一随机变量作为两个随机变量之和
取自Grimmet和Stirzaker: 证明不可能不是U = X + Y的情况,U=X+YU=X+Y其中UUU在[0,1]上均匀分布,而XXX和YYY是独立且均匀分布的。您不应假定X和Y是连续变量。 一个简单的反证法足够了,其中的情况下XXX,ÿYY假定离散通过认为它总是能够找到一个üuu和ü 'u′u',使得P (û ≤ û + Ù ')≥ P (Ú ≤ Û )P(U≤u+u′)≥P(U≤u)P(U\leq u+u') \geq P(U\leq u)而P (X + ÿ ≤ Ù )= P (X + ý ≤ ü + Ú ')P(X+Y≤u)=P(X+Y≤u+u′)P(X+Y \leq u) = P(X+Y \leq u+u')。 但是,该证明不能扩展到X ,YX,YX,Y绝对连续或奇异连续。提示/评论/评论?

4
证明以下两个公式的等价性为Spearman相关
从维基百科中,通过将变量XiXiX_i和YiYiY_i转换为排名变量和,然后计算排名变量之间的皮尔逊相关性,来计算Spearman的排名相关性:xixix_iyiyiy_i 但是,本文继续指出,如果变量和之间没有联系,则上式等于XiXiX_iYiYiY_i 其中di=yi−xidi=yi−xid_i = y_i - x_i,在行列的差异。 有人可以证明这一点吗?我无权访问维基百科文章所引用的教科书。

2
推导二元泊松分布
我最近遇到了双变量Poisson分布,但是对于如何导出它有点困惑。 分布由下式给出: P(X=x,Y=y)=e−(θ1+θ2+θ0)θx1x!θy2y!∑i=0min(x,y)(xi)(yi)i!(θ0θ1θ2)iP(X=X,ÿ=ÿ)=Ë-(θ1个+θ2+θ0)θ1个XX!θ2ÿÿ!∑一世=0米一世ñ(X,ÿ)(X一世)(ÿ一世)一世!(θ0θ1个θ2)一世P(X = x, Y = y) = e^{-(\theta_{1}+\theta_{2}+\theta_{0})} \displaystyle\frac{\theta_{1}^{x}}{x!}\frac{\theta_{2}^{y}}{y!} \sum_{i=0}^{min(x,y)}\binom{x}{i}\binom{y}{i}i!\left(\frac{\theta_{0}}{\theta_{1}\theta_{2}}\right)^{i} 据我所知,在θ0θ0\theta_{0}项之间的相关性的测量XXX和YÿY ; 因此,当XXX和YÿY是独立的,θ0=0θ0=0\theta_{0} = 0和分配简单地变成两个单变量泊松分布的产物。 考虑到这一点,我的困惑是基于求和项-我假设该项解释了XXX和之间的相关性YÿY。 在我看来,该加数构成某种其中“成功”的概率由下式给出二项式累积分布函数的产品(θ0θ1θ2)(θ0θ1个θ2)\left(\frac{\theta_{0}}{\theta_{1}\theta_{2}}\right)和“失败”的概率由下式给出i!1min(x,y)−i一世!1个米一世ñ(X,ÿ)-一世i!^{\frac{1}{min(x,y)-i}},因为(i!1min(x,y)−i!)(min(x,y)−i)=i!(一世!1个米一世ñ(X,ÿ)-一世!)(米一世ñ(X,ÿ)-一世)=一世!\left(i!^{\frac{1}{min(x,y)-i!}}\right)^{(min(x,y)-i)} = i!,但我可能与此相去甚远。 有人可以提供一些有关如何导出这种分布的帮助吗?同样,如果可以将其包含在任何答案中,那么如何将模型扩展到多变量场景(例如三个或更多随机变量),那就太好了! (最后,我已经注意到,之前有一个类似的问题(了解二元泊松分布),但实际上并未对此推导进行探讨。)

2
两个普通乘积之和是拉普拉斯?
它显然是的情况下,如果X一世〜ñ(0 ,1 )Xi∼N(0,1)X_i \sim N(0,1),然后 X1个X2+ X3X4〜大号一个p 升一Ç ë (0 ,1 )X1X2+X3X4∼Laplace(0,1)X_1 X_2 + X_3 X_4 \sim \mathrm{Laplace(0,1)} 我看过关于任意二次形式的论文,这些总是导致可怕的非中心卡方表达式。 上面的简单关系对我来说似乎一点都不明显,所以(如果是真的!)有人能简单证明上面的关系吗?

3
单位球N个样本的最接近原点的中值最近点的公式的解释
在《统计学习的元素》中,引入了一个问题以突出高维空间中k-nn的问题。有NNN被均匀地分布在一个数据点ppp维单位球。 从原点到最近的数据点的中值距离由以下表达式给出: d(p,N)=(1−(12)1N)1pd(p,N)=(1−(12)1N)1pd(p,N) = \left(1-\left(\frac{1}{2}\right)^\frac{1}{N}\right)^\frac{1}{p} 当N=1N=1N=1,公式分解为球半径的一半,我可以看到最近的点如何以方式接近边界p→∞p→∞p \rightarrow \infty,从而使knn后面的直觉在高维度上分解。但是我无法理解为什么公式依赖于N。有人可以澄清一下吗? 该书还指出:“……在训练样本的边缘附近进行预测要困难得多。必须从邻近的样本点推断而不是在它们之间进行内插”。这似乎是一个深刻的陈述,但我似乎无法理解它的含义。有人可以改写吗?

3
关于正规方程证明的问题
在不假设X是可逆的前提下,如何证明正则方程具有一个或多个解?(XTX)β=XTY(XTX)β=XTY(X^TX)\beta = X^TY 我唯一的猜测是它与广义逆有关,但是我完全迷失了。
11 regression  proof 


1
分位数回归估计器公式
我已经看到了分位数回归估计量的两种不同表示形式,分别是 Q(βq)=∑i:yi≥x′iβnq∣yi−x′iβq∣+∑i:yi&lt;x′iβn(1−q)∣yi−x′iβq∣Q(βq)=∑i:yi≥xi′βnq∣yi−xi′βq∣+∑i:yi&lt;xi′βn(1−q)∣yi−xi′βq∣Q(\beta_{q}) = \sum^{n}_{i:y_{i}\geq x'_{i}\beta} q\mid y_i - x'_i \beta_q \mid + \sum^{n}_{i:y_{i}< x'_{i}\beta} (1-q)\mid y_i - x'_i \beta_q \mid 和 Q(βq)=∑i=1nρq(yi−x′iβq),ρq(u)=ui(q−1(ui&lt;0))Q(βq)=∑i=1nρq(yi−xi′βq),ρq(u)=ui(q−1(ui&lt;0))Q(\beta_q) = \sum^{n}_{i=1} \rho_q (y_i - x'_i \beta_q), \hspace{1cm} \rho_q(u) = u_i(q - 1(u_i < 0 )) 其中。有人可以告诉我如何显示这两个表达的对等吗?这是我到目前为止尝试过的,从第二个表达式开始。ui=yi−x′iβqui=yi−xi′βqu_i = y_i - x'_i \beta_q 但从这一点上,我就死在如何进行。请不要说这不是家庭作业或作业问题。非常感谢。Q(βq)=∑i=1nui(q−1(ui&lt;0))(yi−x′iβq)=∑i=1n(yi−x′iβq)(q−1(yi−x′iβq&lt;0))(yi−x′iβq)=⎡⎣∑i:yi≥x′iβn(q(yi−x′iβq))+∑i:yi&lt;x′iβn(q(y一世-x′一世βq)− (y一世-x′一世βq))⎤⎦(y一世-x′一世βq)Q(βq)=∑一世=1个ñü一世(q-1个(ü一世&lt;0))(ÿ一世-X一世′βq)=∑一世=1个ñ(ÿ一世-X一世′βq)(q-1个(ÿ一世-X一世′βq&lt;0))(ÿ一世-X一世′βq)=[∑一世:ÿ一世≥X一世′βñ(q(ÿ一世-X一世′βq))+∑一世:ÿ一世&lt;X一世′βñ(q(ÿ一世-X一世′βq)-(ÿ一世-X一世′βq))](ÿ一世-X一世′βq) \begin{align} Q(\beta_q) &= \sum^{n}_{i=1} …

3
“经统计证明”的概念
当新闻谈论的事情“经过统计学证明”时,他们是正确使用了定义明确的统计概念,使用了错误的统计信息还是仅仅使用了矛盾的词? 我认为“统计证明”实际上不是为了证明假设而进行的事情,也不是数学证明,而是更多的“统计检验”。
10 inference  proof 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.