Questions tagged «self-study»

从课本,自学中使用的教科书,课程或测试的例行练习。该社区的政策是为此类问题“提供有用的提示”,而不是完整的答案。

1
为什么LKJcorr是相关矩阵的先验?
I'm阅读中(第13章“冒险协方差” 高超)一书统计反思理查德McElreath在那里,他提出以下层次模型: (R是一个相关矩阵) 作者解释说,这LKJcorr是信息量较弱的先验,可作为相关矩阵的正则化先验。但是为什么会这样呢?LKJcorr分布具有什么特征,使其成为相关矩阵的先验?相关矩阵在实践中还使用了哪些其他先验条件?

1
负二项分布的最大似然估计
问题如下: 从参数k = 3的负二项式分布中收集n个值的随机样本。 找到参数π的最大似然估计。 为该估计量的标准误差找到一个渐近公式。 说明如果参数k足够大,为什么负二项式分布将近似正态。此正态近似的参数是什么? 我的工作如下: 1.我觉得这是需要的,但是我不确定在这里我是否准确,或者鉴于提供的信息,我是否可以做得更好? p(x)=(x−1k−1)πk(1−π)x−kL(π)=Πnip(xn|π)ℓ(π)=Σniln(p(xn|π))ℓ‘(π)=Σnikπ−(x−k)(1−π)p(x)=(x−1k−1)πk(1−π)x−kL(π)=Πinp(xn|π)ℓ(π)=Σinln⁡(p(xn|π))ℓ‘(π)=Σinkπ−(x−k)(1−π)p(x) = {x-1 \choose k-1}\pi^k(1-\pi)^{x-k}\\ L(\pi) = \Pi_i^n p(x_n|\pi)\\ \ell(\pi) = \Sigma_i^n\ln(p(x_n|\pi))\\ \ell`(\pi) = \Sigma_i^n\dfrac{k}{\pi}-\dfrac{(x-k)}{(1-\pi)} 我认为以下是要求的。对于最后部分我感觉需要更换π^π^\hat{\pi}与kxkx\dfrac{k}{x} ℓ‘‘(π^)=−kπ^2+x(1−π^)2se(π^)=−1ℓ‘‘(π^)−−−−−−−√se(π^)=π^2k−(1−π^)2x−−−−−−−−−−−−√ℓ‘‘(π^)=−kπ^2+x(1−π^)2se(π^)=−1ℓ‘‘(π^)se(π^)=π^2k−(1−π^)2x\ell``(\hat{\pi}) = -\dfrac{k}{\hat{\pi}^2} + \dfrac{x}{(1-\hat{\pi})^2}\\ se(\hat{\pi}) = \sqrt{-\dfrac{1}{\ell``(\hat{\pi})}}\\ se(\hat{\pi}) = \sqrt{\dfrac{\hat{\pi}^2}{k} - \dfrac{(1-\hat{\pi})^2}{x}}\\ 我不确定如何证明这一点,并且仍在研究中。任何提示或有用的链接将不胜感激。我觉得这可能与负二项式分布可以看作是几何分布的集合有关,或者与二项式分布的倒数有关,但不确定如何处理。 任何帮助将不胜感激

4
维度诅咒:kNN分类器
我正在阅读凯文·墨菲(Kevin Murphy)的书:《机器学习-概率论》。在第一章中,作者正在解释维数的诅咒,其中有一部分我不理解。例如,作者指出: 考虑输入沿D维单位立方体均匀分布。假设我们通过在x周围生长一个超立方体直到它包含所需的数据点分数来估计类标签的密度。该立方体的预期边缘长度为。e D(f )= f 1FFfËd(f)= f1个dËd(F)=F1个de_D(f) = f^{\frac{1}{D}} 这是我无法理解的最后一个公式。似乎如果要覆盖10%的点,则沿每个尺寸的边长应为0.1?我知道我的推理是错误的,但我不明白为什么。

1
标准正态随机变量的PDF和CDF函数的凸性
请提供证明是凸。这里,和分别是标准的普通PDF和CDF。 ∀X>0φΦQ(x)=x2+xϕ(x)Φ(x)Q(x)=x2+xϕ(x)Φ(x)Q\left(x\right)=x^{2}+x\frac{\phi\left(x\right)}{\Phi\left(x\right)}∀ X > 0∀X>0\forall x>0 ϕϕ\phiΦΦ\mathbf{\Phi} 尝试的步骤 1)计算方法 我已经尝试了演算方法,并为第二个导数提供了一个公式,但是无法证明它是正。如果您需要更多详细信息,请告诉我。∀ X > 0∀X>0\forall x > 0 最后, ∂Q(X)让 Q(x)=x2+ xϕ(x)Φ (x )Let Q(x)=x2+Xϕ(X)Φ(X)\begin{eqnarray*} \text{Let }Q\left(x\right)=x^{2}+x\frac{\phi\left(x\right)}{\Phi\left(x\right)} \end{eqnarray*} ∂ Q (X )∂Q(x)∂X=2 x + x [ -xϕ(x)Φ(x)− {ϕ(x)Φ(x)}2] +ϕ(x)Φ (x )∂Q(x)∂X=2X+X[-Xϕ(X)Φ(X)-{ϕ(X)Φ(X)}2]+ϕ(X)Φ(X)\begin{eqnarray*} \frac{\partial Q\left(x\right)}{\partial x} & = & 2x+x\left[-\frac{x\phi\left(x\right)}{\Phi\left(x\right)}-\left\{ \frac{\phi\left(x\right)}{\Phi\left(x\right)}\right\} ^{2}\right]+\frac{\phi\left(x\right)}{\Phi\left(x\right)} \end{eqnarray*} ∂ …

2
正态高斯向量的线性变换
我在证明以下陈述方面面临困难。它在Google上的研究论文中给出。我需要帮助证明这一说法! 令X=ASX=ASX= AS,其中AAA是正交矩阵,而SSS是高斯。在任何正交基础上具有相同分布的高斯的同位素行为SSS。 在S上应用A后,XXX高斯如何?AAASSS

2
UMVUE
让(X1,X2,…,Xn)(X1,X2,…,Xn)(X_1,X_2,\ldots,X_n)是从密度的随机样本fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0fθ(x)=θxθ−110&lt;x&lt;1,θ&gt;0f_{\theta}(x)=\theta x^{\theta-1}\mathbf1_{00 我正在尝试找到θ的UMVUEθ1+θθ1+θ\frac{\theta}{1+\theta}。 (X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)的联合密度为 fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp[(θ−1)∑i=1nlnxi+nlnθ+ln(10&lt;x1,…,xn&lt;1)],θ&gt;0fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110&lt;x1,…,xn&lt;1=exp⁡[(θ−1)∑i=1nln⁡xi+nln⁡θ+ln⁡(10&lt;x1,…,xn&lt;1)],θ&gt;0\begin{align} f_{\theta}(x_1,\cdots,x_n)&=\theta^n\left(\prod_{i=1}^n x_i\right)^{\theta-1}\mathbf1_{00 \end{align} 随着人口的PDF fθfθf_{\theta}属于单参数指数族,这表明,对于一个完整的充分统计量θθ\theta是T(X1,…,Xn)=∑i=1nlnXiT(X1,…,Xn)=∑i=1nln⁡XiT(X_1,\ldots,X_n)=\sum_{i=1}^n\ln X_i 由于E(X1)=θ1+θE(X1)=θ1+θE(X_1)=\frac{\theta}{1+\theta},首先想到E(X1∣T)E(X1∣T)E(X_1\mid T)将给我θ的UMVUEθ1+θθ1+θ\frac{\theta}{1+\theta}根据Lehmann-Scheffe定理, 1 + θ。不确定是否可以直接找到该条件期望,还是必须找到条件分布 X1∣∑ni=1lnXiX1∣∑i=1nln⁡XiX_1\mid \sum_{i=1}^n\ln X_i。 另一方面,我考虑了以下方法: 我们有Xi∼i.i.dBeta(θ,1)⟹−2θlnXi∼i.i.dχ22Xi∼i.i.dBeta(θ,1)⟹−2θln⁡Xi∼i.i.dχ22X_i\stackrel{\text{i.i.d}}{\sim}\text{Beta}(\theta,1)\implies -2\theta\ln X_i\stackrel{\text{i.i.d}}{\sim}\chi^2_2,使−2θT∼χ22n−2θT∼χ2n2-2\theta\, T\sim\chi^2_{2n}。 所以,rrr的阶原时刻−2θT−2θT-2\theta\,T大约为零,作为使用卡方PDF计算是E(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(−2θT)r=2rΓ(n+r)Γ(n),n+r&gt;0E(-2\theta\,T)^r=2^r\frac{\Gamma\left(n+r\right)}{\Gamma\left(n\right)}\qquad ,\,n+r>0 因此,似乎对于rrr不同整数选择,我将获得θθ\theta的不同整数幂的无偏估计量(和UMVUE)。例如,E(−Tn)=1θE(−Tn)=1θE\left(-\frac{T}{n}\right)=\frac{1}{\theta}和E(1−nT)=θE(1−nT)=θE\left(\frac{1-n}{T}\right)=\theta直接给我1的UMVUE1θ1θ\frac{1}{\theta}和θθ\theta。 现在,当θ&gt;1θ&gt;1\theta>1我们有θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯\frac{\theta}{1+\theta}=\left(1+\frac{1}{\theta}\right)^{-1}=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots。 我绝对可以得到1的UMVUE1θ,1θ2,1θ31θ,1θ2,1θ3\frac{1}{\theta},\frac{1}{\theta^2},\frac{1}{\theta^3}等。所以结合这些UMVUE是我能得到所需的UMVUEθ1+θθ1+θ\frac{\theta}{1+\theta}。此方法有效吗?还是我应该继续第一种方法?由于UMVUE存在时是唯一的,因此两者都应给我相同的答案。 明确地说,我得到E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E(1+Tn+T2n(n+1)+T3n(n+1)(n+2)+⋯)=1−1θ+1θ2−1θ3+⋯E\left(1+\frac{T}{n}+\frac{T^2}{n(n+1)}+\frac{T^3}{n(n+1)(n+2)}+\cdots\right)=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots 即,E(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE(∑r=0∞Trn(n+1)...(n+r−1))=θ1+θE\left(\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}\right)=\frac{\theta}{1+\theta} 有没有可能是我需要的是UMVUE ∑r=0∞Trn(n+1)...(n+r−1)∑r=0∞Trn(n+1)...(n+r−1)\displaystyle\sum_{r=0}^\infty \frac{T^r}{n(n+1)...(n+r-1)}当θ&gt;1θ&gt;1\theta>1? 为0&lt;θ&lt;10&lt;θ&lt;10<\theta<1,我会得到g(θ)=θ(1+θ+θ2+⋯)g(θ)=θ(1+θ+θ2+⋯)g(\theta)=\theta(1+\theta+\theta^2+\cdots),因此将UMVUE不同。 已经确信的是,在第一种方法的条件期望值不能直接找到,因为E(X1∣∑lnXi=t)=E(X1∣∏Xi=et)E(X1∣∑ln⁡Xi=t)=E(X1∣∏Xi=et)E(X_1\mid \sum\ln X_i=t)=E(X_1\mid \prod X_i=e^t),我已经着手寻找条件分布X1∣∏XiX1∣∏XiX_1\mid \prod X_i。为此,我需要(X1,∏Xi)(X1,∏Xi)(X_1,\prod X_i)的联合密度。 我用了变数(X1,⋯,Xn)→(Y1,⋯,Yn)(X1,⋯,Xn)→(Y1,⋯,Yn)(X_1,\cdots,X_n)\to (Y_1,\cdots,Y_n)使得Yi=∏ij=1XjYi=∏j=1iXjY_i=\prod_{j=1}^i X_j所有i=1,2,⋯,ni=1,2,⋯,ni=1,2,\cdots,n。这导致关节支承的(Y1,⋯,Yn)(Y1,⋯,Yn)(Y_1,\cdots,Y_n)是S={(y1,⋯,yn):0&lt;y1&lt;1,0&lt;yj&lt;yj−1 for j=2,3,⋯,n}S={(y1,⋯,yn):0&lt;y1&lt;1,0&lt;yj&lt;yj−1 for …

1
什么时候不使用交叉验证?
当我阅读该站点时,大多数答案都建议交叉验证应在机器学习算法中进行。但是,当我阅读《理解机器学习》一书时,我看到有一种练习,有时最好不要使用交叉验证。我真的很困惑 什么时候对整个数据进行训练算法比交叉验证更好?它是否发生在真实的数据集中? 让是k个假设类。假设你是给米 IID训练例子,你想学习类^ h = ∪ ķ 我= 1 ^ h 我。考虑两种替代方法:H1个,。。。,HķH1,...,HkH_1,...,H_k米mmH= ∪ķ我= 1H一世H=∪i=1kHiH=\cup^k_{i=1}H_i 使用ERM规则在m个示例中学习HHH米mm 划分米实例为训练集的大小的和验证组的大小α 米,对于一些α &Element; (0 ,1 )。然后,使用验证应用模型选择方法。也就是说,第一个训练每个类ħ 我在(1 - α )米使用相对于所述ERM规则训练样例ħ 我,并让ħ 1,... ,ħ ķ(1 - α )米(1−α)m(1−\alpha)mα 米αm\alpha mα &Element; (0 ,1 )α∈(0,1)\alpha\in(0,1)H一世HiH_i(1−α)m(1−α)m(1−\alpha)mHiHiH_ih^1,…,h^kh^1,…,h^k\hat{h}_1,\ldots,\hat{h}_k成为假设。其次,相对于应用该规则ERM到无限类{ ħ 1,... ,ħ ķ }对α 米验证的例子。h^1,…,h^kh^1,…,h^k\hat{h}_1,\ldots,\hat{h}_kαmαm\alpha m 描述第一种方法优于第二种方法的情况,反之亦然。 形象的态度。

3
数据科学家访谈问题:线性回归低,您会怎么做
我遇到了一个工作的面试问题,面试官问我,假设您的价格弹性模型的非常低(介于5%到10%之间)。您将如何解决这个问题?R2R2R^2 除了我将进行回归诊断以查看出了什么问题或是否应该应用任何非线性方法外,我什么也没想到。我以某种方式认为面试官对我的回答不满意。尽管低,在这种情况下还有其他方法可以拟合模型并用于生产水平预测吗?R2R2R^2 编辑:在稍后的阶段,他们给了我数据以在面试中对问题进行建模,我尝试添加了滞后变量,竞争对手价格的影响,季节性假人,看是否有任何不同。达到了17.6%,在保留样本上的表现很差。我个人认为将这样的模型放在实时环境中进行预测是不道德的,因为它会产生错误的结果并导致客户流失(想象一下,使用这种模型中的定价建议对您的公司收益!)。在这种情况下还有什么其他所有人都需要知道的事情吗?我不知道的什么,我很想说“银弹”?R2R2R^2 此外,让我们想象一下,添加外生变量后再提高2%,那么在这种情况下可以做什么?我们应该放弃建模项目,还是仍然有希望开发出生产水平质量的模型,该模型由保留样本的性能来表示?R2R2R^2 Edit2:我已将此问题发布在Economics.stackexchange.com论坛上,以从经济学的角度理解此问题

2
期望
令,,,为独立的。的期望是什么?X1X1X_1X2X2X_2⋯⋯\cdotsXd∼N(0,1)Xd∼N(0,1)X_d \sim \mathcal{N}(0, 1)X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} 容易找到。但是我不知道如何找到。您能提供一些提示吗?E(X21X21+⋯+X2d)=1dE(X12X12+⋯+Xd2)=1d\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right) = \frac{1}{d}X41(X21+⋯+X2d)2X14(X12+⋯+Xd2)2\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2} 到目前为止我得到了什么 我想通过对称找到。但这与因为可能不等于。因此,我需要其他一些想法来找到期望。E(X41(X21+⋯+X2d)2)E(X14(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_1^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E(X21X21+⋯+X2d)E(X12X12+⋯+Xd2)\mathbb{E}\left(\frac{X_1^2}{X_1^2 + \cdots + X_d^2}\right)E(X4i(X21+⋯+X2d)2)E(Xi4(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^4}{(X_1^2 + \cdots + X_d^2)^2}\right)E(X2iX2j(X21+⋯+X2d)2)E(Xi2Xj2(X12+⋯+Xd2)2)\mathbb{E}\left(\frac{X_i^2X_j^2}{(X_1^2 + \cdots + X_d^2)^2}\right) 这个问题来自哪里 数学堆栈交换中的一个问题要求S ^ {d-1}上的单位均匀随机向量x的方差。我的推导表明,答案非常取决于\ mathbb {E} \ left(\ frac {X_i ^ 4} {(X_1 …

1
通过订单统计显示预估值收敛到百分位数
令是从alpha稳定分布中采样的iid随机变量序列,其参数。X1,X2,…,X3nX1,X2,…,X3nX_1, X_2, \ldots, X_{3n}α=1.5,β=0,c=1.0,μ=1.0α=1.5,β=0,c=1.0,μ=1.0\alpha = 1.5, \; \beta = 0, \; c = 1.0, \; \mu = 1.0 现在考虑序列,其中Y_ {j + 1} = X_ {3j + 1} X_ {3j + 2} X_ {3j + 3}-1,对于j = 0, \ ldots,n-1。Y1,Y2,…,YnY1,Y2,…,YnY_1, Y_2, \ldots, Y_{n}Yj+1=X3j+1X3j+2X3j+3−1Yj+1=X3j+1X3j+2X3j+3−1个Y_{j+1} = X_{3j+1}X_{3j+2}X_{3j+3} - 1j = 0 ,… ,n …

1
两个样本卡方检验
这个问题来自范德法特(Van der Vaart)的书《渐近统计》(渐近统计)。253.#3: 假设和是具有参数和独立多项式向量。在零假设下表明XmXm\mathbf{X}_mYnYn\mathbf{Y}_n(m,a1,…,ak)(m,a1,…,ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(n,b1,…,bk)(n,b_1,\ldots,b_k)ai=biai=bia_i=b_i ∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i}具有分布。其中。Ç我 = (X 米,我 + ÿ Ñ ,我)/(米+ Ñ )χ2k−1χk−12\chi^2_{k-1}c^i=(Xm,i+Yn,i)/(m+n)c^i=(Xm,i+Yn,i)/(m+n)\hat{c}_i = (X_{m,i} + Y_{n,i})/(m+n) 我需要一些入门帮助。这里的策略是什么?我能够将两个求和数合并为: ∑i=1k(mYn,i−nXm,i)2mn(m+n)c^i∑i=1k(mYn,i−nXm,i)2mn(m+n)c^i\sum_{i=1}^k \dfrac{(mY_{n,i} - nX_{m,i})^2}{mn(m+n)\hat{c}_i} 但与CLT,因为它的加权组合这不会工作XmXmX_m和YnYnY_n。不确定这是否是正确的路径。有什么建议么? 编辑:如果m=nm=nm=n则很容易,因为我们得到 mYn−nXmmn(m+n)−−−−−−−−−√=Yn−Xm(m+n)−−−−−−−√mYn−nXmmn(m+n)=Yn−Xm(m+n)\begin{align*} \dfrac{mY_{n} - nX_{m}}{\sqrt{mn(m+n)}} &= \dfrac{Y_{n} - X_{m}}{\sqrt{(m+n)}} \end{align*} 其中分子可以看作是多项式变量的差之和,因此我们可以应用CLT,然后使用同一章的定理17.2结束它。但是,我无法弄清楚如何在这种情况下使用不同的样本量来解决这个问题。有什么帮助吗?(1,a1,…,ak)(1,a1,…,ak)(1,a_1,\ldots,a_k) 链接到van der Vaart的 Google图书的第17章

1
找到独特的MVUE
该问题来自Robert Hogg的《数理统计入门》第六版问题7.4.9,第388页。 令用pdf在其他地方为零,其中。X1,...,XnX1,...,XnX_1,...,X_nf(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;θ)=1/3θ,−θ&lt;x&lt;2θ,f(x;\theta)=1/3\theta,-\theta0 (a)求MLE的θ^θ^\hat{\theta}θθ\theta (b)足够用于统计?为什么呢θ^θ^\hat{\theta}θθ\theta (c)是的唯一MVUE 吗?为什么呢(n+1)θ^/n(n+1)θ^/n(n+1)\hat{\theta}/nθθ\theta 我想我可以解决(a)和(b),但是我对(c)感到困惑。 为一个): 令为订单统计信息。Y1&lt;Y2&lt;...YnY1&lt;Y2&lt;...YnY_10 因此,似然函数正在减小。L(θ;x)L(θ;x)L(\theta;x) 从和, 和 (−θ&lt;y1(−θ&lt;y1(-\theta< y_1 yn&lt;2θ)yn&lt;2θ) y_n < 2\theta)⇒⇒\Rightarrow (θ&gt;−y1(θ&gt;−y1(\theta>-y_1 θ&gt;yn/2),⇒θ&gt;max(−y1,yn/2)θ&gt;yn/2),⇒θ&gt;max(−y1,yn/2)\theta>y_n/2), \Rightarrow \theta>max(-y_1,y_n/2) L(θ,x)L(θ,x)L(\theta,x)被降低,因此,当具有samllest值似然函数将达到最大,因为,当,似然函数将达到最大值。θθ\thetaθ&gt;max(−y1,yn/2)θ&gt;max(−y1,yn/2)\theta>max(-y_1,y_n/2)θ=max(−y1,yn/2)θ=max(−y1,yn/2)\theta=max(-y1,y_n/2) ∴∴\therefore theremleθ^=max(−y1,yn/2)θ^=max(−y1,yn/2)\hat{\theta}=max(-y_1,y_n/2) 对于(b): f(x1;θ)f(x2;θ)...f(xn;θ)=1(3θ)n∏niI(−θ&lt;xi&lt;2θ)=1(3θ)nI(max(xi)&lt;2θ)×1f(x1;θ)f(x2;θ)...f(xn;θ)=1(3θ)n∏inI(−θ&lt;xi&lt;2θ)=1(3θ)nI(max(xi)&lt;2θ)×1f(x_1;\theta)f(x_2;\theta)...f(x_n;\theta)=\frac{1}{(3\theta)^n}\prod_{i}^{n} I(-\theta-\theta)\times 1 ∴∴\therefore通过Neyman的因式分解定理,对于是足够的统计量。因此,也是足够的统计信息。y1=min(xi)y1=min(xi)y_1=min(x_i)θθ\theta−y1−y1-y_1 对于(c): 首先,我们找到的CDFXXX F(x)=∫x−θ13θdt=x+θ3θ,−θ&lt;x&lt;2θF(x)=∫−θx13θdt=x+θ3θ,−θ&lt;x&lt;2θF(x)=\int_{-\theta}^{x}\frac{1}{3\theta}dt=\frac{x+\theta}{3\theta},-\theta0 因此,pdf族已完成。Y1Y1Y_1 同样,仍然通过,我们可以证明pdf族是完整的。FTCFTCFTCYnYnY_n 现在的问题是,我们需要证明是无偏的。(n+1)θ^n(n+1)θ^n\frac{(n+1)\hat{\theta}}{n} 当θ^=−y1θ^=−y1\hat{\theta}=-y_1 E(−y1)=∫2θ−θ(−y1)n(3θ)n(2θ−y1)n−1dy1=1(3θ)n∫2θ−θy1d(2θ−y1)nE(−y1)=∫−θ2θ(−y1)n(3θ)n(2θ−y1)n−1dy1=1(3θ)n∫−θ2θy1d(2θ−y1)nE(-y_1)=\int_{-\theta}^{2\theta}(-y_1)\frac{n}{(3\theta)^n}(2\theta-y_1)^{n-1}dy_1=\frac{1}{(3\theta)^n}\int_{-\theta}^{2\theta}y_1d(2\theta-y_1)^n 我们可以通过零件积分来求解积分 E(−y1)=1(3θ)n[y1(2θ−y1)n∣2θ−θ−∫2θ−θ(2θ−y1)ndy1]=1(3θ)n[θ(3θ)n−(3θ)n+1n+1]=θ−3θn+1=(n−2)θn+1E(−y1)=1(3θ)n[y1(2θ−y1)n∣−θ2θ−∫−θ2θ(2θ−y1)ndy1]=1(3θ)n[θ(3θ)n−(3θ)n+1n+1]=θ−3θn+1=(n−2)θn+1E(-y_1)=\frac{1}{(3\theta)^n}[y_1(2\theta-y_1)^n\mid_{-\theta}^{2\theta}-\int_{-\theta}^{2\theta}(2\theta-y_1)^ndy_1]=\frac{1}{(3\theta)^n}[\theta (3\theta)^n-\frac{(3\theta)^{n+1}}{n+1}]=\theta-\frac{3\theta}{n+1}=\frac{(n-2)\theta}{n+1} ∴E((n+1)θ^n)=n+1nE(−y1)=n+1n(n−2)θn+1=n−2nθ∴E((n+1)θ^n)=n+1nE(−y1)=n+1n(n−2)θn+1=n−2nθ\therefore E(\frac{(n+1)\hat{\theta}}{n})=\frac{n+1}{n}E(-y_1)=\frac{n+1}{n}\frac{(n-2)\theta}{n+1}=\frac{n-2}{n}\theta 因此,当时,并非的无偏估计量(n+1)θ^n(n+1)θ^n\frac{(n+1)\hat{\theta}}{n}θθ\thetaθ^=−y1θ^=−y1\hat{\theta}=-y_1 当θ^=yn/2θ^=yn/2\hat{\theta}=y_n/2 E(Yn)=∫2θ−θynn(3θ)n(yn+θ)n−1dyn=1(3θ)n∫2θ−θynd(yn+θ)n=1(3θ)n[yn(yn+θ)n∣2θ−θ−∫2θ−θ(yn+θ)ndyn]=1(3θ)n[2θ(3θ)−(3θ)n+1n+1]=2θ−3θn+1=2n−1n+1θE(Yn)=∫−θ2θynn(3θ)n(yn+θ)n−1dyn=1(3θ)n∫−θ2θynd(yn+θ)n=1(3θ)n[yn(yn+θ)n∣−θ2θ−∫−θ2θ(yn+θ)ndyn]=1(3θ)n[2θ(3θ)−(3θ)n+1n+1]=2θ−3θn+1=2n−1n+1θE(Y_n)=\int_{-\theta}^{2\theta}y_n\frac{n}{(3\theta)^n}(y_n+\theta)^{n-1}dy_n=\frac{1}{(3\theta)^n}\int_{-\theta}^{2\theta}y_nd(y_n+\theta)^n=\frac{1}{(3\theta)^n}[y_n(y_n+\theta)^n\mid_{-\theta}^{2\theta}-\int_{-\theta}^{2\theta}(y_n+\theta)^ndy_n]=\frac{1}{(3\theta)^n}[2\theta(3\theta)^-\frac{(3\theta)^{n+1}}{n+1}]=2\theta-\frac{3\theta}{n+1}=\frac{2n-1}{n+1}\theta ∴E((n+1)θ^n)=n+1nE(Yn/2)=n+12nE(Yn)=n+12n2n−1n+1θ=2n−12nθ∴E((n+1)θ^n)=n+1nE(Yn/2)=n+12nE(Yn)=n+12n2n−1n+1θ=2n−12nθ\therefore E(\frac{(n+1)\hat{\theta}}{n})=\frac{n+1}{n}E(Y_n/2)=\frac{n+1}{2n}E(Y_n)=\frac{n+1}{2n}\frac{2n-1}{n+1}\theta=\frac{2n-1}{2n}\theta 不过,当时,并不是的无偏估计量(n+1)θ^n(n+1)θ^n\frac{(n+1)\hat{\theta}}{n}θθ\thetaθ^=yn/2θ^=yn/2\hat{\theta}=y_n/2 …

4
假设是iid随机变量。预计序列何时会首次减少?
如标题中所建议。假设是pdf连续iid随机变量。考虑,,因此是序列首次减少时的时间。那么的值是多少?X1个,X2,… ,XñX1个,X2,…,XñX_1, X_2, \dotsc, X_nFFfX1个≤ X2... ≤ Xñ− 1&gt; XñX1个≤X2…≤Xñ-1个&gt;XñX_1 \leq X_2 \dotsc \leq X_{N-1} > X_Nñ≥ 2ñ≥2N \geq 2ññNË[ N]Ë[ñ]E[N] 我尝试首先评估。我有 同样,我得到。当变大时,计算变得更加复杂,我找不到模式。谁能建议我应该如何进行?P[ N= 我]P[ñ=一世]P[N = i] P[N=4]=1P[ N= 2 ]P[ N= 3 ]= ∫∞- ∞F(x )F(x )dX= F(x )22|∞- ∞= 12= ∫∞- ∞F(x )∫∞XF(y)F(y)dÿdX= ∫∞- ∞F(x )1 − F(x …

2
证明或提供反例: 如果,则XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, (∏ n i = 1 X i )1 / nXXX(∏ni=1Xi)1/n(∏i=1nXi)1/n(\prod_{i=1}^{n}X_i)^{1/n} →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, XXX 我的尝试: 否:假设只能取负值,并且假设X ñ ≡ X ∀ ñXXXXn≡XXn≡XX_n \equiv X ∀∀\forall nnn THEN,但是即使,也不严格是负数。相反,它将负数替换为正数和负数。因此,不收敛几乎肯定到。XnXnX_n →a.s.→a.s.\,{\buildrel a.s. \over \rightarrow}\, n (∏ n i = 1 X i )1 / n(∏ n i …

1
k最近邻的VC维
如果k等于使用的训练点数,则k最近邻居算法的VC维是多少? 上下文:在我参加的课程中提出了这个问题,给出的答案为0。但是,我确实不明白为什么会这样。我的直觉是,VC-Dimension应该为1,因为应该可以选择两个模型(即训练点集),以便根据第一个模型,每个点都被标记为属于一个类别,而属于另一个类别根据第二种模型,因此应该有可能粉碎单个点。我的推理错误在哪里?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.