Questions tagged «self-study»

从课本,自学中使用的教科书,课程或测试的例行练习。该社区的政策是为此类问题“提供有用的提示”,而不是完整的答案。

2
EM算法练习题
这是期中考试的练习题。问题是一个EM算法示例。我在(f)部分遇到了麻烦。我列出了要完成的部分(a)-(e),以防万一我之前弄错了。 令是速率为独立指数随机变量。不幸的是,没有观察到实际的值,我们仅观察值是否落在特定间隔内。令,和 对于。观察到的数据由。X1,…,XnX1,…,XnX_1,\ldots,X_nθθ\thetaXXXXXXG1j=1{Xj&lt;1}G1j=1{Xj&lt;1}G_{1j} = \mathbb{1}\left\{X_j < 1\right\}G2j=1{1&lt;Xj&lt;2}G2j=1{1&lt;Xj&lt;2}G_{2j} = \mathbb{1}\left\{1< X_j<2\right\}G3j=1{Xj&gt;2}G3j=1{Xj&gt;2}G_{3j} = \mathbb{1}\left\{X_j > 2\right\}j = 1 ,… ,nĴ=1个,…,ñj=1,\ldots,n(G1 Ĵ,G2 Ĵ,G3 Ĵ)(G1个Ĵ,G2Ĵ,G3Ĵ)(G_{1j},G_{2j},G_{3j}) (a)给出观察到的数据可能性: L (θ | G )=∏j = 1ñ镨{XĴ&lt; 1 }G1 Ĵ镨{ 1 &lt;XĴ&lt; 2 }G2 Ĵ镨{XĴ&gt; 2 }G3 Ĵ=∏j = 1ñ(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3jL(θ|G)=∏j=1nPr{Xj&lt;1}G1jPr{1&lt;Xj&lt;2}G2jPr{Xj&gt;2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3Ĵ\begin{align*} L(\theta | G) &= \prod_{j=1}^n \text{Pr}\left\{X_j < 1\right\}^{G_{1j}}\text{Pr}\left\{12\right\}^{G_{3j}}\\ …

4
什么是“严格正分配”?
我正在阅读Judea Pearl的“因果关系”(2009年第二版),并在第1.1.5条“条件独立性和图形素”中指出: 以下是由条件独立关系(X_ || _Y | Z)满足的属性的(部分)列表。 对称性:(X_ || _ Y | Z)==&gt;(Y_ || _X | Z)。 分解:(X_ || _ YW | Z)==&gt;(X_ || _Y | Z)。 弱联合:(X_ || _ YW | Z)==&gt;(X_ || _Y | ZW)。 收缩:(X_ || _ Y | Z)&(X_ || _ W | ZY)==&gt;(X_ || _ …

2
分布\ CLT中的收敛
鉴于 N=nN=nN = n,条件限制区。的YYY 是 χ2(2n)χ2(2n)\chi ^2(2n)。 NNN有边际收益。泊松(θθ\theta), θθ\theta 是一个正常数。 证明为 θ→∞θ→∞\theta \rightarrow \infty, (Y−E(Y))/Var(Y)−−−−−−√→N(0,1) (Y−E(Y))/Var⁡(Y)→N(0,1)\space \space (Y - E(Y))/ \sqrt{\operatorname{Var}(Y)} \rightarrow N(0,1) 在分配。 谁能提出解决这个问题的策略。似乎我们需要使用CLT(中心极限定理),但是要获取任何信息似乎很难YYY在其自己的。是否可以引入rv来取样,生成YYY? 这是家庭作业这样的提示理解。

1
不存在力矩时的CLT示例
考虑Xñ=⎧⎩⎨1个− 12ķWP (1 -2− n)/ 2WP (1 -2− n)/ 2wp 2− k 对于 k &gt; nXn={1w.p. (1−2−n)/2−1w.p. (1−2−n)/22kw.p. 2−k for k&gt;nX_n = \begin{cases} 1 & \text{w.p. } (1 - 2^{-n})/2\\ -1 & \text{w.p. } (1 - 2^{-n})/2\\ 2^k & \text{w.p. } 2^{-k} \text{ for } k > n\\ \end{cases} 我需要证明,即使有无限的瞬间,ñ--√(X¯ñ)→dñ(0 …

2
自举样本的样本均值方差
令为不同的观察值(无联系)。令表示引导程序样本(来自经验CDF的样本),并令。找到E(\ bar {X} _ {n} ^ {*})和\ mathrm {Var}(\ bar {X} _ {n} ^ {*})。X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}X¯∗n=1n∑ni=1X∗iX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯∗n)E(X¯n∗)E(\bar{X}_{n}^{*})Var(X¯∗n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) 到目前为止,我得到的是X∗iXi∗X_{i}^{*}是X1个,。。。,XñX1,...,XnX_{1},...,X_{n}每个概率为1个ñ1n\frac{1}{n}所以 Ë(X∗一世)=1个ñË(X1个)+ 。。。+1个ñË(Xñ)=ñ μñ= μË(X一世∗)=1个ñË(X1个)+。。。+1个ñË(Xñ)=ñμñ=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu 和 Ë(X* 2一世)=1个ñË(X21个)+ 。。。+1个ñË(X2ñ)=n (μ2+σ2)ñ=μ2+σ2,Ë(X一世∗2)=1个ñË(X1个2)+。。。+1个ñË(Xñ2)=ñ(μ2+σ2)ñ=μ2+σ2,E(X_{i}^{*2})=\frac{1}{n}E(X_{1}^{2})+...+\frac{1}{n}E(X_{n}^{2})=\frac{n(\mu^{2}+\sigma^{2})}{n}=\mu^{2}+\sigma^{2}\>, 给出 V 一[R (X∗一世)= E(X* 2一世)- (E(X∗一世))2=μ2+σ2-μ2=σ2。V一个[R(X一世∗)=Ë(X一世∗2)-(Ë(X一世∗))2=μ2+σ2-μ2=σ2。 \mathrm{Var}(X_{i}^{*})=E(X_{i}^{*2})-(E(X_{i}^{*}))^{2}=\mu^{2}+\sigma^{2}-\mu^{2}=\sigma^{2} \>. 然后, Ë(X¯∗ñ)= E(1个ñ∑我= 1ñX∗一世)=1个ñ∑我= 1ñË(X∗一世)=ñ μñ= μË(X¯ñ∗)=Ë(1个ñ∑一世=1个ñX一世∗)=1个ñ∑一世=1个ñË(X一世∗)=ñμñ=μE(\bar{X}_{n}^{*})=E(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n}\sum_{i=1}^{n}E(X_{i}^{*})=\frac{n\mu}{n}=\mu 和 V 一[R (X¯∗ñ)= V a r(1个ñ∑我= 1ñX∗一世)=1个ñ2∑我= …

2
IID随机变量和的商的期望(剑桥大学工作表)
我正在准备一个面试,要求对基础概率有相当的了解(至少要通过面试本身)。从学生时代开始,我正在整理以下表格。这通常是相当简单的,但是我完全被问题12困扰。 http://www.trin.cam.ac.uk/dpk10/IA/exsheet2.pdf 任何帮助,将不胜感激。 编辑:问题是: 假设是具有和独立均匀分布的正随机变量。令。显示当时,并且时。X1个,X2,。。。X1,X2,...X_1, X_2, ... E(X1个)= μ &lt; ∞E(X1)=μ&lt;∞\mathbb{E}(X_1) = \mu < \inftyE(X− 11个)&lt; ∞E(X1−1)&lt;∞\mathbb{E}(X_1^{-1}) < \infty小号ñ=∑ñ我= 1X一世Sn=∑i=1nXiS_n = \sum_{i=1}^n X_iE(小号米/小号ñ)= m / nE(Sm/Sn)=m/n\mathbb{E}(S_m/S_n) = m/nm &lt; = nm&lt;=nm<=nE(小号米/小号ñ)= 1 + (米- ñ )μ È(小号− 1ñ))E(Sm/Sn)=1+(m−n)μE(Sn−1))\mathbb{E}(S_m/S_n) = 1 + (m-n)\mu\mathbb{E}(S_n^{-1}))m &gt; = n米&gt; =ñm>=n 实际上,在键入内容的过程中,我已经解决了第二部分。 对于,m &gt; = …

3
有关统计生态学的书籍?
我知道之前曾问过这个问题:生态学参考书,但这不是我想要的。 我在寻找的是是否有人可以推荐一本关于统计生态学的好书(或规范的参考书)?我对统计数据有很好的理解,因此该书确实可以适用于任何水平。我会用这本书来教自己更多关于统计学在生态学中的应用,而不是其他任何东西,因此,即使是一本带有良好/有趣示例的入门书,也将不胜感激。另外,我的研究倾向于针对贝叶斯统计,因此结合贝叶斯统计的书甚至更好!


1
如何比较观察到的事件与预期的事件?
假设我有一个频率为4个可能的事件的样本: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 并且我具有发生事件的预期概率: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 利用我四个事件的观测频率之和(18),我可以计算事件的预期频率,对吗? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

1
使用二阶泰勒级数传播误差
我正在阅读John Rice的文章“数学统计和数据分析”。我们关注随机变量的期望值和方差的近似值。我们能够计算随机变量的期望值和方差,并且我们知道关系。因此,可以使用关于的泰勒级数展开来逼近的期望值和方差。YYYXXXY=g(X)Y=g(X)Y = g(X)YYYgggμXμX\mu_X 在第162页上,他列出了3个方程式。 使用一阶泰勒级数展开式的的期望值。它是:。这在我的问题后面称为。YYYμY≈g(μX)μY≈g(μX)\mu_Y \approx g(\mu_X)E(Y1)E(Y1)E(Y_1) 使用一阶泰勒级数展开式的的方差。它是:。这在我的问题后面称为。YYYσ2Y≈σ2X(g′(μX))2σY2≈σX2(g′(μX))2\sigma_Y^2 \approx \sigma_X^2 (g'(\mu_X))^2Var(Y1)Var(Y1)Var(Y_1) 使用二阶泰勒级数展开式的的期望值。它是。在我的问题中稍后将其称为E(Y_2)。YYYμY≈g(μX)+12σ2Xg′′(μX)μY≈g(μX)+12σX2g″(μX)\mu_Y \approx g(\mu_X) + \frac12 \sigma_X^2 g''(\mu_X)E(Y2)E(Y2)E(Y_2) 请注意,Y有两个不同的表达式,YYY因为我们在泰勒级数展开中使用了两个不同的阶数。等式1和2表示Y1=g(X)≈g(μX)+(X−μX)g′(μX)Y1=g(X)≈g(μX)+(X−μX)g′(μX)Y_1 = g(X) \approx g(\mu_X) + (X-\mu_X)g'(\mu_X)。等式3表示Y2=g(X)≈g(μX)+(X−μX)g′(μX)+12(X−μX)2g′′(μX)Y2=g(X)≈g(μX)+(X−μX)g′(μX)+12(X−μX)2g″(μX)Y_2 = g(X) \approx g(\mu_X) + (X-\mu_X)g'(\mu_X) + \frac12 (X-\mu_X)^2 g''(\mu_X)。 注意,没有具体给出Var(Y_2)的方程Var(Y2)Var(Y2)Var(Y_2)。后来,当作者实际上指的是Y_2的期望值(公式3)时,作者似乎将其用于Y_1的方差Y1Y1Y_1(公式2 )。这似乎暗示Var(Y_2)= Var(Y_1)。Y2Y2Y_2Var(Y2)=Var(Y1)Var(Y2)=Var(Y1)Var(Y_2) = Var(Y_1) 我尝试手动计算,但表达式却变得有些复杂。这是我的工作(我停了下来,因为最终我得到了期望的项): Var(Y2)Var(Y2)Var(Y_2)X3X3X^3Var(Y2)=E[(g(μX)+(X−μX)a+12(X−μX)2b−g(μX)−12σ2Xb)2]=E[((X−μX)a+(12(X−μX)2−12σ2X)b)2]=E[(ca+(12c2−12σ2X)b)2]=E[c2a2+ca(c2−σ2X)b+14(c2−σ2X)2b2]=E[(X2−2XμX+μ2X)a2+(X−μX)a((X2−2XμX+μ2X)−σ2X)b+14((X2−2XμX+μ2X)−σ2X)2b2]Var(Y2)=E[(g(μX)+(X−μX)a+12(X−μX)2b−g(μX)−12σX2b)2]=E[((X−μX)a+(12(X−μX)2−12σX2)b)2]=E[(ca+(12c2−12σX2)b)2]=E[c2a2+ca(c2−σX2)b+14(c2−σX2)2b2]=E[(X2−2XμX+μX2)a2+(X−μX)a((X2−2XμX+μX2)−σX2)b+14((X2−2XμX+μX2)−σX2)2b2] \begin{aligned} Var(Y_2) &= E[( g(\mu_X) + (X-\mu_X)a …

1
最小角度回归使相关性单调递减并受束缚?
我正在尝试解决最小角度回归(LAR)问题。这是一个问题3.23页面上97的黑斯蒂等,统计学习的要素,第2位。ed。(第5次打印)。 考虑所有变量和响应均值为零,标准差为1的回归问题。还假设每个变量与响应具有相同的绝对相关性: 1N|⟨xj,y⟩|=λ,j=1,...,p1N|⟨xj,y⟩|=λ,j=1,...,p \frac{1}{N} | \left \langle \bf{x}_j, \bf{y} \right \rangle | = \lambda, j = 1, ..., p 令为上最小二乘系数,并令为。β^β^\hat{\beta}yy\mathbf{y}XX\mathbf{X}u(α)=αXβ^u(α)=αXβ^\mathbf{u}(\alpha)=\alpha \bf{X} \hat{\beta}α∈[0,1]α∈[0,1]\alpha\in[0,1] 要求我显示 ,我对此有疑问。请注意,这基本上可以说,随着我们向前进,每个与残差的相关性在大小上保持相等。1N|⟨xj,y−u(α)⟩|=(1−α)λ,j=1,...,p1N|⟨xj,y−u(α)⟩|=(1−α)λ,j=1,...,p \frac{1}{N} | \left \langle \bf{x}_j, \bf{y}-u(\alpha) \right \rangle | = (1 - \alpha) \lambda, j = 1, ..., p xjxjx_juuu 我也不知道如何显示相关性等于: λ(α)=(1−α)(1−α)2+α(2−α)N⋅RSS√⋅λλ(α)=(1−α)(1−α)2+α(2−α)N⋅RSS⋅λ\lambda(\alpha) = \frac{(1-\alpha)}{\sqrt{(1-\alpha)^2 + \frac{\alpha …

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
寻找的边际密度
如标题所示,我正在寻找的边际密度F(x ,y)= c1 -X2-ÿ2---------√,X2+ÿ2≤1 。F(X,ÿ)=C1个-X2-ÿ2,X2+ÿ2≤1。f (x,y) = c \sqrt{1 - x^2 - y^2}, x^2 + y^2 \leq 1. 到目前为止,我发现为。我通过将转换为极坐标并在积分来弄清楚,这就是为什么我被困在边际密度部分上的原因。我知道,但是我不确定如何在没有大的混乱积分的情况下解决这个问题,我知道答案是“应该是一个很大的混乱积分。是否有可能找到,然后采用来找到CCc32个π32π\frac{3}{2 \pi}F(x ,y)F(X,ÿ)f(x,y)d[R dθd[Rdθdrd\thetaFX(x )=∫∞- ∞F(x ,y)dÿFX(X)=∫-∞∞F(X,ÿ)dÿf_x(x) = \int_{-\infty}^\infty f(x,y)dyF(x ,y)F(X,ÿ)F(x,y)dFdXdFdX\frac{dF}{dx}FX(x )FX(X)f_x(x)?这似乎是一种直观的方法,但我似乎无法在教科书中找到说明这些关系的任何内容,因此我不想做出错误的假设。

3
正态分布
不幸的是,有一个统计问题,我不知道从哪里开始(我正在独自学习,所以如果我听不懂的话,没有人可以问。 问题是 iid N (a ,b 2); a = 0 ; b 2 = 6 ; v a r (X 2 + Y 2)= ?X,YX,YX,Yñ(a ,b2); a = 0 ; b2= 6 ; v 一个[R (X2+ Y2)= ?N(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b^2); a=0; b^2=6; var(X^2+Y^2)=?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.