Questions tagged «self-study»

从课本,自学中使用的教科书,课程或测试的例行练习。该社区的政策是为此类问题“提供有用的提示”,而不是完整的答案。

2
如果和是各自均值为零的独立法线变量,则也是法线变量
我试图证明这一说法: 如果和是独立随机变量,X∼N(0,σ21)X∼N(0,σ12)X\sim\mathcal{N}(0,\sigma_1^2)Y∼N(0,σ22)Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) 那么也是一个普通随机变量。XYX2+Y2√XYX2+Y2\frac{XY}{\sqrt{X^2+Y^2}} 对于特殊情况(例如),我们得到的著名结果是每当和是独立的变量时。实际上,更普遍地知道是独立的变量。σ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigmaXYX2+Y2√∼N(0,σ24)XYX2+Y2∼N(0,σ24)\frac{XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}\left(0,\frac{\sigma^2}{4}\right)XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,σ24)N(0,σ24)\mathcal{N}\left(0,\frac{\sigma^2}{4}\right) 最后的证明是使用的变换其中而。实际上,这里和。我试图模仿这个证明来解决手头的问题,但看起来似乎很混乱。(X,Y)→(R,Θ)→(U,V)(X,Y)→(R,Θ)→(U,V)(X,Y)\to(R,\Theta)\to(U,V)x=rcosθ,y=rsinθx=rcos⁡θ,y=rsin⁡θx=r\cos\theta,y=r\sin\thetau=r2sin(2θ),v=r2cos(2θ)u=r2sin⁡(2θ),v=r2cos⁡(2θ)u=\frac{r}{2}\sin(2\theta),v=\frac{r}{2}\cos(2\theta)U=XYX2+Y2√U=XYX2+Y2U=\frac{XY}{\sqrt{X^2+Y^2}}V=X2−Y22X2+Y2√V=X2−Y22X2+Y2V=\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}} 如果我没有做任何错误,那么对于我最终得到的联合密度为(u,v)∈R2(u,v)∈R2(u,v)\in\mathbb{R}^2(U,V)(U,V)(U,V) fU,V(u,v)=2σ1σ2πexp[−u2+v2−−−−−−√(u2+v2−−−−−−√+vσ21+u2+v2−−−−−−√−vσ22)]fU,V(u,v)=2σ1σ2πexp⁡[−u2+v2(u2+v2+vσ12+u2+v2−vσ22)]f_{U,V}(u,v)=\frac{2}{\sigma_1\sigma_2\pi}\exp\left[-\sqrt{u^2+v^2}\left(\frac{\sqrt{u^2+v^2}+v}{\sigma_1^2}+\frac{\sqrt{u^2+v^2}-v}{\sigma_2^2}\right)\right] 我有上面的乘数,因为变换不是一对一的。222 因此,密度将由,该值不易评估。UUU∫RfU,V(u,v)dv∫RfU,V(u,v)dv\displaystyle \int_{\mathbb{R}}f_{U,V}(u,v)\,\mathrm{d}v 现在,我很想知道是否有证据证明我只能与工作,而不必考虑某个来表明是正常的。对我来说,找到的CDF 看起来并不那么有希望。对于的情况,我也想这样做。UUUVVVUUUUUUσ1=σ2=σσ1=σ2=σ\sigma_1=\sigma_2=\sigma 也就是说,如果和是独立的变量,那么我想证明而无需更改变量。如果我能以某种方式争论,那么我就完成了。所以这里有两个问题,一般情况,然后是特殊情况。XXXYYYN(0,σ2)N(0,σ2)\mathcal{N}(0,\sigma^2)Z=2XYX2+Y2√∼N(0,σ2)Z=2XYX2+Y2∼N(0,σ2)Z=\frac{2XY}{\sqrt{X^2+Y^2}}\sim\mathcal{N}(0,\sigma^2)Z=dXZ=dXZ\stackrel{d}{=}X Math.SE上的相关文章: X2−Y2/X2+Y2−−−−−−−√∼N(0,1)X2−Y2/X2+Y2∼N(0,1)X^2-Y^2/ \sqrt{X^2+Y^2}\sim N(0,1)当独立时X,Y∼N(0,1)X,Y∼N(0,1)X,Y\sim N(0,1)。 假设是iid,则表明是iidX,YX,YX,YN(0,1)N(0,1)N(0,1)XYX2+Y2√,X2−Y22X2+Y2√XYX2+Y2,X2−Y22X2+Y2\frac{XY}{\sqrt{X^2+Y^2}},\frac{X^2-Y^2}{2\sqrt{X^2+Y^2}}N(0,14)N(0,14)N(0,\frac{1}{4})。 编辑。 事实上,这个问题是由于我在Feller的《概率论及其应用入门》(第二卷)练习中发现的L. Shepp以及可能的提示: 当然,并且手边有的密度。U=XYX2+Y2√=11X2+1Y2√U=XYX2+Y2=11X2+1Y2U=\frac{XY}{\sqrt{X^2+Y^2}}=\frac{1}{\sqrt{\frac{1}{X^2}+\frac{1}{Y^2}}}1X21X2\frac{1}{X^2} 让我们看看我现在能做什么。除此之外,还欢迎对以上积分提供一些帮助。

5
隐藏教授(回归战舰)的回归模型[关闭]
已关闭。这个问题需要细节或说明。它当前不接受答案。 想改善这个问题吗?添加细节并通过编辑此帖子来澄清问题。 2年前关闭。 我正在做一项家庭作业,我的教授希望我们创建一个真正的回归模型,模拟数据样本,他将尝试使用我们在课堂上学到的一些技术来寻找我们真正的回归模型。同样,我们将不得不对他给我们的数据集做同样的事情。 他说,过去的所有尝试去欺骗他的人,他都能产生出非常准确的模型。有一些学生创建了一些疯狂的模型,但是可以说他能够产生一个简单的模型就足够了。 我该如何为他找到一个棘手的模型?我不想做4个二次项,3个观测值和大量方差而变得超级便宜吗?我如何才能生成一个看起来无害的数据集,该数据集下面有一个艰难的小模型? 他只是遵循以下3条规则: 您的数据集必须有一个“ Y”变量和20个“ X”变量,分别标记为“ Y”,“ X1”,...,“ X20”。 您的响应变量必须来自满足以下条件的线性回归模型: 其中和。ÿ ' 我 = β 0 + β 1 X ' 我1 + ... + β p - 1 X ' 我,p - 1 + ε 我ε 我〜Ñ (0 ,σ 2)ÿYY ÿ′一世= β0+ β1个X′我1+ … + …

3
学习应用概率的好书?
我正在寻找一本书,该书对概率论进行了深入而严格的介绍,但重点是在数学系以外最有用的材料。我听说过“概率论:探索和应用”非常不错,但是我想提出其他建议。 例如,阿奇姆·克兰克(Achim Klenke)的书对我来说太过分了……它是为证明定理而组织的,而据我所知,它并不是应用程序。同样,我也不喜欢杜雷特的书,也不喜欢比林斯利或费勒...再一次,太过关注数学研究了。


3
单位球N个样本的最接近原点的中值最近点的公式的解释
在《统计学习的元素》中,引入了一个问题以突出高维空间中k-nn的问题。有NNN被均匀地分布在一个数据点ppp维单位球。 从原点到最近的数据点的中值距离由以下表达式给出: d(p,N)=(1−(12)1N)1pd(p,N)=(1−(12)1N)1pd(p,N) = \left(1-\left(\frac{1}{2}\right)^\frac{1}{N}\right)^\frac{1}{p} 当N=1N=1N=1,公式分解为球半径的一半,我可以看到最近的点如何以方式接近边界p→∞p→∞p \rightarrow \infty,从而使knn后面的直觉在高维度上分解。但是我无法理解为什么公式依赖于N。有人可以澄清一下吗? 该书还指出:“……在训练样本的边缘附近进行预测要困难得多。必须从邻近的样本点推断而不是在它们之间进行内插”。这似乎是一个深刻的陈述,但我似乎无法理解它的含义。有人可以改写吗?

1
我的ACF图告诉我有关数据的什么信息?
我有两个数据集: 我的第一个数据集是相对于时间的投资价值(十亿美元),每个单位时间是自1947年第一季度以来的四分之一。时间一直延伸到2002年第三季度。 我的第二个数据集是“将[第一个数据集]中的投资值转换为近似平稳过程的结果”。 第一组数据和第二组数据 相应的ACF图: 我知道这些情节是正确的,因此请我“对其进行评论”。我对自动相关功能还比较陌生,我也不完全确定它能告诉我有关我的数据的信息。 如果有人可以花时间简短地解释一下,将不胜感激。

1
伊辛模型的吉布斯抽样
作业问题: 考虑一维伊辛模型。 令。x_i为-1或+1x=(x1,...xd)x=(x1,...xd)x = (x_1,...x_d)xixix_i π(x)∝e∑39i=1xixi+1π(x)∝e∑i=139xixi+1\pi(x) \propto e^{\sum_{i=1}^{39}x_ix_{i+1}} 设计一个gibbs采样算法,以大致根据目标分布\ pi(x)生成样本π(x)π(x)\pi(x)。 我的尝试: 随机选择值(-1或1)以填充向量x=(x1,...x40)x=(x1,...x40)x = (x_1,...x_{40})。所以x=(−1,−1,1,1,1,−1,1,1,...,1)x=(−1,−1,1,1,1,−1,1,1,...,1)x = (-1, -1, 1, 1, 1, -1, 1, 1,...,1)。所以这是x0x0x^0。 因此,现在我们需要继续进行第一次迭代。我们必须分别为x ^ 1绘制40个不同的x x1x1x^1。所以... 从\ pi(x_1 | x_2 ^ 0,...,x_ {40} ^ 0)中绘制x11x11x_1^1π(x1|x02,...,x040)π(x1|x20,...,x400)\pi(x_1 | x_2^0,...,x_{40}^0) 从\ pi(x_2 | x_1 ^ 1,x_3 ^ 0,...,x_ {40} ^ 0)中绘制x12x21x_2^1π(x2|x11,x03,...,x040)π(x2|x11,x30,...,x400)\pi(x_2 | …

3
统计的未来
当我在关于数学中尚未解决的问题的公开演讲中时,我想到了这个问题。众所周知,仍然存在许多未解决的数学问题。这让我开始思考统计中尚未解决的问题。在花了一些时间在Google上搜索此主题之后,我认为对此问题没有相对详细的讨论。因此,我真的很想听听人们对此的看法。统计作为一门学科去哪里了?我们应该花更多的时间来改进理论还是应该专注于如何分析从各种科学实验中收集的特定数据?任何对此的想法将不胜感激。谢谢!

1
回归系数的抽样分布
之前,我了解了采样分布,这些分布根据未知参数给出了供估计器使用的结果。例如,对于线性回归模型中和的采样分布β^0β^0\hat\beta_0β^1β^1\hat\beta_1Yi=βo+β1Xi+εiYi=βo+β1Xi+εiY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼N(β0, σ2(1n+x¯2Sxx))β^0∼N(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) 和 β^1∼N(β1, σ2Sxx)β^1∼N(β1, σ2Sxx) \hat{\beta}_1 \sim \mathcal N \left(\beta_1,~\frac{\sigma^2}{S_{xx}}\right) 其中Sxx=∑ni=1(x2i)−nx¯2Sxx=∑i=1n(xi2)−nx¯2S_{xx} = \sum_{i=1}^n (x_i^2) -n \bar{x}^2 但是现在我在书中看到了以下内容: 假设我们以通常的方式用最小二乘法拟合模型。考虑贝叶斯后验分布,并选择先验,这样就等于通常的常客抽样分布,即…… (β0β1)∼N2[(β^1β^2), σ^2(n∑ni=1xi∑ni=1xi∑ni=1x2i)−1](β0β1)∼N2[(β^1β^2), σ^2(n∑i=1nxi∑i=1nxi∑i=1nxi2)−1] \left( \begin{matrix} \beta_0 \\ \beta_1 \end{matrix} \right) \sim \mathcal N_2\left[\left(\begin{matrix} \hat{\beta}_1 \\ \hat{\beta}_2 \end{matrix} …

5
共线变量怎么办
免责声明:这是一个家庭作业项目。 我正在尝试根据几个变量提出最佳的钻石价格模型,到目前为止,我似乎已经有了一个很好的模型。但是我遇到了两个显然是共线的变量: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 Depth -0.41035485 1.00000000 0.01779489 Carat.Weight 0.05237998 0.01779489 1.00000000 Table和Depth相互依赖,但是我仍然希望将它们包括在我的预测模型中。我对钻石进行了一些研究,发现“表”和“深度”是指钻石的顶部长度和顶部至底部的距离。由于这些钻石的价格似乎与美感相关,而美感似乎与比例有关,因此,我将使用的比率来预测价格。这是处理共线变量的标准程序吗?如果没有,那是什么?Ť一个b 升ëd Ë p 吨ħŤ一种b升ËdËpŤH\frac{Table}{Depth} 编辑:这是深度〜表的图:

3
抛硬币时应该使用二项式CDF还是普通CDF?
硬币需要进行公平性测试。翻转50次后,出现30个头。假设硬币是公平的,那么在50次翻转中至少获得30个正面的概率是多少? 我的老师说,解决这个问题的正确方法是 normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786 但是,我采用了这样的二项式累积分布函数 1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013 我相信满足二项式分布的标准:单个事件是独立的,只有两种可能的结果(正面对反面),问题的概率恒定(0.5),并且试验次数固定为50然而,显然,这两种方法给出的答案不同,并且模拟支持我的答案(至少运行了几次;很明显,我不能保证您会得到相同的结果)。 我的老师是否认为正态分布曲线也是解决此问题的有效方法是错误的(决不是说正态分布是正态分布,而是n * p和n *(1-p)都大于10),还是我误解了二项式分布?

8
囚犯悖论
我进行了一次锻炼,但还不太清楚。 囚犯悖论三名被单独监禁的囚犯A,B和C在同一天被判处死刑,但由于有法定假日,州长决定对一名囚犯予以赦免。囚犯已被告知这一点,但被告知他们直到预定执行死刑的那一天才知道要解救其中一名。 囚犯A对囚犯说:“我已经知道至少有另外两名囚犯将被处决,因此,如果您告诉我将被处决的人的名字,您将不会给我任何有关我自己被处决的信息” 。 狱卒接受了这一点,并告诉他C肯定会死。 当时的原因是:“在我知道要执行C之前,我有三分之一的机会得到赦免。现在我知道无论是B还是我本人都将被赦免,赔率已提高为2分之1。” 但是狱卒指出:“如果我说过B会死,那么我可能会得出类似的结论,而我肯定会回答B或C,那么为什么要问呢?”。 A获得赦免的机会是什么,为什么?构造一个可以说服他人正确的解释。 您可以通过贝叶斯定理,绘制信念网络或通过常识来解决此问题。无论选择哪种方法,都应加深您对条件概率这个看似简单的概念的理解。 这是我的分析: 这看起来像是Monty Hall问题,但并非完全如此。如果A告诉I change my place with B他C会死后说,他有2/3的机会被保存。如果他不这样做,那么我想说他活着的机会是1/3,就像您在Monty Hall问题中没有改变选择时一样。但同时,他是一个由2个人组成的小组,一个人应该死,所以很容易说他的机率是1/2。 因此,矛盾仍然存在,您将如何处理这个问题。另外,我不知道如何建立对此的信任网络,所以我很感兴趣。

1
基本自举置信区间的覆盖概率
我正在研究的课程存在以下问题: 进行蒙特卡洛研究,以估计标准正常自举置信区间和基本自举置信区间的覆盖概率。从正常人群中抽样,并检查样本均值的经验覆盖率。 标准普通引导程序CI的覆盖率很容易: n = 1000; alpha = c(0.025, 0.975); x = rnorm(n, 0, 1); mu = mean(x); sqrt.n = sqrt(n); LNorm = numeric(B); UNorm = numeric(B); for(j in 1:B) { smpl = x[sample(1:n, size = n, replace = TRUE)]; xbar = mean(smpl); s = sd(smpl); LNorm[j] = xbar + …

6
一个如何应对欧拉计划213问题(“跳蚤马戏”)?
我想解决Euler 213项目,但不知道从哪里开始,因为我是统计学领域的外行,请注意,需要准确的答案才能使用蒙特卡洛方法。您能推荐一些统计主题供我阅读吗?请不要在此处发布解决方案。 马戏团 一个30×30的正方形网格包含900条跳蚤,最初是每平方跳蚤。敲响钟声时,每条跳蚤会随机跳至相邻的正方形(通常有4种可能性,但网格边缘或角落处的跳蚤除外)。 铃响50次后,预计空置正方形数是多少?将答案四舍五入到小数点后六位。

4
非参数统计简介
我过去两年一直在研究统计数据。我所学的几乎所有内容都是关于参数统计的。现在,我想了解更多有关非参数统计的信息。有人可以建议对此领域进行一些简要介绍(也许也可读)吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.