Questions tagged «self-study»

从课本,自学中使用的教科书,课程或测试的例行练习。该社区的政策是为此类问题“提供有用的提示”,而不是完整的答案。


1
最小的指数分布的最大似然估计
我被困在如何解决这个问题上。 因此,对于,我们有两个随机变量序列和。现在,和是具有参数和独立指数分布。然而,而不是观察和,我们观察到,而不是和。ÿ 我我= 1 ,。。。,Ñ X ÿ λ μ X ÿ ž W¯¯XiXiX_iYiYiY_ii=1,...,ni=1,...,ni=1,...,nXXXYYYλλ\lambdaμμ\muXXXYYYZZZWWW Z=min(Xi,Yi)Z=min(Xi,Yi)Z=\min(X_i,Y_i),如果Z_i = X_i则W = 1,如果Z_i = Y_i则为 0 。我必须在Z和W的基础上找到\ lambda和\ mu的最大似然估计的封闭形式。此外,我们需要证明这些是全局最大值。W=1W=1W=1Zi=XiZi=XiZ_i=X_iZi=YiZi=YiZ_i=Y_iλλ\lambdaμμ\muZZZWWW 现在,我知道两个独立指数的最小值本身就是指数,比率等于比率之和,因此我们知道ZZZ是带参数\ lambda + \ mu的指数λ+μλ+μ\lambda+\mu。因此,我们的最大似然估计器为:λ^+μ^=Z¯λ^+μ^=Z¯\hat{\lambda}+\hat{\mu}=\bar{Z}。 但是我对从这里去的方向感到困惑。我知道WWW是参数p = P(Z_i = X_i)的伯努利分布p=P(Zi=Xi)p=P(Zi=Xi)p=P(Z_i=X_i),但我不知道如何将其转换为关于参数之一的语句。例如,根据\ lambda和/或\ mu,MLE W¯W¯\bar{W}将估算什么?我知道如果Z_i = X_i,则\ mu = 0,但是在这里我很难弄清楚如何提出任何代数语句。λλ\lambdaμμ\muZi=XiZi=XiZ_i=X_iμ=0μ=0\mu=0 更新1:所以我在评论中被告知要推导ZZZ和W的联合分布的可能性WWW。 因此f(Z,W)=f(Z|W=1)⋅p+f(Z|W=0)⋅(1−p)f(Z,W)=f(Z|W=1)⋅p+f(Z|W=0)⋅(1−p)f(Z,W)=f(Z|W=1)\cdot p+f(Z|W=0)\cdot (1-p)其中p=P(Zi=Xi)p=P(Zi=Xi)p=P(Z_i=X_i)。正确?由于ZZZ和WWW不是独立的,因此在这种情况下我不知道如何导出联合分布。 因此,根据上述W的定义,得出f(Z_i,W_i)= p \ lambda …

4
我想显示
令为概率空间上的随机变量。证明X:Ω→NX:Ω→NX:\Omega \to \mathbb N(Ω,B,P)(Ω,B,P)(\Omega,\mathcal B,P)E(X)=∑n=1∞P(X≥n).E(X)=∑n=1∞P(X≥n).E(X)=\sum_{n=1}^\infty P(X\ge n). 我对定义等于 E(X)E(X)E(X)E(X)=∫ΩXdP.E(X)=∫ΩXdP.E(X)=\int_\Omega X \, dP. 谢谢。

1
用比例和二项式分布确定样本大小
我正在尝试使用Sokal和Rohlf(3e)写的《生物统计学》一书来学习一些统计数据。这是第5章的练习,其中涵盖了概率,二项式分布和泊松分布。 我意识到有一个公式可以回答这个问题: 但是,该公式不在本文中。我想知道如何仅知道概率,所需的置信度和二项式分布来计算样本量。有没有涉及这一主题的资源?我已经尝试过Google,但是到目前为止,我所看到的都需要我无法访问的信息。n=4(p–√−q√)2n=4(p−q)2 n = \frac 4 {( \sqrt{p} - \sqrt{q} )^2}

4
在这种情况下,对y的x回归明显好于对y的y吗?
在一个10人的随机样本上监测用于测量人血液中葡萄糖水平的仪器。还可以使用非常准确的实验室程序来测量水平。仪器度量用x表示。实验室程序度量用y表示。 我个人认为x上的y更正确,因为其目的是使用仪器读数来预测实验室读数。x上的y最小化了此类预测的误差。 但是提供的答案是y上的x。

1
卢斯选择公理,关于条件概率的问题[关闭]
已关闭。这个问题需要细节或说明。它当前不接受答案。 想改善这个问题吗?添加细节并通过编辑此帖子来澄清问题。 2年前关闭。 我正在读Luce(1959)。然后,我发现了以下语句: 当一个人在备选方案中进行选择时,通常他们的反应似乎受以选择集为条件的概率所支配。但是普通概率论及其对条件概率的标准定义似乎并不是所需要的。一个例子说明了困难。在决定如何从家到另一座城市旅行时,您可以选择乘飞机(a),公共汽车(b)或汽车(c)。令A,B,C表示与旅行形式相关的自然状态的不确定性。请注意,如果选择c,则A和B的所有不确定性都将保留,因为无论您是否在飞机上,飞机都会飞行并且公共汽车在运行。但是,如果您选择a或b,那么您的汽车将保留在车库中,并且从驾驶汽车起就彻底改变了C集。 引入第一章的选择公理是对构建类似于概率的选择理论的首次尝试,该理论绕过了固定的,通用的样本空间假设。 资料来源:http : //www.scholarpedia.org/article/Luce's_choice_axiom 对我来说,概率度量由三重态,样本空间,西格玛代数F和最后一个度量P定义。ΩΩ\OmegaFF\mathcal{F}PPP 对于上述示例,如果我定义以下内容,这似乎是个问题: Ω={bus,car,airplane}Ω={bus,car,airplane}\Omega = \{ \text{bus}, \text{car}, \text{airplane} \} 共同统计中的一个关键假设是ceteris paribus条件。这是因为违反cp假设而需要在选择行为的背景下调整基本概率论的原因吗?

3
掷硬币概率的一个严重的深度问题
可以说我正在掷一万枚硬币。我想知道连续获得4个或更多连续磁头需要多少次翻转。 计数将按以下方式进行,您将计数连续的一轮翻转仅是正面(4头或更多)。当一条尾巴击中并破坏了头的条纹时,计数将从下一次翻转开始。然后重复10,000次翻转。 我想知道不仅连续出现4个或更多磁头的概率,而且是6个或更多,10个或更多的概率。为了澄清是否达到9个头的条纹,将其记为1个条纹4个或更多(和/或6个或更多),而不是2个单独的条纹。例如,如果硬币来到THTHTHTHHHHHH /// THAHTHT...。计数将为13,并在下一条尾部再次开始。 假设数据偏右偏;平均为40次翻转,条纹达到4个或更多,分布为u =28。显然是偏斜的。 我正在尽力寻找一种方法来从描述性数据中弄清楚,除非到目前为止我什么都没发现。 我想找到一种方法来从中获得一些合理的可能性。就像+/- 1 SD为68%的正态曲线等。我研究了对数归一化,它仅真正用于参数测试,这并不是我的目标。 有人告诉我Beta发行版,但我提出的每条建议都令人困惑。我一年前曾问过这个问题,并获得了一些见识,但不幸的是我仍然没有答案。谢谢任何有想法的人。

1
如何从具有多变量相关性的联合分布中找到边际分布?
我的教科书中的一个问题如下。二维随机连续向量具有以下密度函数: fX,Y(x,y)={15xy20if 0 &lt; x &lt; 1 and 0 &lt; y &lt; xotherwisefX,Y(x,y)={15xy2if 0 &lt; x &lt; 1 and 0 &lt; y &lt; x0otherwise f_{X,Y}(x,y)= \begin{cases} 15xy^2 & \text{if 0 < x < 1 and 0 < y < x}\\ 0 & \text{otherwise}\\ \end{cases} 证明边际密度函数和为:fXfXf_XfYfYf_Y fX(x)={5x40if 0 &lt; x &lt; …


1
统计测试建议
我需要在以下方面找到适当的统计检验(似然比检验,t检验等):让是一个随机向量的IID样品(X ; Ý ),并假定(Ý X)〜Ñ [ (μ 1 μ 2),(1 0.5 0.5 1) ]。的假设是: H ^ 0 = μ 1 + μ{Xi;Y一世}ñ我= 1{X一世;ÿ一世}一世=1个ñ\{X_i;Y_i\}^n_{i=1}(X; ÿ)(X;ÿ)(X;Y)(是X)(ÿX)\bigl( \begin{smallmatrix} Y\\ X \end{smallmatrix} \bigr)ññN [ (μ1个μ2),(1.5.51个) ][(μ1个μ2),(1个.5.51个)]\left[\bigl( \begin{smallmatrix} \mu_1\\ \mu_2 \end{smallmatrix} \bigr), \bigl( \begin{smallmatrix} 1 & .5\\ .5 & 1 \end{smallmatrix} \bigr) \right] ; ħ …

1
为什么Anova()和drop1()为GLMM提供了不同的答案?
我有以下形式的GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) 当我使用时drop1(model, test="Chi"),我得到的结果与Anova(model, type="III")从汽车包装或汽车上获得的结果不同summary(model)。后两个给出相同的答案。 通过使用大量虚构数据,我发现这两种方法通常没有区别。对于平衡线性模型,不平衡线性模型(不同组中的n不相等)和平衡广义线性模型,它们给出相同的答案,但对于平衡广义线性混合模型,它们给出相同的答案。因此看来,只有在包括随机因素的情况下,这种矛盾才会显现出来。 为什么这两种方法之间存在差异? 使用GLMM时应使用Anova()还是drop1()应使用? 至少就我的数据而言,两者之间的差异很小。哪一个使用都重要吗?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
两个独立的统一变量之差的分布,在0处截断
设和为两个独立的随机变量,它们具有相同的均匀分布且密度相同XXXÿÿYU(0 ,1)U(0,1个)U(0,1) F(x)=1f(x)=1f(x)=1如果(其他位置为),则。0≤x≤10≤x≤10≤x≤1000 令为定义为的真实随机变量:ZZZ Z=X−YZ=X−YZ=X-Y如果(在其他位置为),则。X&gt;YX&gt;YX>Y000 推导的分布。ZZZ 计算期望值和方差。E(Z)E(Z)E(Z)V(Z)V(Z)V(Z)

1
找到
设X1,X2,...,XnX1,X2,...,XnX_1, X_2, . . . , X_n是具有pdf的iid随机变量 fX(x∣θ)=θ(1+x)−(1+θ)I(0,∞)(x)fX(x∣θ)=θ(1+x)−(1+θ)I(0,∞)(x)f_X(x\mid\theta) =\theta(1 +x)^{−(1+\theta)}I_{(0,\infty)}(x) 其中θ&gt;0θ&gt;0\theta >0。给出1的UMVUE1θ1θ\frac{1}{\theta}并计算其方差 我了解了两种用于获得UMVUE的方法: 克莱默罗下界(CRLB) 莱曼-舍夫·特莱姆 我将尝试使用两者中的前者。我必须承认,我不完全了解这里发生的事情,而我的尝试解决方案是基于一个示例问题。我有一个fX(x∣θ)fX(x∣θ)f_X(x\mid\theta)是一个完整的单参数指数族与 h(x)=I(0,∞)h(x)=I(0,∞)h(x)=I_{(0,\infty)},c(θ)=θc(θ)=θc(\theta)=\theta,w(θ)=−(1+θ)w(θ)=−(1+θ)w(\theta)=-(1+\theta),t(x)=log(1+x)t(x)=log(1+x)t(x)=\text{log}(1+x) 由于w′(θ)=1w′(θ)=1w'(\theta)=1在ΘΘ\Theta上不为零,因此适用CRLB结果。我们有 log fX(x∣θ)=log(θ)−(1+θ)⋅log(1+x)log fX(x∣θ)=log(θ)−(1+θ)⋅log(1+x)\text{log }f_X(x\mid\theta)=\text{log}(\theta)-(1+\theta)\cdot\text{log}(1+x) ∂∂θlog fX(x∣θ)=1θ−log(1+x)∂∂θlog fX(x∣θ)=1θ−log(1+x)\frac{\partial}{\partial \theta}\text{log }f_X(x\mid\theta)=\frac{1}{\theta}-\text{log}(1+x) ∂2∂θ2log fX(x∣θ)=−1θ2∂2∂θ2log fX(x∣θ)=−1θ2\frac{\partial^2}{\partial \theta^2}\text{log }f_X(x\mid\theta)=-\frac{1}{\theta^2} 所以I1(θ)=−E(−1θ2)=1θ2I1(θ)=−E(−1θ2)=1θ2I_1(\theta)=-\mathsf E\left(-\frac{1}{\theta^2}\right)=\frac{1}{\theta^2} 和CRLB为的无偏估计τ(θ)τ(θ)\tau(\theta)是 [τ′(θ)]2n⋅I1(θ)=θ2n[τ′(θ)]2[τ′(θ)]2n⋅I1(θ)=θ2n[τ′(θ)]2\frac{[\tau'(\theta)]^2}{n\cdot I _1(\theta)} = \frac{\theta^2}{n}[\tau'(\theta)]^2 由于∑i=1nt(Xi)=∑i=1nlog(1+Xi)∑i=1nt(Xi)=∑i=1nlog(1+Xi)\sum_{i=1}^n t(X_i)=\sum_{i=1}^n \text{log}(1+X_i) 那么∑ni=1log(1+Xi)∑i=1nlog(1+Xi)\sum_{i=1}^n \text{log}(1+X_i)任何线性函数,或者等效地,1的任何线性函数1n∑ni=1log(1+Xi)1n∑i=1nlog(1+Xi)\frac{1}{n}\sum_{i=1}^n \text{log}(1+X_i),将达到其期望的CRLB,因此将成为其期望的UMVUE。由于E(log(1+X))=1θE(log(1+X))=1θ\mathsf E(\text{log}(1+X))=\frac{1}{\theta}我们的UMVUE为1θ1θ\frac{1}{\theta}是1n∑ni=1log(1+Xi)1n∑i=1nlog(1+Xi)\frac{1}{n}\sum_{i=1}^n \text{log}(1+X_i) 对于天然的参数,我们可以让η=−(1+θ)⇒θ=−(η+1)η=−(1+θ)⇒θ=−(η+1)\eta=-(1+\theta)\Rightarrow \theta=-(\eta+1) …

3
是独立的变量时分布
作为常规练习,我试图找到的分布,其中 和是独立的随机变量。X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2}XXXYYYU(0,1)U(0,1) U(0,1) 的联合密度为 (X,Y)(X,Y)(X,Y)fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right)cosθcos⁡θ\cos\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]zsinθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right)sinθsin⁡θ\sin\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right] 因此,对于1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2,我们有cos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right)。 变换的雅可比的绝对值为|J|=z|J|=z|J|=z 因此(Z,Θ)(Z,Θ)(Z,\Theta)的联合密度由下式给出 fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} 积分θθ\theta,我们得到ZZZ的pdf 为 fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1(1z))11&lt;z&lt;2√fZ(z)=πz210&lt;z&lt;1+(πz2−2zcos−1⁡(1z))11&lt;z&lt;2f_Z(z)=\frac{\pi z}{2}\mathbf 1_{0\sqrt 2 \end{cases} 看起来像正确的表达。对于情况微分会带来一个表达式,该表达式不易简化为我已经获得的pdf。FZFZF_Z1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2 最后,我认为我具有CDF的正确图片: 对于:0&lt;z&lt;10&lt;z&lt;10<z<1 对于:1&lt;z&lt;2–√1&lt;z&lt;21<z<\sqrt 2 阴影部分应该指示区域{(x,y):0&lt;x,y&lt;1,x2+y2≤z2}{(x,y):0&lt;x,y&lt;1,x2+y2≤z2}\left\{(x,y):0<x,y< 1\,,\,x^2+y^2\le z^2\right\} 图片立即产生 FZ(z)=Pr(−z2−X2−−−−−−−√≤Y≤z2−X2−−−−−−−√)=⎧⎩⎨⎪⎪⎪⎪πz24z2−1−−−−−√+∫1z2−1√z2−x2−−−−−−√dx, if 0&lt;z&lt;1, if 1&lt;z&lt;2–√FZ(z)=Pr(−z2−X2≤Y≤z2−X2)={πz24, if 0&lt;z&lt;1z2−1+∫z2−11z2−x2dx, if 1&lt;z&lt;2\begin{align} F_Z(z)&=\Pr\left(-\sqrt{z^2-X^2}\le Y\le\sqrt{z^2-X^2}\right) \\&=\begin{cases}\frac{\pi z^2}{4} &,\text{ if } 0<z<1\\\\ \sqrt{z^2-1}+\int_{\sqrt{z^2-1}}^1 \sqrt{z^2-x^2}\,\mathrm{d}x …

1
word2vec中的交叉熵损失的导数
我正在尝试通过CS224D斯坦福大学在线课程材料的第一个问题集解决问题,而我对问题3A遇到一些问题:当使用带有softmax预测函数和交叉熵损失函数的跳过语法word2vec模型时,我们想要计算相对于预测单词向量的梯度。所以给定softmax函数: wi^=Pr(wordi∣r^,w)=exp(wTir^)∑|V|jexp(wTjr^)wi^=Pr(wordi∣r^,w)=exp⁡(wiTr^)∑j|V|exp(wjTr^) \hat{w_i} = \Pr(word_i\mid\hat{r}, w) = \frac{\exp(w_i^T \hat{r})}{\sum_{j}^{|V|}exp(w_j^T\hat{r})} 和交叉熵函数: CE(w,w^)=−∑kwklog(wk^)CE(w,w^)=−∑kwklog(wk^)CE(w, \hat{w}) = -\sum\nolimits_{k} w_klog(\hat{w_k}) 我们需要计算∂CE∂r^∂CE∂r^\frac{\partial{CE}}{\partial{\hat{r}}} 我的步骤如下: CE(w,w^)=−∑|V|kwklog(exp(wTkr^)∑|V|jexp(wTjr^))CE(w,w^)=−∑k|V|wklog(exp⁡(wkTr^)∑j|V|exp(wjTr^))CE(w, \hat{w}) = -\sum_{k}^{|V|} w_klog(\frac{\exp(w_k^T \hat{r})}{\sum_{j}^{|V|}exp(w_j^T\hat{r})}) =−∑|V|kwklog(exp(wTkr^)−wklog(∑|V|jexp(wTjr^))=−∑k|V|wklog(exp⁡(wkTr^)−wklog(∑j|V|exp(wjTr^))= -\sum_{k}^{|V|} w_klog(\exp(w_k^T \hat{r}) - w_klog(\sum_{j}^{|V|}exp(w_j^T\hat{r})) 现在给定是一个热向量,而我是正确的类:wkwkw_k CE(w,w^)=−wTir^+log(∑|V|jexp(wTjr^))CE(w,w^)=−wiTr^+log(∑j|V|exp(wjTr^))CE(w, \hat{w}) = - w_i^T\hat{r} + log(\sum_{j}^{|V|}exp(w_j^T\hat{r})) ∂CE∂r^=−wi+1∑|V|jexp(wTjr^)∑|V|jexp(wTjr^)wj∂CE∂r^=−wi+1∑j|V|exp(wjTr^)∑j|V|exp(wjTr^)wj\frac{\partial{CE}}{\partial{\hat{r}}} = -w_i + \frac{1}{\sum_{j}^{|V|}exp(w_j^T\hat{r})}\sum_{j}^{|V|}exp(w_j^T\hat{r})w_j 这是正确的还是可以进一步简化?我想尝试确保自己走在正确的轨道上,因为问题集解决方案未在线发布。另外,正确完成书面作业对正确完成编程作业很重要。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.