Questions tagged «self-study»

从课本,自学中使用的教科书,课程或测试的例行练习。该社区的政策是为此类问题“提供有用的提示”,而不是完整的答案。

1
具有的最小方差的无偏估计量
让X1个,。。。,XñX1个,。。。,Xñ X_1, ...,X_n 成为分布的随机样本 ģ Ë ø 米é 吨ř 我Ç (θ )GËØ米ËŤ[R一世C(θ)Geometric(\theta) 对于 0 &lt; θ &lt; 10&lt;θ&lt;1个0<\theta<1。即 pθ(X )= θ (1 - θ)x − 1一世{ 1 ,2 ,。。。}(x )pθ(X)=θ(1个-θ)X-1个一世{1个,2,。。。}(X)p_{\theta}(x)=\theta(1-\theta)^{x-1} I_{\{1,2,...\}}(x) 查找具有最小方差的无偏估计量 G(θ )=1个θG(θ)=1个θg(\theta)=\frac{1}{\theta} 我的尝试: 由于几何分布来自指数族,因此统计 ∑X一世∑X一世\sum X_i 完整且足够 θθ \theta。另外,如果Ť(X)=X1个Ť(X)=X1个T(X)=X_1 是一个估计 G(θ )G(θ)g(\theta),这是公正的。因此,根据Rao-Blackwell定理和Lehmann-Scheffé定理, w ^(X)= E[X1个| ∑X一世]w ^(X)=Ë[X1个|∑X一世]W(X) = …

1
指数族:观察到的与期望的足够统计量
我的问题来自阅读Minka的“估计Dirichlet分布”,该陈述在根据随机向量的观察推导Dirichlet分布的最大似然估计的情况下,没有证明以下内容: 与指数族一样,当梯度为零时,期望的足够统计量等于观察到的足够统计量。 我没有看到以这种方式呈现的指数族中的最大似然估计,也没有在搜索中找到任何合适的解释。有人可以提供对观察到的和预期的足够统计量之间的关系的洞察力,也许可以通过最大程度地减少差异来帮助理解最大似然估计?

1
GLM的日志可能性
在下面的代码中,我使用glm对分组数据执行逻辑回归,并使用mle2对“手工”进行逻辑回归。为什么R中的logLik函数会给我一个对数可能性logLik(fit.glm)=-2.336,而不是我手工得到的一个logLik(fit.ml)=-5.514? library(bbmle) #successes in first column, failures in second Y &lt;- matrix(c(1,2,4,3,2,0),3,2) #predictor X &lt;- c(0,1,2) #use glm fit.glm &lt;- glm(Y ~ X,family=binomial (link=logit)) summary(fit.glm) #use mle2 invlogit &lt;- function(x) { exp(x) / (1+exp(x))} nloglike &lt;- function(a,b) { L &lt;- 0 for (i in 1:n){ L &lt;- L + sum(y[i,1]*log(invlogit(a+b*x[i])) …

3
统计学习要素练习2.2
教科书首先通过以下方式生成一些2类数据: 这使: 然后它问: 我尝试通过首先使用此图形模型对此模型进行建模来解决此问题: 其中是标签,是所选均值的索引,是数据点。这将给ccch(1≤h≤10)h(1≤h≤10)h\,(1\le h \le 10)mchmhcm_h^cxxx PR (X |米CH)=镨(米CH∣ h ,c = b l u e)=镨(米CH| ħ ,Ç = ö ř 一个Ñ 克ë)=PR (ħ )=PR (C ^ )=ñ(米CH,我/ 5 )ñ((1 ,0)Ť,我)ñ((0 ,1)Ť,我)1个101个2镨(X∣米HC)=ñ(米HC,一世/5)镨(米HC∣H,C=b升üË)=ñ((1个,0)Ť,一世)镨(米HC∣H,C=Ø[R一个ñGË)=ñ((0,1个)Ť,一世)镨(H)=1个10镨(C)=1个2 \begin{align*} \Pr(x\mid m_h^c) =& \mathcal{N}(m_h^c,\mathbf{I}/5)\\ \Pr(m_h^c\mid h,c=\mathrm{blue}) =& \mathcal{N}((1,0)^T,\mathbf{I})\\ \Pr(m_h^c\mid h,c=\mathrm{orange}) =& \mathcal{N}((0,1)^T,\mathbf{I})\\ \Pr(h) =& \frac{1}{10}\\ …

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
R线性回归分类变量“隐藏”值
这只是我多次遇到的示例,因此我没有任何示例数据。在R中运行线性回归模型: a.lm = lm(Y ~ x1 + x2) x1是一个连续变量。x2是分类的,具有三个值,例如“低”,“中”和“高”。但是,R给出的输出将类似于: summary(a.lm) Estimate Std. Error t value Pr(&gt;|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 我知道R在这种因素(x2是一个因素)上引入了某种虚拟编码。我只是想知道,如何解释x2“高”值?例如,x2在此处给出的示例中,“ High” 对响应变量有什么影响? 我在其他地方(例如这里)已经看到了这样的示例,但是还没有找到我能理解的解释。
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


2
的概率
假设X1X1X_1和X2X2X_2是具有参数ppp独立几何随机变量。什么是概率X1≥X2X1≥X2X_1 \geq X_2? 我对这个问题感到困惑,因为除了X1X1X_1和X2X2X_2是几何图形之外,我们什么都没告诉。这不是50%50%50\%因为X1X1X_1和X2X2X_2可以在该范围内吗? 编辑:新尝试 P(X1≥X2)=P(X1&gt;X2)+P(X1=X2)P(X1≥X2)=P(X1&gt;X2)+P(X1=X2)P(X1 ≥ X2) = P(X1 > X2) + P(X1 = X2) P(X1=X2)P(X1=X2)P(X1 = X2) =∑x∑x\sum_{x} (1−p)x−1p(1−p)x−1p(1−p)x−1p(1−p)x−1p(1-p)^{x-1}p(1-p)^{x-1}p =p2−pp2−p\frac{p}{2-p} P(X1&gt;X2)P(X1&gt;X2)P(X1 > X2) = P(X1&lt;X2)P(X1&lt;X2)P(X1 < X2)和P(X1&lt;X2)+P(X1&gt;X2)+P(X1=X2)=1P(X1&lt;X2)+P(X1&gt;X2)+P(X1=X2)=1P(X1 < X2) + P(X1 > X2) + P(X1 = X2) = 1 因此,P(X1&gt;X2)P(X1&gt;X2)P(X1 > X2) = 1−P(X1=X2)21−P(X1=X2)2\frac{1-P(X1 = X2)}{2} =1−p2−p1−p2−p\frac{1-p}{2-p}添加P(X1=X2)=p2−pP(X1=X2)=p2−pP(X1 = …

3
统计量与伽玛分布的独立性
设是来自伽马分布G a m m a (α ,β )的随机样本。X1个,。。。,XñX1,...,XnX_1,...,X_nģ 一米米一个(α ,β)Gamma(α,β)\mathrm{Gamma}\left(\alpha,\beta\right) 让和小号2是样品均值和样本方差,分别。X¯X¯\bar{X}小号2S2S^2 然后证明或反驳该和小号2 / ˉ X 2是独立的。X¯X¯\bar{X}小号2/ X¯2S2/X¯2S^2/\bar{X}^2 我的尝试:由于,我们需要检查的独立性ˉX和(X我小号2/ X¯2= 1n − 1∑ñ我= 1(X一世X¯− 1 )2S2/X¯2=1n−1∑i=1n(XiX¯−1)2S^2/\bar{X}^2 = \frac{1}{n-1} \sum_{i=1}^n \left(\frac{X_i}{\bar{X}}-1\right)^2 X¯X¯\bar{X},但我应该怎么建立它们之间的独立性?(X一世X¯)ñ我= 1(XiX¯)i=1n\left(\frac{X_i}{\bar{X}} \right)_{i=1}^{n}

3
更高的是或
因此,我进行了概率测试,但我无法真正回答这个问题。它只是问这样的事情: “考虑到是一个随机变量 0,请使用正确的不等式证明E(X ^ 2)^ 3或E(X ^ 3)^ 2等于或更高。XXXXXX ⩾⩾\geqslant 000E(X2)3E(X2)3E(X^2)^3E(X3)2E(X3)2E(X^3)^2 我唯一能想到的就是詹森的不平等,但我真的不知道如何在这里应用它。

2
显示
如果,则找到。X∼C(0,1)X∼C(0,1)X\sim\mathcal C(0,1)Y=2X1−X2Y=2X1−X2Y=\frac{2X}{1-X^2} 我们有FY(y)=Pr(Y≤y)FY(y)=Pr(Y≤y)F_Y(y)=\mathrm{Pr}(Y\le y) =Pr(2X1−X2≤y)=Pr(2X1−X2≤y)\qquad\qquad\qquad=\mathrm{Pr}\left(\frac{2X}{1-X^2}\le y\right) =⎧⎩⎨⎪⎪⎪⎪⎪⎪Pr(X∈(−∞,−1−1+y2√y])+Pr(X∈(−1,−1+1+y2√y]),ify&gt;0Pr(X∈(−1,−1+1+y2√y])+Pr(X∈(1,−1−1+y2√y]),ify&lt;0={Pr(X∈(−∞,−1−1+y2y])+Pr(X∈(−1,−1+1+y2y]),ify&gt;0Pr(X∈(−1,−1+1+y2y])+Pr(X∈(1,−1−1+y2y]),ify&lt;0\qquad\qquad=\begin{cases} \mathrm{Pr}\left(X\in\left(-\infty,\frac{-1-\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y>0\\ \mathrm{Pr}\left(X\in\left(-1,\frac{-1+\sqrt{1+y^2}}{y}\right]\right)+\mathrm{Pr}\left(X\in\left(1,\frac{-1-\sqrt{1+y^2}}{y}\right]\right),\text{if}\quad y<0 \end{cases} 我不知道上述区分大小写是否正确。 另一方面,以下似乎是一个更简单的方法: 我们可以使用身份来写Y=tan(2tan−1X)Y=tan⁡(2tan−1⁡X)Y=\tan(2\tan^{-1}X)2tanz1−tan2z=tan2z2tan⁡z1−tan2⁡z=tan⁡2z\frac{2\tan z}{1-\tan^2z}=\tan 2z 现在,X∼C(0,1)⟹tan−1X∼R(−π2,π2)X∼C(0,1)⟹tan−1⁡X∼R(−π2,π2)X\sim\mathcal C(0,1)\implies\tan^{-1}X\sim\mathcal R\left(-\frac{\pi}{2},\frac{\pi}{2}\right) ⟹2tan−1X∼R(−π,π)⟹2tan−1⁡X∼R(−π,π)\qquad\qquad\qquad\quad\implies 2\tan^{-1}X\sim\mathcal R(-\pi,\pi) ⟹tan(2tan−1X)∼C(0,1)⟹tan⁡(2tan−1⁡X)∼C(0,1)\qquad\qquad\qquad\quad\implies\tan\left(2\tan^{-1}X\right)\sim\mathcal C(0,1),最后一个是2对1转换。 但是如果要求我从定义中得出的分布,我想第一种方法就是如何进行。计算有点混乱,但是我得出正确的结论吗?也欢迎任何其他解决方案。YYY Johnson-Kotz-Balakrishnan的连续单变量分布(Vol.1)突出了柯西分布的这一特性。事实证明,这只是一般结果的特例。

2
从贝叶斯角度来看,ML估计量的不变性是荒谬的吗?
Casella和Berger表示ML估计量的不变性如下: 但是,在我看来,他们以完全临时的,荒谬的方式定义的“可能性” :ηη\eta 如果我将概率论的基本规则应用于简单情况,我将得到以下结果: 现在应用贝叶斯定理,然后应用和是互斥的,因此我们可以应用求和规则: 大号(η | X )= p (X | θ 2 = η )= p (X | θ = - √η= τ(θ )= θ2η=τ(θ)=θ2\eta=\tau(\theta)=\theta^2甲乙p(X|甲∨乙)=p(X) p (甲∨ 乙| X )L (η| x)=p(x | θ2= η)= p (X | θ = - η–√∨ θ = η–√)= : p (X …

1
哪种深度学习模型可以对不互斥的类别进行分类
示例:我的职位描述中有一句话:“英国Java高级工程师”。 我想使用深度学习模型将其预测为2类:English 和IT jobs。如果我使用传统的分类模型,则只能预测softmax最后一层具有功能的标签。因此,我可以使用2个模型神经网络来预测两个类别的“是” /“否”,但是如果我们有更多类别,那就太贵了。那么,我们是否有任何深度学习或机器学习模型可以同时预测2个或更多类别? “编辑”:使用传统方法使用3个标签,它将由[1,0,0]编码,但在我的情况下,它将由[1,1,0]或[1,1,1]编码 示例:如果我们有3个标签,并且所有这些标签都适合一个句子。因此,如果softmax函数的输出为[0.45,0.35,0.2],我们应该将其分类为3个标签或2个标签,或者可以是一个?我们这样做的主要问题是:分类为1个,2个或3个标签的最佳阈值是多少?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
如何解释考克斯风险模型的生存曲线?
您如何从考克斯比例风险模型解释生存曲线? 在这个玩具示例中,假设我们对数据age变量有一个cox比例风险模型kidney,并生成了生存曲线。 library(survival) fit &lt;- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() 例如,在时间,哪个说法是正确的?还是两者都不对?200200200 陈述1:我们将剩下20%的主题(例如,如果我们有人,那么到200天时,我们应该剩下200个左右), 100010001000200200200200200200 陈述2:对于一个给定的人,他/她有200 20%20%20\%机会在200天生存200200200。 我的尝试:我不认为这两个陈述是相同的(如果我错了,请纠正我),因为我们没有iid假设(所有人的生存时间不是独立地来自一个分布)。在这里我的问题类似于逻辑回归,每个人的危险率取决于该人的。βTxβTx\beta^Tx

1
正态分布误差和中心极限定理
在Wooldridge的《计量经济学入门》一书中有一个报价: 证明误差的正态分布合理的参数通常是这样的:由于是影响的许多不同的未观察因素的总和,因此我们可以调用中心极限定理来得出具有近似正态分布的结论。uuuyyyuuu 此引用与线性模型假设之一有关,即: u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2) 其中uuu是总体模型中的误差项。 现在,据我所知,中心极限定理指出 Zi=(Yi¯¯¯¯¯−μ)/(σ/√n)Zi=(Yi¯−μ)/(σ/√n)Z_i=(\overline{Y_i}-μ)/(σ/√n) (其中Yi¯¯¯¯¯Yi¯\overline{Y_i} 是从任何具有均值μμμ和方差σ^ 2的总体中抽取的随机样本的平均值σ2σ2σ^2) 接近标准正态变量的n→∞n→∞n \rightarrow \infty。 题: 帮助我了解Z_i的渐近正态性如何ZiZiZ_i暗示u∼N(μ,σ2)u∼N(μ,σ2)u \sim N(μ, σ^2)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.