Questions tagged «t-test»

一种将两个样本的平均值或一个样本的平均值(甚至参数估计值)与指定值进行比较的测试;发明人的笔名也称为“学生t检验”。

2
在什么设置下,随着样本数量的增加,置信区间不会变好吗?
在博客文章中,我发现有这样的说法: “我相信Cochrane工作组首先指出(大约在1970年代),在观察环境中具有置信区间时,小样本量会导致更好的覆盖率,而足够大的样本会提供接近零的覆盖率!” 现在,我假设CI宽度应随着样本大小的增加而接近0,但是覆盖范围会同时变差的想法对我来说并不令人信服。这个说法是正确的,在什么情况下?还是我看错了? 我已经使用随机正态分布数据进行了模拟,样本大小为10000至1000000(一次样本t检验,95%CI),每个样本大小运行1000次,对于更大样本量,覆盖率并没有恶化(相反,我发现了预期的接近5%的恒定错误率)。

1
韦尔奇测验的自由度是否总是小于合并测验的DF?
我正在教授基础统计课程,我们正在对两个具有不等方差的独立样本进行t检验(韦尔奇检验)。在我看到的示例中,Welch检验使用的调整后的自由度始终小于或等于。 ñ1个+ n2− 2ñ1个+ñ2-2n_1+n_2-2 总是这样吗?韦尔奇检验是否总是降低(或保持不变)合并t检验(等方差)的自由度? 并且在同一主题上,如果样本标准偏差相等,那么Welch检验的DF是否减少为?我看了一下公式,但是代数变得凌乱。ñ1个+ n2− 2ñ1个+ñ2-2n_1+n_2-2

4
如何最好地分析基于医院的RCT中的住院时间数据?
我很想知道是否存在关于分析来自RCT的住院时间(LOS)数据的最佳方法的共识。这通常是一个非常偏斜的分布,其中大多数患者在几天到一周内出院,但是其余患者的停留时间非常不可预测(有时甚至很长),形成分布的右尾。 分析选项包括: t检验(假设不可能出现正态性) 曼·惠特尼U检验 对数秩检验 组分配的Cox比例风险模型条件 这些方法中的任何一种具有明显更高的功效吗?

2
方差不相等的两个样本t检验的贝叶斯对应物是什么?
我正在寻找方差不相等的两个样本t检验的贝叶斯对应物(韦尔奇检验)。我也在寻找多变量检验,例如Hotelling的T统计量。参考文献表示赞赏。 对于多元情况,假设我们有和(z 1,⋯ ,z N),其中y i(resp z i)是样本均值,样本标准差和数量的捷径点。我们可以假设点数在整个数据集中是恒定的,所有y i的标准偏差都相同(resp z i),并且y i的样本均值(resp z i)(y1个,⋯ ,yñ)(y1,⋯,yN)(y_1,\cdots,y_N)(z1个,⋯ ,zñ)(z1,⋯,zN)(z_1,\cdots,z_N)ÿ一世yiy_iž一世ziz_iÿ一世yiy_iž一世ziz_iÿ一世yiy_iž一世ziz_i)是相关的。如果绘制样本均值,它们将彼此跟随并通过连接它们,您将获得平滑的变化函数。现在,在一些地方功能与同意ž功能,但别人没有,因为米Ë 一个ñ (Ÿ 我)- 米Ë 一个ñ (ž 我)yyyzzz变大。我想对此陈述进行量化。 mean(yi)−mean(zi)std(yi)+std(zi)mean(yi)−mean(zi)std(yi)+std(zi)\frac{mean(y_i)-mean(z_i)}{std(y_i)+std(z_i)}

1
确定一组广告中哪个具有最高点击率所需的样本量
我是一名行业软件设计师,并且正在为一个客户从事项目,因此我想确保我的分析在统计上是正确的。 考虑以下情况: 我们有n个广告(n <10),我们只是想知道哪个广告效果最好。 我们的广告服务器将随机投放这些广告之一。成功的前提是用户点击了广告-我们的服务器会对其进行跟踪。 给出:置信区间:95% 问题:估计的样本量是多少?(我们必须投放多少个广告),为什么?(记住我是个假人) 谢谢

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
如何对大量样本进行t检验?
我有两个人口,一个人口N = 38,704(观察数),另一个人口N = 1,313,662。这些数据集有约25个变量,所有变量都是连续的。我考虑了每个数据集中的每个平均值,并使用公式计算了测试统计量 t =平均差/标准差 问题在于自由度。通过df = N1 + N2-2的公式,我们将拥有表无法处理的更多自由度。有什么建议吗?如何在此处检查t统计量。我知道t检验用于处理样品,但是如果我们将其应用于大样品该怎么办。
11 t-test 


1
在什么情况下,Wilcoxon的符号秩检验优于t检验或符号检验?
经过一些讨论(在下面),我现在对焦点问题有了更清晰的了解,因此这是一个修订后的问题,尽管某些评论现在似乎与原始问题无关。 似乎t检验针对对称分布迅速收敛,有符号秩检验假设对称,并且对于对称分布,均值/伪随机数/中位数之间没有差异。如果是这样,在什么情况下,当他/她同时拥有t检验和sign检验时,相对没有经验的统计学家会认为有序检验有用吗?如果我的一位(例如社会科学专业)学生正在尝试测试一种治疗方法是否比另一种治疗方法更好(通过某种相对容易解释的衡量标准,例如某种“平均”差异的概念),那么我将努力寻找一个有签名的地方,即使在我的大学中,虽然通常会进行等级考试,但忽略了符号测试。


3
Cohen d的相关样本t检验
快速提问:我已经看到Cohen的d为依赖性样本t检验计算了两种不同的方法(例如,样本内设计在前后时间点对药物的功效进行了测试)。 在Cohen方程的分母中使用变化得分的标准偏差。 在Cohen方程的分母中使用预测分数的标准偏差。 我发现很少有文献描述使用哪个选项和/或何时使用这两个选项。 有什么想法吗?


2
在一个样本t检验,在方差如果发生了什么估计样本均值被替换为
假定一个单样本t检验,其中,所述零假设为。统计是然后吨= ‾ X - μ 0μ = μ0μ=μ0\mu=\mu_0使用样本标准差s。在估计小号,一个观测比较样本均值¯X:t = x¯¯¯- μ0s / n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssX¯¯¯x¯\overline{x} 。s = 1n − 1∑ñ我= 1(x一世− x¯¯¯)2---------------√s=1n−1∑i=1n(xi−x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2} 然而,如果我们假设在给定是真实的,人们也可以估算标准偏差小号*使用μ 0,而不是样本均值¯ X:μ0μ0\mu_0s∗s∗s^*μ0μ0\mu_0X¯¯¯x¯\overline{x} 。s∗= 1n − 1∑ñ我= 1(x一世- μ0)2----------------√s∗=1n−1∑i=1n(xi−μ0)2s^*=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\mu_0)^2} 对我来说,这种方法看起来更自然,因为我们因此也将原假设用于估计SD。有谁知道测试中是否使用了所得统计量,或者为什么不知道?

2
测试人们在反复输球后是否退出比赛或降低赌注
我有关于每轮比赛后5轮消耗减少的一系列获胜和失败投注数据。我正在使用如下所示的决策树来显示数据。 往树顶的节点是那些有下注的节点,而往树底的那些节点是有下注的节点。我想看看(a)每个节点的损耗(b)每个节点的平均赌注大小变化。我正在查看前一个节点上每个节点的损耗率和存活率(如果概率为50%,则使用每个节点上的预期人数)。例如,如果每个节点的概率为50%,则在开始的1000个节点中,第二个节点W和L中应该有大约500个人。假设是(a)损失之后损耗率更高赌注(b)表示输家后减少赌注大小,赢家后增加赌注。 我只想首先在一个非常简单的单变量设置中执行此操作。如果有50个人退出,我如何执行t检验以显示从节点WW到节点WWW的平均下注大小的变化在统计上是显着的?我不确定这是正确的方法:每个后续下注都是独立的,但是人们在输家之后都退出比赛,因此样本不匹配。如果只是同一班同学一次又一次地参加一系列考试而又没有一个人辍学的情况,我会理解如何进行适当的t检验,但是我认为这有点不同。 我怎样才能做到这一点?此外,如果结果受到少数客户的歪曲,我该如何计算出前5%和后5%的收入?只是从下注1-3中删除累积赌注最高的客户? 我有从中生成该图的数据,所以在每个节点上都有平均值,std,std错误等。

1
我应该使用Welch(1947)的近似自由度还是Satterthwaite(1946)的近似度?
对于用于Welch t检验的近似自由度的正确公式,我感到困惑。Satterthwaite(1946)的公式是最常引用的公式,但是Welch在1947年提出了另一种公式。我不确定哪个更可取(或被大多数统计软件使用)。 Satterthwaite的公式: (s2X/ nX+ 秒2ÿ/ nÿ)2(s2X/ nX)2/( nX− 1 )+ (秒2ÿ/ nÿ)2/( nÿ− 1 )(sx2/nx+sy2/ny)2(sx2/nx)2/(nx−1)+(sy2/ny)2/(ny−1)\frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x-1)+(s_y^2/n_y )^2/(n_y-1)} 韦尔奇公式: − 2 + (秒2X/ nX+ 秒2ÿ/ nÿ)2(s2X/ nX)2/( nX+ 1 )+ (小号2ÿ/ nÿ)2/( nÿ+ 1 )−2+(sx2/nx+sy2/ny)2(sx2/nx)2/(nx+1)+(sy2/ny)2/(ny+1)-2+ \frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x+1)+(s_y^2/n_y )^2/(n_y+1)} 参考文献: 宾夕法尼亚州萨特斯韦特(1946)。“方差成分估计的近似分布”。生物识别公告,第2卷,第6页,第110-114页。 韦尔奇,BL(1947)。“当涉及几个不同的总体方差时,“学生”问题的推广”。Biometrika,34,1 / 2,第28-35页。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.