Questions tagged «t-test»

一种将两个样本的平均值或一个样本的平均值(甚至参数估计值)与指定值进行比较的测试;发明人的笔名也称为“学生t检验”。

3
如何获得总体r平方变化的置信区间
为了简单的示例,假设有两个线性回归模型 模型1有三个预测,x1a,x2b,和x2c 模型2具有从模型1 3个预测和两个附加的预测x2a和x2b 有一个种群回归方程,其中模型1 解释的种群方差为,模型解释为 。模型2解释的种群中的增量方差为ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δ ρ2= ρ2(2 )- ρ2(1 )Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} 我有兴趣获取\ Delta \ rho ^ 2的估计量的标准误差和置信区间Δ ρ2Δρ2\Delta\rho^2。虽然该示例分别涉及3个和2个预测变量,但我的研究兴趣涉及大量不同数量的预测变量(例如5个和30个)。我首先想到的是使用 Δ [R2一dĴ= r2一dj (2 )- - [R2一dĴ (1 )Δradj2=radj(2)2−radj(1)2\Delta r^2_{adj} = r^2_{adj(2)} - r^2_{adj(1)}作为估计量并进行引导,但是我不确定是否会适当的。 问题 是Δ [R2一dĴΔradj2\Delta r^2_{adj}一个合理的估计Δ ρ2Δρ2\Delta \rho^2? 如何获得总体r平方变化的置信区间(即Δ ρ2Δρ2\Delta\rho^2)? 引导Δ ρ2Δρ2\Delta\rho^2是否适合计算置信区间? 任何对模拟或已发表文献的引用也将受到欢迎。 范例程式码 如果有帮助,我在R中创建了一个小的模拟数据集,可用于演示答案: …

1
排列检验将单个样本与平均值进行比较
当人们实施置换测试以将单个样本与平均值进行比较时(例如,您可能会使用置换t检验),均值将如何处理?我已经看到了需要进行均值检验和样本才能进行置换测试的实现,但是目前尚不清楚它们实际上是在做什么。有没有一种有意义的方法可以对一个样本与假设的均值进行置换检验(例如t检验)?或者,它们只是在引擎盖下默认不进行置换测试?(例如,尽管调用了排列函数或设置了排列测试标志,但默认为标准t检验或类似函数) 在标准的两样本置换测试中,一个样本将具有两组并将标签的分配随机化。但是,当一个“组”是假设平均值时,该如何处理?显然,假设均值本身没有样本量。那么,将均值转换为排列格式的典型方法是什么?“平均”样本是否假定为单点?与样本组大小相等的样本?无限大小的样本? 假设一个假设均值是假设的,我会说它在技术上要么具有无限支持,要么具有您想要为其提供的任何支持。但是,这些都不对实际计算非常有用。值均等于平均值​​的大小相等的样本有时似乎是通过某些测试完成的(例如,只需用假定的位置填充对的另一半)。这很有道理,因为这是等长样本,您将看到假设均值正确无偏差。 所以我的问题是这样的:在实践中,当第二组是平均值(或相似的抽象假定值)时,人们是否真的会模拟置换测试样式标签的随机化?如果是这样,人们在这样做时如何处理标签随机化?

2
这个单一值与该分布相符吗?
这似乎是一个非常幼稚的问题,但我很难看到答案。 我有一组30个值。我独立地获得了第31个值。空假设是第31个值是同一分布的一部分。另一种选择是,它与众不同。我想要某种p值或可能性度量。 我有一些想法: 这类似于想要进行两个样本的t检验-除了对于第二个样本,我只有一个值,并且30个值不一定呈正态分布。 如果我有30个测量值而不是30个测量值,则单个测量值的等级可以提供一些有用的信息。 如何计算这种可能性或p值? 谢谢!亚尼克

4
R中的离散时间事件历史(生存)模型
我正在尝试在R中拟合离散时间模型,但不确定如何执行。 我读过您可以将因变量组织在不同的行中,每个时间观察行一个,并将该glm函数与logit或cloglog链接一起使用。从这个意义上讲,我有三列:ID,Event(在每个时间范围内为1或0)和Time Elapsed(自观察开始以来)以及其他协变量。 如何编写适合模型的代码?哪个因变量?我想我可以将其Event用作因变量,并将其包括Time Elapsed在协变量中。但是,会发生什么ID呢?我需要吗? 谢谢。
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
两组样本量小且不平衡-该怎么办?
我有两个组的数据(即样本),我想进行比较,但是总样本量很小(n = 29)并且严重不平衡(n = 22 vs n = 7)。 这些数据在逻辑上很难收集,而且费用昂贵,因此,“收集更多数据”作为一种明显的解决方案在这种情况下并没有帮助。 测量了许多不同的变量(出发日期,到达日期,迁移时间等),因此有多个测试,其中一些差异非常大(较小的样本具有较高的差异)。 最初,一位同事对这些数据进行了t检验,其中一些在统计学上具有显着性,P <0.001,而另一个在P = 0.069上不显着。一些样本是正态分布的,而其他样本则不是。一些测试涉及与“相等”方差的较大偏差。 我有几个问题: T检验在这里合适吗?如果没有,为什么?这仅适用于满足正态性和方差相等的假设的测试吗? 什么是合适的替代品?也许是排列测试? 不相等的方差会夸大类型I的错误,但是怎么办?小而不平衡的样本量对I型错误有什么影响?

2
为什么匹配对的自由度测试对数减去1?
我习惯知道“自由度”为,在这里有线性模型\ mathbf {Y} = \ mathbf {X} \ boldsymbol {\的β} + \ boldsymbol {\小量} 与\ mathbf {Y } \ in \ mathbb {R} ^ n,\ mathbf {X} \ in M_ {n \ times p}(\ mathbb {R})具有等级r的设计矩阵,\ boldsymbol {\ beta} \ in \ mathbb { R} ^ p,\ boldsymbol {\ epsilon} …

1
关于t检验的正态假设的问题
对于t检验,根据大多数文献,假设人口数据呈正态分布。我不知道为什么。t检验不是只要求样本均值的抽样分布是正态分布,而不是总体吗? 如果情况是t检验最终只要求样本分布具有正态性,那么总体可以看起来像任何分布,对吗?只要样本数量合理即可。那不是中央极限定理所陈述的吗? (我在这里指的是一个样本或独立样本的t检验)

1
学生(Gosset)对t检验的贡献是什么?
一个最近的问题,相关的问题,并引用来源,最近让我知道,ñ− 1N−1N-1人口方差样本估计的校正称为贝塞尔校正。贝塞尔(Bessel)于1846年去世(维基百科引文),t检验于1908年发布(维基百科引文)。由于某些原因,我一直认为Gosset(又名Student)在制定t检验中的贡献是使用了ñ− 1N−1N-1 在计算 s2s2s^2。现在看来,这项贡献显然属于贝塞尔。因此,我想问戈塞特在制定t检验方面的贡献是什么?


1
Tukey HSD测试如何比未校正的t.test P值更具意义?
我来自“ 双向ANOVA的事后成对比较 ”(对此帖子),它显示了以下内容: dataTwoWayComparisons <- read.csv("http://www.dailyi.org/blogFiles/RTutorialSeries/dataset_ANOVA_TwoWayComparisons.csv") model1 <- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) summary(model1) # Treatment is signif pairwise.t.test(dataTwoWayComparisons$StressReduction, dataTwoWayComparisons$Treatment, p.adj = "none") # no signif pair TukeyHSD(model1, "Treatment") # mental-medical is the signif pair. (输出附在下面) 有人可以解释为什么在配对(未调整的p值)t检验失败时,Tukey HSD能够找到有效的配对吗? 谢谢。 这是代码输出 > model1 <- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) > summary(model1) # Treatment is signif …
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.