Questions tagged «effect-size»

效应大小是“一种现象强度的度量或对该数量的基于样本的估计” [Wikipedia]。

1
科恩统计量的方差
Cohen是我们测量效果大小的最常见方法之一(请参阅Wikipedia)。它仅根据合并的标准偏差来测量两个均值之间的距离。我们如何推导Cohen的方差估计的数学公式? dddddd 2015年12月编辑:与该问题相关的是计算附近的置信区间的想法。本文指出ddd σ2d=n+n×+d22n+σd2=n+n×+d22n+\sigma_{d}^2 = \dfrac{n_{+}}{n_{\times}} + \dfrac{d^2}{2n_{+}} 其中是两个样本大小的总和,是两个样本大小的乘积。n+n+n_{+}n×n×n_{\times} 该公式如何得出?

2
哪些描述统计量不是效应大小?
维基百科说 效果大小是现象强度的度量或该数量的基于样本的估计。根据数据计算出的效应大小是一种描述性统计数据,用于传达关系的估计量,而无需对数据中的表观关系是否反映总体中的真实关系做出任何声明。 为了更好地理解它,我想知道除图形和曲线图外,哪些描述性统计数字不是效应大小。

2
了解Gelman&Carlin“超越功率计算:…”(2014)
我正在阅读Gelman&Carlin “超越功率计算:评估S型(符号)和M型(幅值)错误”(2014年)。我试图理解主要思想,主要思路,但我感到困惑。有人可以帮我提炼精华吗? 这篇论文是这样的(如果我理解正确的话)。 心理学方面的统计研究经常受到小样本困扰。 在给定的研究中,以统计学上显着的结果为条件, (1)可能会严重高估真实的效应量; (2)除非有足够大的样本量,否则效应的迹象很有可能相反。 以上是使用对种群效应大小的先验猜测显示的,通常认为效应很小。 我的第一个问题是,为什么要以统计显著性为条件?是否反映了出版偏见?但这似乎并非如此。那为什么呢? 我的第二个问题是,如果我自己进行研究,是否应该对结果进行不同于以往的处理(我做常客统计,对贝叶斯不太熟悉)?例如,我将获取一个数据样本,估算一个模型,并记录一个点估算值,以获取感兴趣的效果以及围绕它的置信度。我现在应该怀疑我的结果吗?如果统计意义重大,还是应该不信任它?给定的任何先前更改如何? (1)统计研究的“生产者”和(2)应用统计论文的读者的主要收获是什么? 参考文献: 盖尔曼,安德鲁和约翰·卡林。“超出功率计算:评估类型S(符号)和类型M(幅度)错误。” 心理科学观点 9.6(2014):641-651。 PS:我认为对我来说,新的要点是包括先验信息,我不确定该如何对待(来自常客主义范式)。

2
我可以在元回归中将效果大小作为自变量包括在内吗?
我的问题是,是否可以在元回归中将效应大小用作因变量,将另一个效应大小用作自变量?XXXYYY 例如,我对运动对饮酒问题的影响进行了荟萃分析,发现了显着的结果和高度异质性。我想做一个元回归,并使用这些干预措施对焦虑的影响大小作为自变量,并以饮酒问题的影响大小作为因变量(假设每项研究都评估了焦虑和饮酒问题,并且我计算了效果大小为对冲的)。ggg 你能理解这个吗?

4
一项研究超负荷意味着什么?
一项研究超负荷意味着什么? 我的印象是,这意味着您的样本量太大,以至于您有能力检测微小的效应量。这些影响的大小可能很小,以至于它们比变量之间的因果关系(不一定是直接因果关系)更可能是由采样过程中的轻微偏差引起的。 这是正确的直觉吗?如果是这样,我不认为有什么大不了的,只要以这种方式解释结果,然后您手动检查并查看估计的效果大小是否足够大以至于“有意义”。 我想念什么吗?关于在这种情况下该怎么做,有更好的建议吗?

3
后期治疗控制设计中相互作用效应的效应大小
如果您选择使用混合方差分析来分析具有连续因变量的前后治疗控制设计,则有多种方法可以量化出现在治疗组中的影响。交互作用是一种主要选择。 通常,我特别喜欢Cohen的d型度量(即)。我不喜欢用方差解释的量度,因为结果会根据不相关的因素(例如组的相对样本大小)而有所不同。μ1个- μ2σμ1个-μ2σ{\frac{\mu_1 - \mu_2}{\sigma}} 因此,我想我可以量化如下效果 Δ μC= μc ^ 2- μç 1ΔμC=μC2-μC1个\Delta\mu_c = \mu_{c2} - \mu_{c1} Δ μŤ= μ第2- μŤ 1ΔμŤ=μŤ2-μŤ1个\Delta\mu_t = \mu_{t2} - \mu_{t1} 因此,效果大小可以定义为Δ μŤ- Δ μCσΔμŤ-ΔμCσ\frac{\Delta\mu_t - \Delta\mu_c}{\sigma} 其中表示对照,t表示治疗,1和2分别表示之前和之后。 σ可以是时间1的合并标准偏差。CCcŤŤtσσ\sigma 问题: 标记此效应大小度量是否合适d? 这种方法看起来合理吗? 这种设计的效果大小度量的标准做法是什么?

1
R / mgcv:为什么te()和ti()张量积产生不同的曲面?
的mgcv软件包R具有两个功能,用于拟合张量积相互作用:te()和ti()。我了解两者之间的基本分工(拟合非线性交互与将这种交互分解为主要效果和交互)。我不明白的是为什么te(x1, x2)而ti(x1) + ti(x2) + ti(x1, x2)可能产生(略)不同的结果。 MWE(改编自?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f + rnorm(n)*0.2 par(mfrow = c(2,2)) # …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
Cohen d的相关样本t检验
快速提问:我已经看到Cohen的d为依赖性样本t检验计算了两种不同的方法(例如,样本内设计在前后时间点对药物的功效进行了测试)。 在Cohen方程的分母中使用变化得分的标准偏差。 在Cohen方程的分母中使用预测分数的标准偏差。 我发现很少有文献描述使用哪个选项和/或何时使用这两个选项。 有什么想法吗?

1
是否有效果大小的一般定义?
该effect-size标签没有维基。关于效果大小的维基百科页面没有提供精确的一般定义。而且我还没有看到效果大小的一般定义。然而读了一些讨论,比如当这一个我的印象是人们心目中的影响大小的一般概念下,在统计检验的情况下。我已经看到的标准化平均被称为影响大小用于正常模型Ñ(μ ,σ 2),以及标准平均差θ = (θ=μ/σθ=μ/σ\theta=\mu/\sigmaN(μ,σ2)N(μ,σ2){\cal N}(\mu,\sigma^2)为“两个高斯手段”的模式。但是一般的定义呢?上面两个示例共有的有趣特性是,据我所知, 功率仅取决于 θ的参数,并且是 |的递增函数。θ | 当我们考虑用于通常测试 ħ 0:{ μ = 0 }在所述第一壳体和 ħ 0:{ μ 1 = μ 2 }在第二种情况下。 θ=(μ1−μ2)/σθ=(μ1−μ2)/σ\theta=(\mu_1-\mu_2)/\sigmaθθ\theta|θ||θ||\theta|H0:{μ=0}H0:{μ=0}H_0:\{\mu=0\}H0:{μ1=μ2}H0:{μ1=μ2}H_0:\{\mu_1=\mu_2\} 这个属性是效应大小概念背后的基本思想吗?那将意味着效果大小被定义为单调一对一转换?还是有一个更精确的一般定义?

2
二项式效应大小显示(BESD)是否会误导效应大小?
我很难接受唐纳德·鲁宾(Donald Rubin)提出过一个真正的技巧。然而,这是我的BESD [感悟1,2,3 ]。 Rosenthal和Rubin(1982)的原始论文声称,显示“无论原始数据是连续的还是分类的,如何将任何产品-时刻的相关性重塑到这种[2x2]的显示器中”都是有价值的。 下表来自p。上方第二个链接451: 这项技术似乎夸大了几乎所有效果大小的大小。在这里,原始数据的 = .01,但是当“转换”为2x2列联表时,我们似乎要面对更大的影响。我并不否认,当以这种方式将数据重新转换为分类格式时,确实为.1,但是我觉得翻译中有些东西很失真。 ϕ[R2R2R^2ϕϕ\phi 我在这里错过真正有价值的东西吗?另外,我给人的印象是,在过去的十年左右的时间里,统计界普遍拒绝将此作为一种合法方法,我对此是否错? 分别计算实验()和控制()成功率()的方程式很简单:Ç 小号[RËEECCC小号[Rsrsr Ë小号[R= .50 + r / 2Esr=.50+r/2E_{sr} = .50 + r/2 和 C小号[R= .50 − r / 2Csr=.50−r/2C_{sr} = .50 - r/2 参考: Rosenthal,R。和Rubin,DB(1982)。一个简单的通用显示实验效果的大小。教育心理学杂志,74,166–169。

5
Ω平方表示R中的作用?
我正在阅读的统计书建议使用Ω平方来衡量实验的效果。我已经使用分割图设计(对象内部和对象间设计的混合)证明了我的对象内部因子具有统计学显着性,p <0.001,F = 17。 现在,我希望看到两者之间的区别有多大...针对R(或python?)的某个地方是否实现了omega平方的实现?痛苦*,我不知道如何用C寻找东西。 谢谢!

2
列联表的贝叶斯分析:如何描述效应大小
我正在研究Kruschke的《做贝叶斯数据分析》中的示例,特别是ch中的泊松指数方差分析。22,他作为对偶发表独立性的频繁卡方检验的替代品。 我可以看到我们如何获得有关变量交互比独立变量(即,当HDI排除零时)所期望的交互频率更高或更低的信息。 我的问题是如何在此框架中计算或解释效果大小?例如,克鲁什克(Kruschke)写道:“蓝眼睛和黑发的组合发生的频率要比如果眼睛的颜色和头发的颜色独立的情况下发生的频率要低”,但是我们如何描述这种关联的强度?我如何分辨哪些互动比其他互动更极端?如果我们对这些数据进行卡方检验,则可以计算Cramér的V,作为整体效果大小的度量。如何在这种贝叶斯语境中表达效果大小? 这是本书中的独立示例(代码为R),以防万一答案在我眼前隐藏在我眼前…… df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", "Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel"))) df Blue Brown Green Hazel Black 20 68 5 15 Blond 94 7 16 …

2
如何在荟萃分析中最好地处理子分数?
我正在使用metafor包对R中的效果大小d进行荟萃分析。d代表患者与健康者之间的记忆评分差异。但是,一些研究仅报告了感兴趣的度量d的子分数(例如,几个不同的内存分数或来自三个单独的内存测试块的分数)。请查看以下带有d的虚拟数据集,它们代表研究的效应量及其标准偏差sd: d <- round(rnorm(5,5,1),2) sd <- round(rnorm(5,1,0.1),2) study <- c(1,2,3,3,3) subscore <- c(1,1,1,2,3) my_data <- as.data.frame(cbind(study, subscore, d, sd)) library(metafor) m1 <- rma(d,sd, data=my_data) summary(m1) 我想征询您的意见,以最佳方式处理这些子评分-例如: 从每个报告多个得分的研究中选择一个子得分。 包括所有子分数(这将违反rfx模型独立性的假设,因为一项研究的子分数来自同一样本) 对于每个报告评分的研究:计算平均得分和平均标准差,并将此“合并效应量”包括在rfx荟萃分析中。 包括所有子评分并添加一个虚拟变量,以指示从哪个研究中得出某个分数。

3
使用转换变量时的线性回归效应大小
执行线性回归时,对因变量进行对数转换(例如对数转换)以获得更好的正态分布构型通常很有用。通常,从回归检查beta值也很有用,以更好地评估结果的效果大小/实际相关性。 这就产生了一个问题,即在使用例如对数转换时,效果大小将为对数刻度,并且有人告诉我,由于所用刻度的非线性,对这些beta进行反向转换将导致无意义的值,没有任何现实世界的用法。 到目前为止,我们通常使用转换变量进行线性回归以检查显着性,然后使用原始非转换变量进行线性回归以确定效果大小。 有正确/更好的方法吗?在大多数情况下,我们使用临床数据,因此,一个现实生活中的例子将是确定某种暴露如何影响持续的变量,例如身高,体重或某些实验室测量值,然后我们得出结论,例如“暴露A产生了影响”。重量增加2公斤”。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.