列联表的贝叶斯分析:如何描述效应大小


9

我正在研究Kruschke的《做贝叶斯数据分析》中的示例,特别是ch中的泊松指数方差分析。22,他作为对偶发表独立性的频繁卡方检验的替代品。

我可以看到我们如何获得有关变量交互比独立变量(即,当HDI排除零时)所期望的交互频率更高或更低的信息。

我的问题是如何在此框架中计算或解释效果大小?例如,克鲁什克(Kruschke)写道:“蓝眼睛和黑发的组合发生的频率要比如果眼睛的颜色和头发的颜色独立的情况下发生的频率要低”,但是我们如何描述这种关联的强度?我如何分辨哪些互动比其他互动更极端?如果我们对这些数据进行卡方检验,则可以计算Cramér的V,作为整体效果大小的度量。如何在这种贝叶斯语境中表达效果大小?

这是本书中的独立示例(代码为R),以防万一答案在我眼前隐藏在我眼前……

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

这是带有效果大小量度的常客输出(书中未列出):

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

这是贝叶斯输出,具有HDI和单元格概率(直接来自本书):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

这是应用于数据的泊松指数模型的后验图:

在此处输入图片说明

以及关于后验概率的后验分布图:

在此处输入图片说明

Answers:


1

对于该索引,Kruschke仅提及效果大小两次,并且两次都是在度量预测变量的上下文中。但是p上有这个。601:

如果研究人员对违反独立性感兴趣,那么兴趣就在于 βrc。该模型为此目的特别方便,因为可以调查任意交互对比以确定何处出现非依赖性。

所以,我收集到 β1,2是要解释的参数。让S 等于所有系数与其对应的x元素的乘积之和,不包括 β1,2x1,2。以来yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eS。什么时候x1,2 = 1,则 λi 增长或缩小百分之一 eβ1,2,不?


1

在ANOVA模型中研究效应量的一种方法是查看“超总体”和“有限总体”标准差。您有一个双向表,所以这是3个方差成分(2个主要影响和1个交互作用)。这基于mcmc分析。您为每个mcmc样本的每种效果计算标准偏差。

sk=1dk1j=1dk(βk,jβ¯k)2

哪里 k索引ANOVA表的“行”。mcmc示例的简单箱线图skk 对效果大小很有启发。

安德鲁·盖尔曼(Andrew Gelman)提倡这种方法。请参阅他在2005年发表的论文“方差分析:为什么它比以往任何时候都重要”


那张纸在这里
肖恩·复活节

这两个答案看起来都非常有希望,谢谢。你们中的每个人是否足够熟悉R如何编程?
2014年

@seaneaster-感谢您添加链接。@ben,这些计算在R中很简单。但是,我不确定您的示例所使用的形式。您应该可以sd ()将其与“ apply”功能之一结合使用。对于箱线图,使用可以轻松地获得这些boxplot ()
概率

谢谢,您能演示使用我的问题中的示例数据和代码吗?
2014年

简而言之,不是因为我不理解您发布的代码-我看不到数据的组织方式。就像我说的那样,要做到这一点并不困难。此方法正在计算一个简单的度量(标准偏差)。此外,R编码不是您的问题的一部分-您询问了如何总结列联表分析。
概率
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.