二项式数据的方差分析


32

我正在分析实验数据集。数据由治疗类型和二项式结果的配对向量组成:

Treatment    Outcome
A            1
B            0
C            0
D            1
A            0
...

在结果列中,1表示成功,0表示失败。我想弄清楚治疗方法是否会显着改变结果。有4种不同的处理方式,每个实验重复多次(每种处理方式2000次)。

我的问题是,我可以使用ANOVA分析二进制结果吗?还是应该使用卡方检验来检查二项式数据?似乎卡方假设比例将被平均分配,事实并非如此。另一个想法是使用每种治疗成功与失败的比例来汇总数据,然后使用比例检验。

我很想听到您对这些二项式成功/失败实验有意义的测试建议。

Answers:


18

否定ANOVA,它假设结果变量呈正态分布(除其他外)。有“旧派”变换可以考虑,但我更喜欢逻辑回归(如您的情况,当只有一个自变量时,等效于卡方)。使用逻辑回归而不是卡方检验的优势在于,如果您发现总体检验有显着结果(类型3),则可以轻松地使用线性对比比较治疗的特定水平。例如,A与B,B与C等。

为了清楚起见,添加了更新:

拿到手边的数据(来自Allison的post doc数据集)并按如下所示使用变量cits,这是我的观点:

postdocData$citsBin <- ifelse(postdocData$cits>2, 3, postdocData$cits)
postdocData$citsBin <- as.factor(postdocData$citsBin)
ordered(postdocData$citsBin, levels=c("0", "1", "2", "3"))
contrasts(postdocData$citsBin) <- contr.treatment(4, base=4) # set 4th level as reference
contrasts(postdocData$citsBin)
     #   1 2 3
     # 0 1 0 0
     # 1 0 1 0
     # 2 0 0 1
     # 3 0 0 0

# fit the univariate logistic regression model
model.1 <- glm(pdoc~citsBin, data=postdocData, family=binomial(link="logit"))

library(car) # John Fox package
car::Anova(model.1, test="LR", type="III") # type 3 analysis (SAS verbiage)
     # Response: pdoc
     #          LR Chisq Df Pr(>Chisq)
     # citsBin   1.7977  3     0.6154

chisq.test(table(postdocData$citsBin, postdocData$pdoc)) 
     # X-squared = 1.7957, df = 3, p-value = 0.6159

# then can test differences in levels, such as: contrast cits=0 minus cits=1 = 0
# Ho: Beta_1 - Beta_2 = 0
cVec <- c(0,1,-1,0)
car::linearHypothesis(model.1, cVec, verbose=TRUE) 

1
@ user2040。我不知道您将如何进行“类型3”测试?与SAS有关吗?(对不起,我对SAS的了解非常有限)。我会按照您的建议进行逻辑回归,但要有2个虚拟变量。同样,鉴于我的理解正确,如果您进行逻辑回归,则通过偏差(或似然比)来测试某些或所有系数是否为0,并且它渐近地为Chi-Sq(不一定为df = 1)
suncoolsu

1
@suncoolsu:是的,实际上您应该得到相同的结论。我不应该说“等价的”(我使用大数据,因此它们的结果相同)。我在答案中添加了一些代码以帮助阐明。
B_Miner 2011年

8

Xkknkkkp^k=Xk/nk

g(p)=arcsinp

但是,一些现代作者对反正弦变换颇有怀疑,例如,请参见http://www.mun.ca/biology/dschneider/b7932/B7932Final10Dec2010.pdf。 但是,这些作者关注的是诸如预测之类的问题,他们指出了反正弦可能会导致问题。如果您只关注假设检验,那应该可以。更现代的方法可以使用逻辑回归。


4
(+1)...如果所有组的编号均相同 观察。
Scortchi-恢复莫妮卡

1
或者可以根据观察次数使用权重。
kjetil b halvorsen

3

我想与您对Chi-Sq测试的看法有所不同。即使数据不是二项式的,它也适用。它基于MLE的渐近正态性(在大多数情况下)。

我会做这样的逻辑回归:

logπ^1π^=β0+β1×D1+β2×D2

哪里

D1D2D1=D2=0A,D1=1,D2=0B,D1=1D2=1C

Ho:β0=β1=β2=0

Is the ANOVA equivalent if there is a relation or not.

Ho:β0=0

Is the test is A has some effect.

Ho:β1β0=0

Is the test is B has some effect.

Ho:β2(β0+β12)=0

Is the test is C has some effect.

Now you can do further contrasts to find our what you are interested in. It is still a chi-sq test, but with different degrees of freedom (3, 1, 1, and 1, respectively)


我仍然需要考虑对比。只要有时间,我都会纠正它。抱歉
suncoolsu 2011年

-3

我认为您是对的,不应将ANOVA用于分析二项式因变量。许多人使用它来比较二进制响应变量(0 1)的均值,但不应使用它,因为这严重违反了正态性和均方差假设。卡方检验或Logistic回归最适合这些情况。


Same as your answer here.
Scortchi - Reinstate Monica
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.