赠款通常需要进行功效分析以支持建议的样本量。在蛋白质组学(和大多数组学)中,在10个样本(可能是100个,但不太可能)中测量的特征/变量为100到1000。同样,众所周知,其中一些测量单位(例如,蛋白质的光谱计数)不是正态分布的,因此我们将使用非参数检验进行分析。我已经看到了假设进行单次测量和进行t检验而确定的样本量的功效,但是我认为这是不完全正确的。特别是频谱计数的另一个问题是,每100个特征的比例都在非常不同的尺度上,并且误差相差很大(数值越大,误差就越小)。[这个问题在极限倍数变化模型中很好地描述,Mutch等,2002 ]
考虑到FDR的某些假设和可接受的倍数变化,确定建议样本量的功效的合适方法是什么?使用此处的工具,我能够确定以下各项:
- 300个基因
- 3次误报
- 1.4倍差异
- 0.8所需功率
- 0.7标准差
每组需要49个样本。
这很方便,因为我提出了50v50设计,知道1.4倍变化是可以接受的,1%FDR是可以的,并且在这个实验中我可能会测量300种蛋白质。功效或样本数量计算的问题将继续发生,因此最好采用参考方法。
编辑: 我读到一位同事提议使用似然函数和Wald检验从负二项式分布建模光谱计数的地方。基本上使用预备数据来获得蛋白质差异估算值,然后针对每个分位数计算组之间可检测到的倍数变化。还有一个FDR(alpha)输入。因此,给定> 80%的功效并设置样本大小,他们可以针对25%的最低方差,50%的较小方差和25%的最高方差确定可检测的倍数变化。问题是我不知道他们是怎么做到的。不确定是否共享这种方法是否可以帮助任何人找到答案。