蛋白质组学的力量？

赠款通常需要进行功效分析以支持建议的样本量。在蛋白质组学（和大多数组学）中，在10个样本（可能是100个，但不太可能）中测量的特征/变量为100到1000。同样，众所周知，其中一些测量单位（例如，蛋白质的光谱计数）不是正态分布的，因此我们将使用非参数检验进行分析。我已经看到了假设进行单次测量和进行t检验而确定的样本量的功效，但是我认为这是不完全正确的。特别是频谱计数的另一个问题是，每100个特征的比例都在非常不同的尺度上，并且误差相差很大（数值越大，误差就越小）。[这个问题在极限倍数变化模型中很好地描述，Mutch等，2002 ]

考虑到FDR的某些假设和可接受的倍数变化，确定建议样本量的功效的合适方法是什么？使用此处的工具，我能够确定以下各项：

300个基因
3次误报
1.4倍差异
0.8所需功率
0.7标准差

每组需要49个样本。

这很方便，因为我提出了50v50设计，知道1.4倍变化是可以接受的，1％FDR是可以的，并且在这个实验中我可能会测量300种蛋白质。功效或样本数量计算的问题将继续发生，因此最好采用参考方法。

编辑： 我读到一位同事提议使用似然函数和Wald检验从负二项式分布建模光谱计数的地方。基本上使用预备数据来获得蛋白质差异估算值，然后针对每个分位数计算组之间可检测到的倍数变化。还有一个FDR（alpha）输入。因此，给定> 80％的功效并设置样本大小，他们可以针对25％的最低方差，50％的较小方差和25％的最高方差确定可检测的倍数变化。问题是我不知道他们是怎么做到的。不确定是否共享这种方法是否可以帮助任何人找到答案。

nonparametric power-analysis

— 本
source

其他一些资源我已经在这个问题上找到：莱2011 。迪克等，2010

— 奔

那个MD安德森计算器对我来说似乎过于乐观。完成多少比较？（我对微阵列太生疏了：在50v50设计中有300个基因意味着您进行了多少次比较？在零下期望3是假阳性吗？对于60多个比较而言，这太严格了。

— AdamO '18

我可以向您展示如何在R中完成此操作，但我只需要生物学方面的背景知识。

— AdamO '18

在应用程序（尤其是道德应用程序中，您必须进行功率研究）中，我喜欢使用该参考文献[Wang and Chen 2004]，因为它很好地解释了高通量数据（无论数据实际是什么）的功率计算背后的概念。。

本质上，除了通常的参数（α，β，N，效果大小）之外，您还使用两个附加参数λ和η。后者η是假定的真正改变的基因编号，而λ是您想要检测的真正改变的基因的分数。使用这种方法将任何已知的功率计算扩展到高通量数据非常简单。

Wang Sue-Jane和James J.Chen。“用于在微阵列实验中鉴定差异表达基因的样品量。” 计算生物学杂志11.4（2004）：714-726。

— 一月
source