蛋白质组学的力量?


9

赠款通常需要进行功效分析以支持建议的样本量。在蛋白质组学(和大多数组学)中,在10个样本(可能是100个,但不太可能)中测量的特征/变量为100到1000。同样,众所周知,其中一些测量单位(例如,蛋白质的光谱计数)不是正态分布的,因此我们将使用非参数检验进行分析。我已经看到了假设进行单次测量和进行t检验而确定的样本量的功效,但是我认为这是不完全正确的。特别是频谱计数的另一个问题是,每100个特征的比例都在非常不同的尺度上,并且误差相差很大(数值越大,误差就越小)。[这个问题在极限倍数变化模型中很好地描述,Mutch等,2002 ]

考虑到FDR的某些假设和可接受的倍数变化,确定建议样本量的功效的合适方法是什么?使用此处工具,我能够确定以下各项:

  • 300个基因
  • 3次误报
  • 1.4倍差异
  • 0.8所需功率
  • 0.7标准差

每组需要49个样本。

这很方便,因为我提出了50v50设计,知道1.4倍变化是可以接受的,1%FDR是可以的,并且在这个实验中我可能会测量300种蛋白质。功效或样本数量计算的问题将继续发生,因此最好采用参考方法。

编辑: 我读到一位同事提议使用似然函数和Wald检验从负二项式分布建模光谱计数的地方。基本上使用预备数据来获得蛋白质差异估算值,然后针对每个分位数计算组之间可检测到的倍数变化。还有一个FDR(alpha)输入。因此,给定> 80%的功效并设置样本大小,他们可以针对25%的最低方差,50%的较小方差和25%的最高方差确定可检测的倍数变化。问题是我不知道他们是怎么做到的。不确定是否共享这种方法是否可以帮助任何人找到答案。


其他一些资源我已经在这个问题上找到:莱2011 。迪克等,2010

1
那个MD安德森计算器对我来说似乎过于乐观。完成多少比较?(我对微阵列太生疏了:在50v50设计中有300个基因意味着您进行了多少次比较?在零下期望3是假阳性吗?对于60多个比较而言,这太严格了。
AdamO '18

1
我可以向您展示如何在R中完成此操作,但我只需要生物学方面的背景知识。
AdamO '18

Answers:


1

在应用程序(尤其是道德应用程序中,您必须进行功率研究)中,我喜欢使用参考文献[Wang and Chen 2004],因为它很好地解释了高通量数据(无论数据实际是什么)的功率计算背后的概念。 。

本质上,除了通常的参数(α,β,N,效果大小)之外,您还使用两个附加参数λ和η。后者η是假定的真正改变的基因编号,而λ是您想要检测的真正改变的基因的分数。使用这种方法将任何已知的功率计算扩展到高通量数据非常简单。

Wang Sue-Jane和James J.Chen。“用于在微阵列实验中鉴定差异表达基因的样品量。” 计算生物学杂志11.4(2004):714-726。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.