有什么方法可以证明两种分析方法是等效的?


11

我有两种不同的分析方法,可以测量基质中特定分子的浓度(例如测量水中的盐含量)

两种方法不同,每种方法都有自己的错误。有什么方法可以证明这两种方法是等效的(或不等效)。

我认为在散点图上绘制通过两种方法测量的多个样本的结果是一个不错的第一步,但是有没有好的统计方法?


您可以在问题中提供更多详细信息吗?我不明白什么是“基质中特定分子的浓度”。
罗宾吉拉德

2
@robin:“基质”在本文中是标准分析化学术语;它是指可以找到要分析的实体(“分析物”)的介质。例如,如果要分析自来水中铅的浓度,则铅是分析物,水是基质。
JM不是统计学家

Answers:


13

简单的相关方法不是分析方法比较研究结果的正确方法。最后,我至少参考了两本有关此主题的推荐书籍(1,2)。简而言之,在比较测量方法时,我们通常期望(a)我们的结论不应该依赖于用于比较的特定样品,并且(b)应考虑与特定测量工具相关的测量误差。这排除了任何基于相关性的方法,我们将注意力转移到方差分量或混合效果模型上,这些模型或模型可以反映项目的系统影响(此处,项目代表收集数据的个人或样本), (一个)。

在您的情况下,您使用两种不同的方法收集了单个测量值(我假设它们都不是黄金标准),最基本的操作是绘制差异()与均值(); 这称为。它将允许您检查(1)两组测量值之间的变化是否恒定,以及(2)在观察值范围内,差异的方差是否恒定。基本上,这只是与的简单散点图的45°旋转,其解释接近于线性回归中使用的拟合值残差值的图。然后,X 1 + X 2/ 2 X 1 X 2X1X2(X1+X2)/2X1X2

  • 如果差异是恒定的(恒定偏差),则可以计算一致性极限(请参阅(3))
  • 如果差异在整个测量范围内不是恒定的,则可以在两种方法之间拟合线性回归模型(选择要用作预测变量的模型)
  • 如果差异的方差不是恒定的,请尝试找到合适的变换,使关系与恒定方差成线性

其他详细信息可以在第(2)章的第4章中找到。

参考文献

  1. 邓恩(2004)。可靠性研究的设计与分析。阿诺德 参见《国际流行病学杂志》的评论。
  2. Carstensen,B(2010)。临床测量方法比较。威利。请参见随附的网站,包括R代码。
  3. 来自Bland和Altman的原始文章,用于评估两种临床测量方法之间一致性的统计方法
  4. 卡斯滕森(2004)。几种测量方法的比较和预测生物统计学5(3),399–413。

您介意“(a)我们的结论不应取决于用于比较的特定样本”的意思吗?在这种情况下,由于“样本”的含糊性,我遇到了麻烦:它是指“统计样本”(假定代表过程或种群的一组数据)还是“环境样本”(一些水,土壤,空气或组织)。无论哪种含义,我都无法完全得出逻辑的结论,即“这将排除基于相关性的任何方法”。
ub

@whuber好吧,我的意思是收集观察到的数据(例如,葡萄糖浓度),理想情况下,该数据应代表所测量内容的可能范围。依赖于相关性可能会引起误解,因为它取决于所采样的单位(例如医院的患者):尽管两种方法之间的关系仍然相同,但只要通过任一尺度进行一次或多次极端测量,我们就可以获得更高的相关性。 。因此,我们的想法是利益度量的分布不应影响我们对方法可比性的结论。(...)
chl

@whuber(...)我们要评估的是数据之外一致性,而不是数据中的关系(我引用的是Carstensen 2010第8-9页)。
chl 2010年

谢谢; 很好地阐明了您的立场。本质上,这是校准的练习,只是我们似乎没有比较的参考标准。我们仅假设实验者选择的物理样品覆盖了一定范围的真实浓度。因此,正如您所写,相关性本身并不一定是两种方法之间一致性的有用度量。但是通常,特别是对于化学分析,实际浓度是已知的(因为实验人员将已知量的物质引入基质中)。
ub

@whuber是的。在没有黄金标准的情况下,我们仅对这两种方法产生“可比”结果的程度感兴趣,因此只依赖于所谓的协议限制。尽管可能预先知道真实的测量方法,但是每种测量工具都有其自身的测量误差-至少对于我曾经在生物医学(例如血糖浓度)和神经心理学(例如抑郁水平)领域处理的误差。
chl 2010年

2

如果您无法了解真正的注意力,那么最简单的方法就是关联。除此之外的步骤可能是使用方法1进行简单回归以预测方法2的结果(反之亦然)。如果方法相同,则截距应为0;否则为0。如果截距大于或小于0,则表示一种方法相对于另一种方法的偏差。如果平均方法得出的结果相同(在控制截距中的向上或向下偏差之后),则非标准化斜率应接近1。非标准化斜率中的误差可作为两种方法一致程度的指标。

在我看来,这里的统计方法的困难在于您试图确认通常被视为零假设的东西,也就是说,这两种方法之间没有区别。只要您不需要ap值,就可以使用统计方法,这并不是致命的打击,并且您可以量化“等效”的含义,并且可以在不再使用之前确定两种方法之间可以有多少偏差认为它们是等效的。在上面详细介绍的回归方法中,如果斜率估计值周围的置信区间包括1,截距周围的CI包括0,则可以认为这些方法等效。


在化学计量学中,仪器的响应通常是非线性和异方差的。进行和解释回归时,至少要加倍注意。
ub

1

我同意@drnexus。另外,对于两种方法的方差相等,我可能建议使用Morgan-Pitman检验。这将告诉您一种方法是否具有比另一种方法更多的方差。这本身可能不是一件坏事,因为大概两个测试具有不同的偏差-偏差权衡(例如,一个测试可能总是说50%(有偏差,但无方差),而另一个测试则无偏差,但非常嘈杂)。一些领域知识可能在这里有助于确定所需的方法权衡。当然,正如其他人所指出的那样,拥有“黄金标准”将是更可取的。


1

很老的问题,但今天又出现了:

通用关键字是“分析化学中的验证”,因此此处有点偏离主题(但由于此处没有化学站点(因此,网址为:http : //area51.stackexchange.com/proposals/4964/chemistry,我猜我们暂时可以留在这里了)

为此,在分析化学中有一些标准程序。

图书:

  • 放克等 al:分析化学质量保证,Wiley-VCH。

  • Kromidas(Hrsg。):位于Wiley-VCH的der Analytik的Handbuch Validierung(
    我不知道是否有英文版本,但还没有英文版本。但是目录列出了多元校准的验证。)

IUPAC也有话要说:

  • Danzer,K.和Currie,LA:分析化学校准指南。第I部分。基础知识和单组分校准,纯粹与应用化学,IUPAC,1998,4,993-1014

  • K. Danzer和M. Otto和LA Currie:分析化学校准指南。第2部分:多组分校准纯粹化学与应用化学,2004,76,1215-1225


0

您使用“分析方法”一词令我有些困惑。我将假设,“分析方法”是指某种特定的模型/估计策略。

概括地说,可以使用两种度量标准来在估计量之间进行选择。

样本中指标

  • 似然比/ Wald检验/ Score检验
  • R 2
  • 样本内命中率(样本数据正确预测的百分比)
  • (许多其他指标取决于模型/估计上下文)

样本外指标

  • 样本外命中率(样本外数据正确预测的百分比)

如果这些估计值相等,则在这些指标上它们的表现也一样好。您还可以看到估计值之间是否在统计上没有差异(例如均值相等性的两个样本检验),但是这种方法取决于模型和方法的细节。


抱歉,我的意思是一种分析测量方法。我已经重新措辞了这个问题。
PaulHurleyuk

在这种情况下,我认为您可能想做均值/比例均等的两样本检验。

2
检验均值/比例是否仅能为您提供两种方法在给定一组响应中给出的平均响应是否相同的点估计?即使这两种方法实际上彼此负相关,这种方法也无法产生“相等”的结果吗?
russellpierce

这是一个好点。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.