变量误差回归:从三个站点合并数据是否有效?


15

最近,我有一个客户来做我的引导程序分析,因为FDA审查员说他们的变量误差回归是无​​效的,因为当合并来自站点的数据时,分析包括来自三个站点的数据,其中两个站点包括一些样本。相同。

背景

客户想使用一种新的测定方法,他们希望证明该方法与现有的认可方法“等效”。他们的方法是比较两种方法应用于相同样品的结果。使用了三个站点进行测试。将变量误差(戴明回归)应用于每个站点的数据。想法是,如果回归显示斜率参数接近1,截距接近0,则表明这两种测定技术给出的结果几乎相同,因此应批准新方法。在站点1,他们有45个样本,给了他们45个配对的观测值。站点2有40个样本,站点3有43个样本。他们进行了三个单独的Deming回归(假设两种方法的测量误差之比为1)。因此,该算法将垂直距离的平方和最小化。

客户在提交的材料中指出,地点1和2所用的一些样品是相同的。在审查中,FDA审查员说Deming回归是无效的,因为使用了共同的样本会导致“干扰”,从而使模型的假设无效。他们要求对Deming结果进行自举调整,以考虑到这种干扰。

那时,由于客户不知道该如何进行引导程序。“干扰”一词很奇怪,我不确定审阅者的确切含义。我认为关键是因为合并数据具有公共样本,所以公共样本之间存在相关性,因此模型误差项不会全部独立。

客户分析

这三个单独的回归非常相似。每个斜率参数接近1,截距接近0。在每种情况下,斜率和截距的95%置信区间分别为1和0。主要区别是站点3上的残留方差略高。此外,他们将此与进行OLS的结果进行了比较,发现它们非常相似(仅在一种情况下,基于OLS的斜率的置信区间不包含1)。如果坡度的OLS CI不包含1,则区间的上限约为0.99。

由于这三个站点的结果如此相似,将站点数据合并起来似乎是合理的。客户进行了汇总的Deming回归,也得出了类似的结果。鉴于这些结果,我为客户撰写了一份报告,对声称回归无效的说法提出了异议。我的观点是,由于两个变量中都存在类似的度量误差,因此客户使用Deming回归作为显示同意/不同意见的方式是正确的。单个站点的回归没有相关误差的问题,因为在给定的站点内没有重复样本。合并数据以获得更紧密的置信区间。

可以通过简单地将数据与站点1中遗漏的常见样本合并来解决此难题。同样,三个单独的站点模型也没有问题并且有效。在我看来,即使没有共同努力,这也提供了有力的证据。此外,对于公共站点,分别在站点1和2进行测量。因此,我认为即使使用所有数据进行汇总分析也是有效的,因为站点1处样品的测量误差与站点2中相应样品的测量误差不相关。这实际上等于在设计中重复了一点空间应该没有问题。它不会创建关联/“干扰”。

在我的报告中,我写道引导分析是不必要的,因为没有相关的调整。这三个站点模型是有效的(站点内没有可能的“干扰”),可以进行合并分析以在合并时删除站点1上的常见样本。这样的汇总分析不会有干扰问题。无需进行自举调整,因为没有偏差可调整。

结论

客户同意我的分析,但害怕将其提交给FDA。他们还是要我进行引导程序调整。

我的问题

A)您是否同意(1)我对客户结果的分析,以及(2)我认为不需要引导程序的论点。

B)鉴于我必须自举Deming回归,是否有任何过程SAS或R可用于我对自举样本进行Deming回归?

编辑:考虑到比尔·胡伯(Bill Huber)的建议,我计划通过对x上的y和对y上的x进行回归来研究变量误差回归的界限。我们已经知道,对于一种版本的OLS,当两个误差方差均相等时,答案与变量误差基本相同。如果对于其他回归也是如此,那么我认为这将表明Deming回归给出了适当的解决方案。你同意吗?

为了满足客户的要求,我需要进行模糊定义的请求引导分析。从伦理上讲,我认为仅提供引导程序是错误的,因为它并不能真正解决客户的真正问题,即证明他们的检测测量程序合理。因此,我将对他们进行分析,并至少要求他们告诉FDA,除了进行引导程序外,我还进行了逆回归并限制了Deming回归,我认为这更合适。我还认为,分析将表明他们的方法与参考等效,因此Deming回归也足够。

我计划使用@whuber在其答案中建议的R程序,以使我能够引导Deming回归。我对R不太熟悉,但我认为我可以做到。我已经将R和R Studio一起安装了。这样对像我这样的新手来说足够容易吗?

我也有SAS,并且对SAS编程更满意。因此,如果有人知道在SAS中执行此操作的方法,我将不胜感激。


2
我不知道这个问题的答案,但是,从纯粹的政治角度来看,做FDA想要做的事情并证明(至少,大概是)结果相似是不是更好?(很好的问题,顺便说一句,+ 1)
彼得·弗洛姆-恢复莫妮卡

1
是的,@ PeterFlom我同意对FDA进行分析并显示无关紧要。但是我认为,以外交方式指出回归的结果及其含义,并在没有重叠样本的情况下进行合并可以加强这一论点。我将进行引导,但我可以使用帮助查找可用的软件来自己进行Deming回归,而无需对其进行独立编码。
Michael R. Chernick 2012年

2
迈克尔,“地点”共有的“样本”的可能性使人们对这些(抽象)术语可能意味着什么的自然解释产生了疑问。例如,我最初将“站点”视为不同的地理位置,将“样本”视为与这些位置相关联的独立实体,每个实体均进行独立测量。在此模型中,样本不可能在不同的地点共有。能否请你澄清被这些术语是什么意思?
ub

3
@whuber这些站点位于不同的位置。样品是来自个体的柠檬酸盐血浆。实验室测试在不同的时间在不同的站点进行。比较是针对打算执行相同功能的两个化验测量设备进行的。在站点1和2上,一些样本被重复使用,但设备在站点1和站点2上独立运行。因此,即使使用相同的样本(或相同样本的一部分),我也说测量误差实际上是独立的。
Michael R. Chernick 2012年

1
a)同意从合并分析中删除重复的样本消除了对缺乏独立性的担忧。b)很少有SAS用户会发现使用R进行涉及罕见回归方法的自举分析很“容易”。引导程序分析确实确实需要功能性编程思维方式,而SAS并不鼓励这种方式。
DWin 2012年

Answers:


10

这是一个相互校准的问题:即定量比较两个独立的测量设备。

似乎存在两个主要问题。 第一个问题(仅在问题中隐含)是在构想问题:如何确定新方法是否与已批准的方法“等效”?第二个问题是如何分析某些样本可能被多次测量的数据。

构想问题

解决上述问题的最佳方法(也许是显而易见的方法)是使用从可比较的介质(例如人血浆)中获得的准确已知值的样品评估新方法。(这通常是通过用已知浓度的标准物质加样实际样品来完成的。)由于尚未这样做,因此让我们假设监管者不可能或不可接受(无论出于何种原因)。因此,我们简化为比较两种测量方法,其中一种方法被用作参考,因为它被认为是准确且可重复的(但没有完美的精度)。

实际上,客户将要求FDA允许新方法作为已批准方法的代理或替代。这样,他们的负担就是证明新方法的结果将足够准确地预测批准的方法在应用后将确定的结果。 这样做的微妙之处在于,我们并没有试图自己预测真实的价值,甚至不知道它们。因此,变量误差回归可能不是分析这些数据的最合适方法。

在这种情况下,通常的解决方案是“逆回归”(例如,在Draper&Smith的《应用回归分析》(第二版)第1.7节中进行了描述)。简而言之,该技术使新方法的结果回归ÿ 反对批准的方法的结果 X,设置一个合适的预测间隔,然后在功能上反转该间隔以获取X 对于任何给定的值 ÿ。如果,在预期范围内ÿ 值,这些范围 X 是“足够小”,然后 ÿ 是有效的代理 X。(根据我的经验,这种方法趋向于严格严格:除非两个测量结果都高度准确,精确且线性相关,否则这些间隔可能会非常大。)

处理重复样本

这里的相关概念是示例支持方差成分。 “样本支持”是指实际测量的对象(此处为人)的身体部位。在拍摄了受试者的一部分后,通常需要将其分为适合于测量过程的子样本。我们可能会担心子样本之间存在差异的可能性。在充分混合的液体样品中,整个样品中的基本量(例如化学物质的浓度)基本上没有变化,但是在固体或半固体(可能包括血液)的样品中,这种变化可能是实质性的。考虑到实验室通常仅需要微升溶液即可进行测量,因此我们必须关注几乎在微观范围内的变化。这可能很重要。

这种变化的可能性 物理样本表明测量结果的变化应划分为单独的“方差成分”。一个成分是样本内变化的方差,其他是后续测量过程中每个独立步骤的方差贡献。(这些步骤可能包括子采样的物理行为,样品的进一步化学和物理处理-例如添加稳定剂或离心-将样品注入测量仪器,仪器内部的变化,仪器之间的变化以及其他由于操作仪器的人的变化,实验室中可能的环境污染等原因而造成的变化。我希望这可以清楚地表明,为了切实回答这个问题,统计人员需要对整个采样和分析过程有透彻的了解。我所能做的就是提供一些一般性指导。)

这些考虑适用于当前的问题,因为在两个不同的“站点”上测量的一个“样本”实际上是从同一个人获得的两个物理样本,然后在实验室之间分配。通过批准的方法进行的测量将使用一个分割样品,同时通过新方法进行的测量将使用另一种分割的样品。通过考虑这些分裂所隐含的方差成分,我们可以解决问题的主要问题。现在应该清楚的是,这些成对的测量之间的差异应该归因于两件事:首先,测量程序之间的实际差异(这就是我们要评估的事实);其次,由于任何变化而导致的差异内部的样本以及提取两个要测量的子样本的物理过程所引起的变化。 如果有关样本同质性和二次抽样过程的物理推理可以确定第二种方差形式可以忽略不计,那么确实不存在审阅者所声称的“干扰”。否则,可能需要在逆回归分析中明确建模和估计这些方差分量。


1
感谢您进行了非常出色的分析,提出了解决此问题的最佳方法。但是,在我的特定情况下,客户选择了Deming回归方法,而不在寻找其他方法。FDA对Deming回归的注射似乎仅仅是由于干扰,他们针对该问题的建议是某种类型的自举校正。我之所以被带进来,是因为他们不知道如何进行引导。他们没有统计学家的参与,也没有像我在报告中给出的那样对结果进行统计分析。
Michael R. Chernick 2012年

2
我非常感谢这些限制(应该对此进行明确说明)。但是,总的来说,解决此类问题的一个好的框架是采用适当的模型作为出发点。如果您尝试使用不合适的方法和无效的模型(以使客户满意)来推理解决方案,则只会加重错误,而无法找到任何可辩护的解决方案。您现在可能要考虑的是Deming回归与逆回归之间的差异,以及如何调整Deming回归以适应多个方差分量。
ub

1
您可能会被激励去证明已经应用的Deming回归已经足够接近更通常或更合适的方法所产生的结果:这样的证明可能是您所处环境中最好的解决方案。
ub

相反,他们所做的只是描述问题以及如何收集数据并显示Deming回归的输出。如果有统计学家参与,关于戴明回归的统计问题可能会更少。我为客户提供的所有功能都为完成的分析提供了一个案例(其中包括为什么可以分析大多数回归而不必担心来自同一来源的重复采样所造成的干扰的原因),并提供了所需的引导程序调整合并模型中的剩余方差。
Michael R. Chernick 2012年

在这一点上,我不能告诉他们进行逆回归。如果批准一种测量方法,我认为可以将其视为参考,这对公司的负担是要表明新方法在本质上与参考所做的工作相同。为此,我认为Deming回归是合适的,至少可以被FDA接受。如果没有出现重复样本的问题,那将是可能的。如果他们在进行合并时离开了我们重复的样本之一,就不会出现该问题。
Michael R. Chernick 2012年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.