贝叶斯定理的解释适用于乳腺X线摄影阳性结果

11

我正在尝试将贝叶斯定理的结果应用于经典的乳房X射线照片示例，而乳房X射线照片的扭曲是完美的。

那是，

癌症发生率： $.01$

假设患者患有癌症，则乳房X光检查阳性的可能性： $1$

假设患者未患癌症，乳房X光检查呈阳性的可能性： $.01$

贝叶斯：

P（癌症|乳房X线照片+）= $\dfrac {1 \cdot .01}{(1 \cdot .01) + (.091 \cdot .99)}$

$= .5025$

因此，如果人口中有一个随机的人进行乳房X光检查并获得阳性结果，那么他们有50％的机会患上癌症吗？我无法直觉地理解在1％的人口中只有1％的假阳性几率会触发50％的结果。从逻辑上讲，我认为具有很小的假阳性率的完全正确的乳房X线照片会更加准确。

— 用户名
source

2

假阳性率不是人口的1％，而是人口的99％。这就是为什么您得到一个看起来很低的概率的原因，因为某人健康的先验概率很高。另外请记住，这只是一次测试，如果您多次参加测试会怎样？然后，测试的准确性开始变得越来越重要。

— dsaxton 2015年

如果是完美的乳房X线照片，则假阳性率将为零，然后p（C | M）= 1 * 0.01 /（1 * 0.01 + 0 * 0.99）= 1.0完美（0），则底部的第二项接近零。“微小的”假阳性率与类似的微小基本率相结合，得出了违反直觉的结果。

— 戴夫X

从我的经验可以看出，形式演绎形式的逻辑是一件很了不起的事情，但是却产生了关于概率推论的极差直觉。bmj.com/content/343/bmj.d6386上的工具可能会帮助您理解。

— conjugateprior

在我的理解中，问题是要求直觉，考虑到假设，条件概率如何可以这么低。而不是实际的乳腺X射线摄影实际统计数据（答案似乎与之有关）。

— Juho Kokkala 2015年

— David Waterworth

11

我将从医学和统计学的角度回答这个问题。在外行新闻界，它受到了广泛的关注，尤其是在畅销书内特· 西尔（Nate Silver）以及其他出版物（如《纽约时报》）上解释了这一概念之后。因此，我很高兴@ user2666425在CV上打开了该主题。

首先，请允许我请澄清，不正确。我可以告诉你，这个数字将是梦想成真。不幸的是，有很多错误的阴性乳房X线照片，特别是在乳腺组织密集的女性中。估计数字可能会达到或更高，具体取决于您是否将所有不同类型的乳腺癌归为一类（侵袭性DCIS）和其他因素。这就是为什么还应用基于超声或MRI技术的其他方式的原因。在筛选测试中，与之间的差异至关重要。 $p\,(+|C) = 1$ $20\%$ $0.8$ $1$

贝叶斯定理告诉我们，并且由于它与年轻的低风险女性的乳房X线照相术有关，因此最近引起了很多关注。我意识到这并不是您要问的，我在最后几段中要解决的，但这是辩论最多的话题。以下是这些问题的味道： $\small p(C|+) = \large \frac{p(+|C)}{p(+)}\small* p(C)$

较年轻的患者（例如40至50岁）的先验（或基于患病率而罹患癌症的可能性）很小。根据NCI，它可以整（见下表）。鉴于乳房X线检查呈阳性，这种相对较低的测试前概率本身会降低测试后患癌症的条件性概率，而与收集的可能性或数据无关。 $\sim 1.5\%$
在将应用于成千上万名先验健康女性的筛查程序中，假阳性的可能性变得非常重要。所以，虽然假阳性率（这是高得多，如果你专注于累积风险）可能听起来不是那么糟糕，它实际上是巨大的心理和经济成本的问题，特别是考虑到前期低点测试年轻，低风险患者的几率。您的这个数字很不合理-事实是，由于许多因素（包括法医学问题），“疤痕”非常普遍。 $7 - 10\%$ $1\%$

因此，对于没有危险因素的年轻女性，重新计算且非常重要的是：

$p(C|+) = \frac{p(+|C)}{p(+)}\small* p(C) =$

。 $= \frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \large \frac{0.8}{0.8*0.015\, +\, 0.07*0.985}\small*\, 0.015 = 0.148$

年轻的低危女性中，当乳房X线检查结果显示为阳性时，患癌症的可能性可低至。顺便说一句，乳腺X线摄影读数间接评估了放射线医师对诊断的信心（称为BI-RADS），随着我们从BI-RADS 3发展到BI-RADS，这种贝叶斯分析将发生根本性变化。 5-从最广泛的意义上讲，所有这些“阳性”测试。 $15\%$

$40$ $45$

在老年妇女中，患病率（以及因此的前测概率）随年龄呈线性增长。根据当前报告，从以下年龄开始，在接下来的10年中女性被诊断出患有乳腺癌的风险如下：

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

$10\%$

$4\%$

$p(C|+)=\large \frac{0.8}{0.8*0.04\, +\, 0.07*0.96}\small*\, 0.04 = 0.32 \sim 32\%$

$p(C|+)$

您问题的具体答案：

$p(+|\bar C)$ $7-10\%$ $1\%$ $p(\bar C)$ 请注意，此“错误警报率”乘以分母中没有癌症的病例（与癌症患者相比）的比例要大得多，而不是“在1％的人口中只有1％的假阳性几率”提到。我相信这是您的问题的答案。要强调的是，尽管这在诊断测试中是不可接受的，但在筛查程序中仍然值得。

直觉问题： @Juho Kokkala提出了OP正在询问直觉的问题。我以为计算和结尾段落中都暗含了它，但是很公平……这就是我要向朋友解释的方式……让我们假装我们要在亚利桑那州的温斯洛用金属探测器寻找流星碎片。就在这儿：

图片来自meteorcrater.com

...，金属探测器关闭。好吧，如果您说这很可能是游客投下的硬币而来，那您可能是对的。但是您要领悟：如果未对位置进行如此彻底的筛选，那么比起我们在纽约市街头时，像这样的地方，探测器发出的哔哔声更有可能来自流星碎片。

乳房X线摄影的工作将针对健康人群，寻找一种无声的疾病，如果不早发现，可能会致命。幸运的是，患病率（尽管与其他无法治愈的癌症相比非常高），即使结果为“阳性”，尤其是在年轻女性中，随机遇到癌症的可能性也很低。

$p(\bar C|+)=0$

$\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}\small* p(C) = \frac{p(+|C)}{p(+|C)\,*\,p(C)}\small* p(C) = 1$ $100\%$

$\frac{\text{likelihood}}{\text{unconditional p(+)}}=\frac{p(+|C)}{p(+|C)\,*\,p(C)\, +\, p(+|\bar C)\,*\,p(\bar C)}$ $<1$ $p(C)$ $\text{posterior} = \alpha * \text{prior}$ $\text{posterior} < \text{prior}$ 阳性预测值（PPV）：筛查测试阳性的受试者确实患有该疾病的概率。

— 安东尼·帕雷拉达（Antoni Parellada）
source

5

乳房X线照相术的一个关键问题在话语中尚未得到充分解决，这是对“阳性”的错误定义。在http://biostat.mc.vanderbilt.edu/ClinStat的“ 诊断”一章中对此进行了说明-请参见此处的生物医学研究中的生物统计学链接。

乳房X线照相术中使用最广泛的诊断编码系统之一是BI-RADS得分，得分4是经常的“阳性”结果。第4类的定义是“不是乳腺癌的特征，而是发生恶性肿瘤的合理可能性（3％至94％；应考虑活检”）。一个类别的风险范围从0.03一直到0.94 ，也就是说，“阳性”的真正含义具有令人难以置信的异质性，也就不足为奇了。

这也表明思想不明确，BI-RADS系统没有针对风险估计为0.945的人员分类。

正如内特·西尔弗（Nate Silver）在《信号与噪声》（The Signal and the Noise）中雄辩地指出的那样，如果我们要概率地思考，我们将在周围做出更好的决定。删除诸如“阳性”和“阴性”之类的医学测试术语将以最佳方式消除误报和误报，并传达不确定性（以及在做出诊断之前进行更多测试的理由）。

— 弗兰克·哈雷尔
source

我们正在实际同步中编写-请在下面查看我对BI-RADS的评论。我完全同意（作为放射科医生的大量个人经验）。

— Antoni Parellada 2015年

3

在《计算风险》一书中对此进行了很好的讨论

这本书的大部分内容是寻找更清晰的方式来讨论和思考概率和风险。一个例子：

40岁的女性患乳腺癌的可能性约为1％。如果她患有乳腺癌，则她在X线钼靶筛查中呈阳性的可能性约为90％。如果她没有患乳腺癌，那么她仍然会呈阳性的概率为9％。测试呈阳性的女性有机会罹患乳腺癌吗？

这是本书使用“自然频率”介绍解决方案的方式。考虑到10,000名女性，其中1％患有癌症，因此有100名女性。其中，有90％的患者将返回阳性检测结果（即90名癌症妇女的检测结果呈阳性）。在没有癌症的9900名患者中，有9％或891名妇女将返回阳性测试。因此，有891 + 90 = 981名妇女的测试结果呈阳性，其中90名患有癌症。因此，呈阳性测试的女性患癌症的机会是90/981 = 0.092

如果100％的癌症妇女检测为阳性，只需将数字稍微更改为100 /（100 + 891）= 0.1

— 托尼·拉德森
source

1

也许这种思路是正确的？：

$.01 * 1$

$0.0025$

— 用户名
source

1

这是一种过于简化但直观的查看方式。考虑100个人。一个人患有癌症，并将测试呈阳性。在不这样做的99个用户中，其中一个将得到误报。因此，在这两种阳性反应中，一种会得癌症，而一种则不会。

— 埃米尔·弗里德曼
source