Answers:
TL; DR:疾病很少见,因此,假阳性的绝对数量比假阴性的绝对数量要多得多。
假设我们的系统的假阳性和假阴性率相同,为1%(相当好!),并且我们今年正在检测新癌症的存在:439.2 / 100,000人口,即人口的0.5%。[ 来源 ]
因此,我们可以看到存在一个问题:对于每个患有癌症的人,两个没有癌症的人都会通过侵入性手术,化学疗法或放射疗法结局。
对于每一个未能发现当前癌症的人,有200人获得了他们不需要且负担不起的积极有害治疗。
你知道那个哭狼的男孩的故事吧?
这是相同的想法。在某个分类器多次发出错误警报(哭狼)后,医务人员将其关闭或忽略。
“哦,这又是一次!不行!”
至少与我合作过的生物工程团队一样,重点在于降低FPR,特别是因为目标是制造一种可以提醒医生注意潜在病状的工具,他们告诉我们,他们将忽略哭泣的产品。太多了。
对于一种有助于医师的产品,尽管有合理的论据认为在农场失踪狼比哭泣狼更糟糕,但我们必须诉诸于他们的心理。
编辑:减少误报也有一个合理的论点。如果您的计算机在偶尔获得真正的肯定(并捕捉到大多数真正的肯定)的同时不断哭泣,那实际上是在说某人可能生病了。他们在医院。医生知道病人可能生病了。
简介:问题可能*不是一个假阴性是否比一个假阳性差,而是*更像是是否可以接受500个假阳性降低到一个假阴性。
*取决于应用
让我进一步谈谈@Dragon的答案:
筛查意味着我们正在看似健康的人群中寻找疾病。正如@Dragon所解释的,对于这些,我们需要极低的FPR(或高灵敏度),否则我们将得到比真实肯定更多的错误肯定。即,阳性预测值(在所有诊断为阳性的疾病中真正患病的#个)将低得无法接受。
灵敏度(TPR)和特异性(TNR)对于诊断系统而言很容易测量:采取一些真正的(未)患病案例并测量正确检测出的案例的比例。
从医生和患者的角度来看,OTOH的预测值都更重要。它们是敏感性和特异性的“逆向”,可以告诉您所有积极(消极)预测中正确的分数。换句话说,在测试说“疾病”之后,患者实际上确实患有该疾病的概率是多少。
正如@Dragon向您展示的那样,发病率(或患病率,取决于我们正在谈论的测试)在这里起着至关重要的作用。在所有筛查/早期癌症诊断应用中,发病率都很低。
为了说明这一点,绝经后妇女的卵巢癌筛查在普通人群中的患病率为0.04%,在有家族史和/或已知抑癌基因BRCA1和2突变的高危妇女中,这一比例为0.5%[Buchen,L.巨蟹座:缺少标记。自然,2011,471,428-432]
因此,问题通常不在于一个假阴性是否比一个假阳性差,而是即使99%的特异性(1%FPR)和95%的敏感性(数字来自上面的链接)也意味着每个假阴性大约500个假阳性。 。
另外,请记住,早期癌症诊断本身并不是治疗癌症的灵丹妙药。例如,对于乳腺癌X线筛查,只有3-13%的真正阳性患者实际上会从筛查中受益。
因此,我们还需要关注每个受益患者的假阳性数。例如,对于乳腺X线摄影,再加上这些数字,可以粗略估计,每个受益于真实阳性的人(39-49岁年龄组)的假阳性范围在400-1800之间。
每个假阴性都有数百个假阳性(每位患者也可能从筛查中受益数百个甚至数千个假阳性),这种情况并不像“一种漏诊的癌症比一种假阳性的癌症诊断更糟糕”那样清晰:确实会产生影响,范围从心理和心理躯体(担心自己患有癌症并不健康)到后续诊断(例如活检)的物理风险(这是一种小型手术,因此都具有这种影响)风险)。
即使一个误报的影响很小,但如果必须考虑数百个误报,则相应的风险可能会大大增加。
建议阅读:Gerd Gigerenzer:精明的风险:如何制定良好的决策(2014年)。
尽管如此,使诊断测试有用所需的PPV和NPV仍高度取决于应用程序。
正如所解释的,在筛查早期癌症的过程中,通常将重点放在PPV上,即确保您不会因误报而造成太多伤害:发现相当一部分(即使不是全部)的早期癌症患者已经是一个进步。未经筛选的现状。
OTOH,献血中的HIV测试首先关注NPV(即确保血液中不含HIV)。尽管如此,在第二(和第三)步骤中,在担心具有(假)阳性HIV测试结果的人之前,可以通过应用进一步的测试来减少假阳性。
最后但并非最不重要的一点是,在医学测试应用中,在筛查并非特别高风险的人群(例如某些鉴别诊断)时,其发生率或流行率并不像通常那样极端。
从个人角度看,而不是数据科学经验,误报比假阴性对患者的生活质量有更大的影响(至少在医学图像处理的大多数应用中。这里我们不讨论实验室结果) 。
让我们看一个具体的例子:肿瘤筛查。
假阴性意味着早期肿瘤有更多时间生长并发展为恶性肿瘤。总体而言,该过程需要很长时间,并且随后进行的每次筛查都有较高的机会进行检测,但是实际上,患者的长期健康受到了影响。
另外,总是有人参与诊断。当前技术阶段的医学图像处理旨在为医学界人士提供帮助,而不是替代品。通常是指指出微妙的病变或组织变化,以至于人们可能忽略它们。医生没有机会忽视晚期肿瘤。他们不需要为此进行图像处理。
就医疗程序而言,如果在下次筛查之前肿瘤没有变得无法手术,则切除早期肿瘤或生长时间稍长的肿瘤之间没有太大区别。去除的组织数量更多,但操作的种类通常相同。(这假设患者定期进行健康检查。)
误报有许多含义,但并非都与疾病直接相关:
该风险效益评估表明,假阴性患者比假阳性患者对患者的风险更低。因此,减少误报的优先级通常更高。
很有可能,这个线程上的每个人都已经知道这是贝叶斯分析核心的问题。仅出于未来朝圣者的利益,他们可能会认为误报在某种程度上只是放射学中的问题,我希望此评论可以提供更一般的观点。