Questions tagged «sensitivity-specificity»

6
记住敏感性,特异性,准确性,准确性和召回率之间差异的最佳方法是什么?
尽管已经看过502847894789次这些术语,但我一生都无法记住灵敏度,特异性,精度,准确性和召回率之间的差异。它们是非常简单的概念,但是名称对我来说是非常不直观的,因此我一直使它们彼此混淆。什么是考虑这些概念的好方法,以便使名称开始有意义? 换句话说,为什么为这些概念选择了这些名称,而不是其他一些名称?


3
比较两个分类器的(均值)ROC AUC,敏感性和特异性的统计显着性(p值)
我有一个包含100个案例和两个分类器的测试集。 我为这两个分类器生成了预测并计算了ROC AUC,敏感性和特异性。 问题1:如何计算p值,以检查一个总分(ROC AUC,敏感性,特异性)是否明显优于另一个? 现在,对于100个案例的相同测试集,我为每种案例分配了不同且独立的功能。这是因为我的功能是固定的,但主观的,并且由多(5)个主题提供。 因此,我针对我的测试集的5个“版本”再次评估了两个分类器,并获得了5个ROC AUC,5个敏感性和5个特异性。然后,我计算了两个分类器的5个主题的每个性能指标的平均值(平均ROC AUC,平均灵敏度和平均特异性)。 问题2:如何计算p值,以检查一个均值(平均ROC AUC,平均敏感性,平均特异性)是否明显好于另一个? 最好提供一些示例python(最好)或MatLab代码的答案。

4
ROC和multiROC分析:如何计算最佳切割点?
我试图了解如何计算ROC曲线的最佳切点(灵敏度和特异性最大化的值)。我正在使用aSAH包中的数据集pROC。 该outcome变量可以由两个独立变量解释:s100b和ndka。使用该Epi包的语法,我创建了两个模型: library(pROC) library(Epi) ROC(form=outcome~s100b, data=aSAH) ROC(form=outcome~ndka, data=aSAH) 以下两个图形说明了输出: 在第一个图表(s100b)中,该函数表示最佳切点位于对应于的值lr.eta=0.304。在第二张图(ndka)中,最佳切点位于的对应值上lr.eta=0.335(的含义lr.eta)。我的第一个问题是: 什么是相应s100b和ndka的值lr.eta值表示(是什么方面的最佳临界点s100b和ndka)? 第二个问题: 现在,假设我创建一个同时考虑了两个变量的模型: ROC(form=outcome~ndka+s100b, data=aSAH) 获得的图形为: 我想知道ndkaAND 的值是什么,s100b通过该函数可以最大程度地提高敏感性和特异性。换句话说:是什么样的价值观ndka和s100b我们已SE = 68.3%和SP = 76.4%(从图表中获取的值)? 我想第二个问题与multiROC分析有关,但是该Epi软件包的文档并未解释如何为模型中使用的两个变量计算最佳切点。 我的问题与reasearchGate的问题非常相似,简而言之: 确定代表灵敏度和特异性之间更好权衡的临界值很简单。但是,对于多变量ROC曲线分析,我注意到大多数研究人员都将注意力集中在确定AUC上几个指标(变量)线性组合的整体准确性的算法上。[...] 但是,这些方法并未提及如何确定与多个指标相关联的临界值组合,以提供最佳的诊断准确性。 Shultz在他的论文中提出了一种可能的解决方案,但是从本文中,我无法理解如何为多元ROC曲线计算最佳切点。 也许Epi包装中的解决方案不是理想的,所以任何其他有用的链接将不胜感激。

7
敏感性或特异性是患病率的函数吗?
标准教学说,敏感性和特异性是测试的属性,与患病率无关。但这不只是一个假设吗? 哈里森的内科学原理第19版说 长期以来,人们一直认为敏感性和特异性是测试准确性与患病率无关的参数,许多文献仍在发表这一声明。然而,这种统计学上有用的假设在临床上是简单的。...住院患者的测试敏感性可能更高,而门诊患者的测试特异性更高。 (住院患者的患病率通常高于门诊患者) 这些参数之间是否存在数学或近似图形关系? 即使这个链接也称其为“简化”。为什么? 编辑:我知道如何定义灵敏度。正如答案中所提到的,没有涉及流行的术语。我本人一直坚持认为,这些是测试的属性,不受所使用的总体影响,直到我遇到此声明,因此才提出问题。但我认为,造成这种混乱的原因不是由于定义,而是由于这些值的实际计算。特异性和敏感性是使用2x2表格计算的,这里参考人群的普遍性重要吗?这就是他们所指的吗?如果可以,功能是什么?

2
结合敏感性和特异性的分类器性能指标?
我有2个类别的标签数据,正在使用多个分类器对其进行分类。并且数据集是很好平衡的。在评估分类器的性能时,我需要考虑分类器在确定真实肯定因素和真实否定因素方面的准确性。因此,如果我使用准确性,并且如果分类器偏向正值并将所有分类都归为正值,那么即使它未能对任何真实的负数进行分类,我也会获得约50%的准确性。此属性扩展到精度和召回率,因为它们仅关注一个类,而后又关注F1评分。(这是我什至从本文中了解的内容,例如“ 超越准确性,F分数和ROC:性能评估的判别方法系列 ”)。 因此,我可以使用敏感性和特异性(TPR和TNR)来查看分类器对每个类别的表现,以最大程度地提高这些值为目标。 我的问题是,我正在寻找一种将这两个值组合成一个有意义的量度的量度。我研究了该文件中提供的措施,但是发现它并不简单。基于我的理解,我想知道为什么我们不能应用像F分数这样的东西,但是我不使用精度和召回率而是使用灵敏度和特异性?因此公式为 ,我的目标是最大化这个措施。我觉得它很有代表性。已经有类似的公式吗?这是否有意义,或者在数学上是否合理?my Performance Measure=2∗sensitivity∗specificitysensitivity+specificitymy Performance Measure=2∗sensitivity∗specificitysensitivity+specificity \text{my Performance Measure} = \frac{2 * \text{sensitivity} * \text{specificity}}{\text{sensitivity} + \text{specificity}}
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.