我有一台生产零件的原型机。
在第一次测试中,该机器生产了零件,并且一个二进制分类器告诉我零件有缺陷(,通常且),而零件是好的。d 1 d 1 < Ñ 1 d 1 / Ñ 1 < 0.01 Ñ 1 ≈ 10 4 Ñ 1 - d 1
然后,技术人员对机器进行一些更改,以减少缺陷零件的数量。
在第二次和随后的测试中,修改后的机器生成零件,并且相同的二进制分类器(未触及)告诉我零件有缺陷,无论如何与非常相似。d 2 d 2 / N 2 d 1 / N 1
技术人员想知道他的更改是否有效。
假设分类器是完美的(灵敏度为100%,特异性为100%),则可以对比例进行测试(使用R,我只输入prop.test(c(d1,d2),c(N1,N2))
)。
但是分类器不是完美的,那么我如何考虑分类器的敏感性和特异性(都是未知的),以便正确地回答技术人员的问题?