对于成本矩阵
L=[010.50]c1c2predictionc1c2truth
为类时预测类的损失为,而真为类时预测类的损失为。正确的预测没有成本,。条件风险用于预测任一类然后c1c2L12=0.5c2c1L21=1L11=L22=0Rk
R(c1|x)R(c2|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)
对于参考,请参阅第15页上的这些
说明。
为了最大程度地降低风险/损失,您可以预测是否因错误而付出的代价(即错误的预测损失乘以预测错误的后验概率)小于错误地预测替代方案的成本,c1L12Pr(c2|x)
L12Pr(c2|x)L12Pr(x|c2)Pr(c2)L12Pr(c2)L21Pr(c1)<L21Pr(c1|x)<L21Pr(x|c1)Pr(c1)<Pr(x|c1)Pr(x|c2)
,其中第二行使用贝叶斯规则。给定相等的先验概率您得到
Pr(c2|x)∝Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.512<Pr(x|c1)Pr(x|c2)
因此您选择将观察值分类为是似然比超过此阈值。现在,我不清楚您是要根据似然比还是就属性来了解“最佳阈值” 。答案根据成本函数而变化。在不等式利用高斯与和,,
c1xσ1=σ2=σμ1=0μ2=1
12log(12)log(12)xσ2x<12π√σexp[−12σ2(x−μ1)2]12π√σexp[−12σ2(x−μ2)2]<log(12π−−√σ)−12σ2(x−0)2−[log(12π−−√σ)−12σ2(x−1)2]<−x22σ2+x22σ2−2x2σ2+12σ2<12σ2−log(12)<12−log(12)σ2
因此根据的预测阈值
x当您进行搜索时,只有在错误预测导致的损失相同的情况下才能实现,即因为只有这样,您才能拥有,您得到。
L12=L21log(L12L21)=log(1)=0x0<12