我已阅读亚历山德鲁·尼古列斯库-米济尔和富卡鲁阿纳的论文“ 从推进获取校准概率,并在讨论” 这一主题。但是,我仍然难以理解和实现逻辑或普拉特定标来校准我的多类提升分类器(带有决策树桩的温和提升)的输出。
我对广义线性模型有些熟悉,并且我想我了解logistic和Platt的校准方法在二进制情况下如何工作,但不确定如何将本文中描述的方法扩展到多类情况。
我正在使用的分类器输出以下内容:
- =分类器针对要分类的样本 i为类 j投的票数
- =预估班级
在这一点上,我有以下问题:
问题1:我是否需要使用多项式logit来估计概率?还是我仍然可以通过逻辑回归来做到这一点(例如,以1-vs-all的方式)?
问题2:如何为多类情况定义中间目标变量(例如,按Platt的缩放比例)?
Q3:我知道这可能要问很多,但是有人愿意为这个问题草拟出伪代码吗?(在更实际的水平上,我对Matlab中的解决方案感兴趣)。
1
好问题。我也想知道即使您确实使用1与其他类型的方案,如何构造校准。如果您使用1相对于其余模型(有k个类)创建k个模型,您是否必须/应该以某种方式对其进行归一化,以使它们求和为1(例如,将每个校准概率除以所有k的和)?
—
B_Miner