关于您的问题:重新加权训练样本是否等于将两种情况之一中的损失乘以一个常数:是的。编写逻辑回归损失函数的一种方法是
其中和分别代表正例和负例,而是根据特征构建的逻辑分类器。例如,如果您想对否定实例赋予更大的权重,则可能希望将损失修改为
∑j = 1Ĵ日志{ 1 + exp[ - ˚F(xĴ) ] }+ ∑k = 1ķ日志{ 1 + exp[ f(xķ) ] }
ĴķF(⋅ )X
w>1ww=2∑j = 1Ĵ日志{ 1 + exp[ - ˚F(xĴ) ] }+ ∑k = 1ķW¯¯ 日志{ 1 + exp[ f(xķ) ] }
对于某些。加权逻辑回归的软件实现可最大程度地减少此损失函数,但您也可以通过将负实例的加权,并拟合标准logistic回归来得出相同的答案(例如,如果,则创建每个否定实例2个副本并适合)。有关这种方法的更多详细信息,请参见
此处。而且,关于发生了什么参数标准误差一般警告
这里,但是这可能不会是这样一个问题,如果你只是在做预测。
w > 1ww = 2