我正在研究一些逻辑回归问题。(“常规”和“有条件”)。
理想情况下,我想对每个输入案例进行加权,以便glm将更多的精力放在正确预测较高加权案例上,而可能会误分类较低加权案例。
当然这已经完成了。谁能指出我一些相关的文献(或者可能建议修改的似然函数。)
谢谢!
1
您假设分类是目标,而不是预测。为了获得最佳的概率估计,您无需重新加权任何东西。“假阴性”和“假阳性”仅在强制选择下出现,并且通常没有人在强迫进行纯二进制选择。
—
Frank Harrell
@弗兰克你说的很好。最终,该项目的目标是预测进一步事件的结果。(因此,我认为可以将其视为带有训练数据的机器学习趣味。)某些结果比其他结果更“重要”,因此我一直在寻找一种对它们进行加权的方法。Nick对于似然函数的建议是合理的,并且在代码中实现应该是微不足道的。
—
诺亚
听起来好像您需要精确的概率模型,而无需权重。
—
Frank Harrell
对; 插入成本函数并使用预测的概率,您将获得最佳决策。
—
弗兰克·哈雷尔
在经过良好校准的概率模型中,没有“错误”,只有随机性无法预测。最佳决策是预测概率和做出各种决策以采取行动的成本函数的函数。
—
Frank Harrell 2015年