这个问题困扰了我很长时间。我了解使用“对数”来最大程度地提高可能性,所以我不问“对数”。
我的问题是,由于最大化对数可能性等于最小化“负对数可能性”(NLL),为什么我们要发明这种NLL?为什么我们不一直使用“阳性可能性”?NLL在什么情况下受到青睐?
我在这里找到了一些解释。https://quantivity.wordpress.com/2011/05/23/why-minimize-negative-log-likelihood/,它似乎在深度上解释了明显的等效性,但并不能解决我的困惑。
任何解释将不胜感激。