Answers:
您已经阅读了有关困惑的Wikipedia文章。它给出了离散分布的困惑
也可以写成
即作为概率的反比的加权几何平均值。对于连续分布,总和将变成整数。
本文还提供了一种使用条测试数据来估计模型的困惑度的方法
也可以写成
或其他各种方式,这应该使“对数平均逆概率”的来源更加清晰。
我发现这很直观:
无论您要评估的是什么,在您评估的数据上的困惑,都会告诉您“这件事与x面模具的正确性差不多。”
http://planspace.org/2013/09/23/perplexity-what-it-is-and-what-yours-is/
我也想知道。第一个解释还不错,但这是我的2点意思。
首先,困惑与描述您猜测某件事正确的频率无关。它与表征随机序列的复杂性有关。
我们正在查看一个数量
我们首先取消对数和幂。
我认为值得指出的是,困惑度与用于定义熵的基础是不变的。因此,从这个意义上讲,困惑比度量熵无限唯一/更少随意。
让我们玩一点。假设您只是在看一枚硬币。当硬币公平时,熵最大,困惑度最大
现在,当我们看面骰子时会发生什么?困惑度是
因此,困惑感代表了一个公平的骰子的边数,当掷骰子时,产生的序列与您给定的概率分布具有相同的熵。
好的,现在我们有了一个关于困惑的直观定义,让我们快速看一下它如何受模型中状态数的影响。让我们从个状态的概率分布开始,并创建个状态的新概率分布,以使原始个状态的似然比保持相同,并且新状态的概率为。在以公平的侧模具开始的情况下,我们可以想象创建一个新的侧模具,以使新侧以概率和原始滚动。双方以相同的可能性滚动。因此,在任意原始概率分布的情况下,如果每个状态的概率由给出,则在给定新状态的情况下,原始个状态的新分布将为,新的困惑将由以下方式给出:
在的极限中,此数量接近
因此,当您使滚动骰子的一侧变得越来越不可能时,困惑似乎最终似乎就不存在了。