这个问题以公式的形式给出了交叉熵的定量定义。
维基百科说,我正在寻找一个更概念上的定义:
在信息论中,如果使用编码方案是基于给定的概率分布q而不是“真实”分布p,则两个概率分布之间的交叉熵衡量从一组可能性中识别事件所需的平均位数。。
我强调了让我难以理解的部分。我想要一个不错的定义,不需要对熵有单独的(预先存在的)理解。
1
您需要定义交叉熵,同时定义熵本身。直觉上如此...如果您在理解熵本身的概念时遇到困难,最好先理解基本概念,然后再理解其任何扩展。
—
Alecos Papadopoulos 2014年
我个人对熵有基本的了解(尽管自应用以来已将近12个月了)。但是,熵的定量表达应放在一小段中,而交叉熵则只需要一个。因此,我觉得可以同时包含这两个方面,这是一个很好的答案,因此读者无需参考其他地方即可理解。
—
Lyndon White