假设是一组离散随机变量和互斥结果是一个利用率函数,其中,,等
当被均匀地分布在和是一个概率质量函数,香农熵被最大化(,并且当一个元素具有的全部质量时,香农熵被最小化(实际上为)。这与关于意外(或不确定性降低),结果和不确定性(或预期意外)和随机变量的直觉相对应:
- 当均匀分布时,不确定性最大化,质量均匀分布的结果越多,我们的不确定性就越大。
- 当所有质量都集中在一个结果中时,我们就没有不确定性。
- 当我们将结果分配为的概率时,当我们实际观察到它时,我们不会获得任何信息(“不惊奇”)。
- 当我们给结果分配概率越来越接近于,对它实际发生的观察变得越来越有用(“令人惊讶”)。
(当然,所有这些都没有对香农信息/熵的编码进行更具体的解释,但对认知的解释较少)。
但是,当具有效用函数的解释时,存在对l o g 1的感官解释。或∑f(ω)log1?在我看来,可能是:
- 如果作为PMF表示在Ω上的均匀分布,则f作为效用函数对应于对结果的无差异,该结果不可能更大*
- 一个效用函数,其中一个结果具有所有效用,而其余结果都不具有(尽可能多地偏向效用),这对应于非常强的相对偏好 -缺乏冷漠。
是否有扩展的参考?我是否错过了有关比较概率质量函数和离散随机变量的归一化相对效用的限制的知识?
*我知道无差异曲线,出于种种原因,看不到它们与我的问题有什么关系,首先是我对分类样本空间进行了研究,而实际上我对“差异”本身不感兴趣,而是当实际的(离散)“概率分布”或(附加)具有效用函数的解释时,如何将效用解释为概率,以及如何解释概率函数。