Answers:
这里的中心概念是Kolmogorov的复杂性,尤其是可压缩性。为了得到压缩的直观的感觉,可以考虑两个字符串和乙∈ 乙 *,其中乙 = { 0 ,1 }。让
1010 1010 1010,和
0110 0111 1001。
需要注意的是。我们如何量化A或B有多少信息?如果我们考虑经典信息理论,通常,传输长度为n的字符串平均需要n位。但是,我们无法说出传输长度为n的特定字符串需要多少位。
为什么随机字符串的信息内容不为零?
仔细观察,我们可以发现实际上。但是,很难说B是否在结构上有任何明显的模式,至少它看起来和感觉比A更随机。因为我们可以在A中找到一个模式,所以我们可以轻松地压缩A并用少于16位来表示它。同样,由于检测B中的任何模式都不容易,因此我们无法对其进行太多压缩。因此,可以说B比A具有更多的信息。此外,长度为n的随机字符串具有最大的信息,因为我们无法对其进行压缩,因此只能用少于位表示它。
那么有用的信息是什么?
对于有用的信息,是的,使用图灵机进行定义。在有用信息X ∈ 乙 *是
其中,表示图灵机T的自限制编码的长度。符号通常是使得Ç (X )表示的Kolmogorov复杂X和Ç (X | Ý )的条件Kolmogorov复杂X给出ÿ。
这里x中包含的有用信息的数量。我们要问的是,在满足要求的那些中选择哪个T。问题是要分离的最短程序X *成零件X * = p q ST p表示适当Ť。实际上,这就是产生最小描述长度(MDL)的想法。
可能是因为很难定义“有用”。假设我们有一个高度结构化,信息丰富的消息,该消息x最多可以压缩为消息y的α倍。直观地讲,x和y包含相同数量的有用信息。实际上,根据通常的定义,它们包含的信息量相同。现在想象前缀Ž的X相同的长度的ÿ ; 它所包含的有用信息应不超过x,因此,不应超过y。但是,y比z更“随机” ,因为z可以压缩而不能压缩。因此,如果我们尝试将“有用的”信息与可压缩性相关联,则会遇到以下悖论:消息的前缀可能比整个消息具有更高的“有用”信息,这似乎是矛盾的。
从不太正式的角度来看,如果您脱离“随机”一词,我认为这可能会有所帮助,因为您正确地认为一组真正的随机位在实际意义上不会存储任何信息。(如果我对一组名称进行加密并将加密后的值发送给您,则它们可能具有很高的Kolmogorov复杂度,但这不会帮助您找出名称)。
但是以这种方式考虑一下。如果您看到的是外语网站(例如瑞典语,假设您不会说),那么它将看起来或多或少是随机的。单词会有一定顺序,但数量不多。但是,如果您查看的网页的文本看起来像这样:123456123456123456123456 ...等,则可以更快地理解它。如果您不会说瑞典语,即使瑞典语网页上说的是“按顺序重复的前六个数字”,您也可能会受益匪浅。这些网站包含相同的信息,但对您而言却是随机的。而且对于空间量,即使您存储的是相同的信息,您所了解的空间也比瑞典网页的效率要低得多。您可能找不到此信息“有用”,因为它
“信息”的概念是通用的,因此看起来像随机的(因此无用的)位可能会向他人存储大量信息。信息量度旨在作为字符串的固有属性,并且不能取决于对您有意义和不有意义的内容以及您可以解释和不能解释的内容。
另一个可能会有所帮助的(技术性的)观点是,我在这里有点不屑一顾。正如Juho所指出的,信息是相对于谁的解释来定义。您可能会发现瑞典文网页作为信息传播工具完全没有用,但是说瑞典语的人可能会发现它包含大量信息。该定义确实反映了这一点。但是,从数学中我们可以了解到,与您交流此网站的最短(最有用的信息)网页与可以与讲瑞典语的人进行交流的最短网页之间的区别仅在于加常数。为什么?因为对于您来说,作为非瑞典语使用者,存储您可以理解的页面的最简单方法是“按顺序重复的前六个整数”。这可能比瑞典人长很多。
但是,即使您会说瑞典语,也只能从长度上减去加法常数!为什么?因为您总是可以购买瑞典语-英语词典。这样一来,超短的瑞典语网页便对您有意义。当然,只有当您拥有字典时,它们才有意义,但是字典的长度是恒定的。因此,