排序列表上的分布


10

说我们有一个有序的物品清单

[a, b, c, ... x, y, z, ...]

我正在寻找一个上面的列表中受某些参数alpha控制的发行版系列,以便:

  • 对于alpha = 0,它将第一项的概率分配为1,将其分配给上方,将其余的分配为0。也就是说,如果我们从此列表中进行采样并进行替换,则总会得到a
  • 随着alpha的增加,我们会按照指数衰减的方式,为列表的其余部分分配越来越高的概率,并遵守列表的顺序。
  • 当alpha = 1时,我们为列表中的所有项目分配相等的概率,因此从列表中进行采样类似于忽略其顺序。

这与几何分布非常相似,但是有一些明显的区别:

  • 在所有自然数上定义了几何分布分布。在上面的例子中,列表的大小是固定的。
  • 没有为alpha = 0定义几何分布。

1
您似乎描述了一个截断的几何分布族。但是,有无数家庭在质量上像您的描述那样。因此,更重要的是要解释您想要使用这样一个家庭的目的。
ub

谢谢@whuber是的,我知道有无数个符合此说明的发行版。有什么特别的想法吗?我有一个系统目前正在选择此列表的第一个元素(代表分数),但是我想将这一选择随机化(并对该随机化进行参数化)。我不是在寻找基于alpha的特定类型的“衰变”。只要alpha = 0表示不进行随机化,即选择第一个元素,1表示“选择任何元素”,并且0到1之间的alpha表示这两个alpha之间的“某物”,那就足够了。
阿梅利奥·瓦兹克斯·雷纳

Answers:


11

假设(列表元素的等级)在具有一个值,该列表包含元素(关系可以随机断开)。然后我们可以定义选择的概率为:ri{ 0 1 ... ñ - 1 } Ñ i{0,1,,n1}ni

pi=αrik=1nαrk

这基本上只是一个适当的标准化截断几何分布,而且还涉及到使用SoftMax功能。在的特殊情况下,请使用约定。注意,分母始终可以用简单的封闭形式的表达式编写。对于它采用值;对于它采用值。0 0 = 1 α < 1个1 - α Ñα=000=1α<1 α=1个Ñ1αn1αα=1n

对于,很显然,这只是为每个元素分配了相等的概率。随着,这接近将所有概率质量赋予第一个元素。α →交通0α=1α0

在包含10个元素的列表中,使用可以清楚地看到您要求的大致指数下降:α=0.5

p00.5005p10.2502p20.1251p30.0626p40.0313p50.0156p60.0078p70.0039p80.0020p90.0010

下图使用长度为10的列表绘制了选择第一个元素的概率基于变化情况。α

在此处输入图片说明


真好 这比我曾经希望的要聪明得多。
马修·德鲁里

@Matthew这些是我前面提到的截断的几何分布。
ub

4

我将尝试从基本原理构建一个示例。

让我们以三种分布为基础:

  • P是对列表的第一个元素分配概率为1,对所有其他元素分配为零的分布。
  • E是分配概率到列表的第一个元素,到下一个元素,依此类推。由于列表是有限的,所以它们的总和不会为,但是我们可以归一化以获得概率分布。 112 1141
  • U是列表上的均匀分布。

现在我们要考虑这些分布的一参数正凸组合

α(t)P+β(t)E+γ(t)U

对于所有其中,具有和。 [ 0 1 ] α 0 = 1 γ 1 = 1α(t)+β(t)+γ(t)=1t[0,1]α(0)=1γ(1)=1

在几何上,我们希望在点 1、0、0,它从第一个角开始,到最后一个角。另外,由于我们希望分布在中间时间看起来是“指数”的,因此我们希望曲线在时间处占据三角形的内部。(α(t),β(t),γ(t))(1,0,0),(0,1,0),(0,0,1)t(0,1)

这是曲线的一个选项:

(1t(1t))(1t,0,t)+t(1t)(13,13,13)

我从我们想要的属性向后构造了此工作。曲线在起始点和结束点之间沿着三角形的边缘延伸。公式的其余部分只是该边缘曲线和单点的凸和。,在时间处将曲线沿边缘推入内部。1(1t,0,t)01(13,13,13)t(0,1)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.