为什么身体素质低下的人有机会生存到下一代?


24

我目前正在阅读和观看遗传算法,并且发现它非常有趣(我上大学时没有机会学习它)。

我了解突变是基于概率的(随机性是进化的根源),但我不知道生存的原因。

据我了解,一个个体I具有适应性例如另一个个体具有适应性我们有,那么比具有更好的生存可能性到下一代。F(i)JF(j)F(i)>F(j)IJ

概率意味着可以生存而可能无法生存(“运气不好”)。我不明白为什么这很好?如果将始终在选择中幸免,那么算法中会出什么问题?我的猜测是该算法将类似于贪婪算法,但我不确定。J I I


13
卡在局部最小值中。
路易斯

即使在现实生活中,有益的突变也不能/更大的环境适应性并不能保证与他们/它一起生活的个体的生存,这实际上可以表达更多的特征(如果环境出乎意料的变化,这可能是有益的,尽管对于优化算法而言不太可能)。……这是尼克回答的结尾,无论如何。
JAB

1
如果您一直都在消灭弱者,那么除了一个普通的爬山者,您还有什么?
拉斐尔

Answers:


35

主要思想是,通过允许次优个体存活,您可以通过一系列小的增量突变从进化景观中的一个“高峰”切换到另一个。另一方面,如果只允许您上坡,则需要巨大且不太可能发生的突变来切换峰。

这是显示差异的图:

在此处输入图片说明

实际上,这种全球化属性是进化算法的主要卖点-如果您只想找到局部最大值,则存在更有效的专门技术。(例如,具有有限差分梯度和线搜索的L-BFGS)

在生物进化的现实世界中,当进化景观发生变化时,允许次优个体生存将增强鲁棒性。如果每个人都集中在一个山峰上,那么如果那个山峰变成了山谷,那么整个种群就会死亡(例如,恐龙是最合适的物种,直到发生小行星撞击并且进化格局发生变化)。另一方面,如果人口中存在某种多样性,那么当景观改变时,某些物种将得以生存。


2
“在生物进化的现实世界中,当进化环境发生变化时,允许次优个体生存将产生强大的鲁棒性” –作为生物学家,这让他很恼火。身体素质低下的人不会“被允许”生存以最大化身体素质,这只是现实的本质。低适应性生物正试图尽可能多地生存。
杰克·艾德利2014年

当然,您是对的,自然不会决定允许还是不允许任何事情,只是发生了。另一方面,在许多例子中,人类选择性饲养仅保持“最佳”状态的动植物,从而形成了一种新疾病或环境发生变化时并不健壮的单一养殖方式。
Nick Alger 2014年

还可以使用其他技术来消除这种影响,例如,采取更大的步骤并使用随机初始种群重新运行。此外,在存在交叉重组的情况下,如果一个较强的基因突变而两个之间的交叉更强,则保持较弱的基因型可能会有所帮助。
拉斐尔

13

尼克·阿尔杰(Nick Alger)的回答非常好,但我将使用一种示例方法,即Metropolis-Hastings方法使它更加数学化。

我要探讨的场景是您的人口为一。您建议以概率Q i j 从状态到状态j进行突变,并且还强加了条件Q i j = Q j i 。我们还将假设所有i的F i > 0ijQ(i,j)Q(i,j)=Q(j,i)F(i)>0i ; 如果您的模型的适应度为零,则可以通过在每个位置添加一个小的epsilon来解决此问题。

我们将有可能接受从j的过渡:一世j

min(1,F(j)F(i))

换句话说,如果更合适,我们总是采用它,但如果j比较不适合,我们则以概率F j 接受它。jj,否则我们将重试直到接受突变。F(j)F(i)

现在我们想探索,即从i过渡到j的实际概率。P(i,j)ij

显然是:

P(i,j)=Q(i,j)min(1,F(j)F(i))

让我们假设。然后min 1 F j F(j)F(i)= 1,依此类推:min(1,F(j)F(i))

= F i Q i j min 1 F j

F(i)P(i,j)
=˚FQĴ=QĴ中号Ñ1˚F
=F(i)Q(i,j)min(1,F(j)F(i))
=F(i)Q(i,j)
=Q(j,i)min(1,F(i)F(j))F(j)
=F(j)P(j,i)

i=jij

F(i)P(i,j)=F(j)P(j,i)

这是很明显的,原因有几个。

QFQ

i

iF(i)P(i,j)=iF(j)P(j,i)

P(j,i)1i1

F(j)=iF(i)P(i,j)

F

当然,这只是众多例子中的一个。正如我在下面指出的那样,它碰巧是一种非常容易解释的方法。通常,您不使用GA来探索pdf,而是寻找一个极值,并且在这种情况下可以放宽某些条件,并且仍然可以保证最终收敛的可能性很高。


Q(i,j)=Q(j,i)QQ(i,j)iQ(i,j)=Q(j,i)ij

F(i)P(i,j)=F(j)P(j,i)F是固定的pdf。如果您希望pdf是固定的,那么从某种意义上说,它可以使过程变得可逆。同样,如果有帮助,则MH算法是针对连续问题(中子传输)而设计的,在这些问题中没有离散数量的边缘。当然,如果您要查找全局最大值,那么搜索整个pdf并不总是您真正想要的。这仅出于说明目的。
别名2014年

7

使用Google Analytics(分析)的优势在于,您可以通过遵循可能来自较差候选对象的路径来探索更广泛的搜索空间。为了探索这些不同的搜索领域,应该有更差的候选人通过,而不是很多,但绝对是几个。如果您每次删除最佳算法后就开始尝试最好的方法,那么它会更像是一个登山者。同样,仅不断选择最好的内容可能会导致过早收敛。


6

实际上,选择算法采用两种方法。一种是您建议的方式,另一种是选择适合度较高的人,而不选择适合度较低的人。

IJF(i)>F(j)IJJF(j)>F(i)

由于GA是围绕现实世界的演化建模的,因此,当使用概率分布时,它们主要是围绕真实社区的演化建模的,在这种演化中,有时身体素质较低的人可能会生存,而身体素质较高的人可能无法生存(粗略的类比:车祸,自然灾难等:-))。


0

它非常简单,从一个角度来看:有时,通过交叉或变异,高适应性的“子级”解决方案可以由低适应性的“父级”解决方案诞生(这实际上是遗传算法的许多理论)。因此,总的来说,人们希望寻求/采用更高适应性的解决方案,但过于强调仅保留/繁殖高适应性的解决方案可能会导致陷入局部极小值,而无法搜索较大的“进化图景”。实际上,一个人可以按照自己的意愿严格或宽松地做出“更高的健身极限”,并尝试如何影响最终解决方案的质量。太严格或太宽松的截止策略都会导致最终解决方案的劣等。当然,所有这些都与真实的生物进化有关。还有更多”

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.