我有两种遗传算法的实现方式,它们应该表现相同。但是,由于无法解决的技术限制,在给定相同输入的情况下,它们的输出并不完全相同。
我仍然想证明没有明显的性能差异。
对于两种算法,我使用相同的配置进行了20次运行,并使用了不同的初始随机数种子。对于每次运行和每一代,记录总体中最佳个体的最小误差 适用度。该算法采用了精英保留机制,因此最佳个人的适合度单调下降。一次运行包含1000代,因此每次运行我都有1000个值。我无法获得更多数据,因为计算非常昂贵。
我应该使用哪种测试?一种简单的方法可能是只比较最后几代中的错误(再次,我将在此处使用哪种测试)?但人们可能还会考虑比较一般的收敛行为。