KOTH:每个人都喜欢代币


24

在这个游戏中,两个玩家争夺吃掉最多积分的代币,但是有一个转折!连续吃多个相同颜色的代币会带来越来越多的奖励,但是要当心,否则您的对手会通过吃掉您想要的代币来破坏您的计划!

规则:

  • 1对1
  • n x n板(随机大小在5x5和15x15之间)
  • 您和您的对手将在同一个随机细胞中产生
  • 整个棋盘将在某些单元格中随机生成数字,范围从1-3
  • 将生成2 *(板的宽度)令牌,但可以覆盖,因此可能会更少。
  • 每个数字都是十六进制RGB格式的三种颜色之一:红色,绿色或蓝色
  • 每回合,玩家1移动并更新棋盘,然后玩家2移动并更新棋盘。因此,每个玩家都可以根据棋盘状态的变化有效地判断前一个玩家的动作。这将一直持续到游戏结束为止,如下所述。
  • 您有6个可能的转弯动作:上,右,下,左,进食和通过
  • 4个移动命令是不言自明的,您可以转弯。如果您退回无意义的举动,我们将假设您的意思是通过。如果您尝试移开电路板的边缘,则不会移动。边缘不包裹。
  • EAT消耗您当前所在位置与
  • 您获得的积分与您消费的积分一样多
  • 如果您连续吃两个相同颜色的数字,您将获得+1
  • 如果您连续吃3个相同颜色的数字,则得到+2
  • 如果您连续吃相同颜色的m个数字,则得到+(m-1)
  • 这些奖金是累加的,因此在您吃另一种颜色时,连续获得m个数字将导致m *(m-1)/ 2。
  • 游戏结束条件:
    • 所有数字都被消耗掉
    • 任一位玩家(没有任何代币都可以2 *(宽度)到达)进行4 *(棋盘的宽度)转弯而没有有效吃掉(只是说“ EAT”,没有你要的标记没有计数)移动,因此只有在两个玩家都没有单个目标标记的情况下,才会超过此界限)
  • 您的AI只需不到一秒钟的时间就可以采取行动,否则将通过PASS作为您的选择。

锦标赛将是轮巡赛,有很多回合,例如100或1000。将生成一个随机棋盘,并且该棋盘上将运行每个有序对的不同玩家。比赛结束后,我们将按总得分对人员进行排名。因此,即使您是一场比赛的玩家2,您的目标仍然是获得尽可能多的积分。

AI提交:我的控制器支持的语言是Javascript。允许多次提交。每个人都为这样的对象提交构造函数:

function (player1) {
    this.yourMove = function (b) {
        return "MOVE";
    }
}

输入的内容player1是布尔值,表示您是否是玩家1。您的构造函数必须具有该yourMove函数,但也可以具有任意数量的其他函数或值。不要定义任何全局变量,只需将它们作为变量放在对象上即可。每次比赛开始时都会创建一个新版本的对象,并yourMove在每次旋转时以当前棋盘为输入在其上调用该对象的新版本 ,并应返回有效的移动。

b,是的输入yourMove,是当前电路板的副本,以下是构造函数以及输入示例,尽管您不能自己调用​​它们:

function token(color, points) {
    this.color = color; //"#FF0000"
    this.points = points; //5
}

function player(pos, score, colorBonus, lastColor) {
    this.pos = pos; //[5, 5]
    this.score = score; //9
    this.colorBonus = colorBonus; //i.e. 2 if you just ate 3 blue tokens in a row
                                  //0 if you just ate two different colors.
    this.lastColor = lastColor; //"#00FF00", is "#000000" at start
}

function board(player1, player2, tokens) {
    this.player1 = player1; //new player([5, 5], 9, 2, "#00FF00")
    this.player2 = player2; //new player([5, 5], 9, 2, "#00FF00")
    this.tokens = tokens; //[[new token("#0000FF", 5), false],
                      // [new token("#0000FF", 5), false]]
}

令牌数组的所有空白正方形均具有“ false”,令牌[a] [b]是x = a,y = b处的令牌,从左上角开始编号。

控制器: 这是 GitHub中控制器的链接。这是一个html文件,您可以运行该文件以查看游戏和循环赛的工作方式,它带有两个AI,一个随机的AI,每转一个随机方向,但在其位置吃掉令牌,以及一个幼稚的算法,寻求获得最多积分的最近令牌。我将在提交的每个AI中添加。

以下是允许您在默认AI上运行控制器的代码段。当前的AI:

  • KindaRandomAI
  • 朴素
  • MirrorBot
  • HungryBot


12
是的,KOTH!自从上一版以来,它就永远存在。
TheNumberOne

2
同意,我爱我一个很好的KOTH,这似乎是一个很好的前提。我对JS有点绿色,如果我们不能将结果保存在玩家外对象中,那么如何在两次移动之间保持游戏状态呢?
DoctorHeckle '16

电路板宽度是否可以传递到函数中的任何位置?
TheNumberOne

@BentNeeHumor是的,接受player1布尔值的函数是您的AI的构造yourMove函数,它将具有将当前板作为输入的函数,例如b
摩擦瓜

1
@DylanSp有时由于合谋的可能性而不允许使用它们,但是在这种情况下,合谋的好处很小,因此我将允许多次提交。
摩擦瓜

Answers:


4

HungryBot

使用积分系统为追求每个令牌的价值增加权重。考虑各种不同因素,并在每个回合中重新评估它们,以确保遵循最佳策略。

function hungryBot(first) {
  // Set up "self"
  var self = this;

  // Determine player order
  this.player = -(first - 2);
  this.enemy = first + 1;

  // Action associative array
  this.actions = ['EAT', 'LEFT', 'RIGHT', 'UP', 'DOWN'];

  //Logic handler
  this.yourMove = function(board) {
    // Determine player object
    var player = board['player' + self.player];
    var enemy = board['player' + self.enemy];

    // Point value action grid
    var actions = [0, 0, 0, 0, 0]; // Associative with "this.actions"

    // Board dimensions
    var size = board.tokens.length;
    var maxDist = size * 2;

    // Colors remaining
    var colors = {
      '#FF0000': 0,
      '#00FF00': 0,
      '#0000FF': 0
    };

    // Averaged value weight
    var average = [0, 0];

    // Total points
    var points = 0;

    // Token holder
    var tokens = [];

    // Token parser
    for (var i = 0, x = 0, y = 0; i < size * size; i += 1, x = i % size, y = i / size | 0) {
      if (!board.tokens[x][y]) {
        continue;
      } else {
        var token = {};
        token.points = board.tokens[x][y].points;
        token.color = board.tokens[x][y].color;
        token.x = x - player.pos[0];
        token.y = y - player.pos[1];
        token.distX = Math.abs(token.x);
        token.distY = Math.abs(token.y);
        token.dist = token.distX + token.distY;
        token.distE = Math.abs(x - enemy.pos[0]) + Math.abs(y - enemy.pos[1]);
        token.value = -token.points - (player.colorBonus + 1) * (token.color == player.lastColor) * ((token.dist == 0) + 1) * 1.618 - (enemy.colorBonus + 1) * (token.color == enemy.lastColor);
        tokens.push(token);
        colors[token.color] += 1;
        points += token.points;
        average[0] += x * token.points;
        average[1] += y * token.points;
      }
    }

    // Determine actual average
    average[0] = average[0] / points | 0;
    average[1] = average[1] / points | 0;

    // Pick best token
    var best = 0;

    // Calculate point values of tokens
    for (i = 0; i < tokens.length; i++) {
      var token = tokens[i];
      // Add remaining numbers of tokens of color as factor
      token.value -= (colors[token.color] / tokens.length) * 1.618;
      // Subtract distance as a factor
      token.value += token.dist;
      // Add distance to average to value
      token.value += (Math.abs(average[0] - (token.x + player.pos[0])) + Math.abs(average[1] - (token.y + player.pos[1]))) / Math.sqrt(2);
      // Consider them higher value if we are closer, and lower if they are
      token.value += ((token.dist - token.distE) / (token.dist + token.distE + 0.001)) * token.dist;
      // Don't go for it if enemy is already there
      token.value += (token.distE == 0 && token.dist > 0) * 100;

      if (tokens[best].value > tokens[i].value || (tokens[best].value === tokens[i].value && Math.round(Math.random()))) {
        best = i;
      }
    }

    // Set token to best token
    var token = tokens[best];

    // What to respond with
    var response = 'PASS';

    // Find best action to get token
    if (token.dist == 0) {
      response = 'EAT'; // We're on the token
    } else if (token.distX >= token.distY) { // Token is more horizontal
      if (token.x < 0) { // Token is left
        response = 'LEFT';
      } else if (token.x > 0) { // Token is right
        response = 'RIGHT';
      }
    } else if (token.distX < token.distY) { // Token is more vertical
      if (token.y < 0) { // Token is above
        response = 'UP';
      } else if (token.y > 0) { // Token is below
        response = 'DOWN';
      }
    }

    // Return response
    return response;
  }
};

您是Python程序员吗?
CalculatorFeline

@CatsAreFluffy不是真的吗?
Mwr247 '16

只是以为你是因为self:)
CalculatorFeline

为什么要使用self?还this不够吗?
科纳·奥布莱恩

2

路径机器人

首字母缩写词代表“寻路和树启发式机器人”

编辑:截至目前,这是AI的排名,以及得分

  1. HungryBot(6422)
  2. 路径机器人(4591)
  3. 朴素AI(3811)
  4. 金达随机AI(618)
  5. 镜宝(193)
  6. LazyBot(25)

链接到完整的控制器 github

描述:与NaiveAI一样,此机器人找到了最接近的令牌,该令牌将为其提供最多的积分。但是,它也可以模拟每个动作的结果,最多可重复6次。

原理:因为NaiveAI已经相当不错了,所以我会做得更好。没有先看代码(大错误)。

节拍:除HungryBot之外的所有内容不适
用于:除HungryBot之外的所有内容

问题:

  • 无法模拟增加的条纹
  • 在计算最佳令牌时挂起
  • 可以传送

我仍然不知道为什么它会传送,但我将其修复。此处的旧视频: https //youtu.be/BIhSKycF9iA

完整代码:

pathBot = function (player1)
{
    this.pathNode = function(pos,ppt,parents,par)
    {
        this.pos = pos;this.ppt = ppt;this.parents = parents;this.par=par;
        this.childs=[];
    }
    this.addChildren = function (pn,children)
    {
        pn.childs=[];
        for(var i=0; i<children.length; i=i+1)
        {
            if(pn.parents.indexOf(children[i].pos)==-1&&pn.pos!=children[i].pos)
                pn.childs.push(
                    new this.pathNode(
                        children[i].pos,
                        children[i].ppt*pn.ppt,
                        pn.parents.concat([pn.pos]),
                        pn
                    )
                );
        }
    }
    this.orderTokensByPPT = function(b,pos){
        var tokens = [];
        for(var y=0; y<b.tokens.length; y=y+1)
        {
            for(var x=0; x<b.tokens[y].length; x=x+1)
            {
                var tok = b.tokens[y][x];
                if(tok)
                {
                    tokens.push(
                        new this.pathNode(
                            [y,x],
                            (tok.points+(tok.color==this.color ? this.streak : 0)) / this.lenOfMovesTo(pos,[y,x]),
                            [],
                            undefined
                        )
                    );
                }
            }
        }
        tokens.sort(function(a,b){
            return b.ppt - a.ppt;
        });
        return tokens;
    }
    this.lenOfMovesTo = function(cur,pos)
    {
        return Math.abs(cur[0]-pos[0])+Math.abs(cur[1]-pos[1])+1;
    }
    this.startAndGoalToCommand = function (start, goal) {
        var diff = [goal[0] - start[0], goal[1] - start[1]];
        if (diff[0] > 0) { return "RIGHT"; }
        else if (diff[1] > 0) { return "DOWN"; }
        else if (diff[1] < 0) { return "UP"; }
        else if (diff[0] < 0) { return "LEFT"; }
        else { return "EAT"; }
    }
    this.color = 0;
    this.streak = 0;
    this.eatTok = function(b)
    {
        if(b.tokens[this.me.pos[0]][this.me.pos[1]].color==this.color)
        {
            this.streak++;
        }
        else{
            this.streak = 0;
            this.color = b.tokens[this.me.pos[0]][this.me.pos[1]].color;
        }
        this.bestToken = false;
        return "EAT";
    }

    this.recurLen = 6;
    this.include = 4;
    this.recurDown = function(b,pn,level)
    {
        if(level==0) return pn;
        this.addChildren(pn,this.orderTokensByPPT(b,pn.pos));
        var newChilds = [];
        for(var i=0; i<pn.childs.length&&i<this.include; i=i+1)
        {
            newChilds.push(this.recurDown(b,pn.childs[i],level-1));
        }
        pn.childs = newChilds;
        return pn;
    }
    this.findMax = function(pn)
    {
        if(pn.childs)
        {
            var maxList = [];
            for(var i=0; i<pn.childs.length; i=i+1)
                maxList.push(this.findMax(pn.childs[i]));
            maxList.sort(
                function(a,b)
                {
                    return b.ppt-a.ppt;
                }
            );
            return maxList[0];
        }
        return pn;
    }
    this.findMaxList = function(pnList)
    {
        for(var i=0; i<pnList.lenght; i=i+1)
        {
            pnList[i] = this.findMax(pnList[i]);
        }
        pnList.sort(function(a,b){return b.ppt-a.ppt;});
        return pnList[0];
    }
    this.bestToken=false;
    this.yourMove = function(b){
        this.op = player1 ? b.player2 : b.player1;
        this.me = player1 ? b.player1 : b.player2;
        if(this.bestToken)
        {
            if(b.tokens[this.bestToken.pos[0]][this.bestToken.pos[1]]==undefined)
                this.bestToken = false;
        }
        if(!this.bestToken)
        {
            var paths = this.orderTokensByPPT(b,this.me.pos);
            for(var i=0; i<paths.length; i++)
            {
                paths[i] = this.recurDown(b,paths[i],this.recurLen);
            }
            var max = this.findMaxList(paths);
            while(max.par)
            {
                max = max.par;
            }
            this.bestToken = max;
        }
        var move = this.startAndGoalToCommand(this.me.pos,this.bestToken.pos);
        if(move=="EAT") return this.eatTok(b);
        else return move;
    }
}

SLaNTbot正在减慢转弯速度,并吞噬了我15%的CPU ... D:编辑:也不吃东西吗?
Mwr247

@ Mwr247速度,是的,它每刻可以模拟2500种可能性。但是对于吃东西,我不知道为什么。就像我在问题中说的那样,它只是传送(也就是将多个空间移动1圈),然后坐在那里什么也不做。我刚好在退货前发出警报,每次似乎都给出正确的指示。
蓝色

也许是这样:“您的AI只需不到一秒钟的时间就可以采取行动,否则将通过PASS作为您的选择。” 我还没有看过控制器,但是如果要花一秒钟的时间,它是否假定已通过?
Mwr247

@ Mwr247我将对此进行调查,但考虑到它在我的计算机上花费的时间少于1秒(或如此),因此似乎不太可能。不过,看上去永远不会受伤。谢谢!
蓝色

@ Mwr247经过更多测试后,事实并非如此。它做出的决策几乎与NaiveAi一样快(至少对我而言)。此外,你更有可能体验远距传物对大地图

1

朴素

从开始r=0,请查看所有与r您的位置相距出租车距离的代币。如果有的话,选择一个如果您现在就获得最高分的人。否则,增加r1然后重试。

naiveAI = function(player1) {
  this.player1 = player1;
  this.yourMove = function(b) {
    var me;
    if (this.player1) {
      me = b.player1;
    } else {
      me = b.player2;
    }
    var d = 0;
    var tokenP;
    while (tokenP == undefined) {
      var arr = this.findTokensAtDistance(me.pos, d)
      tokenP = this.findBestToken(arr, b.tokens, me);
      d += 1;
    }
    return this.startAndGoalToCommand(me.pos, tokenP);
  }
  this.findTokensAtDistance = function(p, d) {
    if (d == 0) {
      return [
        [p[0], p[1]]
      ];
    }
    var myArr = [];
    for (i = 0; i <= d; i++) {
      myArr[i] = [i, d - i];
    }
    var mySecArr = [];
    for (i = 0; i <= d; i++) {
      mySecArr[i] = [myArr[i][0] + p[0], myArr[i][1] + p[1]];
    }
    mySecArr[mySecArr.length] = [myArr[0][0] + p[0], -myArr[0][1] + p[1]];
    for (i = 1; i < myArr.length - 1; i++) {
      mySecArr[mySecArr.length] = [-myArr[i][0] + p[0], myArr[i][1] + p[1]]
      mySecArr[mySecArr.length] = [myArr[i][0] + p[0], -myArr[i][1] + p[1]]
      mySecArr[mySecArr.length] = [-myArr[i][0] + p[0], -myArr[i][1] + p[1]]
    }
    mySecArr[mySecArr.length] = [-myArr[myArr.length - 1][0] + p[0], myArr[myArr.length - 1][1] + p[1]];
    return mySecArr;
  }
  this.findBestToken = function(arr, t, player) {
    var tokenPos;
    for (i = 0; i < arr.length; i++) {
      if (arr[i][0] >= 0 && arr[i][0] < t.length && arr[i][1] >= 0 && arr[i][1] < t.length) {
        if (t[arr[i][0]][arr[i][1]] != false && ((tokenPos == undefined) || (this.tokenScore(player, t[arr[i][0]][arr[i][1]]) > this.tokenScore(player, t[tokenPos[0]][tokenPos[1]])))) {
          tokenPos = [arr[i][0],
            [arr[i][1]]
          ];
        }
      }
    }
    return tokenPos;
  }
  this.tokenScore = function(player, token) {
    if (player.lastColor == token.color) {
      return player.colorBonus + 1 + token.points;
    } else {
      return token.points;
    }
  }
  this.startAndGoalToCommand = function(start, goal) {
    var diff = [goal[0] - start[0], goal[1] - start[1]];
    if (diff[0] > 0) {
      return "RIGHT";
    } else if (diff[1] > 0) {
      return "DOWN";
    } else if (diff[1] < 0) {
      return "UP";
    } else if (diff[0] < 0) {
      return "LEFT";
    } else {
      return "EAT";
    }
  }
}

1

KindaRandomAI

每次转动时,请执行以下操作:如果您的位置上有令牌,则为“ EAT”。否则,请沿随机可行的方向移动,即,如果您位于左侧边缘,请不要说“向左”。

kindaRandomAI = function(player1) {
    this.player1 = player1;
    this.yourMove = function(b) {
        var me;
        if (this.player1) {
            me = b.player1;
        } else {
            me = b.player2;
        }
        if (b.tokens[me.pos[0]][me.pos[1]] != false) {
            return "EAT";
        } else {
            var dirs = this.getViableDirections(b, me.pos);
            var rand = Math.floor(Math.random() * dirs.length);
            return dirs[rand];
        }
    }
    this.getViableDirections = function(b, p) {
        var dirs = [];
        if (p[0] > 0) {
            dirs.push("LEFT");
        }
        if (p[1] > 0) {
            dirs.push("UP");
        }
        if (p[1] < b.tokens.length - 1) {
            dirs.push("DOWN");
        }
        if (p[0] < b.tokens.length - 1) {
            dirs.push("RIGHT");
        }
        return dirs;
    }
}

-1不是完全随机的
CalculatorFeline

那更好!
CalculatorFeline


1

MirrorBot

应该叫做“大炮饲料”

描述:与其他玩家的动作完全相反

原理:我想再次使用JS进行舒适的编程。这不应该赢

将击败:没有人

将会输给:所有人

function mirror(player1) {
    this.hasStarted=false;
    this.player1 = player1;
    this.opl=[0,0];
    this.yourMove = function(b){
        this.op = this.player1 ? b.player2.pos : b.player1.pos;
        out = "EAT";
        console.log(this.op);
        console.log(this.opl);
        if(this.hasStarted){
            if(this.opl[0] < this.op[0]) out = "RIGHT";
            if(this.opl[0] > this.op[0]) out = "LEFT";
            if(this.opl[1] < this.op[1]) out = "UP";
            if(this.opl[1] > this.op[1]) out = "DOWN";
        }
        this.opl = [this.op[0],this.op[1]];
        this.hasStarted = true;
        return out;
    }
}

您的代码有一些问题。右和左不是相反的,并且yourMove的函数定义不是有效的语法。我的代码也曾被破坏过,因此在查找和解决代码中的问题的过程中,我也修复了您的代码。您可以在我的脚本中查看固定代码。
摩擦瓜

@FricativeMelon我修复了损坏的函数定义。我必须反驳权利不是相反的主张。
2016年

0,0是左上角,因此正数x为右,负数x为左。如果新的x-pos的价值大于旧的x-pos,则其他玩家向右移动,因此您应该向左移动,反之亦然。另外,您应该使用var out = "EAT";而不是out = "EAT";,因为后者定义了全局变量。仔细检查一下,第三和第四行什么也不做,也可以删除,并且op可以是局部变量,out而不是属性。
摩擦瓜

@FricativeMelon啊,我明白你在说什么。我已经更新了代码。谢谢!
蓝色:

我将您的新代码放入脚本中,并且现在可以正常工作。虽然没有击败RandomAI :(
摩擦哈密瓜

0

一个目标

查找在最短的时间内给出最多积分并用于该积分的令牌。由于累积效果,将相同颜色的标记排名更高。

function (player1) {
    this.yourMove = function (b) {
        var me = player1? b.player1: b.player2;
        var him= player1? b.player2: b.player1;
        var x = me.pos[0];
        var y = me.pos[1];
        var maxVal = -1;
        var maxX = 0;
        var maxY = 0;
        for(var i = 0;i < b.tokens.length;i++){
            for(var j = 0;j < b.tokens.length;j++){
                if(b.tokens[i][j]){
                    var dist = Math.abs(x-i) + Math.abs(y-j);
                    var val = this.valueOf(b.tokens[i][j]);
                    val /= (dist + 1);
                    if(val > maxVal){
                        maxVal = val;
                        maxX = i;
                        maxY = j;
                    }
                }
            }
        }
        if(maxY < y)
            return "UP";
        if(maxX < x)
            return "LEFT";
        if(maxY > y)
            return "DOWN";
        if(maxX > x)
            return "RIGHT";
        return "EAT";
    }
    this.valueOf = function(t){
        //how many points would it give you?
        return t.points + (this.lastColor == t.color? 2 * this.colorBonus + 1 : 0);
    }
}

0

数量玩家

所有QuantityPlayer关心的是吃的点的数量,而不是点的值或颜色。他知道,即使所有点都不同,也应将它们视为相同。

QuantityBot = function(playernum) {

this.dist = function(token) {
    return (Math.abs(token[0])+Math.abs(token[1]))
}

this.yourMove = function(game_board) {

    board_size = game_board.tokens.length
    board_area = board_size * board_size
    fete = board_size = size * 2

    token_list = []
    count = curr_x = curr_y = 0
    while(count < board_area) {
        if(game_board.tokens[x][y]) {
        token_list.push([x-player.pos[0],y-player.pos[1]])
        }
        count++; x = count % board_size; y = Math.floor(count / size)
    }

    closest_token = token_list[0]
    count = 1
    while(count < token_list.length) {
        curr_token = token_list[count]
        if(dist(curr_token) < dist(closest_token)){closest_token = curr_token}

        count++
    }

    if(dist(closest_token)==0){return 'EAT'}
    else{
    if(closest_token[0] >= closest_token[1]) {if(closest_token[0]<0) {return 'LEFT'} {return 'RIGHT'}}
    else{if(closest_token[1]<0) {return 'UP'} {return 'DOWN'}}
    }

}

}
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.