删除一些并计数


26

考虑所有2^n不同长度的二进制字符串,n并假设n > 2。您可以b < n/2从每个二进制字符串中删除确切的位,而n-b保留剩余长度的字符串。剩余的不同字符串数取决于您删除的位。假设您的目标是保留尽可能少的其余不同字符串,那么此挑战是编写代码以计算作为的函数可以保留的剩余数量n

示例n=3b = 1。您只能留下两个字符串1100

对于n=9b = 1,2,3,4我们有70,18,6,2

对于n=8b = 1,2,3我们有40,10,4

对于n=7b = 1,2,3我们有20,6,2

对于n=6b = 1,2我们有12,4

对于n=5b = 1,2我们有6,2

这个问题最初是由我于2014年在MO上提出的

输入输出

您的代码应采用一个整数,n并为bb = 0和递增的每个值输出一个整数。

得分

在基于Linux的PC上n,您的代码b < n/2在不到一分钟的时间内完成所有代码的最高分。如果出现平局,则b您的代码将获得最大的n胜利。在这一准则也为最大值最快的代码领带断裂的情况nb决定。如果时间相差一秒或两秒以内,则第一个发布的答案将获胜。

语言和图书馆

您可以使用任何喜欢的库语言。因为我必须运行您的代码,所以如果它是免费的(例如在啤酒中)并且可以在Linux中工作,则将有所帮助。


我假设b > 0是额外的输入要求?还是会n=3b=0简单地输出2^n为结果呢?
凯文·克鲁伊森

@KevinCruijssen应该2^n确实输出。
阿努什

另外,您说输入是单个n和单个b,但是分数是在不到一分钟的时间内n完成代码的最大分数b < n/2n在这种情况下,只有一个输入并输出所有结果会更好0 <= b < n/2吗?还是我们应该提供两个程序/功能:一个接受两个输入nb,一个接受仅输入n并输出范围内的所有结果0 <= b < n/2
凯文·克鲁伊森

2
好吧,我已经接受了您的挑战,因此不能再做一次。:)尽管我不知道如何高效地进行计算(高效的O算法是我一直不擅长的事情..也是我不得不重做几次的IT学院的少数学科之一),但看起来一个非常有趣的挑战。我很好奇,看看人们会提出什么答案。
凯文·克鲁伊森

2
有可行的例子吗?无论是从正确性还是从速度方面来说,这都是一个不错的起点。
maxb

Answers:


6

Python 2.7 / Gurobi n = 9

该解决方案非常简单地将Gurobi的ILP解算器用于布尔混合整数问题(MIP)。

唯一的技巧是取出1的补码对称,以将问题大小减半。

使用Gurobi LLC的限时“免费”许可证,我们只能使用2000个限制,但是无论如何,在笔记本电脑上解决10 del 1的时间都远远超出了60秒的限制。

from gurobipy import *
from itertools import combinations

def mincover(n,d):
    bs = pow(2,n-1-d)
    m = Model()
    m.Params.outputFlag = 0
    b = {}
    for i in range(bs):
      b[i] = m.addVar(vtype=GRB.BINARY, name="b%d" % i)
    m.update()
    for row in range(pow(2,n-1)):
      x = {}
      for i in combinations(range(n), n-d):
        v = 0
        for j in range(n-d):
          if row & pow(2,i[j]):
            v += pow(2,j)
        if v >= bs:
          v = 2*bs-1-v
        x[v] = 1
      m.addConstr(quicksum(b[i] for i in x.keys()) >= 1)
    m.setObjective(quicksum(b[i] for i in range(bs) ), GRB.MINIMIZE)
    m.optimize()
    return int(round(2*m.objVal,0))

for n in range(4,10):
    for d in range((n//2)+1):
        print n, d, mincover(n,d)

UPDATE + CORR:10,2的最优解大小为31(例如)Gurobi显示不存在大小为30的对称解(返回问题不可行).. [我尝试在9.5小时运行后显示30​​处的非对称可行性仍然没有定论],例如位整数0 7 13 14 25 28 35 36 49 56 63 64 95 106 118 128 147 159 170 182 195 196 200 207 225 231 240 243 249 252 2550 7 13 14 19 25 28 35 36 49 56 63 64 95 106 118 128 159 170 182 195 196 200 207 225 231 240 243 249 252 255


您打破了“最快的无限赏金”记录?
user202729

我在这里看不到任何赏金,这是什么意思?
jayprich

@ user202729是的。我设置得太低。我应该将其设置为n = 10 :)
Anush

实际上在n = 9时解决它不是一件容易的事。这就是OP使用现有库的原因(应该比我的手写解决方案要好)。
user202729

1
感谢@ChristianSievers,我看到MO声称10,2仅具有非对称最优,我无法反驳或验证。如果我删除对称假设捷径,该捷径最高达n = 9,那么Gurobi仍然可以在所需时间内求解n = 9。
jayprich

3

C ++,n = 6

蛮力,还有一些小的优化。

#include<cassert>
#include<iostream>
#include<vector>

// ===========
/** Helper struct to print binary representation.
`std::cout<<bin(str,len)` prints (str:len) == the bitstring 
represented by last (len) bits of (str).
*/
struct bin{
    int str,len;
    bin(int str,int len):str(str),len(len){}
};
std::ostream& operator<<(std::ostream& str,bin a){
    if(a.len)
        return str<<bin(a.str>>1,a.len-1)<<char('0'+(a.str&1));
    else if(a.str)
        return str<<"...";
    else
        return str;
}
// ===========

/// A patten of (len) bits of ones.
int constexpr pat1(int len){
    return (1<<len)-1;
}

// TODO benchmark: make (res) global variable?

/**Append all distinct (subseqs+(sfx:sfxlen)) of (str:len) 
with length (sublen) to (res).
*/
void subseqs_(
    int str,int len,int sublen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    // std::cout<<"subseqs_ : str = "<<bin(str,len)<<", "
    // "sublen = "<<sublen<<", sfx = "<<bin(sfx,sfxlen)<<'\n';

    assert(len>=0);

    if(sublen==0){ // todo remove some branches can improve perf?
        res.push_back(sfx);
        return;
    }else if(sublen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }else if(sublen>len){
        return;
    }

    if(str==0){
        res.push_back(sfx);
        return;
    }

    int nTrail0=0;
    for(int ncut;str&&nTrail0<sublen;

        ++nTrail0,
        ncut=__builtin_ctz(~str)+1, // cut away a bit'0' of str
        // plus some '1' bits
        str>>=ncut,
        len-=ncut
    ){
        ncut=__builtin_ctz(str)+1; // cut away a bit'1' of str
        subseqs_(str>>ncut,len-ncut,sublen-nTrail0-1,
            sfx|1<<(sfxlen+nTrail0),sfxlen+nTrail0+1,
            res
        ); // (sublen+sfxlen) is const. TODO global var?
    }

    if(nTrail0+len>=sublen) // this cannot happen if len<0
        res.push_back(sfx);
}

std::vector<int> subseqs(int str,int len,int sublen){
    assert(sublen<=len);
    std::vector<int> res;
    if(__builtin_popcount(str)*2>len){ // too many '1's, flip [todo benchmark]
        subseqs_(pat1(len)^str,len,sublen,0,0,res);
        int const p1sublen=pat1(sublen);
        for(int& r:res)r^=p1sublen;
    }else{
        subseqs_(str,len,sublen,0,0,res);
    }
    return res;
}

// ==========

/** Append all distinct (supersequences+(sfx:sfxlen)) of (str:len)
with length (suplen) to (res).
Define (a) to be a "supersequence" of (b) iff (b) is a subsequence of (a).
*/
void supseqs_(
    int str,int len,int suplen,
    int sfx,int sfxlen,
    std::vector<int>& res
){
    assert(suplen>=len);

    if(suplen==0){
        res.push_back(sfx);
        return;
    }else if(suplen==len){
        res.push_back(str<<sfxlen|sfx);
        return;
    }

    int nTrail0; // of (str)
    if(str==0){
        res.push_back(sfx);
        // it's possible that the supersequence is '0000..00'
        nTrail0=len;
    }else{
        // str != 0 -> str contains a '1' bit ->
        // supersequence cannot be '0000..00'
        nTrail0=__builtin_ctz(str);
    }
    // todo try `nTrail0=__builtin_ctz(str|1<<len)`, eliminates a branch
    // and conditional statement

    for(int nsupTrail0=0;nsupTrail0<nTrail0;++nsupTrail0){
        // (nsupTrail0+1) last bits of supersequence matches with 
        // nsupTrail0 last bits of str.
        supseqs_(str>>nsupTrail0,len-nsupTrail0,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    int const strMatch=str?nTrail0+1:len; 
    // either '1000..00' or (in case str is '0000..00') the whole (str)

    for(int nsupTrail0=suplen+strMatch-len;nsupTrail0-->nTrail0;){
        // because (len-strMatch)<=(suplen-1-nsupTrail0),
        // (nsupTrail0<suplen+strMatch-len).

        // (nsupTrail0+1) last bits of supersequence matches with
        // (strMatch) last bits of str.
        supseqs_(str>>strMatch,len-strMatch,suplen-1-nsupTrail0,
            sfx|1<<(nsupTrail0+sfxlen),sfxlen+nsupTrail0+1,
            res);
    }

    // todo try pulling constants out of loops
}

// ==========

int n,b;
std::vector<char> done;
unsigned min_undone=0;

int result;
void backtrack(int nchoice){
    assert(!done[min_undone]);
    ++nchoice;
    std::vector<int> supers_s;
    for(int s:subseqs(min_undone,n,n-b)){
        // obviously (s) is not chosen. Try choosing (s)
        supers_s.clear();
        supseqs_(s,n-b,n,0,0,supers_s);
        for(unsigned i=0;i<supers_s.size();){
            int& x=supers_s[i];
            if(!done[x]){
                done[x]=true;
                ++i;
            }else{
                x=supers_s.back();
                supers_s.pop_back();
            }
        }

        unsigned old_min_undone=min_undone;
        while(true){
            if(min_undone==done.size()){
                // found !!!!
                result=std::min(result,nchoice);
                goto label1;
            }
            if(not done[min_undone])
                break;
            ++min_undone;
        }
        if(nchoice==result){
            // backtrack more will only give worse result
            goto label1;
        }

        // note that nchoice is already incremented
        backtrack(nchoice);

        label1: // undoes the effect of (above)
        for(int x:supers_s)
            done[x]=false;
        min_undone=old_min_undone;
    }
}

int main(){
    std::cin>>n>>b;

    done.resize(1<<n,0);
    result=1<<(n-b); // the actual result must be less than that

    backtrack(0);
    std::cout<<result<<'\n';
}

在本地运行:

[user202729@archlinux golf]$ g++ -std=c++17 -O2 delbits.cpp -o delbits
[user202729@archlinux golf]$ time for i in $(seq 1 3); do ./delbits <<< "6 $i"; done
12
4
2

real    0m0.567s
user    0m0.562s
sys     0m0.003s
[user202729@archlinux golf]$ time ./delbits <<< '7 1'
^C

real    4m7.928s
user    4m7.388s
sys     0m0.173s
[user202729@archlinux golf]$ time for i in $(seq 2 3); do ./delbits <<< "7 $i"; done
6
2

real    0m0.040s
user    0m0.031s
sys     0m0.009s

1
通常是鼓励他人发布比我的代码快的代码。
user202729 '18

请吗?...(请注意:这是机顶盒问题的一个实例。)
user202729

1
我在做这个工作。我只是无法提出任何明智的方法。如果没有其他人发布答案,我将提出我的答案,到目前为止,答案只能高达n = 4。
mypetlion
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.