环绕子序列


11

介绍

在这个挑战中,您的任务是找到字符串的广义子序列。子序列不一定是连续的,它们也可以“环绕”字符串,越过字符串的末端并从头开始。不过,您将需要尽量减少换行次数。

更正式地说,让u并且v是任意两个字符串和k ≥ 0一个整数。我们说uk,计量子v,如果有不同的指标,从而,在大多数指标的满足。这意味着可以在内部找到,方法是从左到右,在途中选择其某些字符,然后最多包装(等效地,最多扫描一次)。请注意,即使重新包装后,也不能选择一个以上的字符,而且-wrapping子序列恰好是我们都熟悉的普通子序列。i1, i2, ..., ilen(u)u == v[i1] v[i2] ... v[ilen(u)]kijij > ij+1uvkk+1v0

任务

您的输入是两个非空的字母数字字符串uv,而您的输出是最小的整数k,因此u是的k换行子序列v。如果不k存在,则输出为-1

考虑输入u := xyzyxzzxyxv := yxzzazzyxxxyz。如果我们开始寻找的字符uv一个贪婪的方式,我们将环绕3次:

 yxzzazzyxxxyz
>─x─────y────z┐
┌─────────────┘
└y───────x────┐
┌─────────────┘
└──zz─────x─y─┐
┌─────────────┘
└──────────x──>

因此,正确的输出最多为3。请注意如何x选择最左边的字符一次,然后在第二次扫描中将其忽略,因为它无法重复使用。但是,存在一种较短的方法,只有两个环绕:

 yxzzazzyxxxyz
>──────────xyz┐
┌─────────────┘
└yxzz────x────┐
┌─────────────┘
└───────y─x───>

事实证明,仅一次环绕(即两次扫描)是不够的,因此正确的输出是2

规则和奖金

您可以编写函数或完整程序,也可以根据需要更改输入顺序。最低字节数获胜,并且不允许出现标准漏洞。

在不到10秒的时间内计算所有测试用例,可获得-10%奖励。我将在机器上测试不清楚的情况;我在Python中的参考实现大约需要0.6秒。我有一台使用1.86 GHz双核CPU的7年笔记本电脑,您可能要考虑到这一点。

测试用例

"me" "moe" -> 0
"meet" "metro" -> -1
"ababa" "abaab" -> 1
"abaab" "baabaa" -> 1
"1c1C1C2B" "1111CCCcB2" -> 3
"reverse" "reserved" -> 2
"abcdefg" "gfedcba" -> 6
"xyzyxzzxyx" "yxzzazzyxxxyz" -> 2
"aasdffdaasdf" "asdfddasdfsdaafsds" -> 2

1
这对于该示例也是有效的解决方案吗?这是一种贪婪的方法。
orlp 2015年

@orlp这是无效的,因为第一个x在三个不同的扫描中使用。它只能使用一次。
Zgarb 2015年

啊,我明白了。
orlp

Answers:


4

Pyth,34个字节

Mh+Smssm>.ukC,dtdfqGsm@HkT.PUHlG_1

这定义了一个函数g,该函数将两个字符串作为参数。在线尝试:Pyth编译器/执行器

此代码效率很低。它的时间和内存复杂度为len(v)!/(len(v)-len(u))!。它无法在10秒内解决较长的测试用例。(它也很可能崩溃,因为它会耗尽内存。)

M                                    define g(G, H): return _
                          .PUHlG        all permutations of [0, 1, ..., len(H)-1] of length len(G)
                 fqGsm@HkT              filter the permutations which form the string G
    mssm>.ukC,dtd                       compute the number of wraps for each of the remaining permutations
  +S                            _1      sort the numbers and append -1
 h                                      return the first element

4

Haskell,160 * 0.9 = 144字节

a#(-1)=a
a#b=min a b
f y=w(y++" ")0$length y
w _ n _[]=n
w(c:d)n o g@(a:b)|n>o=(-1)|a==c=z#w y n z g|c==' '=w y(n+1)o g|1<2=w y n o g where z=w d n o b;y=d++[c]

所有测试用例的计时(注意:参数已翻转):

*Main> map (uncurry f) [
             ("moe", "me"),
             ("metro", "meet"),
             ("abaab", "ababa"),
             ("baabaa", "abaab"),
             ("1111CCCcB2", "1c1C1C2B"),
             ("reserved", "reverse"),
             ("gfedcba", "abcdefg"),
             ("yxzzazzyxxxyz", "xyzyxzzxyx"),
             ("asdfddasdfsdaafsds", "aasdffdaasdf")]
[0,-1,1,1,3,2,6,2,2]
(0.08 secs, 25794240 bytes)

工作原理(简短版本):简单的暴力破解,只需最少使用匹配字符并跳过它。当结束(返回循环数)或循环次数超过到目前为止的最小值(返回-1)时,我停止搜索。

与我的第一个版本相比,节省了很多字节,主要是因为我从一个完整的程序切换到一个函数。

通过一些注释和适当的间距,Haskell打高尔夫球是很容易理解的:

-- a minimum function that ignores a -1 in the right argument to prevent
-- "not solvable" cases in parts of the recursive search to dominate low numbers
-- of solvable parts. If the case isn't solvabale at all, both arguments are
-- -1 and are carried on.
a # (-1) = a
a # b    = min a b

-- the main function f calls the worker funktion w with arguments
-- * the string to search in (STSI), appended by a space to detect cycles
-- * the number of cycles so far
-- * the minimum of cycles needed so far, starting with the length of STSI
-- * the string to search for (STSF) (partial applied away and therefore invisible)
f y = w (y++" ") 0 (length y)

-- the worker function 
w _ n _ [] = n          -- base case: if STSF is empty the work is done and the 
                        -- number of cycles is returned

w (c:d) n o g@(a:b)     -- "c" is first char of STSI, "d" the rest
                        -- "n" number of cycles, "o" minimum of cycles so far
                        -- "g" is the whole STSF, "a" the 1st char, "b" the rest
  | n>o    = (-1)             -- if current cycle is more than a previous result,
                              -- indicate failure
  | a==c   = z # w y n z g    -- if there's a character match, take the min of
                              -- using it and skipping it
  | c==' ' = w y (n+1) o g    -- cycle detected, repeat and adjust n
  | 1<2    = w y n o g        -- otherwise try next char in STSI

  where                 -- just some golfing: short names for common subexpressions
  z = w d n o b;        -- number of cycles if a matching char is used
  y = d ++ [c]          -- rotated STSI

供参考:旧版本,完整程序,187字节

main=interact$show.f.lines
a#(-1)=a
a#b=min a b
f[x,y]=w x(y++" ")0 0
w[]_ n _=n
w g@(a:b)(c:d)n m|a==c=w b d n 1#y|c==' '&&m==1=w g(d++" ")(n+1)0|c==' '=(-1)|1<2=y where y=w g(d++[c])n m

@Zgarb:重新设计了我的解决方案。现在更快,更短了。
nimi

解释时以0.6s运行,编译时以0.01s运行。
Zgarb 2015年

2

JavaScript(ES6)174(193-10%)

像@nimi的答案一样,递归搜索保持最小换行。解决方案的空间很大(对于最后一个示例来说,尤为重要),但是以当前找到的最小时间进行搜索可以节省时间。 编辑1添加一个丢失的测试用例,缩短了一点 编辑2无需传递参数w,它是固定的

K=(w,s,x)=>
  ~-(R=(r,l,p=0,q=1,z=w[p],i=0)=>
  {
    if(z&&!(q>x)){
      if(~(r+l).indexOf(z))
        for(t=l?R(l+r,'',p,q+1):x;x<t?0:x=t,i=~r.indexOf(z,-i);)
          t=R(r.slice(-i),l+r.slice(0,~i),p+1,q);
      q=x
    }
    return q
  })(s,'')

不打高尔夫球

K=(word, astring)=>
{
  var minWraps // undefined at first. All numeric comparison with undefined give false 
  var R=(right, left, pos, wraps)=>
  {
    var cur = word[pos]
    var i,t;
    if (! cur) // when all chars of word are managed
      return wraps;
    if (wraps > minWraps) // over the minimum wrap count already found, stop search
      return wraps; 
    if ( (right+left).indexOf(cur) < 0 ) // if the current char is not found in the remaining part of the string
      return minWraps; // return the current min, could still be undefined (that means 'no way')
    if ( left ) // if there is a left part, try a wrapping search with the current char
    {
      t = R(left+right, '', pos, wraps+1)
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    // find all occurrences of current char in the remaining part
    // for each occurrence, start a recursive search for the next char
    for(i = 0; (i = right.indexOf(cur, i)) >= 0; i++)
    {
      var passed = right.slice(0,i) // the passed chars go in the left part
      var rest = right.slice(i+1) 
      t = R(rest, left+passed, pos+1, wraps) // try next char in the remaining part, no wrap
      if ( !(minWraps < t)) minWraps = t; // set current min if t is less than current min or current min is still undefined
    }
    return minWraps
  }
  var result = R(astring, '', 0, 1) // start with right=string and left empty
  return ~-result; // decrement. convert undefined to -1
}

在Firefox / FireBug控制台中测试

time=~new Date;
[['me','moe']
,['meet','metro']
,['ababa','abaab']
,['abaab','baabaa']
,['1c1C1C2B','1111CCCcB2']
,['reverse','reserved']
,['abcdefg','gfedcba']
,['xyzyxzzxyx','yxzzazzyxxxyz']
,['aasdffdaasdf','asdfddasdfsdaafsds']]
.forEach(s=>console.log(s,r=K(...s)))
time-=~new Date

输出(最后一行是以毫秒为单位的执行时间)

[“ me”,“ moe”] 0
[“ meet”,“ metro”] -1
[“ ababa”,“ abaab”] 1
[“ abaab”,“ baabaa”] 1
[“ 1c1C1C2B”,“ 1111CCCcB2”] 3
[“反向”,“保留”] 2
[“ abcdefg”,“ gfedcba”] 6
[“ xyzyxzzxyx”,“ yxzzazzyxxxyz”] 2
[“ aasdffdaasdf”,“ asdfddasdfsdaafsds”] 2
116


经过Firebug测试,在我的计算机上运行175ms。
Zgarb 2015年

@Zgarb还有改进的余地:我会尝试使其变慢和变短
edc65
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.