扩展bash括号扩展


20

出于大多数历史原因,bash是语法和编程范例的杂烩,这会使它变得笨拙,有时使他们沮丧。语言。其中之一是支撑扩展

括号扩展有两种基本类型:

  • 列表花括号可以包含逗号分隔的任意字符串列表(包括重复项和空字符串)。例如{a,b,c,,pp,cg,pp,}将扩展为a b c pp cg pp(注意空字符串周围的空格)。
  • 序列括号可以包含以分隔的序列终点..。可选地,..可以跟随另一个,然后是步长。序列端点可以是整数或字符。该序列将根据哪个端点更大而自动上升或下降。例如:
    • {0..15} 将扩展到 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
    • {-10..-5} 将扩展到 -10 -9 -8 -7 -6 -5
    • {3..-6..2} 将扩展到 3 1 -1 -3 -5
    • {a..f} 将扩展到 a b c d e f
    • {Z..P..3} 将扩展到 Z W T Q

除此之外,序列括号和列表括号可能与列表括号一起存在:

  • {a,b,{f..k},p} 将扩展到 a b f g h i j k p
  • {a,{b,c}} 将扩展到 a b c

花括号在两侧各以非空白字符串扩展。例如:

  • c{a,o,ha,}t 将扩展到 cat cot chat ct

这对于串联在一起的多个大括号也适用:

  • {ab,fg}{1..3} 将扩展到 ab1 ab2 ab3 fg1 fg2 fg3

这会变得非常复杂。例如:

  • {A..C}{x,{ab,fg}{1..3},y,} 将扩展到 Ax Aab1 Aab2 Aab3 Afg1 Afg2 Afg3 Ay A Bx Bab1 Bab2 Bab3 Bfg1 Bfg2 Bfg3 By B Cx Cab1 Cab2 Cab3 Cfg1 Cfg2 Cfg3 Cy C

但是,如果扩展之间存在空格,则它们只是作为单独的扩展进行扩展。例如:

  • {a..c} {1..5} 将扩展到 a b c 1 2 3 4 5

注意如何始终保持顺序。


如上所述,挑战的条目将扩展bash大括号扩展。尤其是:

  • bash不允许通过(或执行类似扩展的其他Shell)进行评估
  • 序列花括号将始终为数字到数字,小写字母到小写字母或大写字母到大写字母,并且不混合。数字将是32位有符号范围内的整数。如果给出,可选步长将始终为正整数。 (请注意,bash也将扩展{A..z},但这对于本挑战可能会被忽略)
  • 列表花括号中的单个项目将始终仅由大小写字母数字字符(包括空字符串)组成
  • 列表括号可以包含其他括号扩展的任意嵌套
  • 括号可以连接任意次。这将受到您语言记忆的限制,因此可以预期的是,理论上您可以进行任意数量的串联,但是如果/当您的内存用完时,这不会对您不利。

上面文本中的示例用作测试用例。概括起来,每行输入对应于同一行输出,它们分别是:

输入项

{0..15}
{-10..-5}
{3..-6..2}
{a..f}
{Z..P..3}
{a,b,{f..k},p}
{a,{b,c}}
c{a,o,ha,}t
{ab,fg}{1..3}
{A..C}{x,{ab,fg}{1..3},y,}
{a..c} {1..5}
{a{0..100..10},200}r

输出量

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
-10 -9 -8 -7 -6 -5
3 1 -1 -3 -5
a b c d e f
Z W T Q
a b f g h i j k p
a b c
cat cot chat ct
ab1 ab2 ab3 fg1 fg2 fg3
Ax Aab1 Aab2 Aab3 Afg1 Afg2 Afg3 Ay A Bx Bab1 Bab2 Bab3 Bfg1 Bfg2 Bfg3 By B Cx Cab1 Cab2 Cab3 Cfg1 Cfg2 Cfg3 Cy C
a b c 1 2 3 4 5
a0r a10r a20r a30r a40r a50r a60r a70r a80r a90r a100r 200r

3
我调查了一下,由于所有极端情况,简直很难解析:-(
Neil

Answers:


3

红宝石,405个 403 401 400字节

一位智者(Jamie Zawinski)曾经说过:“有些人遇到问题时会想,'我知道,我会使用正则表达式。' 现在他们有两个问题。”

在尝试使用递归正则表达式解决此问题之前,我认为我不会完全理解该引用。最初,正则表达式的情况看起来很简单,直到我不得不处理与方括号相邻的字母的边缘情况,然后才知道自己陷入了困境。

无论如何,请在此处通过测试用例在线运行

->s{s.gsub!(/{(-?\w+)..(-?\w+)(..(\d+))?}/){x,y=$1,$2;a,b,c=[x,y,$4].map &:to_i
$1[/\d/]?0:(a,b=x,y)
k=a<b ?[*a..b]:[*b..a].reverse
?{+0.step(k.size-1,$4?c:1).map{|i|k[i]}*?,+?}}
r=1
t=->x{x[0].gsub(/^{(.*)}$/){$1}.scan(/(({(\g<1>|,)*}|[^,{}]|(?<=,|^)(?=,|$))+)/).map{|i|i=i[0];i[?{]?r[i]:i}.flatten}
r=->x{i=x.scan(/({(\g<1>)*}|[^{} ]+)/).map(&t)
i.shift.product(*i).map &:join}
s.split.map(&r)*' '}

取消高尔夫:

->s{
  s.gsub!(/{(-?\w+)..(-?\w+)(..(\d+))?}/){  # Replace all range-type brackets {a..b..c}
    x,y=$1,$2;a,b,c=[x,y,$4].map &:to_i     # Set up int variables
    $1[/\d/]?0:(a,b=x,y)                    # Use int variables for a,b if they're numbers
    k=a<b ?[*a..b]:[*b..a].reverse          # Create an array for the range in the correct direction
    '{'+                                    # Return the next bit surrounded by brackets
      0.step(k.size-1,$4?c:1).map{|i|k[i]   # If c exists, use it as the step size for the array
      }*','                                 # Join with commas
      +'}'
  }
  r=1                                       # Dummy value to forward-declare the parse function `r`
  t=->x{                                    # Function to parse a bracket block
    x=x[0].gsub(/^{(.*)}$/){$1}             # Remove outer brackets if both are present
                                            # x[0] is required because of quirks in the `scan` function
    x=x.scan(/(({(\g<1>|,)*}|[^,{}]|(?<=,|^)(?=,|$))+)/)
                                            # Regex black magic: collect elements of outer bracket
    x.map{|i|i=i[0];i[?{]?r[i]:i}.flatten   # For each element with brackets, run parse function
  }
  r=->x{                                    # Function to parse bracket expansions a{b,c}{d,e}
    i=x.scan(/({(\g<1>)*}|[^{} ]+)/)        # Regex black magic: scan for adjacent sets of brackets
    i=i.map(&t)                             # Map all elements against the bracket parser function `t`
    i.shift.product(*i).map &:join          # Combine the adjacent sets with cartesian product and join them together
  }
  s.split.map(&r)*' '                       # Split on whitespace, parse each bracket collection
                                            #   and re-join with spaces
}

2

Python 2.7版,752个 728字节

哇,这就像挑战中的一堆代码高尔夫!

感谢@Neil缩短了lambda

def b(s,o,p):
 t,f=s>':'and(ord,chr)or(int,str);s,o=t(s),t(o);d=cmp(o,s)
 return list(map(f,range(s,o+d,int(p)*d)))
def e(s):
 c=1;i=d=0
 while c:d+=-~'{}}'.count(s[i])%3-1;i+=1;c=i<len(s)and 0<d
 return i
def m(s):
 if len(s)<1:return[]
 if','==s[-1]:return m(s[:-1])+['']
 i=0
 while i<len(s)and','!=s[i]:i+=e(s[i:])
 return[s[:i]]+m(s[i+1:])
n=lambda a,b:[c+d for c in a for d in b]or a or b
def p(s):
 h=s.count
 if h('{')<1:return[s]
 f,l=s.index('{'),e(s)
 if h('{')<2and h('..')>0and f<1:s=s[1:-1].split('..');return b(s[0],s[1],s[2])if len(s)>2 else b(s[0],s[1],1)
 if f>0 or l<len(s):return n(p(s[:f]),n(p(s[f:l]),p(s[l:])))
 return sum(map(list,map(p,m(s[1:-1]))),[])
o=lambda s:' '.join(p('{'+s.replace(' ',',')+'}'))

说明

  • b:根据规格计算范围。
  • e:返回第一个最外面的大括号的位置。迭代的。
  • m:分割逗号最外面的元素。递归的。
  • n:合并数组,同时检查是否为空。我无法and/or上班。
  • p:大部分工作完成的地方。检查所有情况(范围,仅列出,需要合并)。递归的。
  • o:应该输入什么。将输入/输出格式化为p

我觉得我在某些地方可以进步,所以我会尝试更多的高尔夫运动。我还要在解释中更详细地说明。


我本来希望[c+d for c in a for d in b] or a or b工作。
尼尔

2

JavaScript的(火狐30-57),465个 427 425字节

f=s=>/\{/.test(s)?f(s.replace(/([^,{}]*\{[^{}]*\})+[^,{}]*/,t=>t.split(/[{}]+/).map(u=>u.split`,`).reduce((a,b)=>[for(c of a)for(d of b)c+d]))):s.split`,`.join` `
s=>f(`{${s.split` `}}`.replace(/\{(-?\w+)\.\.(-?\w+)(\.\.(\d+))?\}/g,(m,a,o,_,e)=>{m=(a>'@')+(a>'_');a=parseInt(a,m?36:10);o=parseInt(o,m?36:10);e=+e||1;if(o<a)e=-e;for(r=[];e<0?o<=a:a<=o;a+=e)r.push(m?a.toString(36):a);r=`{${r}}`;return m-1?r:r.toUpperCase()}))

ES6版本f的文件额外增加了10个字节:

f=s=>/\{/.test(s)?f(s.replace(/([^,{}]*\{[^{}]*\})+[^,{}]*/,t=>t.split(/[{}]+/).map(u=>u.split`,`).reduce((a,b)=>[].concat(...a.map(c=>b.map(d=>c+d)))))):s.split`,`.join` `
g=s=>f(`{${s.split` `}}`.replace(/\{(-?\w+)\.\.(-?\w+)(\.\.(\d+))?\}/g,(m,a,o,_,e)=>{m=(a>'@')+(a>'_');a=parseInt(a,m?36:10);o=parseInt(o,m?36:10);e=+e||1;if(o<a)e=-e;for(r=[];e<0?o<=a:a<=o;a+=e)r.push(m?a.toString(36):a);r=`{${r}}`;return m-1?r:r.toUpperCase()}))
h=(s,t=s.replace(/\{[^{}]*\}/,""))=>s!=t?h(t):!/[{}]/.test(s)
<input oninput="o.textContent=h(this.value)?g(this.value):'{Invalid}'"><div id=o>

说明:首先将空格更改为逗号,然后将整个字符串包装起来{}以保持一致性(感谢@Blue代表这个想法)。然后搜索所有{..}构造并将它们扩展为{,}构造。Next使用递归{,}从内到外反复扩展所有构造。最后用空格替换所有逗号。

f=s=>/\{/.test(s)?                  while there are still {}s
 f(s.replace(                       recursive replacement
  /([^,{}]*\{[^{}]*\})+[^,{}]*/,    match the deepest group of {}s
  t=>t.match(/[^{}]+/g              split into {} terms and/or barewords
   ).map(u=>u.split`,`              turn each term into an array
   ).reduce((a,b)=>                 loop over all the arrays
    [for(c of a)for(d of b)c+d]))   cartesian product
  ):s.split`,`.join` `              finally replace commas with spaces
s=>f(                               change spaces into commas and wrap
 `{${s.split` `}}`.replace(         match all {..} seqences
   /\{([-\w]+)\.\.([-\w]+)(\.\.(\d+))?\}/g,(m,a,o,_,e)=>{
    m=(a>'@')+(a>'_');              sequence type 0=int 1=A-Z 2=a-z
    a=parseInt(a,m?36:10);          convert start to number
    o=parseInt(o,m?36:10);          convert stop to number
    e=+e||1;                        convert step to number (default 1)
    if(o<a)e=-e;                    check if stepping back
    for(r=[];e<0?o<=a:a<=o;a+=e)    loop over each value
     r.push(m?a.toString(36):a);    convert back to string
    r=`{${r}}`;                     join together and wrap in {}
    return m-1?r:r.toUpperCase()})) convert type 1 back to upper case
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.