连接列表中的元素对


82

我知道可以将一个列表连接成一个长字符串,如下所示:

x = ['a', 'b', 'c', 'd']
print ''.join(x)

显然,这将输出:

'abcd'

但是,我想做的只是将列表中的第一个和第二个字符串连接起来,然后连接第三个和第四个字符串,依此类推。简而言之,从上面的示例中取而代之的是:

['ab', 'cd']

有没有简单的方法可以做到这一点?我可能还应该提到,列表中字符串的长度以及列表中字符串的数量都是不可预测的,尽管字符串的数量始终是偶数。因此原始列表也可能是:

['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'] 

“我可能还应该提到列表中字符串的长度是不可预测的” –那么长度重要吗?也就是说,您是只想加入每对列表元素,还是实际上要查看内容并加入,只要结果元素保持在某些特殊长度限制以下?

只需加入每一对,我就以为不知道对数会是一个问题
约翰·

Answers:


75

您可以通过以下步骤使用切片符号:

>>> x = "abcdefghijklm"
>>> x[0::2] #0. 2. 4...
'acegikm'
>>> x[1::2] #1. 3. 5 ..
'bdfhjl'
>>> [i+j for i,j in zip(x[::2], x[1::2])] # zip makes (0,1),(2,3) ...
['ab', 'cd', 'ef', 'gh', 'ij', 'kl']

同样的逻辑也适用于列表。字符串长度无关紧要,因为您只是将两个字符串加在一起。


1
毫无疑问,凯夫皮的答案要好得多。在这个过程中,x[:::2]创建一个对象,x[1::2]创建另一个对象,这些创建可能基于幕后的索引计算,并且在能够获取连续的元素对之前,有必要调用将这两个对象作为参数传递的函数必须串联起来。在用kevpie回答时,只创建了一个迭代器,然后迭代在未处理的列表中从一个元素跳到另一个元素,而不必照顾索引,这是更Python的。
eyquem 2014年

@eyquem使用itertools.islice代替[]消除中间对象。但是,由于两个答案都在相同条件下工作并且返回相同,因此它们都是正确的。而且zip(i[::2], i[1::2])看起来对我很甜蜜,所以,为什么不呢?:)
utdemir 2014年

这仅适用于序列,而@kevpie的答案则更通用,并且适用于任何可迭代的
科斯

37

使用迭代器。

清单理解:

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> [c+next(si, '') for c in si]
['abcde', 'fghijklmn', 'opqr']
  • 对于内存使用非常有效。
  • 恰好是s的一个遍历

生成器表达式:

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> pair_iter = (c+next(si, '') for c in si)
>>> pair_iter # can be used in a for loop
<generator object at 0x4ccaa8>
>>> list(pair_iter) 
['abcde', 'fghijklmn', 'opqr']
  • 用作迭代器

使用map,str .__ add__,iter

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> map(str.__add__, si, si)
['abcde', 'fghijklmn', 'opqr']

从Python 2.6开始可以使用next(iterator [,默认])


2
到目前为止,最好的答案。请参阅我对utdemir答案的评论。
eyquem 2014年

4

只是成为pythonic :-)

>>> x = ['a1sd','23df','aaa','ccc','rrrr', 'ssss', 'e', '']
>>> [x[i] + x[i+1] for i in range(0,len(x),2)]
['a1sd23df', 'aaaccc', 'rrrrssss', 'e']

如果您想在列表长度为奇数时收到警报,可以尝试:

[x[i] + x[i+1] if not len(x) %2 else 'odd index' for i in range(0,len(x),2)]

祝你好运


2

不建立临时列表:

>>> import itertools
>>> s = 'abcdefgh'
>>> si = iter(s)
>>> [''.join(each) for each in itertools.izip(si, si)]
['ab', 'cd', 'ef', 'gh']

要么:

>>> import itertools
>>> s = 'abcdefgh'
>>> si = iter(s)
>>> map(''.join, itertools.izip(si, si))
['ab', 'cd', 'ef', 'gh']

很好,但是考虑到我的代码仍然使我从原始列表开始,我认为我不该选择utdmr的....谢谢您
John

1
>>> lst =  ['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'] 
>>> print [lst[2*i]+lst[2*i+1] for i in range(len(lst)/2)]
['abcde', 'fghijklmn', 'opqr']

1

好吧,我会这样做,因为我对Regs不好。

t = '1. eat, food\n\
7am\n\
2. brush, teeth\n\
8am\n\
3. crack, eggs\n\
1pm'.splitlines()

print [i+j for i,j in zip(t[::2],t[1::2])]

输出:

['1. eat, food   7am', '2. brush, teeth   8am', '3. crack, eggs   1pm']  

希望这可以帮助 :)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.