连接列表中的元素对

82

我知道可以将一个列表连接成一个长字符串，如下所示：

x = ['a', 'b', 'c', 'd']
print ''.join(x)

显然，这将输出：

'abcd'

但是，我想做的只是将列表中的第一个和第二个字符串连接起来，然后连接第三个和第四个字符串，依此类推。简而言之，从上面的示例中取而代之的是：

['ab', 'cd']

有没有简单的方法可以做到这一点？我可能还应该提到，列表中字符串的长度以及列表中字符串的数量都是不可预测的，尽管字符串的数量始终是偶数。因此原始列表也可能是：

['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r']

— 约翰
source

“我可能还应该提到列表中字符串的长度是不可预测的” –那么长度重要吗？也就是说，您是只想加入每对列表元素，还是实际上要查看内容并加入，只要结果元素保持在某些特殊长度限制以下？

— 戳

只需加入每一对，我就以为不知道对数会是一个问题

— 约翰·

75

您可以通过以下步骤使用切片符号：

>>> x = "abcdefghijklm"
>>> x[0::2] #0. 2. 4...
'acegikm'
>>> x[1::2] #1. 3. 5 ..
'bdfhjl'
>>> [i+j for i,j in zip(x[::2], x[1::2])] # zip makes (0,1),(2,3) ...
['ab', 'cd', 'ef', 'gh', 'ij', 'kl']

同样的逻辑也适用于列表。字符串长度无关紧要，因为您只是将两个字符串加在一起。

— utdemir
source

1

毫无疑问，凯夫皮的答案要好得多。在这个过程中，x[:::2]创建一个对象，x[1::2]创建另一个对象，这些创建可能基于幕后的索引计算，并且在能够获取连续的元素对之前，有必要调用将这两个对象作为参数传递的函数必须串联起来。在用kevpie回答时，只创建了一个迭代器，然后迭代在未处理的列表中从一个元素跳到另一个元素，而不必照顾索引，这是更Python的。

— eyquem 2014年

@eyquem使用itertools.islice代替[]消除中间对象。但是，由于两个答案都在相同条件下工作并且返回相同，因此它们都是正确的。而且zip(i[::2], i[1::2])看起来对我很甜蜜，所以，为什么不呢？:)

— utdemir 2014年

这仅适用于序列，而@kevpie的答案则更通用，并且适用于任何可迭代的。

— 科斯

37

使用迭代器。

清单理解：

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> [c+next(si, '') for c in si]
['abcde', 'fghijklmn', 'opqr']

对于内存使用非常有效。
恰好是s的一个遍历

生成器表达式：

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> pair_iter = (c+next(si, '') for c in si)
>>> pair_iter # can be used in a for loop
<generator object at 0x4ccaa8>
>>> list(pair_iter) 
['abcde', 'fghijklmn', 'opqr']

用作迭代器

使用map，str .__ add__，iter

>>> si = iter(['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'])
>>> map(str.__add__, si, si)
['abcde', 'fghijklmn', 'opqr']

从Python 2.6开始可以使用next（iterator [，默认]）

— 凯夫皮
source

2

到目前为止，最好的答案。请参阅我对utdemir答案的评论。

— eyquem 2014年

4

只是成为pythonic :-)

>>> x = ['a1sd','23df','aaa','ccc','rrrr', 'ssss', 'e', '']
>>> [x[i] + x[i+1] for i in range(0,len(x),2)]
['a1sd23df', 'aaaccc', 'rrrrssss', 'e']

如果您想在列表长度为奇数时收到警报，可以尝试：

[x[i] + x[i+1] if not len(x) %2 else 'odd index' for i in range(0,len(x),2)]

祝你好运

— hm
source

2

不建立临时列表：

>>> import itertools
>>> s = 'abcdefgh'
>>> si = iter(s)
>>> [''.join(each) for each in itertools.izip(si, si)]
['ab', 'cd', 'ef', 'gh']

要么：

>>> import itertools
>>> s = 'abcdefgh'
>>> si = iter(s)
>>> map(''.join, itertools.izip(si, si))
['ab', 'cd', 'ef', 'gh']

— 药丸
source

很好，但是考虑到我的代码仍然使我从原始列表开始，我认为我不该选择utdmr的....谢谢您

— John

1

>>> lst =  ['abcd', 'e', 'fg', 'hijklmn', 'opq', 'r'] 
>>> print [lst[2*i]+lst[2*i+1] for i in range(len(lst)/2)]
['abcde', 'fghijklmn', 'opqr']

— 安德烈亚斯·荣格
source

1

好吧，我会这样做，因为我对Regs不好。

码

t = '1. eat, food\n\
7am\n\
2. brush, teeth\n\
8am\n\
3. crack, eggs\n\
1pm'.splitlines()

print [i+j for i,j in zip(t[::2],t[1::2])]

输出：

['1. eat, food   7am', '2. brush, teeth   8am', '3. crack, eggs   1pm']

希望这可以帮助：）

— Sravan K Ghantasala
source