查找列表元素之间的差异

113

给定一个数字列表，人们如何发现i第（）个元素与其第（）个元素之间的差异i+1？

使用lambda表达式还是列表理解更好？

例如：

给定一个列表t=[1,3,6,...]，我们的目标是要找到一个列表v=[2,3,...]，因为3-1=2，6-3=3等等。

python list

— psidedelia
source

154

>>> t
[1, 3, 6]
>>> [j-i for i, j in zip(t[:-1], t[1:])]  # or use itertools.izip in py2k
[2, 3]

— 幽灵幽灵
source

14

如果您需要绝对的差异，[abs(j-i) for i,j in zip(t, t[1:])]

— Anil

如果您想提高效率：（list(itertools.starmap(operator.sub, zip(t[1:], t)))在itertools和导入之后operator）。

— blhsing

3

其实只是list(map(operator.sub, t[1:], t[:-1]))会做。

— blhsing

辉煌！我非常喜欢这个答案！

— Chayim Friedman

104

其他答案是正确的，但是如果您要进行数值运算，则可能需要考虑使用numpy。使用numpy，答案是：

v = numpy.diff(t)

— 克里斯蒂安·阿里斯（Christian Alis）
source

很有帮助！谢谢！np.diff([2,4,9])将会是[2,5]

— TravelTrader

这会比zip版本更有效吗？

— user760900

35

如果您不想使用numpynor zip，则可以使用以下解决方案：

>>> t = [1, 3, 6]
>>> v = [t[i+1]-t[i] for i in range(len(t)-1)]
>>> v
[2, 3]

— 奥梅尔·达根（Omer Dagan）
source

12

您可以使用itertools.tee和zip有效地构建结果：

from itertools import tee
# python2 only:
#from itertools import izip as zip

def differences(seq):
    iterable, copied = tee(seq)
    next(copied)
    for x, y in zip(iterable, copied):
        yield y - x

或itertools.islice改为使用：

from itertools import islice

def differences(seq):
    nexts = islice(seq, 1, None)
    for x, y in zip(seq, nexts):
        yield y - x

您也可以避免使用itertools模块：

def differences(seq):
    iterable = iter(seq)
    prev = next(iterable)
    for element in iterable:
        yield element - prev
        prev = element

如果您不需要存储所有结果并支持无限的可迭代对象，那么所有这些解决方案都可以在恒定的空间中工作。

以下是解决方案的一些微观基准：

In [12]: L = range(10**6)

In [13]: from collections import deque
In [15]: %timeit deque(differences_tee(L), maxlen=0)
10 loops, best of 3: 122 ms per loop

In [16]: %timeit deque(differences_islice(L), maxlen=0)
10 loops, best of 3: 127 ms per loop

In [17]: %timeit deque(differences_no_it(L), maxlen=0)
10 loops, best of 3: 89.9 ms per loop

以及其他建议的解决方案：

In [18]: %timeit [x[1] - x[0] for x in zip(L[1:], L)]
10 loops, best of 3: 163 ms per loop

In [19]: %timeit [L[i+1]-L[i] for i in range(len(L)-1)]
1 loops, best of 3: 395 ms per loop

In [20]: import numpy as np

In [21]: %timeit np.diff(L)
1 loops, best of 3: 479 ms per loop

In [35]: %%timeit
    ...: res = []
    ...: for i in range(len(L) - 1):
    ...:     res.append(L[i+1] - L[i])
    ...: 
1 loops, best of 3: 234 ms per loop

注意：

zip(L[1:], L)等价于，zip(L[1:], L[:-1])因为zip已经终止于最短的输入，但是它避免了的整个副本L。
通过索引访问单个元素非常慢，因为每次索引访问都是python中的方法调用
numpy.diff之所以很慢是因为它必须首先将转换list为ndarray。显然，如果你开始用ndarray这将是多快：
```
In [22]: arr = np.array(L)

In [23]: %timeit np.diff(arr)
100 loops, best of 3: 3.02 ms per loop
```

— 巴库留
source

在第二个解决方案中，islice(seq, 1, None)而不是islice(seq, 1, len(seq))使其与无限的可迭代对象一起工作

— Braham Snyder

5

使用:=Python 3.8+中可用的walrus运算符：

>>> t = [1, 3, 6]
>>> prev = t[0]; [-prev + (prev := x) for x in t[1:]]
[2, 3]

— 尤金·雅玛什（Eugene Yarmash）
source

5

我建议使用

v = np.diff(t)

这是简单易读的。

但如果你想v有相同的长度，t然后

v = np.diff([t[0]] + t) # for python 3.x

要么

v = np.diff(t + [t[-1]])

仅供参考：这仅适用于列表。

用于numpy数组

v = np.diff(np.append(t[0], t))

— 查坦亚·凯萨纳帕利（Chaitanya Kesanapalli）
source

不错的答案，您也可以使用prepend关键字来确保长度相同，请参见下面的答案，我认为这更整洁了

— Adrian Tompkins

4

功能方法：

>>> import operator
>>> a = [1,3,5,7,11,13,17,21]
>>> map(operator.sub, a[1:], a[:-1])
[2, 2, 2, 4, 2, 4, 4]

使用生成器：

>>> import operator, itertools
>>> g1,g2 = itertools.tee((x*x for x in xrange(5)),2)
>>> list(itertools.imap(operator.sub, itertools.islice(g1,1,None), g2))
[1, 3, 5, 7]

使用索引：

>>> [a[i+1]-a[i] for i in xrange(len(a)-1)]
[2, 2, 2, 4, 2, 4, 4]

— 奥拉·福斯海姆（Ola Fosheim）Grøstad
source

该操作员方法很好且优雅

— bcattle

3

好。我想我找到了正确的解决方案：

v = [x[1]-x[0] for x in zip(t[1:],t[:-1])]

— psidedelia
source

2

是的，这很好，但是我认为对于zip（t [1：]，t [：-1]）]中的x来说，应该是v = [x [0] -x [1]）用于排序列表！

— 阿米特·卡尼克

0

具有周期边界的解决方案

有时，使用数值积分时，您可能希望将具有周期性边界条件的列表与众不同（因此，第一个元素计算与最后一个元素的差。在这种情况下，numpy.roll函数会有所帮助：

v-np.roll(v,1)

零前置解决方案

另一个numpy解决方案（仅出于完整性考虑）是使用

numpy.ediff1d(v)

它作为numpy.diff起作用，但仅在向量上起作用（它使输入数组变平）。它提供了在结果矢量前添加或添加数字的功能。这在处理通常是气象变量（例如，雨水，潜热等）通量变化的累积字段时很有用，因为您想要一个与输入变量长度相同的结果列表，而第一个条目保持不变。

那你会写

np.ediff1d(v,to_begin=v[0])

当然，您也可以使用np.diff命令来执行此操作，在这种情况下，尽管您需要使用prepend关键字在序列前加零：

np.diff(v,prepend=0.0)

以上所有解决方案都返回一个与输入长度相同的向量。

— 阿德里安·汤普金斯
source

-1

我的方式

>>>v = [1,2,3,4,5]
>>>[v[i] - v[i-1] for i, value in enumerate(v[1:], 1)]
[1, 1, 1, 1]

— 阿林丹·罗乔杜里
source

1

使用enumerate是浪费的，因为您没有使用value。见stackoverflow.com/a/16714453/832230

— Acumenus '16