带有无限列表的foldl与foldr行为

124

此问题中 myAny函数的代码使用文件夹。当满足谓词时，它将停止处理无限列表。

我用foldl重写了它：

myAny :: (a -> Bool) -> [a] -> Bool
myAny p list = foldl step False list
   where
      step acc item = p item || acc

（请注意，step函数的参数正确颠倒了。）

但是，它不再停止处理无限列表。

我试图按照Apocalisp的回答来跟踪函数的执行：

myAny even [1..]
foldl step False [1..]
step (foldl step False [2..]) 1
even 1 || (foldl step False [2..])
False  || (foldl step False [2..])
foldl step False [2..]
step (foldl step False [3..]) 2
even 2 || (foldl step False [3..])
True   || (foldl step False [3..])
True

但是，这不是函数的行为方式。这怎么了

— 钛诱饵
source

231

如何fold小号的不同似乎是混乱的常见来源，所以这里的一个更一般的概述：

考虑[x1, x2, x3, x4 ... xn ]使用某些函数f和seed 折叠n个值的列表z。

`foldl` 是：

左联想：f ( ... (f (f (f (f z x1) x2) x3) x4) ...) xn
尾递归：遍历列表，然后产生值
惰性：需要结果之前，不会评估任何内容
向后：foldl (flip (:)) []反转列表。

`foldr` 是：

右联想：f x1 (f x2 (f x3 (f x4 ... (f xn z) ... )))
递归到参数中：每次迭代都适用f于下一个值以及折叠其余列表的结果。
惰性：需要结果之前，不会评估任何内容
转发：foldr (:) []返回不变的列表。

有一个稍微含蓄点在这里，游人们有时高达：由于foldl是向后的每个应用程序f被添加到外界的结果; 并且由于它是惰性的，因此在需要结果之前不会进行任何评估。这意味着，要计算结果的任何部分，Haskell首先遍历整个列表，以构建嵌套函数应用程序的表达式，然后评估最外部的函数，并根据需要评估其参数。如果f始终使用第一个参数，则意味着Haskell必须一直递归到最内层术语，然后向后计算的每个应用程序f。

这显然与大多数函数程序员所知道并喜欢的高效尾递归相去甚远！

实际上，即使foldl从技术上讲，它是尾递归的，但由于整个结果表达式是在求值之前构建的，因此foldl可能导致堆栈溢出！

另一方面，请考虑foldr。它也很懒，但是因为它向前运行，所以每个的应用程序f都会添加到结果的内部。因此，为了计算结果，Haskell构造了一个函数应用程序，其第二个参数是折叠列表的其余部分。如果if f在其第二个参数中是lazy（例如，数据构造函数），则结果将是lazy递增的，仅当对结果的某些部分求值时才计算折叠的每一步。

因此，我们可以看到为什么foldr有时在foldl不行的情况下无法工作的原因：前者可以将一个无限列表懒惰地转换为另一个懒惰的无限数据结构，而后者必须检查整个列表以生成结果的任何部分。另一方面，foldr对于立即需要两个参数的函数，例如(+)，可以像一样工作（或者说不起作用），类似于foldl在评估它之前构建一个巨大的表达式。

因此，需要注意的两个重要点是：

foldr 可以将一种惰性递归数据结构转换为另一种。
否则，懒惰折叠将在大型或无限列表上崩溃并导致堆栈溢出。

您可能已经注意到，听起来foldr一切foldl都可以做，还有更多。这是真的！实际上，foldl几乎没有用！

但是，如果我们想通过折叠较大（但不是无限）的列表来产生非惰性结果，该怎么办？为此，我们需要一个严格的折叠，这是标准库提供的：

`foldl'` 是：

左联想：f ( ... (f (f (f (f z x1) x2) x3) x4) ...) xn
尾递归：遍历列表，然后产生值
严格：每个功能应用程序都将一路评估
向后：foldl' (flip (:)) []反转列表。

因为foldl'是strict，为了计算结果，Haskell将在每一步求值 f，而不是让左参数积累一个巨大的，未求值的表达式。这为我们提供了我们想要的通常有效的尾部递归！换一种说法：

foldl' 可以有效地折叠大列表。
foldl' 将挂在无限列表上的无限循环中（不会导致堆栈溢出）。

Haskell Wiki上也有讨论此内容的页面。

— 麦肯
source

6

我来到这里是因为我很好奇，为什么foldr优于foldl在哈斯克尔，而相反为true 二郎（这是我以前学过的Haskell）。由于Erlang不是很懒，函数也不是咖喱，所以foldl在Erlang中的行为与foldl'上面类似。这是一个很好的答案！干得好，谢谢！

— 小清庞-明日香健治

7

这主要是一个很好的解释，但是我发现对foldl“向后”和foldr“向前” 的描述存在问题。这部分是因为在说明为什么折叠向后的flip过程中被应用了(:)。自然的反应是，“当然是倒退了：您对flip列表串联进行了搜索！” 看到所谓的“向后”也很奇怪，因为它在完整评估中首先（最里面）foldl应用于f第一个列表元素。这foldr是“运行落后，”应用f到最后一个元素第一。

— Dave Abrahams 2014年

1

@DaveAbrahams：在公正foldl与foldr忽视严格性与优化之间，第一个意思是“最外面”，而不是“最里面”。这就是为什么foldr可以处理无限列表而foldl不能处理的原因-右折首先适用f于第一个列表元素，而折尾的结果（未评估），而左折必须遍历整个列表以评估的最外层应用f。

— CA McCann 2014年

1

我只是想知道是否有任何情况下会优先使用foldl而不是foldl'，您认为有这种情况吗？

— kazuoua 2015年

1

@kazuoua，其中懒惰是必不可少的，例如last xs = foldl (\a z-> z) undefined xs。

— 尼斯（Ness Ness）

28

myAny even [1..]
foldl step False [1..]
foldl step (step False 1) [2..]
foldl step (step (step False 1) 2) [3..]
foldl step (step (step (step False 1) 2) 3) [4..]

等等

直观上，foldl它总是在“外部”或“左侧”，因此它首先被扩展。无限广告。

— 阿尔特留斯
source

10

您可以Haskell的文档中看到这里是与foldl是尾递归，如果传入一个无限列表，因为它返回一个值之前称自己的下一个参数将永远不会结束......

— 罗曼
source

0

我不知道Haskell，但是在Scheme中，fold-right总是会“作用”在列表的最后一个元素上。因此不适用于循环列表（与无限列表相同）。

我不确定是否fold-right可以写为尾递归，但是对于任何循环列表，您都应该获得堆栈溢出。 fold-leftOTOH通常是通过尾递归实现的，如果不尽早终止，它将陷入无限循环。

— 嬉皮
source

3

由于懒惰，在Haskell中有所不同。

— Lifu Huang，

带有无限列表的foldl与foldr行为

foldl 是：

foldr 是：

foldl' 是：

`foldl` 是：

`foldr` 是：

`foldl'` 是：