10-枚举类型和流

枚举对象
积极vs懒惰

10.1-枚举类型

Elixir提供了枚举类型(enumerables)的概念,使用Enum模块操作它们。我们已经介绍过两种枚举类型:列表和图。

  1. iex> Enum.map([1, 2, 3], fn x -> x * 2 end)
  2. [2, 4, 6]
  3. iex> Enum.map(%{1 => 2, 3 => 4}, fn {k, v} -> k * v end)
  4. [2, 12]

Enum模块为枚举类型提供了大量函数来变化,排序,分组,过滤和读取元素。 Enum模块是开发者最常用的模块之一。

Elixir还提供了范围(range):

  1. iex> Enum.map(1..3, fn x -> x * 2 end)
  2. [2, 4, 6]
  3. iex> Enum.reduce(1..3, 0, &+/2)
  4. 6

因为Enum模块在设计时为了适用于不同的数据类型,所以它的API被限制为多数据类型适用的函数。 为了实现某些操作,你可能需要针对某类型使用某特定的模块。 比如,如果你要在列表中某特定位置插入一个元素,要用List模块中的List.insert_at/3函数。而向某些类型内插入数据是没意义的,比如范围。

Enum中的函数是多态的,因为它们能处理不同的数据类型。 尤其是,模块中可以适用于不同数据类型的函数,它们是遵循了Enumerable协议。 我们在后面章节中将讨论这个协议。下面将介绍一种特殊的枚举类型:流。

10.2-积极vs懒惰

Enum模块中的所有函数都是积极的。多数函数接受一个枚举类型,并返回一个列表:

  1. iex> odd? = &(rem(&1, 2) != 0)
  2. #Function<6.80484245/1 in :erl_eval.expr/5>
  3. iex> Enum.filter(1..3, odd?)
  4. [1, 3]

这意味着当使用Enum进行多种操作时,每次操作都生成一个中间列表,直到得出最终结果:

  1. iex> 1..100_000 |> Enum.map(&(&1 * 3)) |> Enum.filter(odd?) |> Enum.sum
  2. 7500000000

上面例子是一个含有多个操作的管道。从一个范围开始,然后给每个元素乘以3。 该操作将会生成的中间结果是含有100000个元素的列表。 然后我们过滤掉所有偶数,产生又一个新中间结果:一个50000元素的列表。 最后求和,返回结果。

这个符号的用法似乎和F#中的不一样啊…

作为一个替代,流模块提供了懒惰的实现:

  1. iex> 1..100_000 |> Stream.map(&(&1 * 3)) |> Stream.filter(odd?) |> Enum.sum
  2. 7500000000

与之前Enum的处理不同,流先创建了一系列的计算操作。然后仅当我们把它传递给Enum模块,它才会被调用。流这种方式适用于处理大量的(甚至是无限的)数据集合。

10.3-流

流是懒惰的,比起Enum来说。 分步分析一下上面的例子,你会发现流与Enum的区别:

  1. iex> 1..100_000 |> Stream.map(&(&1 * 3))
  2. #Stream<[enum: 1..100000, funs: [#Function<34.16982430/1 in Stream.map/2>]]>

流操作返回的不是结果列表,而是一个数据类型—-流,一个表示要对范围1..100000使用map操作的动作。

另外,当我们用管道连接多个流操作时:

  1. iex> 1..100_000 |> Stream.map(&(&1 * 3)) |> Stream.filter(odd?)
  2. #Stream<[enum: 1..100000, funs: [...]]>

流模块中的函数接受任何枚举类型为参数,返回一个流。 流模块还提供了创建流(甚至是无限操作的流)的函数。 例如,Stream.cycle/1可以用来创建一个流,它能无限周期性枚举所提供的参数(小心使用):

  1. iex> stream = Stream.cycle([1, 2, 3])
  2. #Function<15.16982430/2 in Stream.cycle/1>
  3. iex> Enum.take(stream, 10)
  4. [1, 2, 3, 1, 2, 3, 1, 2, 3, 1]

另一方面,Stream.unfold/2函数可以生成给定的有限值:

  1. iex> stream = Stream.unfold("hełło", &String.next_codepoint/1)
  2. #Function<39.75994740/2 in Stream.unfold/2>
  3. iex> Enum.take(stream, 3)
  4. ["h", "e", "ł"]

另一个有趣的函数是Stream.resource/3,它可以用来包裹某资源,确保该资源在使用前打开,在用完后关闭(即使中途出现错误)。—类似C#中的use{}关键字。 比如,我们可以stream一个文件:

  1. iex> stream = File.stream!("path/to/file")
  2. #Function<18.16982430/2 in Stream.resource/3>
  3. iex> Enum.take(stream, 10)

这个例子读取了文件的前10行内容。流在处理大文件,或者慢速资源(如网络)时非常有用。

一开始Enum和流模块中函数的数量多到让人气馁。但你会慢慢地熟悉它们。 建议先熟悉Enum模块,然后因为应用而转去流模块中那些相应的,懒惰版的函数。