数据页

对于数据页,三部分信息在页头之后背靠背编码。数据页中不允许填充。 按顺序我们有:

  1. 重复级别数据
  2. 定义级别数据
  3. 编码值

页头中指定的 uncompressed_page_size 值是这三部分的总和。

数据页的编码值始终是必需的。定义级别和重复级别是可选的,取决于模式定义。如果列不是嵌套的(即列的路径长度为 1),我们不编码重复级别(它始终为值 1)。对于必需的数据,定义级别被跳过(如果编码,它将始终为最大定义级别的值)。

例如,在列是非嵌套且必需的情况下,页中的数据仅为编码值。

支持的编码在 Encodings.md 中描述。

支持的压缩编解码器在 Compression.md 中描述。