嵌套编码

为了编码嵌套列,Parquet 使用带有定义级别和重复级别的 Dremel 编码。定义级别指定列路径中有多少可选字段被定义。重复级别指定路径中哪个重复字段的值被重复。最大定义级别和重复级别可以从模式计算出来(即有多少嵌套)。这定义了存储级别所需的最大位数(级别为列中的所有值定义)。

支持两种级别编码:BIT_PACKED 和 RLE。目前只使用 RLE,因为它取代了 BIT_PACKED。