子项目
parquet-format 项目包含正确读取 Parquet 文件所需的格式规范和元数据的 Thrift 定义。
parquet-java 项目是一个用于读写 Parquet 文件的 Java 库。它由多个子模块组成,这些子模块实现了读写嵌套的、面向列的数据流的核心组件,以及 Hadoop Input/Output Formats、Pig loaders 和其他用于与 Parquet 交互的基于 Java 的实用程序。
parquet-cpp 项目是一个用于读写 Parquet 文件的 C++ 库。它是 Apache Arrow C++ 实现的一部分,具有 Python、R、Ruby 和 C/GLib 的绑定。
parquet-rs 项目是一个用于读写 Parquet 文件的 Rust 库。
parquet-go 项目是一个用于读写 Parquet 文件的 Golang 库。它是 Apache Arrow Go 实现的一部分。
parquet-compatibility 项目(已弃用)包含兼容性测试,可用于验证不同语言的实现是否可以读写彼此的文件。截至 2022 年 1 月,兼容性测试仅存在到版本 1.2.0。