数据为王

数据为王
关于大数据的那些事儿

标签关键词

关于 Parquet 的文章共有1条

Hadoop

深入分析Parquet列式存储格式

阅读(787)评论(0)

Parquet是面向分析型业务的列式存储格式,由Twitter和Cloudera合作开发,2015年5月从Apache的孵化器里毕业成为Apache顶级项目,最新的版本是1.8.0。 列式存储 列式存储和行式存储相比有哪些优势呢? 可以跳过不符合条件的数据,只读取需要的数据,降低IO数据量。 ...