转自: https://blog.csdn.net/weixin _ 36714575/article/details/8009157
仅供参考,https://blog.csdn.net/weixin _ 43230682/article/details/107185876
五.结论
1 .在压缩存储时间方面,除Sequencefile以外几乎没有差别。
2 .数据压缩率以ORC最佳,与textfile相比节省了50倍的磁盘空间,parquet压缩性能也良好。
3 .就SQL查询速度而言,ORC和parquet性能较好,远远超过其馀存储格式。
综合这些性能指标,建议在工作时将原始日志写入hive的存储格式采用与当前主流做法相匹配的ORC或parquet格式。