参考资料 选择 Parquet for Spark SQL 的 5 大原因 5 Reasons to Choose Parquet for Spark SQL Spark + Parquet In Depth spark-parquet-in-depth Parquet与ORC:高性能列式存储格式 Previous reduceByKey,groupByKey,count,collect算子 Next Spark 算子所遇到的坑 CATALOG FEATURED TAGS Linux Python Hadoop Spark MySQL Hive Shell HBase Maxwell Kafka 数据密集型应用系统设计 ES Flink