Impala 介绍
一、Impala概述
Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。换句话说,Impala是性能最高的SQL引擎(提供类似RDBMS的体验),它提供了访问存储在Hadoop分布式文件系统中的数据的最快方法。
Impala是什么?
Impala提供对大数据更快速,交互式 SQL查询。
Impala支持对存储在HDFS、HBase及S3等数据查询。
Impala使用和Hive相同的元数据、SQL定义、ODBC驱动及用户接口。
Impala提供实时、批数据的统一查询平台。
Impala是对现有大数据查询工具的补充,不能替代基于Hive的MapReduce批处理任务框架(适用于耗时长的批处理任务,例如ETL等)。
Impala建立在集群之上的分布式查询,易于扩展。
相关文章:
OLAP(三):Impala介绍 、 (和hive/spark对比)、COMPUTE STATS
为者常成,行者常至
自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)