一个分布式流处理框架,基于Kafka消息队列来实现类实时...
一个分布式流处理框架,基于Kafka消息队列来实现类实时的流式数据处理
Hadoop 生态系统中的第一个SQL框架
一个框架支持使用简单的编程模型跨计算机集群分布式处理大型...
一个分布式数据仓库系统,提供专用查询和ETL工具
实现大数据的全数据(结构化数据、半结构化数据和非结构化数...
一个原生的SQL-on-Hadoop引擎
一个开源的MPP SQL引擎,作为Hive 的高性能替代...