常见大数据产品

常见大数据产品

常见大数据产品 大数据产品提供数据存储、处理、分析和可视化功能,支持从海量数据中提取价值。包括Hadoop、Spark等处理框架,HDFS、HBase等存储系统,Hive、Impala等数据仓库工具,Kafka、Flink等流处理平台,以及Hue、Ambari等管理和监控工具。广泛应用于商业智能、机器学习、实时分析等领域。

开源产品 Apache Hadoop

分布式存储与计算平台

Apache Spark

大数据处理框架

Apache Flink

实时数据处理引擎

Apache HBase

分布式非关系数据库

Apache Kafka

流处理平台

Apache Hive

数据仓库工具

Apache Storm

实时计算系统

Apache Druid

实时分析数据库

Apache Solr

搜索平台

Apache Kudu

存储引擎

Apache Impala

实时查询分析

Apache Oozie

工作流调度系统

Apache Beam

统一的模型进行批处理和流处理

Apache Airflow

工作流管理平台

Apache Pulsar

云原生分布式消息传递和流数据平台

Apache Pig

Hadoop平台脚本语言

Apache Tez

扩展数据处理框架

Apache Ambari

管理与监控Hadoop集群

Apache Chukwa

数据收集系统

Apache Cassandra

分布式NoSQL数据库

Apache Avro

数据序列化系统

Prestodb

分布式SQL查询引擎

DuckDB

轻量便捷OLAP数据库

Greenplum

大规模分布式数据仓库

这些产品里除了轻量便捷的DuckDB、基于PG改造的Greenplum外,基本都是 Hadoop 生态产品。站在个人角度比较认同 DuckDB 的观点,对于大部分的中小企业来说,数据分析不会太复杂,很多分析操作都是即时性、快捷的。

商业产品 Teradata

分析型数据库

Snowflake

云数据仓库

Databricks

大数据处理和分析

Cloudera

Hadoop发行版

Splunk

数据分析和情报

Elasticsearch

分布式搜索引擎

Confluent Platform

企业级流处理

Qlik

数据集成和分析

Tableau

数据可视化平台

Power BI

商业分析服务

帆软BI

企业级数据可视化平台

TIBCO Spotfire

数据分析与可视化

SAS

分析解决方案

云产品 Amazon Redshift

云数据仓库

Google BigQuery

云数据仓库

Amazon EMR

大数据处理服务

Google Cloud Dataproc

管理的Spark和Hadoop服务

Azure HDInsight

云中的Hadoop服务

IBM Db2 Warehouse

数据仓库数据库

Microsoft Azure Synapse Analytics

无限数据仓库和分析

捐赠本站(Donate) 如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))

相关推荐

閟幄的解释
365会提款不成功吗

閟幄的解释

📅 09-11 👁️ 5309
Angular与Vue的全方位对比分析
bet878365

Angular与Vue的全方位对比分析

📅 07-28 👁️ 1257
[幻化攻略]【天下3官方论坛】元魂珠神启使用攻略——[合体篇](合体强化节点效果展示)