04. 开源系统对比
常见的消息系统对比
现在市面上有非常多的消息队列产品,虽然这些消息队列产品在功能和特性方面各有优劣,但我们在选择的时候要有一个最低标准,保证入选的产品至少是及格的。
- 首先,必须是开源的产品,这个非常重要。开源意味着,如果有一天你使用的消息队列遇到了一个影响你系统业务的
Bug ,你至少还有机会通过修改源代码来迅速修复或规避这个Bug ,解决你的系统火烧眉毛的问题,而不是束手无策地等待开发者不一定什么时候发布的下一个版本来解决。 - 其次,这个产品必须是近年来比较流行并且有一定社区活跃度的产品。流行的好处是,只要你的使用场景不太冷门,你遇到
Bug 的概率会非常低,因为大部分你可能遇到的Bug ,其他人早就遇到并且修复了。你在使用过程中遇到的一些问题,也比较容易在网上搜索到类似的问题,然后很快的找到解决方案。 - 还有一个优势就是,流行的产品与周边生态系统会有一个比较好的集成和兼容,比如,
Kafka 和Flink 就有比较好的兼容性,Flink 内置了Kafka 的Data Source ,使用Kafka 就很容易作为Flink 的数据源开发流计算应用,如果你用一个比较小众的消息队列产品,在进行流计算的时候,你就不得不自己开发一个Flink 的Data Source 。
最后,作为一款及格的消息队列产品,必须具备的几个特性包括:
- 消息的可靠传递:确保不丢消息;
- Cluster:支持集群,确保不会因为某个节点宕机导致服务不可用,当然也不能丢消息;
- 性能:具备足够好的性能,能满足绝大多数场景的性能要求。
快速对比
目前业界使用比较多的是

-
Kafka:
Kafka 是Apache 下的一个子项目,是一个高性能跨语言分布式发布/ 订阅消息队列系统,而Jafka 是在Kafka 之上孵化而来的,即Kafka 的一个升级版。具有以下特性:快速持久化,可以在O(1) 的系统开销下进行消息持久化;高吞吐,在一台普通的服务器上既可以达到10W/s 的吞吐速率;完全的分布式系统,Broker、Producer、Consumer 都原生自动支持分布式,自动实现负载均衡;支持Hadoop 数据并行加载,对于像Hadoop 的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。Kafka 通过Hadoop 的并行加载机制统一了在线和离线的消息处理。Apache Kafka 相对于ActiveMQ 是一个非常轻量级的消息系统,除了性能非常好之外,还是一个工作良好的分布式系统。 -
RocketMQ:
RocketMQ 是阿里巴巴在2012 年开源的消息队列产品,后来捐赠给Apache 软件基金会,2017 正式毕业,成为Apache 的顶级项目。阿里内部也是使用RocketMQ 作为支撑其业务的消息队列,经历过多次“双十一”考验,它的性能、稳定性和可靠性都是值得信赖的。作为优秀的国产消息队列,近年来越来越多的被国内众多大厂使用。 -
Pulsar:
Pulsar 旨在取代Apache Kafka 多年的主宰地位。Pulsar 在很多情况下提供了比Kafka 更快的吞吐量和更低的延迟,并为开发人员提供了一组兼容的API ,让他们可以很轻松地从Kafka 切换到Pulsar 。Pulsar 的最大优点在于它提供了比Apache Kafka 更简单明了、更健壮的一系列操作功能,特别在解决可观察性、地域复制和多租户方面的问题。在运行大型Kafka 集群方面感觉有困难的企业可以考虑转向使用Pulsar 。 -
RabbitMQ:
RabbitMQ 是使用Erlang 编写的一个开源的消息队列,本身支持很多的协议:AMQP,XMPP, SMTP, STOMP,也正因如此,它非常重量级,更适合于企业级的开发。同时实现了Broker 构架,这意味着消息在发送给客户端时先在中心队列排队。对路由,负载均衡或者数据持久化都有很好的支持。 -
Redis:
Redis 是一个基于Key-Value 对的NoSQL 数据库,开发维护很活跃。虽然它是一个Key-Value 数据库存储系统,但它本身支持MQ 功能,所以完全可以当做一个轻量级的队列服务来使用。对于RabbitMQ 和Redis 的入队和出队操作,各执行100 万次,每10 万次记录一次执行时间。测试数据分为128Bytes 、512Bytes、1K 和10K 四个不同大小的数据。实验表明:入队时,当数据比较小时Redis 的性能要高于RabbitMQ ,而如果数据大小超过了10K ,Redis 则慢的无法忍受;出队时,无论数据大小,Redis 都表现出非常好的性能,而RabbitMQ 的出队性能则远低于Redis 。 -
ZeroMQ:
ZeroMQ 号称最快的消息队列系统,尤其针对大吞吐量的需求场景。ZeroMQ 能够实现RabbitMQ 不擅长的高级/ 复杂的队列,但是开发人员需要自己组合多种技术框架,技术上的复杂度是对这MQ 能够应用成功的挑战。ZeroMQ 具有一个独特的非中间件的模式,你不需要安装和运行一个消息服务器或中间件,因为你的应用程序将扮演这个服务器角色。你只需要简单的引用ZeroMQ 程序库,可以使用NuGet 安装,然后你就可以愉快的在应用程序之间发送消息了。但是ZeroMQ 仅提供非持久性的队列,也就是说如果宕机,数据将会丢失。其中,Twitter 的Storm 0.9.0 以前的版本中默认使用ZeroMQ 作为数据流的传输(Storm 从0.9 版本开始同时支持ZeroMQ 和Netty 作为传输模块) 。 -
ActiveMQ 是Apache 下的一个子项目。类似于ZeroMQ ,它能够以代理人和点对点的技术实现队列。同时类似于RabbitMQ ,它少量代码就可以高效地实现高级应用场景。ActiveMQ 太过于复杂,在使用过程中经常出现消息丢失或者整个进程挂起的情况,并且难以定位。