Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。 对于像Hadoop的一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群来提供实时的消费。
Kafka真的不适用于Event Sourcing
聊聊架构
2+阅读 · 2018年9月9日
基于MySQL Binlog的Elasticsearch数据同步实践
DBAplus社群
15+阅读 · 2019年9月3日
Apache Kafka 迎来了“后浪”
InfoQ
0+阅读 · 2020年5月8日
Kafka 基本原理 :15 篇热文回顾
ImportNew
2+阅读 · 2017年7月2日
浅谈分布式消息技术 Kafka
CSDN云计算
0+阅读 · 2017年7月26日
实时流处理新选择:LinkedIn重磅发布Samza 1.0
AI前线
0+阅读 · 2018年12月3日
开源消息队列QMQ的设计与实现理念
InfoQ
1+阅读 · 2018年12月17日
一文追溯 ETL 的发展历程
CSDN
3+阅读 · 2020年3月30日
75%新项目都可以“无脑”选择单体架构
InfoQ
0+阅读 · 2022年2月9日
参考链接
父主题
微信扫码咨询专知VIP会员