- 简介
- 目录大纲
- 最新文档
13、Kafka 应用
Kafka支持许多当今最好的工业应用。 我们将在本章中简要介绍Kafka最为显着的应用。 Twitter Twitter是一种在线社交网络服务,提供发送和接收用户推文的平台。 注册用户可以阅读和发布tweet,但未注册的用户只能阅读tweets。 Twitter使用Storm-Kafka作为其流处理基础架构的一部分。 LinkedIn Apache Kafka在LinkedIn中用于活动流数……
李智 - 2025年3月17日 13:28
12、Kafka 工具
Kafka在“org.apache.kafka.tools。”下打包的工具。 工具分为系统工具和复制工具。 系统工具 可以使用运行类脚本从命令行运行系统工具。 语法如下 ```java bin/kafka-run-class.sh package.class - - options ``` 下面提到一些系统工具 Kafka迁移工具 - 此工具用于将代理从一个版本迁移到另一个版本。 Mirror……
李智 - 2025年3月17日 13:28
11、Kafka 实时应用程序(Twitter)
让我们分析一个实时应用程序,以获取最新的Twitter Feed和其标签。 早些时候,我们已经看到了Storm和Spark与Kafka的集成。 在这两种情况下,我们创建了一个Kafka生产者(使用cli)向Kafka生态系统发送消息。 然后,storm和spark集成通过使用Kafka消费者读取消息,并将其分别注入到storm和spark生态系统中。 因此,实际上我们需要创建一个Kafka Pro……
李智 - 2025年3月17日 13:28
10、Kafka 与Spark的集成
关于Spark Spark Streaming API支持实时数据流的可扩展,高吞吐量,容错流处理。 数据可以从诸如Kafka,Flume,Twitter等许多源中提取,并且可以使用复杂的算法来处理,例如地图,缩小,连接和窗口等高级功能。 最后,处理的数据可以推送到文件系统,数据库和活动仪表板。 弹性分布式数据集(RDD)是Spark的基本数据结构。 它是一个不可变的分布式对象集合。 RDD中的……
李智 - 2025年3月17日 13:28
09、Kafka 整合 Storm
关于Storm Storm最初由Nathan Marz和BackType的团队创建。 在短时间内,Apache Storm成为分布式实时处理系统的标准,允许您处理大量数据。 Storm是非常快的,并且一个基准时钟为每个节点每秒处理超过一百万个元组。 Apache Storm持续运行,从配置的源(Spouts)消耗数据,并将数据传递到处理管道(Bolts)。 联合,Spouts和Bolt构成一个拓扑……
李智 - 2025年3月17日 13:28