Storm集成Kafka环境搭建，原理介绍，功能开发，功能测试_技术 _ 頭條網

引言

前面，我们已经介绍了kafka入门知识，storm的入门知识，如果你对这些都不熟悉，请参考之前发布的文章，这篇文章主要是实战，没有过多的理论介绍，如果有任何疑问，可以在下面留言，会在第一时间进行回复……文章最后，附有完整的代码实例

一、Kafka环境启动

版本选择：版本很重要，否则搭建环境，会出现很多问题，切记本篇文章只针对以下版本有效，其它版本请自行测试……

Zookeeper：3.4.12

Kafka：0.9.0.1

Storm：1.1.1

1、启动zookeeper环境

zkServer.sh start

2、启动Kafka环境

cd /usr/local/kafka_2.11-0.9.0.1

bin/kafka-server-start.sh -daemon config/server-1.properties &

3、查看进程，看是否启动成功

[root@jikeh ~]# jps
2322 Jps
2052 ConsoleProducer
1556 QuorumPeerMain #zookeeper启动成功
1966 Kafka #kafka启动成功

二、Storm集成Kafka

1、Kafka消费者

1）pom依赖

<maven.compiler.target>1.8/<maven.compiler.target>
<spring-boot.version>1.5.16.RELEASE/<spring-boot.version>
<spring-boot-maven-plugin.version>1.5.16.RELEASE/<spring-boot-maven-plugin.version>
<maven-compiler-plugin.version>3.5.1/<maven-compiler-plugin.version>
<storm.version>1.1.1/<storm.version>
<kafka.clients.version>0.9.0.1/<kafka.clients.version>
/<properties>

<dependencies>
<dependency>
<groupid>org.springframework.boot/<groupid>
<artifactid>spring-boot/<artifactid>
<version>${spring-boot.version}/<version>
/<dependency>
<dependency>
<groupid>org.springframework.boot/<groupid>
<artifactid>spring-boot-starter-web/<artifactid>
<version>${spring-boot.version}/<version>
/<dependency>
<dependency>
<groupid>org.springframework.boot/<groupid>
<artifactid>spring-boot-configuration-processor/<artifactid>
<version>${spring-boot.version}/<version>
/<dependency>

<dependency>
<groupid>org.apache.storm/<groupid>
<artifactid>storm-core/<artifactid>
<version>${storm.version}/<version>

<exclusions>
<exclusion>
<groupid>org.apache.logging.log4j/<groupid>
<artifactid>log4j-slf4j-impl/<artifactid>
/<exclusion>
/<exclusions>
/<dependency>

<dependency>
<groupid>org.apache.storm/<groupid>
<artifactid>storm-kafka/<artifactid>
<version>${storm.version}/<version>

<exclusions>
<exclusion>
<groupid>org.apache.kafka/<groupid>
<artifactid>kafka-clients/<artifactid>
/<exclusion>

<exclusion>
<artifactid>slf4j-api/<artifactid>
<groupid>org.slf4j/<groupid>
/<exclusion>
/<exclusions>
/<dependency>

<dependency>
<groupid>org.apache.kafka/<groupid>
<artifactid>kafka-clients/<artifactid>
<version>${kafka.clients.version}/<version>
<exclusions>
<exclusion>
<artifactid>slf4j-api/<artifactid>
<groupid>org.slf4j/<groupid>
/<exclusion>
/<exclusions>
/<dependency>

<dependency>
<groupid>org.apache.kafka/<groupid>
<artifactid>kafka_2.11/<artifactid>
<version>${kafka.clients.version}/<version>
<exclusions>
<exclusion>
<groupid>org.apache.kafka/<groupid>
<artifactid>kafka-clients/<artifactid>
/<exclusion>
<exclusion>
<groupid>org.apache.zookeeper/<groupid>
<artifactid>zookeeper/<artifactid>
/<exclusion>
<exclusion>
<groupid>log4j/<groupid>
<artifactid>log4j/<artifactid>
/<exclusion>
<exclusion>
<artifactid>slf4j-api/<artifactid>
<groupid>org.slf4j/<groupid>
/<exclusion>
<exclusion>
<artifactid>slf4j-log4j12/<artifactid>
<groupid>org.slf4j/<groupid>
/<exclusion>
/<exclusions>
/<dependency>

/<dependencies>

2）Kafka Spout：接收Kafka消息

//这个地方其实就是kafka配置文件里边的zookeeper.connect这个参数，可以去那里拿过来。
//ZkStr 字符串格式是 ip:port（例如：localhost:2181）.brokerZkPath 是存储所有 topic 和 partition信息的zk 根路径.默认情况下，Kafka使用 /brokers路径.
String brokerZkStr = "192.168.199.147:2181";
ZkHosts zkHosts = new ZkHosts(brokerZkStr);

String topic = "jikeh";

//汇报offset信息的root路径
String offsetZkRoot = "/" + topic;

//存储该spout id的消费offset信息,譬如以topoName来命名
String offsetZkId = UUID.randomUUID().toString();

SpoutConfig kafkaConfig = new SpoutConfig(zkHosts, topic, offsetZkRoot, offsetZkId);
kafkaConfig.scheme = new SchemeAsMultiScheme(new StringScheme());

//kafka.api.OffsetRequest.EarliestTime(): 从topic 初始位置读取消息 (例如，从最老的那个消息开始)
//kafka.api.OffsetRequest.LatestTime(): 从topic尾部开始读取消息 (例如，新写入topic的信息)
kafkaConfig.startOffsetTime = kafka.api.OffsetRequest.LatestTime();
KafkaSpout spout = new KafkaSpout(kafkaConfig);

TopologyBuilder builder = new TopologyBuilder();
builder.setSpout("spout", spout);

3）处理kafka消息

public class KafkaConsumerBolt extends BaseRichBolt {

private OutputCollector collector;

@Override
public void prepare(Map map, TopologyContext topologyContext, OutputCollector outputCollector) {
this.collector = outputCollector;
}

@Override
public void execute(Tuple tuple) {
try {
String message = tuple.getStringByField("str");

// String message = tuple.getString(0);

System.out.println("--->" + message);

this.collector.ack(tuple);

} catch (Exception e) {
this.collector.fail(tuple);
}
}

@Override
public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {

}
}

4）本地模式运行Storm作业

Config config = new Config();
LocalCluster cluster = new LocalCluster();
cluster.submitTopology("KafkaConsumerTopology", config, builder.createTopology());

2、Kafka生产者

1）pom

与上面相同

2）数据源

public class MessageSpout extends BaseRichSpout {

private Fields fields = null;
private SpoutOutputCollector collector ;

public MessageSpout(Fields fields){
this.fields = fields;
}

@Override
public void open(Map map, TopologyContext topologyContext, SpoutOutputCollector spoutOutputCollector) {

this.collector = spoutOutputCollector;
}

@Override
public void nextTuple() {
for (int i = 0; i < 5; i++) {
this.collector.emit(new Values("jikeh", "visit--" + i));
}
Utils.sleep(2000);
}

@Override
public void declareOutputFields(OutputFieldsDeclarer outputFieldsDeclarer) {
outputFieldsDeclarer.declare(this.fields);
}

@Override
public void ack(Object o) {

}

@Override
public void fail(Object o) {

}
}

3）数据处理并写入kafka

//2、写入kafka
//set producer properties.
Properties props = new Properties();
props.put(ProducerConfig.BOOTSTRAP_SERVERS_CONFIG, "192.168.199.147:9092");
props.put(ProducerConfig.KEY_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
props.put(ProducerConfig.VALUE_SERIALIZER_CLASS_CONFIG, StringSerializer.class.getName());
props.put(ProducerConfig.RETRIES_CONFIG, 3);

KafkaBolt bolt = new KafkaBolt()
.withProducerProperties(props)
.withTopicSelector(new DefaultTopicSelector(topicName))
// .withTupleToKafkaMapper(new FieldNameBasedTupleToKafkaMapper("key", "value"))
;
builder.setBolt("bolt", bolt).shuffleGrouping("spout");

代码下载地址：https://gitee.com/jikeh/JiKeHCN-RELEASE.git

项目名：spring-boot-storm-kafka

相關文章:

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

网络工程师职业生涯中，哪两点是最重要的？

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

Hive分桶表

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

第一章 Spring Framework概述

opencv人工智能深度学习这样实现人脸的年龄检测

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

深入了解ProcessFunction的状态操作(Flink-1.10)

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪