zookeeper集群和kafka集群

文章

林里克斯

1409字数

Linux,Kafka

在 Linux 下安装 zookeeper 集群和 kafka 集群

它是一个分布式消息系统，由 linkedin 使用 scala 编写，用作 LinkedIn 的活动流（Activity Stream）和运营数据处理管道（Pipeline）的基础。具有高水平扩展和高吞吐量。

一：实验平台：CentOs 6.5

二： Java版本：jdk-8u111-linux-x64.tar.gz

三： kafka版本：kafka_2.10-0.10.1.1.tgz

四： zookeeper版本：zookeeper-3.4.9.tar.gz

五：所用IP地址为：192.168.7.223

六： zookeeper所用端口是：2181 2182 2183

七： kafka所用端口是：9001 9002 9003

步骤:

一、环境搭建
二、zookeeper 集群安装
三、kafka集群
三、验证

一、环境搭建

jdk环境的搭建

$ mkdir /ane/java
$ tar -xzvf jdk-8u111-linux-x64.tar.gz -C /ane/java #解压缩

添加 Java 环境变量。添加并编辑 /etc/profile.d/jdk.sh

$ vim /etc/profile.d/jdk.sh

JAVA_HOME=/usr/java/jdk1.7.0_67
JAVA_BIN=$JAVA_HOME/bin
PATH=$PATH:$JAVA_BIN
CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export  JAVA_HOME JAVA_BIN PATH CLASSPATH

$ source /etc/profile
#使环境变量立即生效

$ java -version  #查看jdk版本

java version "1.8.0_111"
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)

二、zookeeper 集群安装

1.zookeeper下载地址

http://zookeeper.apache.org/releases.html

2.解压安装

$ mkdir /ane
$ tar -xf zookeeper-3.4.9.tar.gz -C /ane
#解压到/ane目录下
$ mv zookeeper-3.4.9 zookeeper
#规范名字
$ cd /ane/zookeeper
$ mkdir zk{1,2,3}
#为集群创建必要目录
$ cd conf/
$ cp -p zoo_sample.cfg /ane/zookeeper/zk1/zoo.cfg
#拷贝配置文件

修改zoo.cfg

$ vim /ane/zookeeper/zk1/zoo.cfg

dataDir=/ane/zookeeper/zk1
#数据目录
clientPort=2181
#端口号
server.1=192.168.7.221:2888:3888
#新增
server.2=192.168.7.221:4888:5888
#新增
server.3=192.168.7.221:6888:7888
#新增

server.1 这个1是服务器的标识也可以是其他的数字，表示这个是第几号服务器，用来标识服务器，这个标识要写到快照目录下myid文件里 192.168.7.221为集群里的IP地址，第一个端口是master和slave之间的通信端口，默认是2888，第二个端口是leader选举的端口，集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是3888

配置信息详解

tickTime：
这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔，也就是每个 tickTime 时间就会发送一个心跳。
initLimit：
这个配置项是用来配置 Zookeeper 接受客户端（这里所说的客户端不是用户连接 Zookeeper 服务器的客户端，而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器）初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间（也就是 tickTime）长度后 Zookeeper 服务器还没有收到客户端的返回信息，那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒
syncLimit：
这个配置项标识 Leader 与Follower 之间发送消息，请求和应答时间长度，最长不能超过多少个 tickTime 的时间长度，总的时间长度就是5*2000=10秒
dataDir：
快照日志的存储路径
dataLogDir：
事物日志的存储路径，如果不配置这个那么事物日志会默认存储到dataDir制定的目录，这样会严重影响zk的性能，当zk吞吐量较大的时候，产生的事物日志、快照日志太多
clientPort：
这个端口就是客户端连接 Zookeeper 服务器的端口，Zookeeper 会监听这个端口，接受客户端的访问请求。修改他的端口改大点

复制配置文件到另外两个文件里

$ cp -p /ane/zookeeper/zk1/zoo.cfg /ane/zookeeper/zk2/zoo.cfg
$ cp -p /ane/zookeeper/zk1/zoo.cfg /ane/zookeeper/zk3/zoo.cfg

修改两个的端口号

$ vim /ane/zookeeper/zk2/zoo.cfg

dataDir=/ane/zookeeper/zk2
clientPort=2182

$ vim /ane/zookeeper/zk3/zoo.cfg

dataDir=/ane/zookeeper/zk3
clientPort=2183

myid文件和server.myid  在快照目录下存放的标识本台服务器的文件，他是整个zk集群用来发现彼此的一个重要标识。
zoo.cfg 文件是zookeeper配置文件 在conf目录里。
log4j.properties文件是zk的日志输出文件 在conf目录里用java写的程序基本上有个共同点日志都用log4j，来进行管理。

创建myid节点文件

$ echo "1" > /ane/zookeeper/zk1/myid
$ echo "2" > /ane/zookeeper/zk2/myid
$ echo "3" > /ane/zookeeper/zk3/myid

3.启用zookeeper集群

$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk1/zoo.cfg
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk2/zoo.cfg
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk3/zoo.cfg

编写zookeeper集群的快捷启动脚本

$ vim /ane/startZK.sh

/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk1/zoo.cfg &
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk2/zoo.cfg &
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk3/zoo.cfg &

查看zookeeper集群进程

$ ps -ef | grep java

/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep

zkServer.sh和zkEnv.sh
#zkServer.sh 主的管理程序文件
#zkEnv.sh 是主要配置，zookeeper集群启动时配置环境变量的文件

三、kafka集群

1.下载地址：

http://kafka.apache.org/downloads

2.安装解压

$ tar zxf kafka_2.12-0.10.1.1.tgz -C /ane/
$ mv kafka_2.12-0.10.1.1 kafka
$ cd /ane/kafka

3.创建kafka规范目录

$ mkdir server{0,1,2}

4.修改配置文件server.properties

$ pwd
/ane/kafka/config
$ vim server.properties

broker.id=0     #集群唯一标识，不能相同
port=9001       #新增 默认为9000
log.dirs=/ane/logs/kafka0-logs      #修改日志存放路径
zookeeper.connect=192.168.7.221:2181,192.168.7.221:2182,192.168.7.221:2183      #增加zookeeper地址

5.配置信息详情

broker.id=0     #当前机器在集群中的唯一标识，和zookeeper的myid性质一样
port=19092      #当前kafka对外提供服务的端口默认是9092
host.name=192.168.7.100     #这个参数默认是关闭的，在0.8.1有个bug，DNS解析问题，失败率的问题。
num.network.threads=3       #这个是borker进行网络处理的线程数
num.io.threads=8        #这个是borker进行I/O处理的线程数
log.dirs=/opt/kafka/kafkalogs/      #消息存放的目录，这个目录可以配置为“，”逗号分割的表达式，上面的num.io.threads要大于这个目录的个数这个目录，如果配置多个目录，新创建的topic他把消息持久化的地方是，当前以逗号分割的目录中，那个分区数最少就放那一个
socket.send.buffer.bytes=102400     #发送缓冲区buffer大小，数据不是一下子就发送的，先回存储到缓冲区了到达一定的大小后在发送，能提高性能
socket.receive.buffer.bytes=102400      #kafka接收缓冲区大小，当数据到达一定大小后在序列化到磁盘
socket.request.max.bytes=104857600      #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数，这个值不能超过java的堆栈大小
num.partitions=1        #默认的分区数，一个topic默认1个分区数
log.retention.hours=168     #默认消息的最大持久化时间，168小时，7天
message.max.byte=5242880        #消息保存的最大值5M
default.replication.factor=2        #kafka保存消息的副本数，如果一个副本失效了，另一个还可以继续提供服务
replica.fetch.max.bytes=5242880     #取消息的最大直接数
log.segment.bytes=1073741824        #这个参数是：因为kafka的消息是以追加的形式落地到文件，当超过这个值的时候，kafka会新起一个文件
log.retention.check.interval.ms=300000      #每隔300000毫秒去检查上面配置的log失效时间（log.retention.hours=168 ），到目录查看是否有过期的消息如果有，删除
log.cleaner.enable=false        #是否启用log压缩，一般不用启用，启用的话可以提高性能
zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口

6.拷贝配置文件到三个server目录下

$ cp -p /ane/kafka/config/server.properties /ane/kafka/server0/
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server1/
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server2/

7.修改server目录下的比修改参数

$ vim /ane/kafka/server1/server.properties

broker.id=1
port=9002
log.dirs=/ane/kafka/logs/kafka1-logs

$ vim /ane/kafka/server2/server.properties

broker.id=2
port=9003
log.dirs=/ane/kafka/logs/kafka2-logs

8..启动kafka

$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server0/server.properties &
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server1/server.properties &
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server2/server.properties &

9.编写kafka快捷启动脚本

$ vim /ane/startkafka.sh

/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server0/server.properties &
sleep 10
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server1/server.properties &
sleep 10
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server2/server.properties &

10.启动kafka服务器

$ ./startkafka.sh

三、验证

1.查看进程

2.查看端口

kafka是基于zookeeper的正常才能启动的。
启动kafka之前需要zookeeper启动正常才能启动kafka

3.创建主题

$ /ane/kafka/bin/kafka-topics.sh --create --zookeeper 10.113.128.24:2181,10.113.128.24:2182,10.113.128.24:2183 --topic test --partitions 3 --replication-factor 1

4.向主题中写入内容

$ /ane/kafka/bin/kafka-console-producer.sh --broker-list 10.113.128.24:9090,10.113.128.24:9091,10.113.128.24:9092 --topic test

5.消费消息

$ /ane/kafka/bin/kafka-console-consumer.sh --bootstrap-server 10.113.128.24:9090 --topic test --from-beginning

Over~

版权协议须知！

本篇文章来源于 Uambiguous ，如本文章侵犯到任何版权问题，请立即告知本站，本站将及时予与删除并致以最深的歉意

Linux Zookeeper Kafka

发布时间

2017-01-09

文章阅读

2277

网友评论

2277 0 2017-01-09

博主卡片

林里克斯 博主大人

一个致力于Linux的运维平台

运维时间

林

搭建这个平台，只为分享及记载自己所遇之事和难题。

现在时间 2026-07-26

今日天气

随机推荐

08-17 Linux 创建 swap 空间

10-24 Linux 下删除大量文件效率对比

01-01 Nginx+Tomcat+Redis实现Session共享

02-19 Mac版微信防止消息撤回

09-04 Linux 日志分割神器 logrotate

02-11 用Python写一个快递查询

站点统计

文章总数：241篇
分类总数：29个
评论总数：15条
本站总访问量 579205 次

@ymidsuwfoa 这篇文章不错！

@svmuvwpuqi 真棒！

@smdxydrauu 博主太厉害了！

@xiaozi 最后的分享的镜像下载地址打不开服务器没有开机吗？

@yuanyuan 为什么我的4b安装centos7.9 插上tf卡显示不兼...

@Li 用Win32DiskImager烧录前少写了一步，下载的....

@奥奥

@Wong arrhenius 牛比

@MakerFace 厉害了！

@TongSir 老哥更新下我的友链链接 https://blog.ton...

New 朋友动态

你好朋友 !