分布式运用之Filebeat+Kafka+ELK 的服务部署

本文介绍: 1.1 Kaf k a 工作流程及文件存储机制Kaf k a 中消息是以 topic 进行分类的，生产者生产消息，消费者消费消息，都是面向 topic 的。topic 是逻辑上的概念，而 partition 是物理上的概念，每个 p a rt i t i on 对应于一个 log 文件，该 log 文件中存储的就是 producer 生产的数据。Pr oduce r 生产的数据会被不断追加到该 log 文件末端，且每条数据都有自己的 offset。

1.1 Kaf k a 工作流程及文件存储机制
Kaf k a 中消息是以 topic 进行分类的，生产者生产消息，消费者消费消息，都是面向 top ic 的。

top ic 是逻辑上的概念，而 p a rt i t i on 是物理上的概念，每个 p a rt i tion 对应于一个 log 文件，该 lo g 文件中存储的就是 producer 生产的数据。Pr oducer 生产的数据会被不断追加到该 lo g 文件末端，且每条数据都有自己的 off set。消费者组中的每个消费者，都会实时记录自己消费到了哪个 off set，以便出错恢复时，从上次的位置继续消费。

由于生产者生产的消息会不断追加到 log 文件末尾，为防止 log 文件过大导致数据定位效率低下，Kaf ka 采取了分片和索引机制，将每个 partition 分为多个 s egm ent。每个 s egm ent 对应两个文件：“.index” 文件和 “.log” 文件。这些文件位于一个文件夹下，该文件夹的命名规则为：top ic 名称+分区序号。例如，test 这个 top ic 有三个分区，则其对应的文件夹为 test-0、test-1、test-2。

index 和 log 文件以当前 s egm ent 的第一条消息的 off set 命名。

“.index” 文件存储大量的索引信息，“.log” 文件存储大量的数据，索引文件中的元数据指向对应数据文件中 message 的物理偏移地址。

1.2 数据可靠性保证
为保证 producer 发送的数据，能可靠的发送到指定的 top ic，top ic 的每个 partition 收到 producer 发送的数据后，都需要向 producer 发送 ack（ac knowledge m ent 确认收到），如果 producer 收到 ac k，就会进行下一轮的发送，否则重新发送数据。

当 producer 向 leader 发送数据时，可以通过 request.required.acks 参数来设置数据可靠性的级别：
●0：这意味着producer无需等待来自broker的确认而继续发送下一批消息。这种情况下数据传输效率最高，但是数据可靠性确是最低的。当broker故障时有可能丢失数据。
 
●1（默认配置）：这意味着producer在ISR中的leader已成功收到的数据并得到确认后发送下一条message。如果在follower同步成功之前leader故障，那么将会丢失数据。
 
●-1（或者是all）：producer需要等待ISR中的所有follower都确认接收到数据后才算一次发送完成，可靠性最高。但是如果在 follower 同步完成后，broker 发送ack 之前，leader 发生故障，那么会造成数据重复。
 
三种机制性能依次递减，数据可靠性依次递增。
 
注：在 0.11 版本以前的Kafka，对此是无能为力的，只能保证数据不丢失，再在下游消费者对数据做全局去重。在 0.11 及以后版本的 Kafka，引入了一项重大特性：幂等性。所谓的幂等性就是指 Producer 不论向 Server 发送多少次重复数据， Server 端都只会持久化一条。


cd /usr/local/filebeat
cp filebeat.yml filebeat.yml.bak
vim filebeat.yml
filebeat.prospectors:
- type: log
  enabled: true
  paths:
    - /var/log/httpd/access_log
  tags: ["access"]
  
- type: log
  enabled: true
  paths:
    - /var/log/httpd/error_log
  tags: ["error"]
  
......
#添加输出到 Kafka 的配置
output.kafka:
  enabled: true
  hosts: ["192.168.73.109:9092","192.168.73.110:9092","192.168.73.111:9092"]    #指定 Kafka 集群配置
  topic: "httpd"    #指定 Kafka 的 topic
  
#启动 filebeat
./filebeat -e -c filebeat.yml

bin/logstash-plugin install logstash-filter-multiline

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

1. Kaf k a 架构深入了解

2. Filebeat+Kafka+ELK 的部署

实验 步骤

步骤二：部署 ELK，在 Logstash 组件所在节点上新建一个 Logstash 配置文件

进行访问 测试

发表回复取消回复

1. Kafka 架构深入了解

2. Filebeat+Kafka+ELK 的部署

步骤二：部署 ELK，在 Logstash 组件所在节点上新建一个 Logstash 配置文件

进行访问测试

相关文章

发表回复 取消回复

1. Kaf k a 架构深入了解

发表回复取消回复