Kafka（六）消费者_代码007(未授权)

本文介绍: Kafka消费者是指使用Apache Kafka消息系统的客户端应用程序，用于从Kafka集群中读取消息并进行处理。Kafka消费者可以订阅一个或多个主题，并实时地从主题中消费新的消息。消费者可以以不同的方式处理消息，例如将其存储到数据库中、进行实时分析或者将其传递给其他系统。Kafka消费者通常是分布式的，可以部署在多个节点上以实现高可用性和扩展性。消费者使用Kafka提供的消费者API来管理消息的订阅和消费，以及处理消息的偏移量（offset）等问题。Kafka消费者的设计使得它们能够处理高吞吐量和大规

Kafka消费者是指使用Apache Kafka消息系统的客户端应用程序，用于从Kafka集群中读取消息并进行处理。Kafka消费者可以订阅一个或多个主题，并实时地从主题中消费新的消息。消费者可以以不同的方式处理消息，例如将其存储到数据库中、进行实时分析或者将其传递给其他系统。

Kafka消费者通常是分布式的，可以部署在多个节点上以实现高可用性和扩展性。消费者使用Kafka提供的消费者API来管理消息的订阅和消费，以及处理消息的偏移量（offset）等问题。

Kafka消费者的设计使得它们能够处理高吞吐量和大规模的消息流，同时保持低延迟和高可靠性。这使得Kafka成为许多大型互联网公司和数据密集型应用程序的首选消息系统。

应用程序使用KafkaConsumer向Kafka订阅主图，并从订阅的主题中接收消息。Kafka的消费者从属于消费者群组，一个群组里的消费者订阅的是同一个主题，每个消费者负责读取这个主题的部分消息。
Kafka消费者消费流程
I will add comments for this diagram later …

这个参数是常用的KafkaProducer和KafkaConsumer用来连接Kafka集群的入口参数，这个参数对应的值通常是Kafka集群中部分broker的地址，比如：host1:9092,host2:9092，不同的broker地址之间用逗号隔开。

        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("group.id", "test-group");
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        KafkaConsumer<String, String> consumer = new KafkaConsumer<>(props);
        consumer.subscribe(Arrays.asList("topic1", "topic2"));

while (true) {
            ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
            // 处理拉取到的消息
            records.forEach(record -> System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value()));
        }

    public void commitOffset() {
        KafkaConsumer<String, String> consumer = create();
        consumer.subscribe(Arrays.asList("topic1", "topic2"));
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
            }
            try {
                consumer.commitSync();
            } catch (CommitFailedException | WakeupException e) {
                logger.error("Commit failed.", e);
            }
        }
    }

    public void commitOffsetAsync() {
        KafkaConsumer<String, String> consumer = create();
        consumer.subscribe(Arrays.asList("topic1", "topic2"));
        while (true) {
            ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
            for (ConsumerRecord<String, String> record : records) {
                System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
            }
            consumer.commitAsync(new OffsetCommitCallback() {
                @Override
                public void onComplete(Map<TopicPartition, OffsetAndMetadata> offsets, Exception exception) {
                    if (null != exception) {
                        logger.error("Commit failed for offsets {}", offsets, exception);
                    }
                }
            });
        }
    }

    public void commitOffsetAsyncAndSync() {
        KafkaConsumer<String, String> consumer = create();
        consumer.subscribe(Arrays.asList("topic1", "topic2"));
        try {
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, String> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                }
                consumer.commitAsync();
            }
        } catch (WakeupException e) {
            logger.error("Unexpected error", e);
            consumer.commitSync();
        } finally {
            consumer.close();
        }
    }

    public void commitSpecificOffset() {
        KafkaConsumer<String, String> consumer = create();
        consumer.subscribe(Arrays.asList("topic1", "topic2"));

        try {
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, String> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                }
                // 手动提交偏移量
                for (TopicPartition partition : records.partitions()) {
                    long offset = records.records(partition).get(records.records(partition).size() - 1).offset();
                    consumer.commitSync(Collections.singletonMap(partition, new org.apache.kafka.clients.consumer.OffsetAndMetadata(offset + 1)));
                }
            }
        } catch (WakeupException e) {
            // Ignore for shutdown
        } finally {
            consumer.close();
        }
    }

package com.qupeng.demo.kafka.kafkaapache.consumer;

import org.apache.kafka.clients.consumer.ConsumerRebalanceListener;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.TopicPartition;

import java.util.Collection;

public class MyRebalanceListener implements ConsumerRebalanceListener {

    KafkaConsumer kafkaConsumer;

    public MyRebalanceListener(KafkaConsumer kafkaConsumer) {
        this.kafkaConsumer = kafkaConsumer;
    }

    // 消费者放弃对分区的所有权时调用
    @Override
    public void onPartitionsRevoked(Collection<TopicPartition> partitions) {

    }

    // 重新分配分区，消费者开始读取消息之前调用
    @Override
    public void onPartitionsAssigned(Collection<TopicPartition> partitions) {

    }

    // 使用协作再均衡算法，并且之前不是通过再均衡获得的分区被重新分配给其他消费者时调用
    @Override
    public void onPartitionsLost(Collection<TopicPartition> partitions) {
        ConsumerRebalanceListener.super.onPartitionsLost(partitions);
    }
}

    public void commitInRebalance() {
        KafkaConsumer<String, String> consumer = create();
        Map<TopicPartition, OffsetAndMetadata> currentOffsets = new HashMap<>();
        try {
            consumer.subscribe(Arrays.asList("topic1", "topic2"), new MyRebalanceListener(consumer));
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, String> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                    currentOffsets.put(new TopicPartition(record.topic(), record.partition()),
                            new OffsetAndMetadata(record.offset() + 1, null));
                }
                consumer.commitAsync(currentOffsets, null);
            }
        } catch (WakeupException e) {
            logger.error("Unexpected error", e);
        } finally {
            try {
                consumer.commitSync(currentOffsets);
            } catch (Exception e) {
                throw new RuntimeException(e);
            } finally {
                consumer.close();
            }
        }
    }

    public void seekOffsetByTime() {
        KafkaConsumer<String, String> consumer = create();
        Long oneHourEarlier = Instant.now().atZone(ZoneId.systemDefault()).minusHours(1).toEpochSecond();
        Map<TopicPartition, Long> partitionLongMap = consumer.assignment().stream().collect(Collectors.toMap(tp -> tp, tp ->oneHourEarlier));
        Map<TopicPartition, OffsetAndTimestamp> offsetMap = consumer.offsetsForTimes(partitionLongMap);
        for (Map.Entry<TopicPartition, OffsetAndTimestamp> entry : offsetMap.entrySet()) {
            consumer.seek(entry.getKey(), entry.getValue().offset());
        }
        try {
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, String> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                }
            }
        } finally {
            consumer.close();
        }
    }

    public void seekSpecificOffset() {
        KafkaConsumer<String, String> consumer = create();

        // Assign a specific partition and offset
        TopicPartition partition = new TopicPartition("your-topic", 0);
        consumer.assign(Collections.singleton(partition));
        consumer.seek(partition, 100);

        try {
            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                for (ConsumerRecord<String, String> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                }
            }
        } finally {
            consumer.close();
        }
    }

    private AtomicBoolean exitFlag = new AtomicBoolean(false);

    public void consumeAndExit() {
        KafkaConsumer<String, String> consumer = create();
        addShutdownHook(consumer, Thread.currentThread());
        consumer.subscribe(Arrays.asList("topic1", "topic2"));
        try {
            while (!exitFlag.get()) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(10000));
                for (ConsumerRecord<String, String> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value());
                }
                consumer.commitAsync();
            }
            consumer.close();
        } catch (WakeupException e) {
            consumer.commitSync();
        } finally {
            consumer.close();
        }
    }

    public void setExitFlag() {
        Runtime.getRuntime().addShutdownHook(new Thread() {
            @Override
            public void run() {
                exitFlag.compareAndSet(false, true);
            }
        });
    }

    public void addShutdownHook(Consumer consumer, Thread mainThread) {
        Runtime.getRuntime().addShutdownHook(new Thread() {
            @Override
            public void run() {
                consumer.wakeup();
                try {
                    mainThread.join();
                } catch (InterruptedException e) {
                    logger.error("", e);
                }
            }
        });
    }

package com.qupeng.demo.kafka.kafkaapache.consumer;

import com.qupeng.demo.kafka.kafkaapache.producer.Product;
import org.apache.kafka.common.serialization.Deserializer;

import java.nio.ByteBuffer;
import java.nio.charset.StandardCharsets;

public class CustomizedDeserializer implements Deserializer<Product> {
    @Override
    public Product deserialize(String topic, byte[] data) {
        ByteBuffer byteBuffer = ByteBuffer.wrap(data);
        int id = byteBuffer.getInt();
        int nameSize = byteBuffer.getInt();
        byte[] nameBytes = new byte[nameSize];
        byteBuffer.get(nameBytes);
        String name = new String(nameBytes, StandardCharsets.UTF_8);
        return new Product(id, name);
    }
}

package com.qupeng.demo.kafka.kafkaapache.consumer;

import com.qupeng.demo.kafka.kafkaapache.producer.Product;
import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;

import java.time.Duration;
import java.util.Arrays;
import java.util.Properties;

public class AvroConsumer {
    public KafkaConsumer create() {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("group.id", "test-group");
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "io.confluent.kafka.serializers.KafkaAvroDeserializer");
        props.put("schema.registry.url", "localhost:8081");

        return new KafkaConsumer<>(props);
    }

    public void consume() {

        KafkaConsumer<String, Product> consumer = create();
        consumer.subscribe(Arrays.asList("topic1", "topic2"));

        while (true) {
            ConsumerRecords<String, Product> records = consumer.poll(Duration.ofMillis(100));
            // 处理拉取到的消息
            records.forEach(record -> System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value().getName()));
        }
    }
}

package com.qupeng.demo.kafka.kafkaapache.consumer;

import org.apache.kafka.clients.consumer.ConsumerRecords;
import org.apache.kafka.clients.consumer.KafkaConsumer;
import org.apache.kafka.common.PartitionInfo;
import org.apache.kafka.common.TopicPartition;

import java.time.Duration;
import java.util.ArrayList;
import java.util.List;
import java.util.Properties;

public class IndependentConsumer {
    public KafkaConsumer create() {
        Properties props = new Properties();
        props.put("bootstrap.servers", "localhost:9092");
        props.put("group.id", "test-group");
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");

        return new KafkaConsumer<>(props);
    }

    public void consume() {

        KafkaConsumer<String, String> consumer = create();
        List<PartitionInfo> partitionInfos = consumer.partitionsFor("Topic");
        if (null != partitionInfos) {
            List<TopicPartition> topicPartitions = new ArrayList<>();
            for (PartitionInfo partitionInfo : partitionInfos) {
                topicPartitions.add(new TopicPartition(partitionInfo.topic(), partitionInfo.partition()));
            }
            consumer.assign(topicPartitions);

            while (true) {
                ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(100));
                records.forEach(record -> System.out.printf("offset = %d, key = %s, value = %s%n", record.offset(), record.key(), record.value()));
                consumer.commitSync();
            }
        }
    }
}

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

kafka 消息消费者

目录

Kafka消费者

1 配置消费者

bootstrap.servers

group.id

key.deserializer

value.deserializer

group.instance.id

fetch.min.bytes=1

fetch.max.wait.ms

fetch.max.bytes=57671680 (55 mebibytes)

max.poll.record=500

max.partition.fetch.bytes

session.timeout.ms=45000 (45 seconds)

heartbeat.interval.ms=3000 (3 seconds)

max.poll.interval.ms=300000 (5 minutes)

default.api.timeout.ms=60000 (1 minute)

request.timeout.ms=40000 (40 seconds)

auto.offset.reset=latest

enable.auto.commit=true

auto.commit.interval.ms=5000 (5 seconds)

partition.assignment.strategy=class org.apache.kafka.clients.consumer.RangeAssignor,class org.apache.kafka.clients.consumer.CooperativeStickyAssignor

client.id

client.rack

receive.buffer.bytes=65536 (64 KB)

send.buffer.bytes=131072 (128 KB)

offsets.retention.minutes=10080(7 days)

2 分区再均衡

2.1 再均衡发生的场景

2.2 再均衡的分类

2.3 分区分配过程

3 固定群组成员

4 创建消费者

5 轮询

5.1 线程安全

6 提交和偏移量

6.1 自动提交

6.2 手动同步提交

6.3 异步提交

6.4 同步和异步组合提交

6.5 提交特定的偏移量

7 再均衡监听器

8 从特定偏移量位置读取记录

9 消费者程序如何退出

10 反序列化器

10.1 自定义反序列化器

10.2 Avro反序列化器

11 独立消费者

相关文章

发表回复 取消回复

发表回复取消回复