提问者:小点点

Apache Kafka Streams将KTables物化到主题似乎很慢


我正在使用kafka流,并试图将KTable具体化为主题。

它有效,但似乎每30秒左右完成一次。

Kafka Stream如何/何时决定将KTable的当前状态具体化为主题?

有没有办法缩短这个时间,让它更“实时”?

这是我使用的实际代码

// Stream of random ints: (1,1) -> (6,6) -> (3,3)
// one record every 500ms
KStream<Integer, Integer> kStream = builder.stream(Serdes.Integer(), Serdes.Integer(), RandomNumberProducer.TOPIC);

// grouping by key
KGroupedStream<Integer, Integer> byKey = kStream.groupByKey(Serdes.Integer(), Serdes.Integer());

// same behaviour with or without the TimeWindow
KTable<Windowed<Integer>, Long> count = byKey.count(TimeWindows.of(1000L),"total");

// same behaviour with only count.to(Serdes.Integer(), Serdes.Long(), RandomCountConsumer.TOPIC);
count.toStream().map((k,v) -> new KeyValue<>(k.key(), v)).to(Serdes.Integer(), Serdes.Long(), RandomCountConsumer.TOPIC);

共1个答案

匿名用户

这由commit.interval.ms控制,默认为30s。更多详细信息在这里:http://docs.confluent.io/current/streams/developer-guide.html

缓存的语义学是,只要最早的commit.interval.ms或cache. max.bytes.buffer ering(缓存压力)命中,数据就会刷新到状态存储并转发到下一个下游处理器节点。

而这里:

https://cwiki.apache.org/confluence/display/KAFKA/KIP-63:统一流中的存储和下游缓存