2019-10-31发表2025-04-16更新付威 4 分钟读完 (大约659个字)0次访问

分布式队列的几个名词和解释--以kafka为例

每一个生产者都需要向队列中生产消息，不同的生产者生产消息需要有所区别，供对应的消费者消费消息，这个是队列名称之为 Topic或者Subject

队列的消息需要一个存储的介质，Kafka的对应的存储为文件存储，生产者生产的消息存储在MessageLog, 然后根据不同的消费和路由规则路由，投递到对应的服务器上面，产生对应的ConsumerLog.

当投递的消息比较多的时候，就需要对ConsumerLog进行分片，分到不同的服务器上面，这个分片称之为partition,对于Kafka来说，一个Consumer一般和Partition成倍数关系，一个Consumer可以消费一个或者多个Partition.

Broken可以理解为消费者的服务器。

很多成熟的MQ的消息的存储都采用的磁盘的存储模式，可能有人会认为为什么不采用内存？内存的效率不应该更快吗？我开始也有这个疑问，后来才知道顺序IO的时候，才知道不适用内存的原因：

当Kafka的消费者访问服务端的时候，需要经历一下几个过程：

(后面补个图)

从上面的过程可以看出，数据经历了从内核态-->用户态-->内核态的流转，如果使用零拷贝的技术，直接从内核态的数据拷贝的Socket的缓冲区，避免了从内核态到用户态的流转

分布式队列的几个名词和解释--以kafka为例

付威

2019-10-31

2025-04-16

You need to set install_url to use ShareThis. Please set it in _config.yml.