Mi informacion de contacto
Correo[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Corredor : se refiere a un nodo en el clúster de Kafka. Un clúster de Kafka consta de varios corredores que trabajan juntos para gestionar el almacenamiento, la transmisión y el consumo de mensajes. El corredor gestiona una o más particiones.
Tema : El productor envía el mensaje al tema especificado y el consumidor se suscribe al tema para obtener el mensaje. El tema en sí es solo una agrupación lógica y no tiene concepto de almacenamiento físico.
Dividir : Es un subconjunto del tema y la unidad básica para almacenar y procesar mensajes en Kafka. Cada tema se puede dividir en varias particiones y cada partición es una secuencia de mensajes ordenada e inmutable.
Réplica: Una partición puede tener varias copias.
Corredor líder: En varias copias de una partición, el intermediario es responsable de procesar todas las solicitudes de lectura y escritura de la partición.
SeguidorBroker: En varias copias de una partición, el intermediario responsable de sincronizar los datos del líder se encuentra en la partición.
El productor envía el mensaje (registro) a Kafka y el consumidor obtiene los datos a través del desplazamiento (desplazamiento, similar a un subíndice de matriz).
Al mismo tiempo, cada partición tendrá su propio archivo de registro. Kafka utiliza archivos de registro para guardar datos en el disco.
Los productores se conectan al clúster de Kafka a través de Bootstrap Broker. Este paso es para establecer la conexión inicial y obtener los metadatos del clúster.
Una vez que el productor obtiene estos metadatos, sabe quién es el intermediario líder para cada partición y, por lo tanto, puede enviar mensajes directamente al intermediario líder correcto.
El productor debe especificar un tema al enviar un mensaje, pero la partición es opcional.
En Kafka, cuando un productor envía un mensaje a un corredor, la primera operación del corredor es grabar el mensaje en el disco para garantizar la persistencia y confiabilidad del mensaje.
Los consumidores en Kafka suelen pertenecer a un grupo de consumidores. Cada grupo de consumidores tiene una identificación de grupo única. El concepto de grupos de consumidores se utiliza para lograr el equilibrio de carga y el consumo paralelo de mensajes.
Cuando varios consumidores pertenecen al mismo grupo, Kafka asignará la partición de tema a los consumidores del grupo.Cada partición solo puede ser consumida por un consumidor dentro del grupo., que puede lograr el equilibrio de carga.
Un único consumidor se suscribe a un tema:
Varios consumidores pertenecen al mismo grupo.:
Varios consumidores pertenecen a diferentes grupos.:
Kafka creará nuevas particiones en el clúster. Estas nuevas particiones se asignarán a diferentes Brokers para lograr un almacenamiento equilibrado y una alta disponibilidad de datos. Kafka no redistribuye ni equilibra automáticamente los datos de las particiones existentes a las nuevas. Las nuevas particiones están vacías desde el momento en que se crean y los datos solo se escribirán en estas nuevas particiones cuando los productores posteriores envíen mensajes. El grupo de consumidores detectará el cambio en el número de particiones y provocará un reequilibrio.
Kafka permite múltiples réplicas (Replica) de cada partición, las cuales se almacenan en diferentes Brokers. Una réplica se llama Líder y es responsable de procesar todas las solicitudes de lectura y escritura. Las otras réplicas son Seguidoras y son responsables de sincronizar los datos del Líder.
Solo una copia de varias copias puede leer y escribir al mismo tiempo, que es la copia líder. Las otras copias se convierten en copias seguidoras y se utilizan como copias de seguridad.