kafka - Estudo CDC Source Connector

Projeto para estudo de aplicação para estudo do uso do design pattern Change Data Capture (CDC) para monitorar alterações em um banco de dados com o Kafka. Será utilizado com cenário um serviço de atualização de dados de usuário, que ao ser atualizado com sucesso no banco de dados, é enviado uma email para o usuário que teve os dados atualizados.

Sumário

Tecnologias
Arquitetura de Software para Desenvolvimento
Arquitetura dos componentes
- service--userdata
- service--push-email
Criação banco de dados
- Kubernetes
  - Acessar o banco de dados
Criação do conector CDC
Referencias

Tecnologias

MySQL
Apache Kafka 3.5
Kafka Connectors
Kubernetes
Quarkus com Java 21
NodeJs com Typescript

Arquitetura de Software para Desenvolvimento

Todos os projetos desenvolvidos no estudo irão seguir o design arquitetural da Arquitetura Hexagonal, afim de pratica a separação dos componentes internos e externos da camada de negócio. Os projetos terão a estrutura do desenho a seguir:

Estrutura do projeto:

Transport Layer: Camada para a entrada de dados do projeto, podendo ser um controller REST API, uma FILA SQL, etc.
Interactors: Camada de negócio da aplicação, que representa toda a logica do negócio, como validações, utilizando principalmente a camada de entities como seus objetos.
Entities: Camada de dominio dos objetos, eles representam a camada de dominio e contem os objetos que representam os conceitos principais para o negócio.
Repositories: Camada de acesso a recursos externos da aplicação, nessa camada ainda não é definida a tecnologia dos recursos externos, sendo apenas uma porta de acesso para serviços fora da aplicação.
Data Sources: Camada que representa os recursos externos que são acessiveis pela camada de Repositories da aplicação, podendo ser um banco de dados, um serviço externo que responde por REST API, uma fila, etc.

Arquitetura dos componentes

A seguir está detalhado os componentes que irão compor o estudo

service--userdata

Serviço é responsavel por todas as alterações de dados de usuário realizadas no banco de dados. O serviço irá responder via REST API.

userdata

Banco de dados que terá armazenados os dados do usuário. O banco será configurado para utilizar o Desing Pattern CDC, assim todas as alterações realizadas no banco serão armazenadas em uma tabela SQL separa.

Kafka Source Connector

Conector Kafka Microsoft SQL Server CDC Source Connector para integrar com o banco de dados, sendo responsavel por produzir as mensagens de atualização de dados cadastrais para um tópico Kafka.

cdc.info-user

Tópico Kafka responsavel por receber as atualizações de dados cadastrais, essa informação será consumida pelo serviço de push por email. O objetivo do tópico é informar a todas as partes interessadas sobre a atualização de dados cadastrais.

service--push-notification

Serviço responsavel por realizar o envio de notificações para usuários sobre as atualizações de dados. O serviço irá consumir o tópico kafka cdc.inf-user para que seja enviado sobre a atualização de dados cadastrais para o usuário.

Configurando o cluster Kafka

Kubernetes & Microk8s

Com o Microk8s instalado, deve ser instalado os plugins do registry para armazenar as imagens docker customizadas e do DNS, para que seja possivel comunicar os pods entre si pelo service e pelo localhost. Para isso, execute o comando abaixo:

microk8s enable registry dns

Agora, deve registrar a imagem do kafka connect para que instale as configurações do debezium. Para isso basta executar o comando abaixo:

# Comando cria a imagem do kafka connect com os plugins instalados
docker build -t localhost:32000/cp-server-connect-mssql:1.0.1 .

# Comando envia a imagem customizada ao registry do microk8s
docker push localhost:32000/cp-server-connect-mssql:1.0.1

Com a imagem registrada, deve acessar o diretório k8s/kafka/ e executar o comando abaixo:

kubectl apply -f no-auth/

Com isso, será criado os seguintes recursos:

Zookeeper: Serviço de coordenação para sistemas distribuídos usado pelo Kafka para gerenciamento de tópicos de brokers e offsets de consumidores.
Kafka Broker: Servidor do Kafka que armazena dados e atende clientes. Faz parte de um cluster Kafka, gerenciando a persistência e replicação de mensagens.
Kafka Connect: Serviço para integração do Kafka a outros sistemas de dados. Para conexão é realizado o uso de conectores que são responsaveis pela integração.
KsqlDB Cluster: Cluster KsqlDB é o serviço para processamento de streams de eventos em tempo real utilizando uma sintaxe semelhante ao SQL.
Confluent Control Center: Painel de controle para recursos do Kafka, que oferece monitoramento, gerenciamento e informações dos sistemas.
Confluent REST Proxy: Ferramenta que disponibiliza uma interface interface RESTful para um cluster Kafka, facilitando a produção e consumo de mensagens, visualização do estado do cluster e realização de ações administrativas sem o protocolo nativo Kafka.
Schema Registry: Repositório centralizado para o gerenciamento de esquemas do Kafka. Fornece uma camada de serviço para seus metadados e uma interface RESTful para gerenciar esquemas Avro.

Acessando o painel de control do Kafka

Com os recursos instalados no cluster Kubernetes, eles podem ser acessados através da seguintes url:

Kafka Broker: localhost:9092
Kafka Connect: http://localhost:8083
KsqlDB Cluster: http://localhost:8088
Confluent Control Center: http://localhost:9021/clusters
Confluent REST Proxy: http://localhost:8082
Schema Registry: http://localhost:8081

Criação banco de dados

Kubernetes

Para criar o banco de dados, será utilizado o Kubernetes para a infraestrutura do servidor. Para o teste local, está sendo utilizado o Microk8s.

Com o arquivo .kubeconfig configurado no seu computador, para criar o banco de dados no cluster Kubernetes, basta acessar o diretório k8s/microsoft-sql-server/ e executar o comando a seguir:

kubectl apply -k .

namespace/mssql created
service/mssql created
pod/mssql created

para validar a execução do pod do banco de dados, basta listar o pod pelo namespace com o comando a seguir:

kubectl get pods -n mssql

NAME    READY   STATUS    RESTARTS   AGE
mssql   1/1     Running   0          8m41s

Acessar o servidor de banco de dados e criando banco de dados e tabela de users

Para acessar o banco de dados, está sendo utilizado o DBeaver. Para conectar com o banco executado localmente no Microk8s, basta acessar com a host localhost, porta 3306 (porta exposta pelo service), usuario root (ou outro usuario que deseje criar) e a senha está no artefato kubernetes pod.yaml.

⚠️ Pode ser necessário criar um port forward do service do banco de dados com o localhost, para isso basta executar o comando abaixo

kubectl port-forward service/mysql 3306:3306

Conectado ao banco de dados, basta abrir uma janela de script SQL, e executar o script abaixo:

CREATE DATABASE IF NOT EXISTS userdata;

USE userdata;

CREATE TABLE IF NOT EXISTS users (
    id BINARY(16) PRIMARY KEY,
    username VARCHAR(255) NOT NULL,
    email VARCHAR(255) NOT NULL,
    password VARCHAR(255) NOT NULL,
    fullName VARCHAR(255),
    dateOfBirth DATE,
    address VARCHAR(255),
    createdAt DATE,
    lastUpdated DATE,
    status ENUM('Unconfirmed', 'Confirmed') NOT NULL
);

Criação do conector CDC

Para criar o conector CDC, será utilizado o Mysql Debezium CDC Source Connector, que será o responsavel por consumir a tabela de alteração do Bin log do Mysql e criar eventos em um tópico Kafka. Para, será realizado a criação do conector via rest API Proxy do Confluent Platform. conforme o exemplo abaixo:

curl --location 'http://localhost:8083/connectors' \
--header 'Content-Type: application/json' \
--data '{
  "name": "mysql-debezium-cdc-source-user", #nome connector
  "config": {
    "database.history.kafka.bootstrap.servers": "broker.kafka.svc.cluster.local:29092", #url cluster kafka
    "database.server.name": "userdata", #nome do database
    "schema.history.internal.kafka.bootstrap.servers": "broker.kafka.svc.cluster.local:29092", #url cluster kafka
    "schema.history.internal.kafka.topic": "schemahistory.changes", #nome tópico para alteração das tabelas monitoradas
    "debezium.source.database.history": "io.debezium.relational.history.FileDatabaseHistory", #forma de armazenamento das alterações
    "connector.class": "io.debezium.connector.mysql.MySqlConnector", #classe do connector
    "tasks.max": "1", #numero de tasks do conector em execução
    "topic.prefix": "cdc.table", #prefixo do tópico de eventos
    "database.hostname": "mysql.mysql.svc.cluster.local",
    "database.port": "3306", # porta do banco de dados
    "database.user": "root", #usuario do banco de dados
    "database.password": "*********", #senha do usuário do banco de dados
    "database.server.id": "1", # id do servidor de banco de dados
    "column.include.list": ".*id, .*fullname, .*email, .*username" #campos que deseja monitorar,
    "table.include.list": ".*users" #tabela que deseja monitorar,
    "include.schema.changes": "false", # flag para habilitar se deseja monitorar alterações nas tabelas do database
    "table.ignore.builtin": "true", #flag para ignorar database do sistema
    "database.include.list": ".*userdata" #database que deseja monitorar
  }
}'

Executado a requisição, o conector irá passar a publicar eventos de criação, alteração e deleção na tabela informada, e nestes eventos terão os campos informados na criação do connector. A seguir os exemplos das operações:

Exemplo de evento de criação de usuário

Exemplo de evento de atualização de dados de usuário

Exemplo de evento de exclusão de usuário

Name		Name	Last commit message	Last commit date
Latest commit History 45 Commits
imgs		imgs
k8s		k8s
service--push-notification		service--push-notification
service--userdata		service--userdata
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

kafka - Estudo CDC Source Connector

Sumário

Tecnologias

Arquitetura de Software para Desenvolvimento

Arquitetura dos componentes

service--userdata

userdata

Kafka Source Connector

cdc.info-user

service--push-notification

Configurando o cluster Kafka

Kubernetes & Microk8s

Acessando o painel de control do Kafka

Criação banco de dados

Kubernetes

Acessar o servidor de banco de dados e criando banco de dados e tabela de users

Criação do conector CDC

Referencias

About

Releases

Packages

Contributors 2

Languages

License

lucas-silvs/kafka--estudo-cdc-source-connector

Folders and files

Latest commit

History

Repository files navigation

kafka - Estudo CDC Source Connector

Sumário

Tecnologias

Arquitetura de Software para Desenvolvimento

Arquitetura dos componentes

service--userdata

userdata

Kafka Source Connector

cdc.info-user

service--push-notification

Configurando o cluster Kafka

Kubernetes & Microk8s

Acessando o painel de control do Kafka

Criação banco de dados

Kubernetes

Acessar o servidor de banco de dados e criando banco de dados e tabela de users

Criação do conector CDC

Referencias

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages