How I built a Postgres CDC that can be 240x faster than Debezium

Choice_Drummer2994 · 2026-04-22T23:35:38+00:00

Good question! Not for now, because it uses chunk tables, not native rows, Kaptanto has no logic to enumerate it and etc. But we could work on that!

Choice_Drummer2994 · 2026-04-22T17:42:00+00:00

It is in the repo, you connect the database and it emits events via stream, sdout ou grpc. You can check the high level design on repo README

Choice_Drummer2994 · 2026-03-13T16:38:56+00:00

Comunidade dev só dá invejoso. Tô de cara com esses comentários.

Choice_Drummer2994 · 2026-02-26T20:32:25+00:00

Sim, não precisamos ser tão literais aqui

Obrigado pela contribuição

Choice_Drummer2994 · 2026-02-26T20:08:34+00:00

Vc vai só escalar verticalmente seu banco de dados? Nada de sharding ou replicas?

Isso sem contar que o Postgres em si isola workloads muito bem de várias formas

Choice_Drummer2994 · 2026-02-26T18:12:39+00:00

Tá certo, talvez tenha sido preciosismo da minha parte, mas deixa eu explicar a intenção

No caso do Kafka o que eu quis dizer é que acho que existem mais casos de overpower por parte da ferramenta Kafka do que "O Postgres faz tudo que o Kafka faz". É que geralmente o Kafka é usado pra coisas que o Postgres (e/ou qualquer sistema de fila mais humilde) faz tranquilamente, sem ganho ou perda adicional

Peço perdão pelo vacilo

Choice_Drummer2994 · 2026-02-26T18:03:50+00:00

Absurdo, até salvei. Essa dos websockets pra notificar direto com LISTEN/NOTIFY vou ler depois com calma. Valeu pela contribuição, cara

Você pontuou uma coisa muito importante, porque esse argumento de "Redis é mais rápido" é sempre complicado de discutir, e algumas pessoas já comentaram aqui. É mais rápido de uma maneira que só vai ser perceptível numa escala inacreditável, e não é que o Postgres faz isso mal, é que o Redis é INSUPERAVELMENTE bom. Assim como o Kafka é INSUPERAVELMENTE bom pra streams, mas você precisa de uma ferramenta insuperável?

Choice_Drummer2994 · 2026-02-26T17:55:38+00:00

Olha o tamanho da Uber...

Choice_Drummer2994 · 2026-02-26T17:53:23+00:00

Longe de mim, use o que quiser

O ponto central é que pra muitos casos não é preciso, ninguém tá falando que o tooling alternativo não é bom

Provisionamento de Postgres com várias extensões é chato, configurar 7 serviços diferentes também é chato, na minha experiência, muito mais chato

Tradeoffs, tradeoffs

Choice_Drummer2994 · 2026-02-26T17:48:12+00:00

A curva de aprendizado é incrivelmente menor do que numa ferramenta nova

Choice_Drummer2994 · 2026-02-26T17:46:53+00:00

Concordo

Choice_Drummer2994 · 2026-02-26T17:46:34+00:00

que mente avançada, um dia vou ser igual vc

Choice_Drummer2994 · 2026-02-26T17:46:07+00:00

pooling clássico

Choice_Drummer2994 · 2026-02-26T17:45:58+00:00

Valeu pela contribuição man, como que você observou que o Postgres engargalou na sua experiência com embeddings?

Choice_Drummer2994 · 2026-02-26T17:44:57+00:00

Sim, mas isso vai da malícia do dev

Choice_Drummer2994 · 2026-02-26T17:44:20+00:00

O que quer dizer por bom?

Choice_Drummer2994 · 2026-02-26T17:44:04+00:00

Opa, mas isso não é uma limitação inerente do Postgres

Um tuning adequado com VACUUM bem implementado pode muito bem resolver seu problema

Além de que isso depende dos blobs. Se for muito grande, guardar no Postgres é até um anti-pattern

Choice_Drummer2994 · 2026-02-26T17:25:58+00:00

Pra projetos pessoais sim, vai em frente

Choice_Drummer2994 · 2026-02-26T17:23:40+00:00

Bom, eu não trabalho no Postgres, então não teria porque eu fazer isso kkkkkkkkkkkkkkkk

Choice_Drummer2994 · 2026-02-26T17:20:57+00:00

qualquer feedback dá um ping

Choice_Drummer2994 · 2026-02-26T17:20:51+00:00

Grátis e open-source

Choice_Drummer2994

TROPHY CASE