- Menyediakan cara termudah untuk memindahkan dan mentransformasikan data antar database PostgreSQL
- Streaming real-time: Mengalirkan perubahan data hampir secara real-time menggunakan replikasi logis PostgreSQL
- Penyalinan massal: Melakukan sinkronisasi data awal dengan cepat melalui penyalinan massal yang dapat diproses secara paralel
- Transformasi yang kuat: Menerapkan transformasi berbasis regular expression, menyamarkan data sensitif, dan memfilter berdasarkan nilai kolom
- Routing yang fleksibel: Mengarahkan data antar tabel dengan mulus, termasuk ke tabel dengan nama berbeda atau ke tabel yang sama melalui pemetaan kolom kustom
- Contoh aturan transformasi
- Menyamarkan alamat email: Mengubah kolom email menjadi karakter penyamaran.
- Memformat nomor telepon: Mengubah format nomor telepon menggunakan regular expression.
- Routing tabel dan pemetaan kolom
- Routing tabel yang fleksibel: Mengarahkan tabel pengguna ke tabel pelanggan, sambil memetakan ID dan nama pengguna ke ID pelanggan dan nama pelanggan.
- Routing multi-tabel: Mengarahkan tabel pesanan ke tabel transaksi, sambil memetakan ID dan jumlah total ke ID transaksi dan nilai transaksi.
- Kasus penggunaan umum
- Replikasi data real-time antar DB PostgreSQL
- Menyusun pipeline ETL dengan transformasi data
- Pengalihan ulang data, masking, dan filtering
- Menjalankan migrasi database tanpa downtime
- Event streaming dari PostgreSQL
- Cara kerjanya
- pg_flo memanfaatkan sistem replikasi logis PostgreSQL untuk menangkap dan mengalirkan perubahan data.
- Menggunakan NATS sebagai message broker untuk memisahkan pembacaan dari WAL dari proses replikator dan worker, sehingga memberikan fleksibilitas dan skalabilitas.
- Transformasi dan filtering diterapkan sebelum data mencapai tujuan.
1 komentar
Komentar Hacker News
Proyek pg_flo terlihat sangat menarik, terutama arsip ke S3 dan versi alat yang lebih murah terasa menarik
Sedang mengerjakan proyek yang menggunakan replikasi logis PostgreSQL untuk merapikan data dari database utama dan mengarsipkannya ke S3
Sedang meneliti solusi Postgres CDC dan ingin tahu apakah pg_flo bisa membantu
Berharap ini bisa menjadi alternatif Debezium
pglogical bisa berjalan di dalam Postgres, tetapi pg_flo tampaknya merupakan layanan eksternal, bukan ekstensi
Sangat antusias untuk mencoba alat ini
Ingin tahu apa bedanya dibandingkan Sequin
Sudah lama mencari alat serupa, dan waktunya terasa pas sekali
Ingin tahu apakah menggunakan replikasi lebih baik daripada melakukan backup ke S3
Alat yang sangat keren