2 poin oleh mrchypark 2026-01-06 | Belum ada komentar. | Bagikan ke WhatsApp

Saat menggunakan DuckDB untuk pekerjaan analitik,
saya merasa banyak hal sudah bisa dilakukan hanya dengan SQL.

Namun secara pribadi,
ketika menulis SQL, makin panjang proses analisisnya
pola penggunaan CTE yang semakin banyak terus berulang.

Karena jika status perantara tidak diberi nama dan dipatok,
saya sendiri pun mudah kehilangan jejak
urutan pemikiran saat membangun kueri ini.


Mengapa sintaks dplyr terlintas di benak

Mungkin karena saya sudah lama menggunakan R,
sintaks dplyr yang menangani tabel secara bertahap
seperti filter → mutate → group_by → summarise
terus tertinggal di kepala saya.

Pekerjaan yang sama tentu bisa dilakukan dengan SQL,
namun saya merasa agak kurang nyaman
untuk meninggalkan urutan berpikir itu apa adanya di dalam kode.


Jadi saya mencoba eksperimen kecil di atas DuckDB

Saya tidak ingin memasang runtime R lagi,
dan di sisi lain sulit juga menjelaskan nuansa ini hanya dengan kata-kata,
jadi saya membuat eksperimen kecil dalam bentuk extension DuckDB
yang mengubah pipeline bergaya dplyr menjadi SQL.

Untuk saat ini, yang ditangani baru sebatas berikut.

  • select, filter, mutate
  • arrange
  • group_by, summarise
  • fungsi agregasi dasar

Join atau restrukturisasi yang kompleks (seperti pivot) masih belum ditangani.
Ini juga bukan proyek yang menargetkan kompatibilitas dplyr secara penuh.
Untuk saat ini, ini masih eksperimen yang berangkat dari ketidaknyamanan pribadi saya,
jadi saya juga penasaran dengan pendapat orang-orang yang pernah memikirkan hal serupa.

Belum ada komentar.

Belum ada komentar.