DuckDB mulai muncul sebagai jq yang baru
- Proyek DuckDB adalah basis data mirip SQLite untuk aplikasi data, dengan kemampuan mengimpor berbagai format data tanpa dependensi tambahan.
- File JSON dapat dibaca dan di-parse langsung sebagai tabel basis data, dan hal ini juga berlaku untuk banyak format lain.
- Saat bekerja dengan JSON, biasanya
jq digunakan, tetapi karena sintaks jq yang kompleks, menggunakan DuckDB terasa lebih nyaman bagi mereka yang sudah akrab dengan SQL.
- Sebagai contoh, setelah mengambil informasi repositori organisasi golang dalam format JSON menggunakan GitHub API, statistik tentang jenis lisensi open source dapat diperoleh dengan mudah menggunakan SQL.
- Menulis pernyataan SQL dengan DuckDB dapat dilakukan dengan mudah bahkan tanpa merujuk dokumentasi, dan menggunakan sintaks yang mirip dengan fungsi JSON di PostgreSQL.
- DuckDB juga mendukung output JSON, dan bila perlu hasilnya dapat dipercantik dengan
jq.
- Selain JSON, DuckDB juga dapat mengimpor berbagai format data seperti CSV, parquet, dan file Excel.
- Jika tidak perlu menyimpan data secara permanen, data dapat langsung di-query tanpa membuat tabel.
- DuckDB dapat membaca JSON langsung bukan hanya dari file lokal, tetapi juga dari URL.
Opini GN⁺
- DuckDB bisa menjadi alat yang menarik bagi pengguna yang sering melakukan pekerjaan terkait analisis data. Khususnya bagi mereka yang terbiasa dengan SQL, ini dapat menjadi alternatif yang kuat untuk menangani data JSON dengan mudah.
- Kemampuan DuckDB untuk membaca data JSON secara langsung menyederhanakan proses pra-pemrosesan data dan menawarkan keuntungan berupa pengurangan langkah transformasi data terpisah saat membangun pipeline data.
- Jika penggunaan DuckDB semakin meluas, dibandingkan dengan alat-alat kompleks yang sudah ada untuk analisis dan pemrosesan data, ini dapat menurunkan kurva belajar dan meningkatkan produktivitas.
- Namun, jika DuckDB masih belum dikenal luas atau dukungan komunitasnya belum memadai, pengguna mungkin akan kesulitan menemukan solusi saat menghadapi masalah.
- Proyek open source lain yang menawarkan fungsi serupa dengan DuckDB antara lain Apache Drill dan PrestoDB, yang juga mendukung kueri SQL untuk dataset berskala besar.
1 komentar
Komentar Hacker News
Kombinasi jq dan alat shell dasar
curl ... | jq '.[].license.key' | sort | uniq -c.Babashka dan Clojure
ClickHouse local CLI
Penggunaan jq, DuckDB, dan SQL
Kueri Google Sheets
Structured logging dengan database SQLite
Benthos
Nushell
pq (prql-query)
JSON dan penggunaan bahasa pemrograman