Cara Menggunakan DuckDB (DuckDB Python + Jupyter Lab)
(zzsza.github.io)Ini adalah artikel yang merangkum cara menggunakan DuckDB, yang belakangan ini mendapat banyak perhatian di antara proyek open-source OLAP.
Artikel ini juga membahas bagaimana DuckDB dapat dimanfaatkan di Jupyter Lab, dan saya juga menambahkan beberapa extension yang menurut saya mengesankan.
Anda bisa langsung melakukan kueri pada file Parquet di S3 dan menggunakannya dengan mudah, jadi tampaknya ini benar-benar bisa menggantikan Athena. Area penggunaan Pandas juga sepertinya semuanya bisa digantikan.
Daftar isi
- Pengenalan DuckDB, apa itu DuckDB?
- BIG DATA IS DEAD
- Tujuan DuckDB & keunggulan DuckDB
-
- Simple
-
- Portable
-
- Feature Rich
-
- Fast
-
- Extensible
-
- Free
-
- Thorough Testing
- Benchmark performa DuckDB
- Instalasi DuckDB
-
- Menjalankan DuckDB
- Menjalankan secara sederhana (DuckDB Python)
- Data Load
- Menjalankannya dengan lebih nyaman menggunakan jupysql
- Sintaks SQL
- Secrets Manager
- DuckDB Extension
- bigquery
- h3
- pg_duckdb
- vss(Vector Similarity Search)
- Cara memanfaatkan DuckDB
- Contoh penggunaan di BigQuery
- Menggunakannya seperti data warehouse lokal (pengganti Pandas)
- Sebagai mesin analitik ringan yang digunakan saat dibutuhkan
- Digunakan pada tahap transform dalam pipeline ETL, ELT
- Melakukan kueri Parquet yang ada di GCS
- Ringkasan
- Referensi
2 komentar
Terima kasih atas materi yang bagus.
Terima kasih sudah membaca!!