8 poin oleh xguru 2022-06-30 | 1 komentar | Bagikan ke WhatsApp
  • Mengonversi file Web ARChive (.warc) ke format Apache Parquet berbasis kolom
  • Parquet dapat dimuat ke DuckDB untuk di-query dengan mudah
  • Open source Rust

1 komentar

 
xguru 2022-06-30

DuckDB - Embedded OLAP DB open source

Mirip dengan WarcDB - data web crawl sebagai SQLite DB yang sempat naik beberapa waktu lalu.
Namun, di tempat yang sudah punya infrastruktur yang menggunakan Parquet, sepertinya ini akan lebih mudah dipakai