- Ekstensi geospasial DuckDB secara drastis menurunkan hambatan akses ke data geospasial dengan antarmuka sederhana berbasis SQL
- Berkat itu, bahkan analis data umum dapat melakukan analisis geospasial hanya dengan dua baris kode
- Sejak akhir 2023, minat pencarian untuk 'geospatial' meningkat tajam, dan ini bertepatan dengan waktu rilis ekstensi DuckDB
- Penyebaran proyek geospasial modern seperti Overture Maps juga dinilai mencerminkan pengaruh DuckDB
- Tim DuckDB menangani kompleksitas dependensi dan integrasi alat GIS secara internal untuk menyederhanakan pengalaman pengguna
Bagaimana DuckDB mengubah bidang geospasial
- Penulis menghadiri Cloud-Native Geospatial Conference 2025 yang baru-baru ini digelar dan membahas demokratisasi data geospasial
- Topik utamanya adalah bagaimana data geospasial dapat diperluas ke lebih banyak sektor industri, dan DuckDB berada di pusat pembahasan itu
- Hingga akhir 2023, volume pencarian untuk kata kunci ‘geospatial’ cenderung stagnan, tetapi setelah rilis ekstensi geospasial DuckDB, angkanya naik tajam
- Seolah membuktikan pengaruh DuckDB, di Google Trends kata kunci DuckDB dan geospatial juga menunjukkan tren kenaikan bersama
- Tentu saja, hubungan sebab-akibat tidak bisa dipastikan, tetapi penulis menilai korelasi ini bermakna
Analisis geospasial hanya dengan dua baris
install spatial;
load spatial;
- Sebelumnya, orang harus memasang atau mengompilasi banyak paket, lalu membangun database secara terpisah
- Sebaliknya, DuckDB menyediakan lingkungan analisis geospasial lengkap lewat satu antarmuka SQL
- Hasilnya, siapa pun yang bisa menggunakan SQL dapat mengaksesnya dengan mudah, sekaligus mengurangi beban infrastruktur TI
Overture Maps juga berkat DuckDB?
- Penulis mempertanyakan apakah adopsi sukses Overture Maps Foundation akan mungkin terjadi tanpa DuckDB
- Ia memperkirakan bahwa tanpa DuckDB, hambatan awal untuk menangani data geospasial akan terlalu tinggi
Diskusi tambahan di Hacker News
- Pengembang DuckDB, Max, menekankan bahwa mereka membundel alat GIS FOSS seperti PROJ DB, GDAL, dan QGIS secara internal untuk menghilangkan dependensi
- Berkat itu, alat ini dapat digunakan di berbagai platform seperti WASM tanpa proses instalasi yang rumit
- Selain itu, fitur berperforma tinggi seperti eksekusi vektorisasi out-of-core dan penyimpanan terkompresi berbasis kolom juga sudah terintegrasi
- Belakangan ini, pengembangan mesin geometri baru dan fitur optimasi spatial join juga telah masuk ke branch dev
Kesimpulan
- DuckDB menghilangkan masalah instalasi dan keterhubungan alat geospasial yang kompleks, lalu menyediakan semuanya bersama SQL
- Karena itu, DuckDB dinilai sebagai perangkat lunak yang memberi kontribusi menentukan bagi demokratisasi data geospasial
2 komentar
DuckDB benar-benar sedang melesat.
Opini Hacker News
Saya menyukai DuckDB dan terutama melakukan analisis geospasial. Biasanya saya membagi wilayah geografis menggunakan heksagon Uber H3, menghitung jarak Haversine, menghitung luas geometris, dan menentukan titik termasuk ke geometri yang mana. Fitur-fitur ini sudah ada di geopandas atau postgis, jadi ekstensi spasial DuckDB tidak menawarkan sesuatu yang benar-benar baru
Dulu saya harus memasang atau mengompilasi beberapa paket open source, mencatat lokasi path dengan cermat, dan membangun database khusus. Itu adalah beban kerja yang mungkin tidak akan dicoba oleh generalis data atau tidak didukung oleh departemen TI
CREATE EXTENSION postgis;selama lebih dari 10 tahun. PG, MySQL, Oracle, MS SQL Server, dan SQLite sudah lama punya ekstensi spasial. DuckDB tidak benar-benar membuat perbedaan dalam hal kemudahan instalasiAda juga
import geopandas, dan itu sudah digunakan cukup lama. Terlepas dari nada sarkastik, saya penasaran apa yang sebenarnya istimewa dari DuckDB. Kalau penulis menunjukkan contoh nyata, saya mungkin bisa lebih memahami klaim merekaPerangkat lunak yang paling saya nantikan saat mengerjakan aplikasi geospasial adalah Felt. Saya berharap mereka memperluas alatnya agar developer bisa mengontrol autentikasi/otorisasi peta dan sumber data, sehingga isolasi tenant dimungkinkan dan akses ke data proprietari bisa dilakukan. Ini bisa merevolusi cara teknologi geospasial diintegrasikan ke aplikasi konsumen
Saya tidak menganggap "instalasi geospasial" sebagai game changer dari sisi kesederhanaan dibanding
pip install geopandasApakah itu jauh lebih sederhana daripada 'load extension postgis'? geos dan gdal memang selalu agak merepotkan, tetapi saya merasa docker sudah mengabstraksikan semuanya. 'docker pull postgis' cukup mudah. Saya tidak familier dengan hal lain yang ditawarkan DuckDB
Saya meninggalkan komentar untuk mempromosikan proyek serupa. Saya sedang mengerjakan ekstensi geospasial untuk Polars. Ini belum stabil, tetapi sudah sangat dekat, dan fungsinya hampir lengkap (setara GeoPandas dengan GEOS dan PROJ sebagai backend)
Seberapa besar ukuran data set-nya? Di perusahaan kami mencoba memakai DuckDB untuk data transaksi dan pelaporan keuangan. Data set-nya sekitar 500GB CSV di S3, dan DuckDB tidak bisa menanganinya
Ada kekhawatiran soal lisensi DuckDB dan GEOS. Yang pertama berlisensi MIT dan yang kedua LGPL 2.1
DuckDB memang hebat untuk geospasial, tetapi apakah ini yang paling penting dalam 10 tahun terakhir? Ada banyak alat di berbagai kategori, jadi bagi saya ini tidak masuk posisi teratas. Ada QGIS, postGIS (masih standar), ArcGIS Online (masih standar), alat pemetaan JS seperti mapbox (saya lebih suka deckgl), jenis data baru seperti COG, geopackage, geoparquet, alat fotogrametri, 3D tiles, gdal dan pdal, serta pustaka inti seperti shapely