16 poin oleh GN⁺ 2025-05-04 | 2 komentar | Bagikan ke WhatsApp
  • Ekstensi geospasial DuckDB secara drastis menurunkan hambatan akses ke data geospasial dengan antarmuka sederhana berbasis SQL
  • Berkat itu, bahkan analis data umum dapat melakukan analisis geospasial hanya dengan dua baris kode
  • Sejak akhir 2023, minat pencarian untuk 'geospatial' meningkat tajam, dan ini bertepatan dengan waktu rilis ekstensi DuckDB
  • Penyebaran proyek geospasial modern seperti Overture Maps juga dinilai mencerminkan pengaruh DuckDB
  • Tim DuckDB menangani kompleksitas dependensi dan integrasi alat GIS secara internal untuk menyederhanakan pengalaman pengguna

Bagaimana DuckDB mengubah bidang geospasial

  • Penulis menghadiri Cloud-Native Geospatial Conference 2025 yang baru-baru ini digelar dan membahas demokratisasi data geospasial
  • Topik utamanya adalah bagaimana data geospasial dapat diperluas ke lebih banyak sektor industri, dan DuckDB berada di pusat pembahasan itu
  • Hingga akhir 2023, volume pencarian untuk kata kunci ‘geospatial’ cenderung stagnan, tetapi setelah rilis ekstensi geospasial DuckDB, angkanya naik tajam
  • Seolah membuktikan pengaruh DuckDB, di Google Trends kata kunci DuckDB dan geospatial juga menunjukkan tren kenaikan bersama
  • Tentu saja, hubungan sebab-akibat tidak bisa dipastikan, tetapi penulis menilai korelasi ini bermakna

Analisis geospasial hanya dengan dua baris

install spatial;   
load spatial;  
  • Sebelumnya, orang harus memasang atau mengompilasi banyak paket, lalu membangun database secara terpisah
  • Sebaliknya, DuckDB menyediakan lingkungan analisis geospasial lengkap lewat satu antarmuka SQL
  • Hasilnya, siapa pun yang bisa menggunakan SQL dapat mengaksesnya dengan mudah, sekaligus mengurangi beban infrastruktur TI

Overture Maps juga berkat DuckDB?

  • Penulis mempertanyakan apakah adopsi sukses Overture Maps Foundation akan mungkin terjadi tanpa DuckDB
  • Ia memperkirakan bahwa tanpa DuckDB, hambatan awal untuk menangani data geospasial akan terlalu tinggi

Diskusi tambahan di Hacker News

  • Pengembang DuckDB, Max, menekankan bahwa mereka membundel alat GIS FOSS seperti PROJ DB, GDAL, dan QGIS secara internal untuk menghilangkan dependensi
  • Berkat itu, alat ini dapat digunakan di berbagai platform seperti WASM tanpa proses instalasi yang rumit
  • Selain itu, fitur berperforma tinggi seperti eksekusi vektorisasi out-of-core dan penyimpanan terkompresi berbasis kolom juga sudah terintegrasi
  • Belakangan ini, pengembangan mesin geometri baru dan fitur optimasi spatial join juga telah masuk ke branch dev

Kesimpulan

  • DuckDB menghilangkan masalah instalasi dan keterhubungan alat geospasial yang kompleks, lalu menyediakan semuanya bersama SQL
  • Karena itu, DuckDB dinilai sebagai perangkat lunak yang memberi kontribusi menentukan bagi demokratisasi data geospasial

2 komentar

 
zihado 2025-05-05

DuckDB benar-benar sedang melesat.

 
GN⁺ 2025-05-04
Opini Hacker News
  • Saya menyukai DuckDB dan terutama melakukan analisis geospasial. Biasanya saya membagi wilayah geografis menggunakan heksagon Uber H3, menghitung jarak Haversine, menghitung luas geometris, dan menentukan titik termasuk ke geometri yang mana. Fitur-fitur ini sudah ada di geopandas atau postgis, jadi ekstensi spasial DuckDB tidak menawarkan sesuatu yang benar-benar baru

    • Namun, mesin DuckDB memungkinkan bekerja langsung dengan file parquet/geoparquet dalam skala besar di desktop lokal. Dalam hal ini, DuckDB lebih unggul daripada geopandas. Kualitas hidup jadi lebih baik
    • DuckDB memiliki arsitektur ekstensi yang memungkinkan fitur geospasial yang unik seperti kurva Hilbert dan dukungan Uber H3
  • Dulu saya harus memasang atau mengompilasi beberapa paket open source, mencatat lokasi path dengan cermat, dan membangun database khusus. Itu adalah beban kerja yang mungkin tidak akan dicoba oleh generalis data atau tidak didukung oleh departemen TI

    • Saya sudah memakai CREATE EXTENSION postgis; selama lebih dari 10 tahun. PG, MySQL, Oracle, MS SQL Server, dan SQLite sudah lama punya ekstensi spasial. DuckDB tidak benar-benar membuat perbedaan dalam hal kemudahan instalasi
  • Ada juga import geopandas, dan itu sudah digunakan cukup lama. Terlepas dari nada sarkastik, saya penasaran apa yang sebenarnya istimewa dari DuckDB. Kalau penulis menunjukkan contoh nyata, saya mungkin bisa lebih memahami klaim mereka

  • Perangkat lunak yang paling saya nantikan saat mengerjakan aplikasi geospasial adalah Felt. Saya berharap mereka memperluas alatnya agar developer bisa mengontrol autentikasi/otorisasi peta dan sumber data, sehingga isolasi tenant dimungkinkan dan akses ke data proprietari bisa dilakukan. Ini bisa merevolusi cara teknologi geospasial diintegrasikan ke aplikasi konsumen

    • Tulisan ini tidak mengakui betapa niche-nya hal-hal seperti ini. Perlu banyak edukasi tentang sistem koordinat, proyeksi, transformasi, dan sebagainya. Jika memungkinkan, saya ingin mengganti banyak alat pemetaan kustom dengan Felt. Itu akan membuat saya bisa fokus pada proses inti geospasial tanpa harus fokus pada kode untuk menampilkan dan memanipulasinya di browser. Dari sisi LOC yang harus dipelihara, ini hampir sama atau bahkan lebih besar
    • Seperti disebut di komentar lain, DX DuckDB yang dijelaskan pada dasarnya sama dengan PostGIS
  • Saya tidak menganggap "instalasi geospasial" sebagai game changer dari sisi kesederhanaan dibanding pip install geopandas

    • Keduanya sama-sama satu baris
  • Apakah itu jauh lebih sederhana daripada 'load extension postgis'? geos dan gdal memang selalu agak merepotkan, tetapi saya merasa docker sudah mengabstraksikan semuanya. 'docker pull postgis' cukup mudah. Saya tidak familier dengan hal lain yang ditawarkan DuckDB

  • Saya meninggalkan komentar untuk mempromosikan proyek serupa. Saya sedang mengerjakan ekstensi geospasial untuk Polars. Ini belum stabil, tetapi sudah sangat dekat, dan fungsinya hampir lengkap (setara GeoPandas dengan GEOS dan PROJ sebagai backend)

  • Seberapa besar ukuran data set-nya? Di perusahaan kami mencoba memakai DuckDB untuk data transaksi dan pelaporan keuangan. Data set-nya sekitar 500GB CSV di S3, dan DuckDB tidak bisa menanganinya

  • Ada kekhawatiran soal lisensi DuckDB dan GEOS. Yang pertama berlisensi MIT dan yang kedua LGPL 2.1

    • Ini menyebabkan situasi rumit di mana beberapa build melanggar LGPL 2.1. Misalnya, static linking dengan aplikasi closed source
  • DuckDB memang hebat untuk geospasial, tetapi apakah ini yang paling penting dalam 10 tahun terakhir? Ada banyak alat di berbagai kategori, jadi bagi saya ini tidak masuk posisi teratas. Ada QGIS, postGIS (masih standar), ArcGIS Online (masih standar), alat pemetaan JS seperti mapbox (saya lebih suka deckgl), jenis data baru seperti COG, geopackage, geoparquet, alat fotogrametri, 3D tiles, gdal dan pdal, serta pustaka inti seperti shapely