3 poin oleh GN⁺ 2025-03-24 | 2 komentar | Bagikan ke WhatsApp
  • Mozilla.ai meyakini bahwa kecerdasan buatan (AI) menawarkan banyak peluang untuk memperkuat komunitas melalui kolaborasi terbuka.
  • Peluang-peluang ini harus dirancang dengan hati-hati, dan kekhawatiran terhadap penggunaan AI yang berlebihan semakin meningkat.
  • Dengan latar belakang ini, mereka mengembangkan dan merilis OpenStreetMap AI Helper Blueprint.
  • Mengapa OpenStreetMap?
    • Data adalah komponen penting bagi aplikasi AI, dan OpenStreetMap memiliki komunitas aktif yang menjaga basis data peta terbuka paling lengkap.
    • OpenStreetMap menyediakan beragam data seperti jalan, stasiun kereta, dan lainnya, yang bila digabungkan dengan citra satelit menawarkan kemungkinan tak terbatas untuk melatih berbagai model AI.
    • Tujuannya adalah mempercepat bagian-bagian lambat dari proses pemetaan dengan AI, sambil mempertahankan verifikasi manusia pada bagian yang penting.
  • Mengapa computer vision?
    • Banyak fitur peta direpresentasikan sebagai poligon, dan pekerjaan untuk menemukannya serta menggambarnya memakan banyak waktu.
    • Model computer vision dapat melakukan tugas-tugas ini dengan mudah jika tersedia data yang cukup.
    • Model YOLOv11 dan SAM2 digunakan untuk tugas deteksi objek dan segmentasi, dan model-model ini ringan, cepat, serta ramah untuk dijalankan secara lokal.
  • OpenStreetMap AI Helper Blueprint
    • Langkah 1: Membuat dataset deteksi objek dari OpenStreetMap
      • Menggabungkan data OpenStreetMap dengan citra satelit lalu mengubahnya ke format yang sesuai untuk pelatihan.
      • Mengunduh data wilayah yang diminati menggunakan Nominatim API dan Overpass API, lalu menyimpannya dalam format Ultralytics YOLO.
    • Langkah 2: Fine-tuning model deteksi objek
      • Melakukan fine-tuning pada model YOLOv11 dan mengunggahnya ke Hugging Face Hub.
    • Langkah 3: Berkontribusi ke OpenStreetMap
      • Menggunakan model hasil fine-tuning untuk menjalankan inferensi pada beberapa tile, lalu memverifikasi objek baru secara manual sebelum mengunggahnya ke OpenStreetMap.
  • Pemikiran penutup
    • OpenStreetMap adalah contoh kuat dari kolaborasi terbuka yang dipimpin komunitas untuk membangun peta dunia.
    • OpenStreetMap AI Helper Blueprint menunjukkan bahwa AI dapat meningkatkan kontribusi manusia, sekaligus menekankan nilai data berkualitas tinggi.
    • Dengan Blueprint ini, sekitar 5 kali lebih banyak kolam renang dapat dipetakan dalam waktu yang sama dibandingkan pekerjaan manual.
    • Disarankan untuk bereksperimen melatih model untuk fitur peta lainnya, serta berkontribusi atau memperluas proyek ini.

2 komentar

 
depth221 2025-03-24

Setelah saya cari, sepertinya Map Feature biasanya diterjemahkan sebagai (fitur) objek peta.

 
GN⁺ 2025-03-24
Komentar Hacker News
  • Salam dari OpenStreetMap Foundation. Fitur yang terdeteksi AI tidak boleh langsung ditambahkan ke basis data

    • Algoritme memiliki masalah deteksi palsu dan masalah memetakan objek garis lurus atau persegi panjang menjadi goyah
    • Ini berguna sebagai alat untuk mendeteksi fitur yang hilang, tetapi tetap perlu campur tangan manusia untuk memastikan objek yang terdeteksi telah digambar dengan benar
    • Panduan terkait dapat dilihat di wiki OpenStreetMap
  • Setelah deteksi kolam renang, saya juga ingin mencoba deteksi panel surya

    • Ada banyak pendapat yang menolak gagasan bahwa OSM bisa terus berkembang hanya dengan kerja manual
    • Saya telah membuat 60.000 perubahan selama 10 tahun, tetapi semangat relawan manusia saja tidak cukup untuk menyelesaikan pemetaan pada skala global
    • Kita memerlukan kerangka kerja yang dapat diskalakan untuk memberi anotasi pada kualitas data, sumber, cara pelaporan bug, dan panduan bagi konsumen
    • Misalnya, saat ingin melakukan kueri seperti "bisnis tipe X yang dipetakan manusia selama 1 tahun terakhir", hal itu sampai batas tertentu bisa dilakukan dengan "tanggal pemeriksaan"
    • Namun kita tidak tahu akurasi atributnya atau apakah pemeta hanya memverifikasi nama/lokasinya saja
    • Mungkin akan lebih baik mengumpulkan jam operasional semua tempat agar data bisa dipelihara otomatis setiap bulan
    • Sebagai konsumen data, mungkin akan lebih baik jika kita bisa memfilter hanya sumber tertentu yang tepercaya
    • Data tetap bisa digunakan meskipun ada batasan seperti POI yang diinferensikan oleh AI
  • Setelah mengalami pemetaan otomatis secara langsung, saya menjadi sangat waspada

    • Saya bepergian dengan motor di Amerika Selatan, dan di OSM ada banyak edit yang tampak seperti hasil otomatisasi sehingga di beberapa wilayah hampir tidak bisa digunakan
    • Ini terjadi bukan hanya di jalan pedesaan, tetapi juga di kota yang cukup besar
  • Saya pernah bekerja di bidang ini beberapa tahun lalu

    • Ada banyak model, dataset, alat, dan sebagainya yang sudah ada
    • Materi terkait bisa dilihat di GitHub
  • Kita memetakan informasi nyata di lapangan, bukan apa yang terlihat di citra satelit

    • Jangan berkontribusi pada hal-hal yang dibayangkan oleh AI
  • Google tidak mengizinkan ini, tetapi Mapbox mengizinkannya jika untuk tujuan nonkomersial atau digunakan di OSM

    • Anda bisa menggunakan citra satelit Mapbox untuk membuat dataset vektor turunan
  • Saya berharap Mozilla fokus membuat browser yang bagus

  • Beberapa bulan lalu saya melakukan pekerjaan serupa (data geografis skala kecil)

    • Materi terkait bisa dilihat di GitHub
  • Saya ingin melihat detail tentang cara melakukan fine-tuning SAM/2 untuk mendeteksi kolam renang atau susunan panel surya

    • Ini berguna untuk proyek ketahanan komunitas, tetapi saya tidak berhasil mengikuti fine-tuning SAM2
    • Model Yolov8 cukup baik dalam menemukan dan melakukan segmentasi panel surya, tetapi tepinya sangat buruk sehingga butuh banyak pekerjaan
    • Hasil yang dilatih dengan SAM2 tampak jauh lebih baik
    • Karena masalah akurasi, saya tidak akan menambahkannya ke OSM, tetapi bisa dipakai di tempat lain
  • Dulu ini disebut 'head-up digitizing'