- Niantic sedang mengembangkan Large Geospatial Model (LGM), yang memanfaatkan pembelajaran mesin berskala besar untuk memahami suatu adegan dan menghubungkannya dengan jutaan adegan lain di seluruh dunia
- Manusia dapat membayangkan struktur dari berbagai sudut berkat kemampuan pemahaman spasial, tetapi ini merupakan tugas yang sulit bagi mesin
- Visual Positioning System(VPS) milik Niantic telah melatih lebih dari 5 miliar neural network agar dapat beroperasi di lebih dari 1 juta lokasi
- Apa itu Large Geospatial Model?
- LGM membantu komputer mengenali, memahami, dan menavigasi dunia fisik
- Mirip dengan LLM, LGM dibangun menggunakan sejumlah besar data mentah, yang memungkinkan pemahaman berbasis lokasi tentang ruang, struktur, dan interaksi fisik
- Melampaui model visi 3D, model geospasial berakar pada lokasi geografis tertentu dan dapat diukur dengan satuan skala yang presisi
- Status pekerjaan Niantic
- Selama 5 tahun terakhir, Niantic telah membangun VPS agar pengguna dapat menempatkan konten digital secara akurat di lingkungan fisik
- VPS dibangun melalui pemindaian pengguna, yaitu data yang dikumpulkan dari sudut pandang pejalan kaki, termasuk tempat-tempat yang tidak dapat diakses dengan mobil
- Saat ini ada 10 juta lokasi yang telah dipindai di seluruh dunia, dan 1 juta pemindaian baru dikumpulkan setiap minggu
- Dari sistem lokal ke pemahaman bersama
- Neural map saat ini adalah model geospasial yang dapat digunakan, tetapi LGM memiliki visi yang melampaui peta lokal yang berdiri sendiri
- LGM memungkinkan berbagi data antar model lokal dan dapat menyimpulkan bagian belakang bangunan dari lokasi tertentu
- Ini mewujudkan pemahaman dunia yang terpusat berdasarkan data geospasial dan visual
- Pemahaman seperti manusia
- Manusia memiliki kemampuan untuk mengenali apa yang mereka lihat dari sudut yang berbeda
- Pemahaman semacam ini secara realistis hanya dapat dicapai melalui pembelajaran mesin berskala besar, dan itulah yang menjadi tujuan Niantic
- Berkembang menjadi foundation model yang saling melengkapi
- LGM dapat digunakan bukan hanya untuk penentuan lokasi sederhana, tetapi juga memungkinkan cara baru untuk merepresentasikan, memanipulasi, dan menghasilkan adegan
- Berbagai jenis foundation model saling melengkapi satu sama lain, dan sistem ini memungkinkan pengenalan, pemahaman, serta pengoperasian dunia fisik
- Niantic bertujuan memimpin pengembangan Large Geospatial Model berskala besar untuk menghadirkan pengalaman baru bagi pengguna
1 komentar
Komentar Hacker News
Sebagai pemain Pokémon GO, rasanya seperti saya memberikan data pelatihan lewat permainan ini dan mereka mendapat keuntungan dari kerja saya. Saya berhenti memindai PokéStop karena usaha yang dibutuhkan terlalu besar dibanding imbalannya. Jika mereka merilis model dan bobotnya, saya akan merasa itu berkontribusi pada kepentingan publik yang lebih besar.
Saya jarang memakai teknologi AR di Pokémon GO karena lambat, jadi mengejutkan bahwa sekarang teknologinya sudah berkembang sampai bisa dipakai untuk melatih LGM. Secara ekonomi juga masuk akal: pemain mendapat game gratis, Niantic mendapat keuntungan, dan teknologi baru diberikan ke dunia.
Di MyFitnessPal, saat pengguna memindai barcode, aplikasi itu mengumpulkan kebisingan latar untuk dipakai sebagai data pelatihan. Dari situ mereka bisa mendapatkan informasi tentang dapur penyimpanan bahan makanan rata-rata, kulkas, dan lorong supermarket.
Postingan blog ini dan reaksi HN membingungkan. Sebenarnya mereka belum melatih modelnya, hanya mengumumkan rencananya. Mereka bilang telah melatih 50 juta jaringan saraf, tetapi itu tampaknya hanya bagian dari pekerjaan yang sudah mereka lakukan sebelumnya. Ini terlihat seperti dokumen visi untuk memosisikan Niantic sebagai perusahaan AI.
Ada pendapat filosofis bahwa data geospasial seharusnya menjadi barang publik. Karena data hasil crowdsourcing berasal dari orang biasa, pengetahuan dan fakta semestinya menjadi aset publik.
Saya tidak berpikir membuat adegan 3D secara real-time adalah masa depan peta. Gedung, jalan, rambu, dan sebagainya sangat statis, dan untuk sebagian besar kasus penggunaan tidak banyak berubah. Akan lebih berguna jika model yang akurat diambil dari cloud.
Mungkin dalam rapat Google/Niantic muncul ide untuk membangun generasi baru model 3D lewat crowdsourcing. Lalu mereka membeli hak Pokémon untuk mewujudkannya.
Brian Maclendon (Niantic) menyampaikan detail menarik tentang ini dalam presentasi Bellingfest.
Sulit memahami apa itu LGM. Ini tampaknya bukan tentang data geospasial, melainkan tentang peningkatan model visi yang memprediksi bagian belakang bangunan. Data pelatihannya berasal dari gambar yang dihasilkan saat menangkap Pokémon.
Ada pendapat bahwa CIA mungkin sudah memiliki akses. Kekhawatiran soal privasi sudah muncul sejak beberapa tahun lalu.