- Model baru OpenAI, o3 memiliki kemampuan menebak lokasi pengambilan foto dengan akurasi yang sangat mengejutkan hanya dari fotonya
- Menunjukkan proses menganalisis petunjuk visual dalam foto, lalu menarik lebih banyak detail melalui pembesaran dan pemotongan gambar
- Awalnya menebak Cambria, California, tetapi tebakan keduanya yaitu El Granada ternyata tepat
- Dengan memanfaatkan Tool-augmented Chain-of-Thought, proses analisis fotonya menunjukkan pola yang sangat inovatif
- Menekankan perlunya kewaspadaan terhadap dua sisi teknologi, sekaligus menyoroti risiko berbagi foto
Kemampuan luar biasa model o3 dalam menebak lokasi foto
- Model o3 dari OpenAI memiliki kemampuan menebak di mana sebuah foto diambil dengan akurasi yang mengejutkan hanya dari melihat fotonya
- Pengguna memberikan foto pemandangan jalan biasa tanpa landmark yang jelas, lalu meminta, "Menurutmu foto ini diambil di mana?"
- Model sempat salah paham pada awalnya dan mengira tidak bisa melihat gambar, tetapi segera mulai melakukan analisis visual
- Model mempersempit lokasi pengambilan dengan menganalisis berbagai petunjuk visual seperti rumah, taman bunga, bukit, dan rambu
Proses analisis foto oleh o3
- Model menggunakan metode memotong dan memperbesar foto untuk memeriksa pelat nomor kendaraan
- Dengan menggunakan kode Python, model memotong bagian tertentu dari gambar lalu menganalisis hasilnya
- Dari desain pelat nomor, model menyimpulkan bahwa lokasinya berada di California, lalu juga menganalisis lingkungan sekitar dan gaya arsitektur
- Dari sana, model akhirnya menebak Cambria, California dan mengajukan Half Moon Bay–El Granada sebagai alternatif kedua
Akurasi analisis dan eksperimen tambahan
- Lokasi pengambilan sebenarnya adalah El Granada, sehingga tebakan kedua model ternyata benar
- Ini menunjukkan bahwa model dapat menyimpulkan lokasi bahkan tanpa menggunakan metadata EXIF
- Saat pengguna bereksperimen dengan tangkapan layar yang sudah menghapus informasi EXIF, model tetap mampu melakukan penalaran yang akurat
- Model lain seperti Claude 3.5/3.7 Sonnet juga menunjukkan performa yang baik, tetapi tidak mendukung fitur pembesaran seperti o3
- Model Gemini kadang menggunakan informasi lokasi secara tidak akurat atau memberikan tebakan yang keliru
Sistem penalaran terhubung alat dan maknanya
- o3 mengadopsi pendekatan baru Tool-augmented Chain-of-Thought, di mana ia langsung menggunakan alat yang dibutuhkan saat "sedang berpikir"
- Pola ini menunjukkan performa yang kuat bukan hanya untuk analisis foto, tetapi juga untuk beragam tugas lain seperti pencarian
- Ke depan, pendekatan serupa diperkirakan akan menyebar ke model AI lainnya
Sisi menyenangkan dan berbahaya dari teknologi
- Mengamati proses penalaran model memberikan pengalaman yang sangat menyenangkan dan imersif
- Pada saat yang sama, penting juga untuk menyadari bahwa pelacakan lokasi lewat foto kini telah menjadi hal yang umum dimungkinkan
- Siapa pun dapat melacak lokasi pribadi hanya dari foto keseharian, sehingga perlu ada kesadaran terhadap isu privasi dan keamanan
Informasi tambahan tentang akses lokasi pada model o3
- o3 dapat merujuk pada informasi lokasi perkiraan pengguna, tetapi ini bukan faktor utama dalam penalaran lokasi yang presisi
- Bahkan tanpa metadata EXIF, model cukup akurat menganalisis foto dari wilayah yang berjarak ribuan mil
- Pengguna lain juga melakukan eksperimen di berbagai lokasi dan kembali mengonfirmasi kemampuan analisis o3
2 komentar
Bagaimana jika kita memasukkan data palsu ke EXIF?
Komentar Hacker News
Saya bermain Geoguessr kompetitif di level tinggi dan ingin menguji model ini
Saya yakin model ini tidak melihat data EXIF
Pada semua gambar yang saya coba, model dasar menentukan lokasi foto dengan akurasi sekitar 95%
Saya mencoba hal yang sama dan hasilnya lucu
o3 memodelkan lokasi pengguna secara kasar
Ini mengingatkan pada orang-orang yang kaget melihat iklan tentang hal yang baru saja mereka bicarakan saat menonton YouTubeTV
Akan ada area di mana tebakan lokasi bisa sangat akurat sampai terasa menyeramkan
Saya yakin model ini tidak melihat data EXIF
Di hari lain, hasilnya tidak terlalu mengesankan
Saya tidak yakin apakah o4-mini gagal dalam tugas ini