Membandingkan seberapa baik VLM dapat memprediksi arah pandang pengguna dengan data eye-tracking nyata
(arxiv.org)Halo. Karena selalu ada orang lain yang mengunggah berita lain lebih cepat daripada saya, akhirnya Show GN ini jadi tulisan pertama saya.
Saya penasaran apakah VLM bisa memprediksi ke mana pengguna melihat pada UI, jadi saya melakukan eksperimen sendiri dan merangkumnya dalam sebuah makalah.
Dengan menggunakan dataset bernama UEyes, saya membandingkan hasil prediksi pandangan dari VLM dengan data eye-tracking nyata.
Saya juga menghubungi penulis pertama UEyes(cs.HC) 1 untuk endorsement di arXiv, dan beliau dengan senang hati menyetujuinya.
paper: https://arxiv.org/abs/2604.26352
github: https://github.com/dunward/uigaze
Belum ada komentar.