ImageBind - model AI multimodal dari Meta
(imagebind.metademolab.com)- Bahkan tanpa supervisi, dapat mengikat data dari 6 modalitas sekaligus untuk menganalisis berbagai jenis informasi dengan lebih baik
- gambar, video, audio, teks, kedalaman, thermal, IMU (unit pengukuran inersia)
- Memungkinkan pembuatan gambar berdasarkan suara, atau pencarian informasi dengan menggabungkan data audio/video/gambar/kedalaman
- Kinerja pengenalan Zero-shot / Few-Shot yang sangat baik
Belum ada komentar.