ONE-PEACE: model representasi umum untuk multimodalitas tanpa batas
(github.com/OFA-Sys)- General Representation Model yang mencakup modalitas visi, audio, dan bahasa
- Memberikan hasil yang sangat baik pada tugas-tugas terintegrasi bahkan tanpa model pralatih
- Dengan Emergent Zero-shot Retrieval yang kuat, dapat menyelaraskan modalitas yang tidak dipasangkan dalam data pelatihan
- Audio-to-Image, Audio+Text-to-Image, Audio+Image-to-Image
1 komentar
Kelihatannya model ini memecahkan rekor SOTA di banyak tugas.