7 poin oleh xguru 2023-07-03 | 1 komentar | Bagikan ke WhatsApp
  • Implementasi open-source dari model Flamingo milik DeepMind
  • Merilis model 3B, 4B, dan 9B
    • Berbasis MPT-1B/7B dan RedPajama-3B
  • Mencapai lebih dari 80% performa model Flamingo yang sama
  • Meningkatkan kode pelatihan dan evaluasi
    • Mendukung Fully Sharded Data Parallel (FSDP)
    • Menambahkan dataset baru (TextVQA, VizWiz, HatefulMemes, Flickr30k) ke suite evaluasi