OpenFlamingo - framework open-source untuk melatih/mengevaluasi model multimodal skala besar (LMM)

xguru · 2023-03-31T10:15:01+09:00

Bertujuan mengembangkan sistem multimodal yang dapat memproses input gambar/teks secara bersamaan seperti GPT-4 Untuk itu, model Flamingo dari DeepMind, yaitu LMM (Large Multimodal Model) yang memproses dan melakukan inferensi pada gambar/video/teks, diimplementasikan sebagai open source Yang termasuk dalam rilis pertama Framework Python untuk melatih LMM bergaya Flamingo Dataset multimodal skala besar dengan gambar/teks yang saling terinterleaving Benchmark evaluasi pembelajaran in-context untuk tugas vision-language Model OpenFlamingo-9B berbasis LLaMA Karena dataset pelatihan Flamingo tidak dipublikasikan, pelatihan dilakukan dengan dataset Multimodal C4 dari LAION-2B serta 5 juta sampel yang diekstrak dari 10 juta sampel

(laion.ai)

11 poin oleh xguru 2023-03-31 | 1 komentar | Bagikan ke WhatsApp

Bertujuan mengembangkan sistem multimodal yang dapat memproses input gambar/teks secara bersamaan seperti GPT-4
Untuk itu, model Flamingo dari DeepMind, yaitu LMM (Large Multimodal Model) yang memproses dan melakukan inferensi pada gambar/video/teks, diimplementasikan sebagai open source
Yang termasuk dalam rilis pertama
- Framework Python untuk melatih LMM bergaya Flamingo
- Dataset multimodal skala besar dengan gambar/teks yang saling terinterleaving
- Benchmark evaluasi pembelajaran in-context untuk tugas vision-language
- Model OpenFlamingo-9B berbasis LLaMA
Karena dataset pelatihan Flamingo tidak dipublikasikan, pelatihan dilakukan dengan dataset Multimodal C4 dari LAION-2B serta 5 juta sampel yang diekstrak dari 10 juta sampel

1 komentar

xguru 2023-03-31

Flamingo: Model Bahasa Visual untuk Few-Shot Learning

OpenFlamingo - framework open-source untuk melatih/mengevaluasi model multimodal skala besar (LMM)

Bacaan terkait

1 komentar