6 poin oleh lemonmint 2024-12-06 | Belum ada komentar. | Bagikan ke WhatsApp

Google mengumumkan PaliGemma 2, model vision-language terbaru dalam keluarga produk Gemma. PaliGemma 2 dibangun di atas model Gemma 2 yang sudah ada, lalu menambahkan kemampuan untuk memahami dan berinteraksi dengan gambar sehingga memperluas kemungkinan untuk berbagai aplikasi AI.

  • Performa yang dapat diskalakan: Menyediakan berbagai ukuran model (3B, 10B, 28B parameter) dan resolusi (224px, 448px, 896px) untuk menghadirkan performa yang dioptimalkan bagi beragam tugas.
  • Pembuatan caption panjang: Menghasilkan caption gambar yang detail dan sesuai konteks, melampaui sekadar identifikasi objek dengan menjelaskan aksi, emosi, dan keseluruhan cerita dalam sebuah adegan.
  • Ekspansi ke domain baru: Menunjukkan performa unggul di berbagai bidang seperti pengenalan rumus kimia, pengenalan notasi musik, penalaran spasial, dan pembuatan laporan rontgen dada.
  • Upgrade dan fine-tuning yang mudah: Pengguna PaliGemma yang ada dapat melakukan upgrade dengan mudah, dan model ini juga dapat dengan mudah di-fine-tune agar sesuai dengan tugas dan dataset tertentu.

Perluasan ekosistem Gemmaverse:

Sejak peluncuran PaliGemma, keluarga produk Gemma telah tumbuh cepat menjadi Gemmaverse, ekosistem aktif dengan puluhan ribu model dan aplikasi. Berbagai contoh inovatif seperti kemajuan pencarian dokumen visual dari ColPali, teknik fine-tuning dari RoboFlow, dan kemajuan pelacakan objek real-time menunjukkan potensi Gemmaverse.

Belum ada komentar.

Belum ada komentar.