9 poin oleh xguru 2022-12-10 | 1 komentar | Bagikan ke WhatsApp
  • Diam-diam dirilis melalui commit di GitHub
  • Dilatih melalui lebih banyak epoch bersama normalisasi, dan menunjukkan performa yang meningkat dibanding model sebelumnya
  • Arsitekturnya tetap sama seperti sebelumnya
  • Saat memanggil load_model("large"), model large-v2 akan dimuat
  • Makalah terkait model ini akan segera dipublikasikan
  • Epoch: semua data yang termasuk dalam dataset pelatihan melewati model masing-masing satu kali (Forward Pass/Backward Pass). Dengan kata lain, ini adalah satuan untuk satu kali pembelajaran seluruh dataset