13 poin oleh xguru 2023-04-03 | 1 komentar | Bagikan ke WhatsApp
  • Perubahan format file memungkinkan penggunaan mmap() tanpa read(), sehingga kecepatan pemuatan bobot meningkat 10~100 kali
  • Kini juga mendukung 7B dalam satu file serta 13B dalam banyak file, dan kode pemuatannya menjadi jauh lebih sederhana
  • Selain itu, perubahan ini membuat tensor disejajarkan pada batas 32 byte, sehingga dapat diharapkan peningkatan performa tambahan pada prosesor tertentu