22 poin oleh xguru 2023-03-30 | Belum ada komentar. | Bagikan ke WhatsApp
  • Sistem minimal untuk menjalankan LLM terbaru di GPU Nvidia konsumen
  • Mendukung beberapa LLM (LLAMA, BLOOM, OPT) hingga skala 170B
  • Mendukung berbagai jenis GPU Nvidia
  • Kode kecil berbasis Python yang mudah digunakan
  • Secara internal menggunakan algoritme GPTQ untuk kompresi 3-bit guna meminimalkan penggunaan memori GPU

Belum ada komentar.

Belum ada komentar.