4 poin oleh xguru 2023-01-03 | 3 komentar | Bagikan ke WhatsApp
  • Menjalankan model bahasa superbesar seperti BLOOM-176B secara "kolaboratif"
    • Hubungkan GPU Anda ke Petals
    • Masing-masing memuat sebagian model, lalu bersama orang lain menjalankan inferensi dan fine-tuning
  • Inferensi sekitar 1 detik per langkah (token), 10x lebih cepat daripada offloading, sehingga cukup untuk chatbot dan aplikasi interaktif lainnya
    • Inferensi paralel memungkinkan ratusan token per detik
  • Sedang dikerjakan pengenalan insentif eksplisit (Bloom points) bagi penyedia waktu GPU

3 komentar

 
won9497 2023-01-03

bagus!!

 
won9497 2023-01-03

Eh, ini bukan tulisan itu...

 
xguru 2023-01-03

Bahkan versi BLOOM-7B yang jauh lebih kecil pun, kalau dijalankan langsung secara lokal, katanya butuh sekitar 90 detik di Ryzen (16 core) + RAM 32 GB.
Kalau benar bisa berjalan sebagaimana yang diklaim, ini memang lumayan bagus sih.. tapi entah kenapa ada nuansa blockchain gitu..
(Menurut pengembangnya, mereka memang tidak menggunakan blockchain)