talk-llama - Berbicara dengan LLaMA di terminal
(github.com/ggerganov)- Mendemonstrasikan Whisper Medium (Whisper.cpp) + LLaMA v2 13B Q8_0 di M2 Ultra
- Menggunakan Whisper untuk mengenali suara, mengirim pertanyaan tersebut ke LLaMA, lalu mengeluarkan jawabannya melalui sintesis suara MacOS dengan perintah
say - Mendukung pengelolaan sesi sehingga memungkinkan percakapan berkelanjutan berdasarkan riwayat percakapan sebelumnya
1 komentar
Sepertinya 13B berjalan dengan baik di Ultra. Jadi penasaran bagaimana performanya di M3 Max.