- Proyek ini membagikan hasil tentang cara menjalankan model Deepseek R1 Distill 8B Q40 pada perangkat Raspberry Pi 5 8GB.
- Beberapa unit Raspberry Pi digunakan untuk mengevaluasi dan memprediksi performa model.
- Hasil evaluasi dan prediksi
- 2 x Raspberry Pi 5 8GB
- Evaluasi: 7,70 token per detik
- Prediksi: 3,54 token per detik
- 4 x Raspberry Pi 5 8GB
- Evaluasi: 11,68 token per detik
- Prediksi: 6,43 token per detik
- Informasi lain
- Pengujian dilakukan saat jaringan dalam keadaan tertutup.
- Performa pada lingkungan klaster yang menggunakan beberapa perangkat turut diuji.
1 komentar
Komentar Hacker News
brew install llmataupipx install llmatauuv tool install llmllm install llm-mlxllm mlx download-model mlx-community/DeepSeek-R1-Distill-Llama-8Bllm -m mlx-community/DeepSeek-R1-Distill-Llama-8B 'poem about an otter'