Rilis Whisper.cpp 1.4.0
(github.com/ggerganov)- Dukungan quantization bilangan bulat: model ggml Whisper kini dapat dikonversi dari bobot floating-point 16-bit bawaan ke bobot bilangan bulat 4, 6, 8-bit
- Mengurangi ukuran di disk dan penggunaan memori sehingga dapat berjalan lebih cepat pada beberapa arsitektur
- Dimungkinkan berkat kode yang dikontribusikan ke proyek llama.cpp
- Dukungan NVIDIA GPU menggunakan cuBLAS
1 komentar
Whisper.cpp - implementasi C/C++ berperforma tinggi dari OpenAI Whisper