- Berdasarkan SenseVoice, model pemahaman suara multibahasa yang memiliki fitur seperti pengenalan suara otomatis (ASR), identifikasi bahasa suara (LID), pengenalan emosi suara (SER), dan deteksi peristiwa audio (AED)
- Dioptimalkan untuk inferensi super cepat dan timestamp yang akurat, sehingga dapat memproses transkripsi audio dengan lebih cerdas dan lebih cepat
- Opsi utama
--language: mendeteksi/menentukan bahasa secara otomatis (auto, zh, en, yue, ja, ko)
--textnorm: memilih apakah akan menerapkan inverse text normalization (withitn untuk hasil inverse-normalized, woitn untuk teks mentah)
--device-id: menjalankan pada GPU tertentu (default: -1 untuk CPU)
--quantize: menggunakan model terkuantisasi untuk pemrosesan yang lebih cepat
1 komentar
Karena ada bahasa Korea di opsi, saya jadi ingin mencobanya hehe