Omni SenseVoice - Pengenalan suara berkecepatan tinggi dengan timestamp per kata

xguru · 2024-11-10T09:31:01+09:00

Berdasarkan SenseVoice, model pemahaman suara multibahasa yang memiliki fitur seperti pengenalan suara otomatis (ASR), identifikasi bahasa suara (LID), pengenalan emosi suara (SER), dan deteksi peristiwa audio (AED) Dioptimalkan untuk inferensi super cepat dan timestamp yang akurat, sehingga dapat memproses transkripsi audio dengan lebih cerdas dan lebih cepat Opsi utama --language: mendeteksi/menentukan bahasa secara otomatis (auto, zh, en, yue, ja, ko) --textnorm: memilih apakah akan menerapkan inverse text normalization (withitn untuk hasil inverse-normalized, woitn untuk teks mentah) --device-id: menjalankan pada GPU tertentu (default: -1 untuk CPU) --quantize: menggunakan model terkuantisasi untuk pemrosesan yang lebih cepat

(github.com/lifeiteng)

13 poin oleh xguru 2024-11-10 | 1 komentar | Bagikan ke WhatsApp

Berdasarkan SenseVoice, model pemahaman suara multibahasa yang memiliki fitur seperti pengenalan suara otomatis (ASR), identifikasi bahasa suara (LID), pengenalan emosi suara (SER), dan deteksi peristiwa audio (AED)
Dioptimalkan untuk inferensi super cepat dan timestamp yang akurat, sehingga dapat memproses transkripsi audio dengan lebih cerdas dan lebih cepat
Opsi utama
- --language: mendeteksi/menentukan bahasa secara otomatis (auto, zh, en, yue, ja, ko)
- --textnorm: memilih apakah akan menerapkan inverse text normalization (withitn untuk hasil inverse-normalized, woitn untuk teks mentah)
- --device-id: menjalankan pada GPU tertentu (default: -1 untuk CPU)
- --quantize: menggunakan model terkuantisasi untuk pemrosesan yang lebih cepat

1 komentar

yangeok 2024-11-12

Karena ada bahasa Korea di opsi, saya jadi ingin mencobanya hehe

Omni SenseVoice - Pengenalan suara berkecepatan tinggi dengan timestamp per kata

Bacaan terkait

1 komentar