13 poin oleh xguru 2024-11-10 | 1 komentar | Bagikan ke WhatsApp
  • Berdasarkan SenseVoice, model pemahaman suara multibahasa yang memiliki fitur seperti pengenalan suara otomatis (ASR), identifikasi bahasa suara (LID), pengenalan emosi suara (SER), dan deteksi peristiwa audio (AED)
  • Dioptimalkan untuk inferensi super cepat dan timestamp yang akurat, sehingga dapat memproses transkripsi audio dengan lebih cerdas dan lebih cepat
  • Opsi utama
    • --language: mendeteksi/menentukan bahasa secara otomatis (auto, zh, en, yue, ja, ko)
    • --textnorm: memilih apakah akan menerapkan inverse text normalization (withitn untuk hasil inverse-normalized, woitn untuk teks mentah)
    • --device-id: menjalankan pada GPU tertentu (default: -1 untuk CPU)
    • --quantize: menggunakan model terkuantisasi untuk pemrosesan yang lebih cepat

1 komentar

 
yangeok 2024-11-12

Karena ada bahasa Korea di opsi, saya jadi ingin mencobanya hehe