14 poin oleh spilist2 2023-08-23 | Belum ada komentar. | Bagikan ke WhatsApp

(Ini tampaknya lebih cocok untuk SHOW, tetapi karena ini bukan buatan saya, saya unggah ke NEWS alih-alih SHOW.)

====

Ini adalah repositori yang mengukur tingkat kesalahan berbagai test set yang dibuka oleh AI-Hub dalam bentuk Character Error Rate untuk tiap API pengenalan ucapan, menggunakan API dari situs pengembang tempat Anda bisa mencoba pengenalan ucapan bahasa Korea. Repositori ini membahas hal-hal berikut.

  • Mengukur tingkat kesalahan Character Error Rate pada test set AI Hub dengan menggunakan berbagai API pengenalan ucapan seperti Return Zero (Riteonjero), Google, OpenAI Whisper, ETRI, dan Naver
  • Pengantar metode evaluasi pengenalan ucapan bahasa Korea

====

Proyek ini dipublikasikan untuk mengevaluasi performa berbagai API pengenalan ucapan secara objektif. Tujuannya adalah menganalisis perbedaan performa berbagai layanan pengenalan ucapan yang tersedia di pasar saat ini, dan melalui hal itu memberikan aksesibilitas yang lebih baik bagi pengguna dan pengembang.

Materi yang dipublikasikan sebagai paper biasanya hanya mengevaluasi performa untuk bahasa Inggris, dan mempublikasikan WER (Word Error Rate) di paperswithcode. Namun, pengenalan ucapan bahasa Korea lebih tepat dievaluasi dengan CER (Character Error Rate), bukan WER, tetapi saya tidak dapat menemukan leaderboard yang tertata rapi untuk itu.

KsponSpeech pertama kali dipublikasikan pada 2018, tetapi karena AI-Hub hanya dapat diakses oleh warga domestik dan jumlah orang Korea yang meneliti serta mengembangkan pengenalan ucapan tidak banyak, sumber daya ini tidak dapat dibuka dalam bentuk berbagai resource.

Return Zero sambil meneliti dan mengembangkan pengenalan ucapan secara mandiri, juga berkontribusi agar lebih banyak orang dapat mengakses resource semacam ini, dengan berkontribusi ke speechbrain, yang banyak digunakan di bidang pengenalan ucapan, sehingga kini dapat digunakan pada recipe terbaru, dan juga dapat diakses di huggingface.

Belakangan ini, berbagai jenis data ucapan telah dipublikasikan di AI-Hub, dan saya merasa bahwa mengevaluasi serta memberi tahu sejauh mana mesin pengenalan ucapan bahasa Korea telah berkembang terhadap berbagai data set tersebut akan membantu kemajuan pengenalan ucapan bahasa Korea.

Belum ada komentar.

Belum ada komentar.