- Meta mendukung komunikasi real-time (RTC) untuk miliaran orang melalui aplikasi seperti WhatsApp, Instagram, dan Messenger.
- Meta berupaya menghadirkan pengalaman berkualitas tinggi bahkan bagi pengguna yang tidak memiliki koneksi cepat atau ponsel terbaru.
- Meta mengembangkan codec Meta Low Bitrate (MLow) yang meningkatkan kualitas audio bahkan pada koneksi lambat.
Motivasi pengembangan codec baru
- Penggunaan RTC berskala besar di produk Meta memungkinkan pengamatan terhadap performa codec dalam berbagai skenario jaringan.
- Banyak panggilan terjadi dalam kondisi koneksi jaringan yang buruk.
- Codec Opus tidak dapat memberikan kualitas audio yang memadai pada bitrate rendah.
- Codec audio berbasis ML yang baru dapat memberikan kualitas yang baik pada bitrate rendah, tetapi biaya komputasinya menjadi masalah.
- Karena banyak pengguna memakai perangkat kelas bawah, dibutuhkan codec audio berkualitas tinggi dengan kebutuhan komputasi yang rendah.
Codec MLow
- Codec MLow memberikan kualitas dua kali lebih baik daripada Opus, dengan kompleksitas komputasi 10% lebih rendah.
- MLow sudah sepenuhnya diterapkan di Instagram dan Messenger, dan sedang aktif diadopsi di WhatsApp.
- MLow dapat mengenkode audio berkualitas tinggi bahkan pada bitrate rendah, sehingga secara signifikan meningkatkan kualitas audio dalam skenario packet loss.
Struktur internal MLow
- MLow menggunakan teknik lanjutan yang dikembangkan berdasarkan konsep codec CELP (Code Excited Linear Prediction).
- Sinyal masukan dibagi menjadi pita frekuensi rendah dan tinggi, lalu masing-masing dienkode.
- Pita frekuensi tinggi dienkode dengan sedikit bit untuk menghadirkan SuperWideBand (sampling 32kHz) pada bitrate rendah.
Rencana ke depan
- MLow secara signifikan meningkatkan kualitas audio bahkan pada perangkat kelas bawah.
- Meta berencana menyediakan lebih banyak audio redundan secara efisien untuk meningkatkan pemulihan audio pada jaringan dengan packet loss tinggi.
Pendapat GN⁺
- Kelebihan MLow: Menyediakan kualitas audio tinggi bahkan pada koneksi lambat, sehingga sangat meningkatkan pengalaman pengguna.
- Tantangan teknis: Mempertahankan kualitas tinggi dengan kompleksitas komputasi rendah adalah tugas yang sangat sulit secara teknis.
- Produk pesaing: Selain Opus, ada berbagai codec audio lain, tetapi MLow menawarkan performa unggul bahkan pada perangkat kelas bawah.
- Hal yang perlu dipertimbangkan saat adopsi: Saat mengadopsi codec baru, kompatibilitas dengan sistem yang ada dan pengujian performa sangat penting.
- Dampak bagi pengguna: Dapat memberi manfaat besar bagi banyak pengguna yang memakai perangkat kelas bawah.
1 komentar
Opini Hacker News
Codec bitrate rendah baru: Untuk mengurangi latensi dalam komunikasi real-time, laju paket harus tinggi, dan akibatnya overhead bisa lebih besar daripada payload sebenarnya. Namun, ini bisa berguna pada komunikasi circuit-switched atau sistem VoIP yang menggunakan kompresi header.
Meta membagikan risetnya: Meta tampaknya kembali mendapat popularitas dengan membagikan banyak riset dan pekerjaan open source. Reputasi Facebook sempat buruk, tetapi tampaknya sudah sedikit tertebus.
Tidak ada perbandingan dengan Codec2: Tidak adanya perbandingan dengan Codec2 membuat nilai nyata dan motivasi dari pekerjaan ini jadi dipertanyakan. Tidak perlu codec audio baru yang terikat pada IP baru.
Perbandingan dengan Google Meet: Google Meet mampu menjalankan panggilan audio dengan baik bahkan di internet lambat, jadi menarik untuk mengetahui apakah codec ini lebih baik daripada Google Meet. Teknologi Google Meet tidak dipublikasikan.
Kualitas panggilan telepon: Penasaran mengapa panggilan telepon saat ini terdengar kurang jelas dibanding μ-law ADPCM 8kHz 8-bit dari era 90-an.
Tidak ada perbandingan dengan Pied Piper: Tidak ada perbandingan dengan Pied Piper.
Apakah akan dirilis: Penasaran apakah codec ini akan dirilis atau hanya sekadar pamer teknologi. Meta AI Research memang inovatif, tetapi sulit menemukan referensi lain tentang codec ini.
Lisensi: Tidak ada informasi tentang lisensi.
Tidak menyebut NoLACE: NoLACE tidak disebutkan, sehingga sampel perbandingannya terasa kurang berguna.
Perbandingan dengan Opus: Opus terdengar lebih halus pada 6 kbps, sedangkan sampel MLow memiliki artefak yang kasar dan terdengar artifisial. Pada bitrate yang lebih tinggi, pilihannya kemungkinan akan lebih jelas.