10 poin oleh xguru 2024-04-11 | 5 komentar | Bagikan ke WhatsApp
  • Proyek baru dari Bellard, pembuat FFMPEG/QEMU
  • TSAC adalah utilitas kompresi audio yang mampu mencapai bitrate sangat rendah seperti mono 5.5kb/s atau stereo 7.5kb/s pada 44.1kHz, sambil tetap memberikan kualitas suara yang baik
  • TSAC dapat mengompresi lagu stereo berdurasi 3,5 menit menjadi file berukuran 192KiB
  • Untuk kinerja cepat diperlukan GPU Nvidia; hanya dengan CPU juga didukung, tetapi kecepatannya lambat

Informasi teknis

  • TSAC didasarkan pada versi modifikasi dari Descript Audio Codec yang diperluas ke stereo dan model Transformer untuk lebih meningkatkan rasio kompresi. Kedua model dikuantisasi menjadi 8-bit per parameter
  • Model Transformer dievaluasi dengan cara yang deterministik dan dapat direproduksi, sehingga hasilnya tidak bergantung pada model GPU atau CPU tertentu maupun jumlah thread yang dikonfigurasi. Artinya, file terkompresi dapat didekompresi menggunakan konfigurasi perangkat keras atau perangkat lunak yang berbeda.

5 komentar

 
botplaysdice 2024-04-11

Melihat homepage-nya, ternyata dia sempat tertarik juga pada LLM;;;; Orang seperti ini dengan teknologi terbaru seperti ini? Sambil berpikir begitu, saya jadi merasa memang AI adalah arus utama.

 
xguru 2024-04-11

Kalau memperbarui pengantar tentang Fabrice Bellard, sosok monster yang pernah saya tulis dulu..

Fabrice Bellard

Pada 1989 mengembangkan LZEXE

Pada 1996, Harissa - sebuah Java Virtual Machine sekaligus kompiler Java ke kode C

Pada 1997, mengumumkan rumus untuk mengetahui nilai digit tertentu dari pi (π) dalam representasi biner.
-> Menghitungnya tanpa menghitung digit sebelumnya sama sekali. Digit ke-1 triliun adalah "1"
https://en.wikipedia.org/wiki/Bellard%27s_formula

Pada 1998, memperkenalkan TinyGL - implementasi OpenGL yang kecil dan dapat di-embed

Pada 2000, memperkenalkan FFMpeg. Saat ini digunakan oleh sebagian besar pemutar video yang kita lihat.

Pada 2000, memenangkan IOCCC dengan kode C 448-byte untuk mencari bilangan prima terbesar. Bilangan prima ini adalah yang terbesar yang ditemukan hingga 2016.

Pada 2001, memperkenalkan Tiny C Compiler - kompiler C super ringan

Pada 2002, memperkenalkan QEmacs - klon Emacs super ringan. Bisa merender dan mengedit HTML/XML/CSS2 secara WYSIWYG (dengan browser engine bawaan)

Pada 2003, memperkenalkan QEMU - emulator CPU dengan kemampuan virtualisasi perangkat keras

Pada 2004, memperkenalkan TinyCC Boot Loader - bootloader yang dapat langsung mengompilasi kernel Linux lalu melakukan boot

Pada 2005, memperkenalkan generator sinyal DVB-T: memungkinkan siaran TV digital dari desktop sebagai pengganti pemancar mahal. Yang ini source code-nya tidak dibuka

Pada 2009, mencetak rekor dunia dengan menghitung 2,7 triliun digit di belakang koma π. Katanya dihitung selama 131 hari dengan desktop miliknya sendiri.
-> Katanya ini lebih karena tantangan pemrograman komputer daripada minat pada angka besar.

Pada 2011, memperkenalkan JSLinux. Linux yang berjalan di web browser.

Pada 2019, memperkenalkan QuickJS JavaScript Engine, mesin JavaScript yang kecil, cepat, dan dapat di-embed

Pada 2022, merilis TextSynth, SaaS yang dibuat menggunakan gpt2tc(GPT-2)

Selain itu juga ada format gambar BPG berbasis HEVC dengan rasio kompresi lebih baik daripada JPG (menyediakan decoder JavaScript sehingga bisa dipakai di browser apa pun)

Ia juga mengimplementasikan base station 4G LTE/5G NR berbasis PC dengan biaya rendah, dan mengomersialkannya melalui perusahaannya sendiri, Amarisoft

Setiap hal yang dia kerjakan selalu membuat saya takjub, bagaimana mungkin semua ini dikerjakan oleh satu orang.

 
mdisprgm 2024-04-11

Wow..

 
botplaysdice 2024-04-11

Dulu, entah kapan, di HN ada postingan tentang kode yang dibuat orang ini...

Seseorang bertanya, "Bellard tidak posting di sini (HN)?", lalu ada balasan seperti, "Orang seproduktif itu mana mungkin datang ke sini buat nulis postingan"... haha

Memang benar-benar monster....

 
xguru 2024-04-11

Opini Hacker News

Ringkasan:

  • Ada banyak tanggapan positif terhadap TSAC, codec audio baru dari Bellard. Terutama, performanya pada bitrate rendah dinilai lebih unggul dibanding codec yang sudah ada.
  • Jika berkas terkompresi TSAC dirusak, hasilnya menjadi menarik. Suara pada mode Fast dan mode biasa berbeda satu sama lain.
  • Untuk pemrosesan real-time dibutuhkan GPU NVIDIA, dan decoding di perangkat mobile bisa menjadi beban. Pemanfaatannya pada sistem embedded berspesifikasi rendah tampaknya akan terbatas.
  • Ukuran berkas terkompresi decoder TSAC mencapai 237MB, yang menimbulkan keheranan. Muncul pertanyaan apakah sampel audio ikut disertakan di dalam decoder.
  • Ada rasa penasaran untuk membandingkannya dengan codec yang mendukung bitrate lebih rendah seperti Codec2.
  • Ada komentar tentang TSAC dari pengembang DAC (codec yang menjadi dasar TSAC). Pendekatan peningkatan dengan memanfaatkan Transformer terasa menarik.
  • Cara kerja TSAC mirip dengan model AI pembuat musik. Sebagian menghasilkan musik dengan memasukkan token ke language model, sementara sebagian lain menggantikan tokenisasi dengan menyediakan representasi kontinu untuk model Diffusion.
  • Muncul pertanyaan tentang metode evaluasi TSAC yang deterministik dan dapat direproduksi. Ada yang penasaran apakah ia memanfaatkan floating point dan konkurensi. Porting ke GPU AMD dapat memengaruhi perilaku deterministik.
  • Sebagian besar teknologi kompresi media berfokus pada skenario bitrate rendah. Ada rasa ingin tahu seberapa besar efek peningkatannya pada bitrate tinggi. Misalnya, perbedaan performa AV1 pada 10Mbps dibanding AAC 256kbps, dan sebagainya.