AMD mengumumkan model bahasa kecil pertamanya, AMD-135M

(community.amd.com)

6 poin oleh GN⁺ 2024-09-29 | 1 komentar | Bagikan ke WhatsApp

AMD mengumumkan model bahasa kecil pertamanya, AMD-135M
Model ini dilatih menggunakan akselerator AMD Instinct™ MI250 dengan 670 miliar token
Terdiri dari dua model: AMD-Llama-135M dan AMD-Llama-135M-code
- Model AMD-Llama-135M dilatih selama 6 hari dengan 670 miliar token menggunakan data umum
- Model AMD-Llama-135M-code kemudian di-fine-tune selama 4 hari tambahan dengan 20 miliar token data kode
- Kode pelatihan, dataset, dan bobot model ini disediakan sebagai open source
Mengoptimalkan performa inferensi dengan Speculative Decoding
- Model bahasa besar biasanya melakukan inferensi dengan pendekatan autoregresif
- Keterbatasan utama pendekatan ini adalah hanya dapat menghasilkan satu token pada setiap forward pass
- Masalah ini diatasi dengan diperkenalkannya speculative decoding
- Sebuah model draft kecil digunakan untuk menghasilkan sekumpulan token kandidat, lalu divalidasi oleh model target yang lebih besar
- Pendekatan ini memungkinkan beberapa token dihasilkan pada setiap forward pass, sehingga secara signifikan mengurangi konsumsi akses memori dan sangat meningkatkan kecepatan
Percepatan performa inferensi
- Performa inferensi diuji dengan menggunakan AMD-Llama-135M-code sebagai model draft untuk CodeLlama-7b
- Dibandingkan antara penggunaan dan tanpa penggunaan speculative decoding pada akselerator MI250 dan prosesor Ryzen™ AI (termasuk NPU)
- Pada konfigurasi tertentu, terkonfirmasi adanya peningkatan kecepatan saat menggunakan speculative decoding
Langkah berikutnya
- AMD menyediakan implementasi referensi open source untuk mendorong inovasi di komunitas AI
- Detail lebih lanjut tentang AMD-135M tersedia di blog teknis
- Kode dapat diakses di repositori GitHub AMD
- File model dapat diunduh dari Hugging Face Model Card
- Pengajuan akses ke kartu akselerator Instinct dapat dilakukan melalui AMD Developer Cloud

Ringkasan GN⁺

Model bahasa kecil pertama AMD, AMD-135M, membawa kemajuan penting bagi komunitas AI
Performa inferensi ditingkatkan secara signifikan melalui speculative decoding
Implementasi referensi open source membantu pengembang mereplikasi model dan melatih SLM serta LLM lainnya
Menargetkan dorongan inovasi di bidang AI serta perkembangan teknologi yang lebih inklusif dan etis

1 komentar

comsect62 2024-09-30

Untuk berkembang menjadi kecerdasan umum buatan, harus ada momentum untuk lompatan yang bersifat dimensional, dan momentum itu adalah pendidikan.

AMD mengumumkan model bahasa kecil pertamanya, AMD-135M

Ringkasan GN⁺

Bacaan terkait

1 komentar