Nvidia merilis pipeline pembuatan data sintetis untuk pelatihan LLM

xguru · 2024-06-17T09:41:01+09:00

NVIDIA mengumumkan keluarga model Nemotron-4 340B Dapat digunakan untuk menghasilkan data sintetis guna pelatihan LLM komersial di berbagai industri seperti layanan kesehatan, keuangan, manufaktur, dan ritel Data pelatihan berkualitas tinggi berperan penting dalam performa, akurasi, dan kualitas respons LLM kustom. Namun, dataset yang kuat mahal dan sulit diakses Nemotron-4 340B menyediakan cara yang skalabel bagi pengembang untuk menghasilkan data sintetis secara gratis yang membantu membangun LLM yang kuat Mencakup model Base, Instruct, dan Reward Membentuk pipeline untuk menghasilkan data sintetis yang digunakan untuk melatih dan meningkatkan LLM Dioptimalkan untuk framework open source NVIDIA NeMo, serta kompatibel dengan library NVIDIA TensorRT-LLM Saat ini tersedia untuk diunduh di Hugging Face, dan juga akan disediakan sebagai microservice NVIDIA NIM di ai.nvidia.com Pembuatan data sintetis dengan Nemotron LLM dapat digunakan untuk menghasilkan data pelatihan sintetis ketika sulit memperoleh akses ke dataset berskala besar, beragam, dan berlabel Model Nemotron-4 340B Instruct dapat menghasilkan beragam data sintetis yang meniru karakteristik data nyata untuk meningkatkan performa dan ketangguhan LLM kustom Model Nemotron-4 340B Reward menyaring respons berkualitas tinggi untuk meningkatkan mutu data yang dihasilkan AI. Model ini menilai respons berdasarkan lima atribut: helpfulness, correctness, coherence, complexity, dan verbosity Peneliti dapat menggunakan model Nemotron-4 340B Base bersama data kustom untuk membuat model instruct atau reward mereka sendiri Fine-tuning melalui NeMo dan optimasi inferensi melalui TensorRT-LLM Dengan menggunakan NVIDIA NeMo dan NVIDIA TensorRT-LLM, efisiensi model instruct dan reward dapat dioptimalkan untuk menghasilkan data sintetis dan mengevaluasi respons Model Nemotron-4 340B memanfaatkan tensor parallelism yang membagi masing-masing matriks bobot ke banyak GPU dan server, sehingga memungkinkan inferensi skala besar yang efisien Model Nemotron-4 340B Base yang dilatih dengan 9 triliun token dapat dikustomisasi untuk use case atau domain tertentu menggunakan framework NeMo Berbagai metode kustomisasi disediakan melalui framework NeMo, yang dapat meningkatkan akurasi dan memperbaiki output untuk sub-tugas tertentu Untuk meningkatkan kualitas model, NeMo Aligner dan model Nemotron-4 340B Reward dapat menyelaraskan model menggunakan dataset beranotasi

(blogs.nvidia.com)

11 poin oleh xguru 2024-06-17 | 1 komentar | Bagikan ke WhatsApp

NVIDIA mengumumkan keluarga model Nemotron-4 340B
- Dapat digunakan untuk menghasilkan data sintetis guna pelatihan LLM komersial di berbagai industri seperti layanan kesehatan, keuangan, manufaktur, dan ritel
Data pelatihan berkualitas tinggi berperan penting dalam performa, akurasi, dan kualitas respons LLM kustom. Namun, dataset yang kuat mahal dan sulit diakses
Nemotron-4 340B menyediakan cara yang skalabel bagi pengembang untuk menghasilkan data sintetis secara gratis yang membantu membangun LLM yang kuat
- Mencakup model Base, Instruct, dan Reward
- Membentuk pipeline untuk menghasilkan data sintetis yang digunakan untuk melatih dan meningkatkan LLM
- Dioptimalkan untuk framework open source NVIDIA NeMo, serta kompatibel dengan library NVIDIA TensorRT-LLM
- Saat ini tersedia untuk diunduh di Hugging Face, dan juga akan disediakan sebagai microservice NVIDIA NIM di ai.nvidia.com

Pembuatan data sintetis dengan Nemotron

LLM dapat digunakan untuk menghasilkan data pelatihan sintetis ketika sulit memperoleh akses ke dataset berskala besar, beragam, dan berlabel
Model Nemotron-4 340B Instruct dapat menghasilkan beragam data sintetis yang meniru karakteristik data nyata untuk meningkatkan performa dan ketangguhan LLM kustom
Model Nemotron-4 340B Reward menyaring respons berkualitas tinggi untuk meningkatkan mutu data yang dihasilkan AI. Model ini menilai respons berdasarkan lima atribut: helpfulness, correctness, coherence, complexity, dan verbosity
Peneliti dapat menggunakan model Nemotron-4 340B Base bersama data kustom untuk membuat model instruct atau reward mereka sendiri

Fine-tuning melalui NeMo dan optimasi inferensi melalui TensorRT-LLM

Dengan menggunakan NVIDIA NeMo dan NVIDIA TensorRT-LLM, efisiensi model instruct dan reward dapat dioptimalkan untuk menghasilkan data sintetis dan mengevaluasi respons
Model Nemotron-4 340B memanfaatkan tensor parallelism yang membagi masing-masing matriks bobot ke banyak GPU dan server, sehingga memungkinkan inferensi skala besar yang efisien
Model Nemotron-4 340B Base yang dilatih dengan 9 triliun token dapat dikustomisasi untuk use case atau domain tertentu menggunakan framework NeMo
Berbagai metode kustomisasi disediakan melalui framework NeMo, yang dapat meningkatkan akurasi dan memperbaiki output untuk sub-tugas tertentu
Untuk meningkatkan kualitas model, NeMo Aligner dan model Nemotron-4 340B Reward dapat menyelaraskan model menggunakan dataset beranotasi

1 komentar

soychick 2024-06-17

Menggunakan Nemotron untuk menghasilkan data sintetis dan memakainya dalam pelatihan LLM

Nvidia merilis pipeline pembuatan data sintetis untuk pelatihan LLM

Pembuatan data sintetis dengan Nemotron

Fine-tuning melalui NeMo dan optimasi inferensi melalui TensorRT-LLM

Bacaan terkait

1 komentar