Google merilis open source model AI NLP Switch Transformer dengan 1,6 triliun parameter

xguru · 2021-02-19T10:43:21+09:00

Peningkatan kecepatan pelatihan 7x dibanding model T5 (Text-to-Text Transfer Transformer) yang sudah ada Algoritme MoE (Mixture-of-Experts) varian bernama Switch Routing, yang menerapkan parameter berbeda untuk setiap nilai input Menggunakan Mesh-Tensorflow untuk pelatihan model (Model Parallelism)

(infoq.com)

3 poin oleh xguru 2021-02-19 | Belum ada komentar. | Bagikan ke WhatsApp

Peningkatan kecepatan pelatihan 7x dibanding model T5 (Text-to-Text Transfer Transformer) yang sudah ada
Algoritme MoE (Mixture-of-Experts) varian bernama Switch Routing, yang menerapkan parameter berbeda untuk setiap nilai input
Menggunakan Mesh-Tensorflow untuk pelatihan model (Model Parallelism)

Google merilis open source model AI NLP Switch Transformer dengan 1,6 triliun parameter

Bacaan terkait

Belum ada komentar.