MTIA v1: Akselerator inferensi AI generasi pertama Meta
(ai.facebook.com)- GPU tidak optimal untuk menjalankan DLRM (Deep Learning Recommendation Model) milik Meta
- Karena itu, Meta mengembangkan ASIC Meta Training and Inference Accelerator (MTIA) yang cocok untuk sistem rekomendasi
- Dirancang bersama dengan mempertimbangkan kebutuhan model rekomendasi generasi berikutnya, lalu diintegrasikan ke PyTorch untuk membangun sistem ranking yang sepenuhnya dioptimalkan
- Proses TSMC 7nm, 800Mhz, 102.4 TOPS @ INT8, 51.2 TFLOPS @ FP16, 25W
Belum ada komentar.