Cloud TPU v5e
- Cloud TPU yang paling hemat biaya, serbaguna, dan dapat diskalakan, dengan integrasi ke framework utama seperti Google Kubernetes Engine (GKE), Vertex AI, Pytorch, JAX, dan TensorFlow
- Dibandingkan Cloud TPU v4, menawarkan performa pelatihan hingga 2x lebih tinggi per dolar untuk LLMs dan model gen AI, serta performa inferensi hingga 2,5x lebih tinggi
- Mendukung 8 konfigurasi virtual machine (VM) yang berbeda agar pengguna dapat memilih konfigurasi yang sesuai untuk berbagai ukuran LLM dan model gen AI
- Dengan diperkenalkannya teknologi Multislice, pengguna dapat menskalakan model AI melampaui batas pod TPU fisik hingga puluhan ribu chip Cloud TPU v5e atau TPU v4
A3 GPU VM
- Dilengkapi GPU NVIDIA H100 Tensor Core. Secara khusus dibuat untuk melatih dan melayani beban kerja gen AI serta LLMs dengan tuntutan tinggi, dan akan tersedia secara umum mulai bulan depan
- A3 VMs menawarkan pelatihan 3x lebih cepat dan bandwidth jaringan 10x lebih tinggi dibanding generasi sebelumnya, menghadirkan skala dan performa yang besar
Belum ada komentar.