Fly.io, kini dilengkapi GPU
(fly.io)AI memang keren sekali
- Fly.io adalah layanan cloud publik baru yang memungkinkan penempatan daya komputasi lebih dekat ke pengguna.
- Kini AI workload dapat diproses di lingkungan edge computing dengan menggunakan GPU.
- Fly.io memungkinkan pengguna menjalankan aplikasi full-stack atau platform pengembangan berbasis Fly Machines API lebih dekat ke pengguna.
Contoh penggunaan nyata GPU Fly.io
- Anda dapat men-deploy kode Anda sendiri dan model pilihan Anda di atas backbone cloud Fly.io.
- Dengan GPU Fly.io, Anda dapat dengan mudah menjalankan aplikasi GPU yang menjalankan Ollama (teman-teman di bidang generasi teks) dalam dua langkah.
- Anda dapat menambahkan konfigurasi ke
fly.tomllalu menjalankan perintahfly apps create sandwich_ai && fly deployuntuk men-deploy aplikasi.
Kecepatan cahaya punya batas
- Menjalankan GPU dengan cepat memang bagus, tetapi Fly.io benar-benar menunjukkan nilainya pada inferensi di edge.
- Salah satu contohnya adalah aplikasi yang memungkinkan pengguna memasukkan bahan-bahan yang ada di dapur lalu langsung mendapatkan resep sandwich.
- Fly.io memiliki GPU di data center di seluruh dunia dan memungkinkan program yang sama dijalankan di semua wilayah yang mendukung GPU.
Hanya saat benar-benar dibutuhkan
- GPU adalah perangkat pemrosesan paralel yang kuat, tetapi tidak murah.
- Anda dapat menambahkan bagian
serviceske filefly.tomluntuk menentukan cara aplikasi melakukan scale up dan scale down. - Anda dapat mengaturnya agar tidak perlu membayar biaya GPU saat pengguna tidak meminta resep sandwich.
Detail
- Menyediakan GPU yang tersedia di beberapa wilayah di Amerika Serikat, Eropa, dan Sydney.
- Menawarkan berbagai opsi GPU dan harga, dan secara default setiap deployment menggunakan delapan inti CPU AMD EPYC.
- Volume dapat dihubungkan hingga 500GB, serta tersedia diskon untuk reserved instance dan dedicated host.
Pendapat GN⁺:
- Fly.io menyediakan layanan cloud inovatif yang dapat memproses AI workload di lingkungan edge computing, dengan fokus pada peningkatan pengalaman pengguna.
- Layanan berbasis GPU ini menawarkan solusi yang mempertimbangkan baik kecepatan inferensi maupun efisiensi biaya, dan sangat cocok untuk aplikasi yang membutuhkan daya komputasi tinggi secara real-time.
- Layanan ini meningkatkan aksesibilitas teknologi AI dan dapat membantu pengembang membuat aplikasi baru yang inovatif, sehingga merupakan perkembangan yang sangat menarik dan bermanfaat.
1 komentar
Opini Hacker News
cogyang digunakan oleh replicate, dan apakah Fly bisa menjalankan model yang sudah dipaketkan sebelumnya dengan prediction API yang sama. Ia merasa replicate mungkin membuat orang ragu, tetapi jika Fly mengadopsinya, pengalamannya akan menjadi lebih mulus.