2 poin oleh GN⁺ 2023-07-31 | 1 komentar | Bagikan ke WhatsApp
  • San Francisco Compute adalah kelompok yang mengumpulkan startup dan lembaga riset untuk membeli dan berbagi sumber daya komputasi secara bersama guna pelatihan model skala besar.
  • Alih-alih setiap startup membeli klaster GPU sendiri, kelompok ini membeli klaster dengan total jumlah GPU yang sebanding dengan jumlah startup.
  • Berdasarkan kepemilikan, penjadwal pekerjaan mengalokasikan sumber daya komputasi secara adil kepada semua startup.
  • Dengan ini, startup dapat menggunakan 512 GPU selama satu minggu untuk mempercepat pelatihan model, sambil menghindari kerepotan harus terus mengisi 128 GPU selama satu bulan penuh.
  • Jika ada sumber daya komputasi yang menganggur, penjadwal dapat mengalokasikan lebih banyak sumber daya kepada startup daripada jatah adil mereka.
  • Model ini mirip dengan yang digunakan di lembaga riset besar seperti OpenAI dan Deepmind, tetapi umumnya lebih mudah diakses oleh startup yang memiliki klaster lebih kecil dan kontrak jangka panjang.
  • Tujuannya adalah menyediakan sumber daya komputasi sekitar $2.00 per GPU H100 dengan alokasi burst dan kontrak jangka pendek.
  • Startup dapat bergabung dengan kelompok ini dengan mengisi formulir atau menghubungi penyelenggara.
  • Startup dapat keluar dari klaster setelah melalui periode pemberitahuan sebelumnya, dan startup baru dapat ditambahkan secara bertahap.
  • Kelompok ini dapat melakukan sedikit kelebihan pasokan untuk mengakomodasi eksperimen kecil atau permintaan dari teman dengan harga yang baik.
  • Pembiayaan pembelian klaster dapat didistribusikan dengan bantuan bank.
  • Kelompok ini berencana menyiapkan 512 GPU H100 online dalam 4-6 minggu, dan dapat menambahkan lebih banyak sumber daya jika permintaan tinggi.
  • Mailing list debugging infrastruktur dan grup Slack disediakan sebagai ruang bagi anggota untuk meminta bantuan terkait masalah infrastruktur.

1 komentar

 
GN⁺ 2023-07-31
Komentar Hacker News
  • Seorang komentator menyebutkan proyek serupa yang pernah mereka ikuti sebelumnya sambil berharap proyek ini berhasil
  • Seorang komentator merefleksikan perubahan ketersediaan TPU dan tantangan yang dihadapi dalam proyek sebelumnya
  • Seorang komentator mengekspresikan sikap optimistis terhadap proyek saat ini dan menyarankan tim untuk secara aktif menerima ide dari orang lain
  • Seorang komentator membandingkan model bisnis proyek ini dengan penyedia cloud seperti AWS dan Azure
  • Saran untuk meng-host infrastruktur di luar California karena biayanya tinggi
  • Pertanyaan tentang perbandingan proyek ini dengan Lambda Labs
  • Pertanyaan tentang potensi penggunaan proyek ini bagi mahasiswa sarjana dan pascasarjana
  • Rekomendasi menggunakan vast.ai untuk machine learning sebagai hobi
  • Penyebutan ide koperasi GPU
  • Pertanyaan tentang asal-usul nama proyek dan rencana keterlibatan komunitas
  • Pertanyaan tentang pendanaan untuk pembelian H100
  • Komentar tersebut mencakup dua pesan kesalahan