Launch HN: Regatta Storage (YC F24) – Teknologi yang mengubah S3 menjadi sistem file cloud mirip POSIX lokal
(news.ycombinator.com)-
Pengenalan Regatta Storage
- Regatta Storage adalah sistem file cloud baru yang menawarkan kapasitas tanpa batas, kinerja seperti lokal, dan sinkronisasi otomatis ke penyimpanan yang kompatibel dengan S3
- Memungkinkan akses instan ke set data besar di S3 menggunakan alat seperti Spark, Pytorch, dan pandas
- Pengguna dapat mencoba layanan ini secara gratis dengan membuat akun
-
Latar belakang pengembangan
- Pendiri mengembangkan Regatta berdasarkan pengalamannya membangun dan mengoperasikan penyimpanan cloud di Amazon EFS dan Netflix
- Ia menyukai kesederhanaan dan skalabilitas EFS, tetapi di Netflix penggunaan EFS tidak banyak
- Masalah performa muncul saat memindahkan beban kerja dari disk lokal ke NFS
- Regatta dikembangkan untuk menyelesaikan masalah di pasar penyimpanan cloud yang tidak terselesaikan oleh block storage atau file storage
-
Fitur Regatta
- Sistem file cloud dengan skema bayar sesuai pemakaian yang secara otomatis diskalakan bersama aplikasi
- Tersinkron otomatis dengan S3 dalam format file native, sehingga dapat terhubung dengan set data yang ada dan memakai data file langsung dari S3
- Data yang tidak digunakan akan dihapus dari cache Regatta sehingga pengguna hanya membayar biaya penyimpanan S3
- Sedang mengembangkan protokol file kustom yang memberikan performa seperti lokal untuk workload file kecil dan skalabilitas seperti Lustre untuk pekerjaan data terdistribusi
-
Implementasi teknis
- Pelanggan me-mount sistem file Regatta melalui NFSv3, dan instance caching terhubung ke bucket S3 milik pelanggan
- Menyediakan performa baca dan tulis yang di-cache dalam sub-milidetik sambil mempertahankan konsistensi yang kuat
- Operasi kompleks seperti mengganti nama direktori dapat dilakukan dengan cepat dan andal, lalu dipropagasikan secara asinkron ke bucket S3
-
Kasus penggunaan dan harapan pengguna
- Digunakan untuk membangun server notebook Jupyter tanpa server bagi peneliti AI
- Digunakan sebagai lapisan caching terdistribusi di atas S3 untuk mengakses file bersama dengan latensi rendah
- Menggantikan volume boot Ceph dan menghasilkan penghematan biaya
- Menyambut masukan pengguna dan ide untuk arah pengembangan ke depan, serta menantikan pendapat dari komunitas
1 komentar
Komentar Hacker News
Perbedaan antara Rclone dan Regatta Storage adalah saat melakukan operasi mutasi pada file system, Regatta menyediakan konsistensi kuat dengan menggunakan lapisan cache berkecepatan tinggi. Rclone tidak memiliki lapisan yang menjamin konsistensi antar klien paralel
Ini tampak seperti salah satu produk paling keren yang keluar dari YC, dan ada beberapa pertanyaan tentang cara kerjanya
Sedang meng-host DuckDB menggunakan GCP Filestore dan meminta informasi tentang harga serta performa Regatta
Tertarik sebagai disk backup untuk SQLite/DuckDB/parquet, dan ingin pembacaan yang di-cache dari penyimpanan NVMe lokal instance
Menganggap menggunakan NFS sebagai protokol adalah ide yang bagus
Ada kekhawatiran bahwa AWS mungkin akan menyalin produk ini dan menawarkannya dengan harga lebih murah
Pernah berhasil melakukan demo di depan CEO Adobe pada 2008, di mana foto yang diambil dengan iPhone otomatis muncul sebagai file di Mac
Penasaran apakah Lambda + SQLite + Regatta bisa digunakan untuk membangun storage SQL ACID real-time
Tidak jelas bagaimana konflik pembaruan file ditangani
Ada alternatif terkenal seperti s3fs, rclone, goofys, dan lainnya