- Framework yang ditujukan untuk memproses secara terpadu stream processing / batch processing / workload komputasi berkinerja tinggi (AI)
- Saat ini menyediakan solusi pengganti drop-in untuk Spark SQL dan Spark DataFrame API (kompatibel)
- Dapat berjalan pada satu mesin atau dalam konfigurasi terdistribusi
- Berdasarkan benchmark TPC-H, 4 kali lebih cepat dibanding Spark, mengurangi biaya perangkat keras sebesar 94%, dan tidak memerlukan perubahan kode
- Tersedia sebagai paket Python
pip install "pysail==0.2.0.dev0"
- Tech stack
- Mesin berbasis Rust yang dibangun di atas Apache Arrow dan Apache DataFusion
- Sesi Spark berkomunikasi dengan server Sail menggunakan protokol Spark Connect
Belum ada komentar.