Tuplex - Framework Pemrosesan Big Data Paralel

xguru · 2021-07-09T09:20:53+09:00

Menyediakan API Python yang mirip dengan Apache Spark / Dask, tetapi → tidak memanggil interpreter Python → menghasilkan bytecode LLVM yang dioptimalkan untuk pipeline dan dataset input yang diberikan → 5~91x lebih cepat dibanding interpreter Secara internal berbasis kompilasi data-driven dan pemrosesan mode ganda, sehingga memberikan kecepatan yang mirip dengan pipeline yang dikodekan dan dioptimalkan dalam C++ Mendukung MacOS / Linux Makalah "Tuplex: Data Science in Python at Native Code Speed" yang dipresentasikan di SIGMOD '21

(github.com)

11 poin oleh xguru 2021-07-09 | Belum ada komentar. | Bagikan ke WhatsApp

Menyediakan API Python yang mirip dengan Apache Spark / Dask, tetapi

→ tidak memanggil interpreter Python

→ menghasilkan bytecode LLVM yang dioptimalkan untuk pipeline dan dataset input yang diberikan

→ 5~91x lebih cepat dibanding interpreter

Secara internal berbasis kompilasi data-driven dan pemrosesan mode ganda, sehingga memberikan kecepatan yang mirip dengan pipeline yang dikodekan dan dioptimalkan dalam C++
Mendukung MacOS / Linux
Makalah "Tuplex: Data Science in Python at Native Code Speed" yang dipresentasikan di SIGMOD '21

Tuplex - Framework Pemrosesan Big Data Paralel

Bacaan terkait

Belum ada komentar.