- ETL berbasis Python yang dirancang untuk mengekstrak, menyiapkan, dan membersihkan data dari berbagai sumber dan format
- Mendukung file terstruktur maupun tidak terstruktur (CSV, Parquet, PDF, Word, HTML, dll.)
- Bertujuan membantu baik data scientist maupun data engineer agar dapat dengan mudah mengembangkan pipeline melalui antarmuka low-code yang intuitif, sekaligus menghasilkan kode Python yang bisa di-deploy di mana saja
- Merancang pipeline data dengan GUI dan menghasilkan kode Python native yang dapat di-deploy di lingkungan on-premise maupun cloud
- Sangat unggul untuk integrasi data dari file ke database, ekstraksi dan persiapan data untuk data science dan sistem berbasis LLM, serta pengambilan dan pengayaan API
1 komentar
Komentar Hacker News