12 poin oleh xguru 2024-06-20 | 1 komentar | Bagikan ke WhatsApp
  • ETL berbasis Python yang dirancang untuk mengekstrak, menyiapkan, dan membersihkan data dari berbagai sumber dan format
    • Mendukung file terstruktur maupun tidak terstruktur (CSV, Parquet, PDF, Word, HTML, dll.)
  • Bertujuan membantu baik data scientist maupun data engineer agar dapat dengan mudah mengembangkan pipeline melalui antarmuka low-code yang intuitif, sekaligus menghasilkan kode Python yang bisa di-deploy di mana saja
    • Merancang pipeline data dengan GUI dan menghasilkan kode Python native yang dapat di-deploy di lingkungan on-premise maupun cloud
  • Sangat unggul untuk integrasi data dari file ke database, ekstraksi dan persiapan data untuk data science dan sistem berbasis LLM, serta pengambilan dan pengayaan API

1 komentar

 
xguru 2024-06-20
Komentar Hacker News
  • Amphi adalah alat ETL low-code untuk data terstruktur dan tidak terstruktur, berguna untuk integrasi file, persiapan data, migrasi data, dan pembuatan pipeline data untuk pekerjaan AI. Alat ini menghasilkan kode Python sehingga bisa di-deploy di mana saja.
  • Memudahkan orang nonteknis melakukan pekerjaan data tidak selalu merupakan hal yang baik. Jika menulis Python dan SQL terasa sulit, mungkin lebih baik mempertimbangkan pekerjaan lain.
  • Judulnya perlu diubah. Ini bukan open source, melainkan berlisensi Elastic License v2.
  • Ini bukan open source. Judulnya menyesatkan.
  • Sebaiknya tambahkan penjelasan tentang singkatan ETL di situs web untuk orang-orang yang tidak mengetahuinya.
  • Untuk alat Python ETL open source, dlthub.com dan hub.meltano.com adalah opsi yang lebih baik. Saya benar-benar menggunakan Meltano dan puas dengannya.
  • Saya penasaran apakah Amphi mendukung framework rapidsai dask_cudf yang mirip dengan pandas.
  • Idenya bagus, tetapi abstraksi tingkat tinggi di dokumentasinya kurang tepat. Seharusnya bisa mendefinisikan sesuatu yang berperilaku seperti tabel dalam pipeline data dan menerapkan transformasi padanya. Fakta bahwa ini adalah alat gratis patut diapresiasi.
  • Saya puas dengan Dagster, tetapi Amphi juga menarik.
  • Saya penasaran bagaimana alat seperti Amphi lahir. Sudah ada banyak alat Python ETL open source, jadi saya ingin tahu apakah alat ini dibuat untuk memecahkan masalah tertentu atau hanya proyek yang didorong oleh passion.