- Agen coding AI minimalis yang dikembangkan oleh tim Princeton·Stanford pembuat SWE-bench dan SWE-agent
- Agen rekayasa perangkat lunak AI ultra-ringan yang terdiri dari sekitar 100 baris kode Python, berjalan tanpa file konfigurasi besar atau monorepo
- Hanya menggunakan bash sebagai alat, sehingga kompatibel dengan model apa pun bahkan tanpa antarmuka tool-calling milik LLM
- Mencapai lebih dari 74% pada benchmark SWE-bench verified, dan mencatat tingkat yang sama berdasarkan Gemini 3 Pro
- Menjalankan setiap aksi secara independen dengan
subprocess.run, sehingga tidak memerlukan sesi shell persisten, dan saat beralih ke Docker cukup sesederhana menggantinya dengan docker exec
- Dengan struktur histori linear sepenuhnya, trajektori dan pesan yang dikirim ke LLM menjadi identik sehingga optimal untuk debugging dan fine-tuning
- Mendukung deployment di berbagai lingkungan sandbox seperti lokal, Docker/Podman, Singularity/Apptainer, Bubblewrap, Contree
- Mendukung semua model melalui litellm, openrouter, portkey dan lain-lain, serta kompatibel dengan endpoint
/completion dan /response beserta interleaved thinking
- Diadopsi oleh Meta, NVIDIA, IBM, Essential AI, Nebius, Anyscale, Princeton·Stanford dan lainnya
- Dibandingkan Claude Code, kecepatan mulai jauh lebih cepat, dan dapat digunakan sebagai baseline untuk mengevaluasi performa LLM itu sendiri tanpa overfitting pada scaffold agen
- Menyediakan CLI(
mini), batch inference, trajectory browser, dan binding Python (DefaultAgent, LitellmModel, LocalEnvironment)
- Lisensi MIT
1 komentar
Sekarang pengembangan agen secara langsung jadi lebih mudah.