- Ingin mengecek performa Computer Use API baru dari Claude, tetapi proyek bawaannya terlihat terlalu berat
- Agent adalah aplikasi Electron sederhana yang memungkinkan Claude 3.5 Sonnet mengendalikan komputer lokal secara langsung
- Sempat ingin menambahkan mode "semi-otomatis" dengan konfirmasi pengguna di setiap langkah, tetapi setiap langkah terlalu lambat sehingga dianggap tidak perlu
- Jika model mulai bingung, Anda dapat menekan tombol "Stop" untuk mengakhiri eksekusi
Memulai
git clone https://github.com/corbt/agent.exe
cd agent.exe
npm install
- Ubah nama
.env.example menjadi .env, lalu tambahkan Anthropic API Key
npm start
- Minta model melakukan tugas menarik di komputer
Sistem yang didukung
- MacOS
- Secara teori, Windows dan Linux juga dapat didukung (semua dependensi bersifat lintas platform)
Keterbatasan yang diketahui
- Hanya berfungsi di layar utama
- AI dapat mengendalikan komputer sepenuhnya
- Mungkin juga ada banyak masalah lainnya
Tips
- Claude sangat menyukai Firefox
- Browser lain juga bisa digunakan, tetapi akan bekerja lebih baik jika Firefox diinstal
Roadmap
- Ini adalah proyek yang dibuat dalam 6 jam, jadi kemungkinan besar tidak akan dikembangkan lebih lanjut
- Namun, jika ada PR yang keren, akan ditinjau dan digabungkan
Ringkasan GN⁺
- Proyek ini menyediakan cara sederhana untuk menguji Computer Use API dari Claude
- Karena AI dapat mengendalikan komputer sepenuhnya, mungkin ada kekhawatiran terkait keamanan
- Kompatibilitas dengan Firefox sangat baik, dan terutama dapat digunakan di MacOS
- Proyek dengan fungsi serupa antara lain AutoHotkey dan Sikuli
1 komentar
Komentar Hacker News
Menurut saya ide Kyle sangat bagus, dan sebagai pengembang desktop automation serta Electron yang berpengalaman, saya merasa source code-nya layak dibaca dan dicoba untuk tugas-tugas dasar
Saya penasaran berapa lama sampai seseorang tidak menyadari ini menambahkan daemon ke sistem
Saya ingat cerita di berita beberapa tahun lalu, "Alexa, tolong pesan rumah boneka"
Saya penasaran bagaimana cara mengotomatisasi aplikasi GUI non-browser di Linux Wayland
Saya penasaran kenapa namanya .exe, padahal ini tampak dimaksudkan sebagai aplikasi multiplatform yang terutama mendukung macOS
Baru-baru ini saya mencoba Cursor dengan memulai proyek full-stack dari nol dalam mode "compose", dan saya terkejut dengan hasilnya
Ada batasan yang sudah diketahui agar AI tidak bisa sepenuhnya mengambil alih komputer
Membuat air gap lalu menyuruhnya mengoding sistem operasinya sendiri mungkin terdengar keren, tetapi saya tidak ingin menaruhnya dekat data nyata
Sepertinya ini hanya bekerja untuk tugas-tugas sederhana
Saya ingin komputer membuat meme sepanjang hari, sementara saya merawat keluarga, berkebun, dan menghasilkan uang dari kripto